Metadata gaat over andere data. Het is geen sexy onderwerp. Maar met een beetje moeite is er ‘goud’ mee te behalen.
Er zijn verschillende types metadata. Metadata kan iets beschrijven, bijvoorbeeld als het concept ‘auto’ wordt gedefinieerd. Een tweede type metadata geeft de structuur en samenhang aan tussen verschillende begrippen of objecten. Denk bijvoorbeeld aan gegevens over een verkoop van auto’s. Het is dan de samenhang tussen ‘verkoop’ en ‘auto’.
 
Beschrijvende data wordt vaak hoog gewaardeerd terwijl structuur metadata niet vaak nodig is. Verkoopcijfers bijvoorbeeld worden hoog gewaardeerd en moeten altijd beschikbaar zijn. Maar soms is er ook behoefte aan info over de middelen waarmee de verkoopcijfers beschikbaar worden gemaakt.
Metadata is geen ‘primaire levensbehoefte’ wanneer het wel duidelijk is waar het over gaat of hoe iets in elkaar zit. Wanneer het gaat over automatiseringsmiddelen, is het vooral van belang dat het systeem werkt en dat de data beschikbaar is. Mede daardoor is metadata voor velen ‘lood om oud ijzer’ of lijkt zelfs wel overbodig.
Metadata mis je pas als je het nodig hebt: “Waar is dat document?”, “Is dit de totale omzet tijdens een actie of alleen de actieomzet?”, “Wat zijn de bronsystemen van dit rapport?” en “Wat is de impact als we deze change uitvoeren?”.
Is dit document een patientendossier, blijken de jaarcijfers over een andere periode te gaan  of blijkt een bronsysteem al maanden geen data meer te leveren, dan kan het gebrek aan metadata nare gevolgen hebben.
 
Het hebben van metadata kan ook een gouden kans om nieuwe omzet te genereren. Denk aan gegevens over het klikgedrag van consumenten op een website. Maar als ik bij klanten zie hoe ingewikkeld het is om te achterhalen waar en waarvoor een bepaalde tabel of  interface wordt gebruikt, dan is er nog wel wat te doen. Het gebrek aan structuurdata kost dan vroeg of laat veel tijd en geld.
 
Data over bijvoorbeeld tabellen, laadprocessen en interfaces zit veelal in de systemen zelf. Deze systemen bevatten meestal wel een gebruikersinterface waarmee bepaalde interne data getoond kan worden. Maar dit is slechts 1 view op de werkelijkheid. Daarnaast toont zo’n systeem meestal nauwelijks data over andere systemen en dus heb je voor elk systeem weer een aparte tool nodig. Een derde issue is wanneer deze data veel gedetaileerder is dan waaraan behoefte is. Wordt bijvoorbeeld getoond hoe een verwerkingsproces is opgebouwd, terwijl alleen behoefte is aan de source en target tabellen, dan is er behoefte aan een ander soort overzicht.
 
Een vorm waarin al deze metadata beschikbaar gemaakt kan worden is bijvoorbeeld een datawarehouse, een metadata warehouse. Stel je als beheerder voor wat er mogelijk wordt als je de namen van alle databases en tabellen, datafiles, laadprocessen en management rapportages in 1 database hebt opgenomen waarbij tevens de relaties zijn toegevoegd tussen de genoemde objecten (tabel x is source voor laadproces y en tabel x zit in database z). Haal je dagelijks deze data automatisch uit de bronsystemen en wordt de actuele stand van zaken in het metadata warehouse geladen (hoe traditioneel ook), dan kan het ICT-landschap via queries vanuit verschillende invalshoeken in kaart gebracht worden. Maar hoeveel ICT-projecten zijn er niet gestart waarbij de impact snel duidelijk was?

Laat het metadata warehouse de repository zijn van een grafische tool waarmee objecten en hun relaties bij elkaar geklikt kunnen worden en je kunt dan eenvoudig een maatwerk overzichtsplaat produceren. Een impact analyse is dan snel gedaan. Zolang metadata direct beschikbaar en actueel is, is dat goud waard voor elk ICT-project en natuurlijk ook voor de beschikbaarheid van de verkoopcijfers.
 
Op kleine schaal ben ik hiermee bij een grote klant bezig geweest. Nu kan daar binnen enkele tellen worden getoond welke processen gebruik maken van een bepaald bestand en hoe de data stroomt. Ook is nu snel helder welke processen en bestanden nodig zijn voor een specifiek management rapport en welke andere processen van deze componenten afhankelijk zijn. Zolang alles werkt is deze metadata niet nodig. Maar is er een change of gaat er iets mis …