Binnen ECM projecten is metadata een veel terugkerend begrip waarvan een ieder (gezien het feit dat men het steeds tegenkomt) het belang wel in ziet. Wel merk ik dat de laatste tijd iets vaker ter discussie wordt gesteld hoe noodzakelijk metadata is. Aangaande metadata lees overigens ook de blog van mijn collega Sjef Philippi: De juiste metadata voor uw documenten.
Hoe opgeruimd ben ik? Dat is een vraag die we ons allemaal wel eens stellen. Als dit betrekking heeft op onze emotionele staat gaat het er daarbij om hoe we allen met het ons wel bekende ‘rugzakje’ omgaan. Wat platter gaat het er gewoon om hoe georganiseerd, geordend iemand opereert. Hierin zie je alle variaties en mogelijkheden die er zijn voorbij komen, wat vooral opvalt is dat er tussen privé en zakelijk nogal een verschil kan zitten.

Het leukste zijn hierbij zijn uiteraard diegenen die in dit opzicht echt compleet anders zijn, soort Dr Jekyll and Mr Hyde. Een collega laat zich bijvoorbeeld voorstaan op zijn clean desk policy en van anderen om zich heen verlangt dat er erg secuur met alle bedrijfsinformatie wordt omgegaan. Terwijl het in zijn normale dagelijkse leven best wel rommelig is en het bij elkaar zoeken van de juiste documenten voor de inkomstenbelasting een jaarlijks terugkerende crime is. Andersom, alhoewel minder vaak, kom je dit ook tegen. Op het werk best een sloddervos, iemand waarvan gesteld wordt dat hij/zij administratieve zaken beter aan een ander over kan laten, terwijl thuis, als het gaat om de hobby verzameling, alles met minutieuze precisie vastgelegd en gedocumenteerd is.
Waar gaat dit heen zult u wel denken, dit is immers een blog waar men schrijfsels verwacht die gerelateerd zijn aan het ECM vakgebied. De link tussen het voorgaande en ECM is misschien niet keihard. Echter mijn gedachtegang is dat iemand die zeer secuur is in zijn werk waarschijnlijk ook zeer secuur om zal gaan met metadata, terwijl een persoon die vrij los is in zijn administratie waarschijnlijk niet de meest geschikte persoon is om verantwoordelijk te maken voor het (correct) aanvullen van metadata.
Eigenlijk wordt er best vaak, zonder ondersteuning of duidelijke richtlijnen, veel gevraag van medewerkers.  

Afvragen
Momenteel is er veel beweging rondom metadata, voorheen  werd dit als absoluut noodzakelijk geacht voor het later goed terug kunnen vinden van stukken.  Er werd gericht op gezocht en de metadata werd in indexen opgeslagen om snel toegankelijk te zijn. De opkomst van fulltext search stelt hele andere eisen aan indexatie, daardoor is metadata terrein aan het verliezen.
 
Hierdoor lijkt het dat de noodzaak van metadata aan het afnemen is. Door de voortgang aan  hardware zijde (sneller, efficiënter, ruimer etc.) en het beter worden van software wordt de eindgebruiker steeds meer ontzorgt. Indexen worden on the fly opgebouwd, zoeken kan over gigantische hoeveelheden data en ook nog effectief. Niet elke organisatie heeft dit overigens al op zulk hoog nivo draaien, maar technisch is er ondertussen erg veel mogelijk.
Hiermee lijkt de noodzaak van metadata af te nemen. Ik zeg bewust lijkt aangezien er namelijk nog wat andere zaken zijn waar rekening mee gehouden dient te worden.
Ten eerste wordt het lastiger om eventueel over te stappen op een andere oplossing, als content volledig ongestructureerd in een systeem aanwezig is en de structuur, manier van weergave volledig gebaseerd is op de indexen en andere handigheden van de software zelf dan is dit lastig te verplaatsten naar een ander systeem.

Dit systeem zal immers vanaf scratch moeten beginnen met het opbouwen van een structuur. En natuurlijk zijn er tegenwoordig zaken als auto classificatie en verrijkingssoftware die slimme algoritmes en methodes hebben om alsnog metadata op te bouwen, maar dit zijn toch vaak tijdsrovende en zeker geen foutloze processen. Men heeft het dan vaak over uitval en die percentages zijn tegenwoordig aanzienlijk gedaald. Echter de absolute hoeveelheid uitval hangt vanzelfsprekend ook af van de hoeveelheid content en in de meeste organisaties groeit deze nog exponentieel. Mits goed overdacht en uitgewerkt is het overstappen naar een andere oplossing natuurlijk mogelijk.
Een veel zwaarwegender argument is voor de duurzaamheid van metadata is het feit dat men daar tegenwoordig steeds meer mee kan. Onder benamingen als content analytics, content statistics, dynamic content management ziet men namelijk een enorme opgang in producten die metadata gebruiken voor steeds slimmere zaken. Waar metadata initieel primair bedoeld was voor het categoriseren en structureren van content wordt het nu veel breder gebruikt.
Metadata kan daarmee essentieel zijn voor toekomstige toepassingen. Om goede analyses, slimme voortstellen te doen met content is metadata vaak onmisbaar. Dit geldt ook voor de koppeling tussen gestructureerde (BI) data en ECM content. Neem een fabriek met machines, stel dat men met geavanceerde sensoren, meettechnieken exact bijhoud hoe veel productie de machine al gedraaid heeft.  En dat men daarnaast aan de hand van historische data, kengetallen en actuele data het onderhoud van die machine bepaalt. Dus in plaats van iets te vervangen als het stuk is, is men in staat een onderdeel te vervangen vlak voor het stuk dreigt te gaan. Dit komt de efficiëntie van die machine uiteraard ten goede. Echter tijdens het (ad hoc) onderhoud dient de monteur wel over de juiste, meest recente versie van handleidingen, specificaties etc. te beschikken. Het aanleveren van die informatie zal heden ten dage nog steeds op basis van metadata geschieden. Dit is maar een voorbeeld van het cruciale nut van metadata.
Kortom hoewel de noodzaak voor metadata op bepaalde punten wat lijkt af te nemen is het een gegeven dat er voorlopig binnen de ECM wereld nog een grote rol voor is. De vraag of er dus nog plaats is voor metadata in deze snel voortschrijdende ECM wereld dient op dit moment absoluut met JA beantwoord te worden.