Inmiddels is het al februari en van de goede voornemens is wellicht niet zoveel meer over. Zelf ben ik erg positief over het nieuwe jaar. Zakelijk zie ik veel beweging ontstaan op het gebied van data en met name data kwaliteit. Veel nieuwe initiatieven die aan het ontstaan zijn en dat kan ik natuurlijk alleen maar toejuichen.
 
Een paar weken geleden kreeg ik, door een nieuwsbrief, het Gartner rapport van Data Quality tools van november 2014 in mijn mail. Altijd interessant hoe de verschillende data quality tools worden geplot in het quadrant, maar in vergelijking tot oktober 2013 stonden dezelfde tools in het leader quadrant.
 

Bron: Gartner (November 2014)
 
Persoonlijk vind ik het altijd erg boeiend om te lezen wat de visie van Gartner is bij de verschillende leveranciers. Wat mij opviel  is dat Gartner bij elk product benoemt hoeveel klanten er gebruik van maken. Deze informatie wordt niet bij elk rapport wordt gegeven, maar vond ik zeer waardevol.  Er is geen enkele leverancier die meer dan 10.000 klanten heeft voor het product, het product met de minste klanten heeft er 100.

Het leader quadrant kenmerkt leveranciers die een grote variëteit hebben aan data quality functies in hun product. Dit zijn onder andere profiling, parsing (opsplitsen van bijvoorbeeld volledige naam in meerdere afzonderlijke velden), standaardisatie, matching, validatie en verrijking. De bedrijven in het leader quadrant zijn actief in de markt, hebben een afdoende grootte en zijn internationaal actief.

In mijn inleiding begon ik met het feit dat ik steeds meer signalen die, dat er wat wordt gedaan met data kwaliteit bij onze klanten, Gartner ziet deze trend ook. Steeds meer bedrijven hebben de intentie om meer prioriteit gaan geven aan data initiatieven. Daarnaast ziet Gartner steeds meer data gerelateerde rollen in organisaties ontstaan (data steward, data eigenaar of data kwaliteits analist).

Deze trend is alleen maar positief, een verbetering van data kwaliteit is niet alleen de kwestie van een tool aanschaffen en gaan schonen. Het is een continu proces waaraan wel een aantal randvoorwaarden zijn gesteld. Bijvoorbeeld er is een data eigenaar, er zijn definities gesteld waaraan de data moet voldoen en deze definities zijn meetbaar. Zijn deze randvoorwaarden er niet, zullen deze eerst gecreëerd moeten worden om het project tot een succes  te gaan maken. Met deze randvoorwaarden ontstaan de mogelijkheden om het als een continu initiatief te gaan implementeren. Op regelmatige basis zal je de data en ook nieuwe gegevens moeten gaan controleren en nalopen om toekomstige vervuiling te gaan tackelen.
 
Mocht u naar aanleiding van dit blog meer informatie willen hebben over data kwaliteit en de mogelijke ondersteuning die Capgemini kan leveren, neem dan contact op met mij of één van mijn collega’s.