Ga direct naar inhoud

AI-potentieel ontgrendelen via Data Mesh

Capgemini
Jul 12, 2024

Sinds OpenAI’s ChatGPT in november 2022 het transformatie-potentieel van AI aantoonde, struikelen bedrijven over elkaar heen om op de AI-trein te springen. Als gevolg daarvan werd Nvidia het meest waardevolle bedrijf ter wereld, dankzij grote investeringen in AI-hardware.

Bovendien doen bedrijven uit alle sectoren hun uiterste best om het AI-talent te behouden en te werven dat nodig is om complexe AI-modellen te bouwen. Deze voorbeelden illustreren dat bedrijven het potentieel van AI erkennen. Hoewel hardware en talent belangrijke factoren zijn, spelen hoog volume, gemakkelijk toegankelijke en betrouwbare data een grote rol om de potentiële waarde van AI echt te maximaliseren.

Dat is waar data mesh om de hoek komt kijken. Data mesh is een paradigma dat uitgaat van een schaalbare, gedecentraliseerde benadering van dataopslag, -gebruik en -eigendom. Het versnelt de inzet van use cases aanzienlijk, zorgt voor productgerichte oplossingen en vergroot inzichtgestuurde besluitvorming.

Data mesh in een notendop

Hoewel data mesh uitgebreid wordt beschreven door Zhamak Dehghani en Piethein Strengholt, is er geen consensus over de praktische implementatie ervan. Het kan vanuit verschillende invalshoeken worden benaderd, bijvoorbeeld vanuit een data-architectuurperspectief of een organisatorische manier van werken. De aanpak van Capgemini Invent combineert beide invalshoeken, zoals weergegeven in figuur 1:

  • Gefedereerde data governance: maakt decentralisatie van de uitvoering van databeheer mogelijk, terwijl standaarden worden gecentraliseerd met algemene beleidsregels.
  • Data als een product: benadrukt dat data niet moeten worden beheerd als een bijproduct van bedrijfsprocessen, maar als een op zichzelf staand product, rekening houdend met eindgebruikers en hun toepassing.
  • Eigendom per domein: houdt in dat de data eigendom is van degenen die de context het beste begrijpen. Dit zijn de mensen die met de data werken en de waarde, structuur en het doel ervan begrijpen.
  • Self-service dataplatform: biedt een infrastructuur om autonoom toegang te krijgen tot data, deze te beheren en te implementeren door databeheerders en gebruikers. Het platform biedt de nodige mogelijkheden om de volledige levenscyclus van gegevens te ondersteunen, van inname tot consumptie.
  • Datagedreven cultuur: bevordert samenwerking tussen domeinen en zorgt ervoor dat data wordt behandeld als een kritische organisatorische asset. Een sterke datagedreven cultuur stimuleert continu leren, gedeelde verantwoordelijkheid en afstemming met organisatiedoelen, wat essentieel is voor de effectieve implementatie van een data mesh.

Figuur 1

Versnelling van AI-use cases via data mesh

De snelle ontwikkelingen in de huidige zakelijke omgevingen vereisen snelheid en wendbaarheid van de datavaardigheden van organisaties, zonder concessies te doen aan kwaliteitsnormen. Een data mesh verankert het eigendom in de hele organisatie en biedt de volgende drie voordelen

1. Snelle implementatie van use cases

Self-service platforms stellen zakelijke gebruikers in staat om snel de benodigde inzichten te verzamelen, waardoor mogelijke knelpunten worden geëlimineerd doordat er geen beroep meer hoeft te worden gedaan op een centraal datateam. Daarnaast zorgt de gedecentraliseerde datagovernance ervoor dat de domeinen zorgen voor schone, goed gedocumenteerde en gebruiksklare dataproducten. Op deze manier wordt de noodzaak voor het voorbewerken van data sterk verminderd, wat leidt tot aanzienlijk verbeterde doorlooptijden voor de ontwikkeling van AI-modellen.

2. Maximale waarde creëren met geschikte dataproducten

Decentralisatie van data-eigendom betekent dat data, eigendom is van de bedrijfsdomeinen die de context en relevantie ervan begrijpen. Een verkoopteam heeft bijvoorbeeld het beste inzicht in verkoopdata en de context ervan. Dit resulteert in dataproducten die geoptimaliseerd zijn voor use cases die de bedrijfswaarde verhogen. Om het potentieel van data te realiseren, is het dus essentieel dat ze niet alleen toegankelijk, maar ook bruikbaar zijn.

3. Schaalbaarheid zorgt voor concurrentievoordeel

De federatieve architectuur heeft een aanzienlijk  betere schaalbaarheid dan een traditioneel centraal datateam, waardoor de flexibiliteit op domeinniveau toeneemt. Het ondersteunt de groei van organisaties door nieuwe domeinen mogelijk te maken zonder de huidige activiteiten en kwaliteit van de huidige dataproducten te verstoren. Dit betekent dat organisaties de snelle marktontwikkelingen kunnen bijhouden en zo een concurrentievoordeel kunnen creëren.

Data mesh gaat verder dan alleen een technologische implementatie

Om de waarde te realiseren die een data mesh kan bieden, is de uitvoering cruciaal:

“Met een goed gecoördineerde, langetermijnstrategie is het succesvol implementeren van een data mesh haalbaar,” zegt Saini. Hij vervolgt: “Het is een geweldig concept dat gedijt op sterke empowerment en visionair leiderschap vanuit de organisatie zelf. Wanneer teams op één lijn zitten en het leiderschap toegewijd is, kunnen de voordelen van een data mesh transformerend zijn. Organisaties die deze aanpak omarmen, zijn goed gepositioneerd om uit te blinken in de data-gedreven toekomst.”

Nitesh Saini, Director Data Strategy & AI bij Capgemini Invent

In de praktijk zijn cultuur en menselijke aspecten net zo belangrijk als de juiste technologie. Om een bloeiende datacultuur te bevorderen, zijn vier elementen essentieel:

  • Voortdurend leren en ontwikkelen: bied doorlopende opleidings- en ontwikkelingsmogelijkheden om werknemers te helpen hun datavaardigheden te verbeteren en op de hoogte te blijven van de nieuwste datatools en -technologieën.
  • Innovatie en experimenten: zorg voor een omgeving waarin medewerkers zich aangemoedigd voelen om te experimenteren met data, nieuwe benaderingen uit te proberen en te innoveren zonder bang te hoeven zijn om te falen.
  • Steun van de leiding: zorg voor commitment van de leiding om prioriteit te geven aan data-initiatieven, te investeren in data-infrastructuur en datagestuurde besluitvorming te bevorderen.
  • Erkenning en stimulansen: erken en beloon medewerkers en teams die data effectief gebruiken om bedrijfsresultaten en innovaties te stimuleren

Waarom data mesh-projecten mislukken

De overstap naar een data mesh kan een ingrijpende transformatie zijn die aanzienlijke inspanning en tijd van een organisatie vergt. In de praktijk zien we bij onze klanten dat organisaties vaak moeite hebben om de eindstreep te halen, voornamelijk vanwege drie belangrijke obstakels:

1. Gebrek aan empowerment en steun van het topmanagement

Om een data mesh-strategie succesvol uit te voeren, is aanzienlijke empowerment nodig. Het is belangrijk dat het topmanagement, dat mogelijk niet bekend is met data mesh, wordt overtuigd door de ROI van zo’n verandering. Zonder dit kan een bedrijf moeite hebben om essentiële middelen en prioriteitenveilig te stellen.

2. Organisatorische weerstand tegen decentralisatie

Het implementeren van een data mesh vereist een significante organisatorische verschuiving die weerstand kan oproepen bij medewerkers. Velen zijn gewend aan de comfortzone van bestaande systemen en kunnen angst hebben voor de onzekerheid en verstoring die gepaard gaan met een nieuwe gedecentraliseerde aanpak. Traditionele afdelingssilo’s kunnen ook de noodzakelijke cross-functionele samenwerking belemmeren die essentieel is voor een data mesh. Als één domein niet effectief functioneert, valt het systeem uit elkaar.

3. Gebrek aan technische expertise en vaardigheden

Het toepassen van data mesh vereist geavanceerde technologieën en tools, die technisch complex kunnen zijn. Dit vraagt om nieuwe vaardigheden van datawetenschappers, data engineers en andere medewerkers om de nieuwe architectuur, tools en technologieën te begrijpen. Er is echter vaak een tekort aan geschoolde professionals met de nodige expertise, wat leidt tot uitdagingen bij het werven en behouden van talent. Daarom wordt het trainen en bijscholen van werknemers steeds belangrijker.

“Om succes te behalen, is tijd nodig, waarbij alle tien afdelingen binnen uw organisatie opereren met een gedeeld begrip en gesynchroniseerd tempo,” zegt Saini. “Stel je een bus voor met tien wielen; wanneer één wiel eraf valt of niet bijblijft, raakt de hele reis verstoord. Voortdurende samenwerking en afstemming zijn cruciaal om de vaart erin te houden. Elk team moet even gecommitteerd zijn om een probleemloze voortgang te waarborgen en tegenslagen te voorkomen”

Nitesh Saini

Auteurs

Nitesh Saini

Director Data, Analytics and GenAI Strategy
Nitesh Saini is Director of Data, Analytics and GenAI Strategy at Capgemini Invent with over 25 years of experience in both Industry and Consulting. As a Digital, Technology and Data leader, he has focused on transforming Business and IT to new value through innovative thinking and has a solid track record for translating business strategy into IT strategy across various organizations.

Jim Rovekamp 

Senior Consultant Data & AI Strategy
Jim is a business consultant with a focus on strategy, data and AI. He has been involved in designing data strategies for multiple companies within different industries. Besides delivering data strategies, he has experience in data transformation programs, guiding companies to become a data-driven organization.

Calvin Rekveld

Senior Consultant Data Strategy & Transformation
‘Calvin is a Senior Consultant at Capgemini Invent in the Data Strategy & Factory team. He has worked for multiple clients across different industries, specializing in developing data strategies, as well as in the transformation and implementation of those strategies. His enthusiasm for data drives him to help clients become more data-driven.

Flory van der Steuijt

Data & Business Analyst
Flory is a Data & Business Analyst at Capgemini Invent in the Data, Strategy & Factory team. She has extensive experience in the public sector and is involved in sustainability teams within Capgemini Invent, highlighting her commitment to making a positive impact on society. Additionally, she specializes in data analysis and dashboarding.