Ga direct naar inhoud

Grootscheepse data-analyses zijn niet het antwoord op fraude

Reinoud Kaasschieter
2018-11-07

Fraude is een regelmatig terugkerend onderwerp op de voorpagina’s van de kranten. De verontwaardiging onder politici en burgers is steevast groot, want het gaat vaak om publiek geld. De verontwaardiging verrast me niet. Maar wat ik wel verontrustend vind, is dat allerlei data-analisten beweren dat ze fraude kunnen ontdekken met wat slimme zoekvragen. Wat een optimistische kijk op de wereld.

Ken de wet en wees ethisch

Fraude-opsporing wordt door de wet beperkt. Dit voorkomt dat iemand gewoon gegevens kan doorzoeken naar afwijkingen zonder aanwijsbare reden. Met persoonsgegevens, die worden beschermd onder de AVG/GDPR, zijn deze beperkingen nog strikter geworden. Vanuit juridisch oogpunt vereist iedere gegevensverwerking wettelijke goedkeuring en een specifiek, expliciet en legitiem doel dat het gebruik van die gegevens beperkt.Het combineren van gegevens met andere, externe gegevensverzameling kan ook problematisch zijn. Wat technisch mogelijk is, is niet altijd haalbaar of legaal.

Fraude-opsporing moet zowel ethisch als legaal zijn. Bij data-analyses gaat het allemaal om statistiek, wat betekent dat fouten inherent zijn. Hoe gaan data-analisten om met deze (Type I) fouten? En wie heeft de schuld wanneer iemand ten onrechte wordt beschuldigd?

Gegevens vormen niet de realiteit

Data vormen niet de hele realiteit, het zijn zelfs geen schaduwen in een grot, om naar Plato te verwijzen. Persoonlijke gegevens kunnen alleen worden verzameld en bewaard voor vooraf gedefinieerde doeleinden. Deze doelen voor het verzamelen liggen meestal bij de uitvoering van bedrijfsprocessen, niet bij fraude-opsporing. En analisten mogen niet meer persoonsgegevens verzamelen dan ze strikt nodig hebben, dus…

Goede fraudeurs weten dat geen enkel proces perfect is – er zijn altijd blinde vlekken die kunnen worden misbruikt. Fraudeurs volgen het proces zoals voorgeschreven, maar ze kennen ook de mazen in het net en de uitzonderingen. Met andere woorden, de gegevensverzameling kan er goed uitzien, zelfs wanneer er fraude plaatsvindt.

Vaak is het een externe gebeurtenis die fraudedetectie triggert. Bijvoorbeeld iemand die gaat praten. Zorg goed voor uw klokkenluiders, zij kunnen u wijzen op ernstiger gevallen van fraude dan wat data-analyses over kruimeldieven onthullen.

Wees bescheiden en denk na over je acties

In China is het zogenaamde sociaalkredietsysteem in een stroomversnelling terecht gekomen. Uiteindelijk zal het gedrag van alle Chinese burgers worden gevolgd. Als dat binnen de kaders valt die door de overheid zijn gesteld, zullen burgers extra privileges krijgen. Doen ze dat niet, kunnen zij van de basisvoorzieningen worden uitgesloten. Data-analyse zal dit alles mogelijk maken, maar is dit de maatschappij waarin we willen leven?

Wat zijn de mogelijke neveneffecten van massale gegevensanalyses voor fraude? Als we de persoonsgegevens van iedereen bewaken op anomalieën, met andere woorden mogelijke fraude, wat voor soort gemeenschap creëren we dan? Een plek waar uitzonderingen verdacht zijn, waar je middelmatig moet zijn om een prettig leven te leiden.

Fraudepreventie beperkt onze vrijheid. Een onzichtbare bewaking van elke afzonderlijke transactie die we doen, zou wel eens een van de grootste en minst verwachte bedreigingen voor de vrijheid kunnen zijn die we ooit zijn tegengekomen. Een wereld zonder fraude is een utopisch concept, maar ook een gevangenis waarin ik niet wil leven.