Künstliche Intelligenz benötigt Datenmanagement – und umgekehrt

Publish date:

Wie Künstliche Intelligenz und Machine Learning digitale Transformationsinitiativen antreiben – und dabei auf Datenmanagement nicht verzichten können. Ein Gastbeitrag von Axel Toonen, Informatica.

Axel Toonen, Informatica

Wer über die Digitale Transformation spricht, wird kaum auf Künstliche Intelligenz (KI) und Machine Learning (ML) verzichten können. Branchenübergreifend spielen KI und ML eine entscheidende Rolle: Von der Entdeckung neuer Therapien über Betrug im Finanzwesen bis hin zum personalisierten Einkaufszettel. Aber wie werden die dafür nötigen Daten effektiv verwaltet?

 

Eine gute KI benötigt ein funktionierendes Datenmanagement

Der Erfolg Künstlicher Intelligenz hängt von der Effektivität entwickelter Modelle ab, anhand derer KI trainiert und skaliert wird. Der Erfolg dieser, von Datenwissenschaftlern entwickelter, Modelle hängt wiederum von der Verfügbarkeit vertrauenswürdiger und aktueller Daten ab. Steve Guggenheimer von Microsoft hat auf der Informatica World Konferenz im Mai in Las Vegas diese Beziehung zwischen Daten und KI auf den Punkt gebracht: „Sie können keine intelligenten KI-Konversationen führen, solange Sie keine intelligente Datenkonversationen führen können.“ Diese Ansicht wurde von vielen Experten bestätigt, so z.B. auf Forbes und im Harvard Business Review.

Erklärbare KI muss Vorschrift werden

Warum benötigen Datenwissenschaftler, die mit der Erstellung von KI-Modellen beauftragt sind, unbedingt qualitativ hochwertige Daten? Dies lässt sich am Beispiel eines Vorhersagemodells verdeutlichen, mit dem das Verhalten eines Verbrauchers bereits im Vorfeld gedeutet werden soll. Ein wertvolles Merkmal für ein solches Modell könnte der Ort des Verbrauchers sein, der durch die Postleitzahl angegeben wird. Was aber, wenn die Postleitzahldaten fehlen, unvollständig oder ungenau sind? In dem Fall sind nachteilige Effekte, etwa falsche Vorhersagen, während des Trainings oder des Einsatzes des Modells möglich, was den Nutzen des Projekts signifikant verringern kann.

Darüber hinaus könnte eine genaue, vollständige und verifizierte Postleitzahl auch dazu beitragen, Zielpersonen anhand von Einkommensklasse, Alter, Lebenserwartung und weiteren Merkmalen zu segmentieren. Wir alle sollten erwarten, dass „erklärbare KI“ zu einer verbindlichen Vorschrift wird anstatt nur eine Option zu sein. Ohne metadatenbasierte Herkunft und Rückverfolgbarkeit können KI-gestützte Anwendungen und Erkenntnisse nicht in der Produktion eingesetzt werden.

Künftig kein modernes Datenmanagement ohne KI

Aufgrund der enormen Datenmengen, die für die digitale Transformation benötigt werden, müssen Unternehmen ihre wichtigsten Daten und Metadaten ermitteln und katalogisieren, um Relevanz, Wert und Sicherheit zu zertifizieren und Transparenz zu gewährleisten. Sie müssen diese Daten bereinigen und mastern. Und sie müssen diese Daten effektiv verwalten und schützen. Deshalb spielen KI und ML eine ebenso wichtige Rolle bei der Skalierung von  Datenverwaltungspraktiken.

Wenn Daten nicht effektiv und skalierbar verwaltet werden, werden KI/ML-Modelle dasselbe Schicksal erleiden wie viele herkömmliche Data-Warehousing-Initiativen in den letzten 30 Jahren: Werden Daten von schlechter Qualität verwendet, kann den Ergebnissen nicht vertraut werden. Hier kommen KI und ML für das Datenmanagement ins Spiel, und deshalb hat Informatica seine Innovationsinvestitionen so stark auf die CLAIRE-Engine konzentriert, die metadatengesteuerte KI-Fähigkeit von Informatica. CLAIRE nutzt alle Metadaten des Unternehmens zur Automatisierung und Skalierung der routinemäßigen Datenverwaltungs- und Stewardship-Aufgaben.

Besuchen Sie Informatica und Capgemini auf der Informatica World Tour Germany am 8. Oktober in Frankfurt und erfahren Sie in der Keynote von Informatica CEO Anil Chakravarthy mehr darüber, wie KI auch Ihrem Unternehmen hilft, die datengesteuerte digitale Transformation zu beschleunigen. Treffen Sie die Experten von Capgemini und Informatica persönlich vor Ort.

Weitere Posts

Artificial Intelligence

Fachartikel OBJEKTspektrum: Testen von und mit Künstlicher Intelligenz

Rik Marselis
Date icon Mai 8, 2020

Die neuen Möglichkeiten, die intelligente Maschinen wie Roboter, Chatbots, aber auch digitale...

Agile

VUCA: Ist wirklich alles kaum vorherseh- und planbar?

Dr. Eldar Sultanow
Date icon April 10, 2020

Agile Organisationen sollen dank ihrer Agilität besser und schneller auf Unvorhergesehenes...