Zum Inhalt gehen

Value from Data: Automobil-Hersteller schöpfen das Potential ihrer Fahrzeugdaten nicht aus! – Wie kann ein Datenkatalog helfen?

Dr. Katja Tiefenbacher
25. Mai 2020
capgemini-invent
ide-value-capgemini-invent

Capgemini Invent adressiert die CxO Daten-Strategie und unterstützt seine Kunden bei der datengetriebenen Wertschöpfung.

Mit unseren Offerings rund um #valuefromdata zeigen wir Ihnen, wie Sie Ihre Daten so managen, dass Sie deren volles Potential ausschöpfen. So maximieren Sie den Wert, den Sie mit Ihren Daten generieren.

Skalierung von KI – Die harte Wahrheit

Künstliche Intelligenz (KI) ist allgegenwärtig und greift auch im Automotive-Sektor um sich, so dass Google, Apple, Facebook & Co. mittlerweile argwöhnisch beäugt werden. Die Befürchtung: Mittelfristig wird die Durchführung von KI-Use Cases in die Hände der Technologie-Konzerne fallen. Viele internationale Automobil-Hersteller haben dies erkannt und ihre Daten zu einem strategischen und integralen Bestandteil des eigenen Geschäftsmodells erklärt. Dies ist nicht überraschend, wenn man bedenkt, dass Automobil-Hersteller ihr operatives Ergebnis durch den Einsatz von KI um bis zu 16% steigern können1.

Speziell bei Fahrzeugdaten haben viele Automobil-Hersteller jedoch Schwierigkeiten, KI-Use Cases auf breiter Ebene zu implementieren. Neben datenschutzrechtlichen Schwierigkeiten, sowie der Herausforderung die Daten aus dem Fahrzeug zu extrahieren, wird dies vor allem durch einen Mangel an Transparenz über die verfügbaren Daten verursacht, der ihre effiziente Nutzung behindert. Konkret nennen 38% der befragten Unternehmen die Integration zwischen bestehenden Systemen und Tools als wichtigste technologische Herausforderung, gleichzeitig wird die Auswahl geeigneter Use Cases für die Umsetzung von 43% der Unternehmen als organisatorische Hürde genannt1.

Bei unseren Kunden im Automotive-Sektor haben wir die Erfahrung gemacht, dass insbesondere die Rollen innerhalb einer Organisation bei der Umsetzung von KI-Use Cases durch diese Situation behindert werden. Dem fachlichen Use Case Owner, der die Use Cases treibt, fehlt oftmals die Transparenz über die Verfügbarkeit von Fahrzeugdaten und zugeordnete Verantwortlichkeiten, um zunächst einmal die Durchführbarkeit möglicher Use Cases beurteilen zu können. Der Data Scientist hat Schwierigkeiten Fragestellungen rund um die Nutzbarmachung der Daten, wie „Was bedeuten die Daten im Einzelnen?“ oder „In welcher Frequenz wird das Signal auf dem Steuergerät erhoben?“, zu beantworten2. Und dem Data Steward fehlt die Möglichkeit die Generierung und Nutzung von Fahrzeugdaten aktiv zu verwalten und dabei auch die Datenqualität zu verbessern3.

Lösung – Der Datenkatalog

Die Einführung eines Datenkatalogs begegnet diesen Herausforderungen. Ein Datenkatalog speichert alle relevanten Daten über verfügbare Daten (d.h. Metadaten), um geeignete Daten schnell und einfach aufspüren zu können und die Implementierung von KI-Use Cases zu ermöglichen. Dies umfasst neben technischen Informationen, wie Feldlänge, Datentyp etc., vor allem auch die fachliche Bedeutung der Daten, Verantwortlichkeiten in Bezug auf die Datenhoheit, sowie speichernde  Systeme und zugehörige Datenflüsse innerhalb einer Organisation. Damit liefert der Datenkatalog einen systemübergreifenden Überblick über verfügbare Daten im Unternehmen und bildet die Brücke zwischen technischer Speicherung der Daten und ihrer geschäftlichen Relevanz.

datenkatalog-capgemini-invent
Abbildung 1: Datenkatalog Capgemini Invent

Drei Hauptmerkmale eines Datenkatalogs unterstützen die Akteure dabei, geeignete Fahrzeugdaten zu finden und darauf zuzugreifen.

Hauptmerkmale eines Datenkatalogs – Transparenz

Insbesondere der Use Case Owner und der Data Scientist befassen sich mit dem Aspekt der Datennutzung. Das Business Glossar des Datenkatalogs spielt für sie eine wichtige Rolle, um Antworten auf ihre Fragen zu bekommen. Im Gegensatz zu einem Data Dictionary, welches die technischen Metadaten speichert, bildet das Business Glossar vielmehr ein Rahmenwerk für ein gemeinsames Vokabular. Damit die Fahrzeugdaten aussagekräftig sind, können im Business Glossar deren fachliche Bedeutung, ihre Einordnung im Fahrzeug (Steuergerät, etc.) und Gültigkeit dokumentiert werden.

Darüber hinaus können die Beziehungen zwischen technischen und fachlichen Metadaten sowie die Data Lineage von den Quellsystemen zu den Zielsystemen (innerhalb und außerhalb des Fahrzeugs) in einem Datenkatalog visualisiert werden. Dies ermöglicht einen einfachen Zugang zu Informationen wie „Welche Fahrzeugdaten stammen ursprünglich von welchem Steuergerät?“, „Welche Verbindungen bestehen zu anderen Daten?“ oder „Wurden die Daten manipuliert?“.

Für einen unserer Kunden, einen internationalen Automobil-Hersteller, haben wir einen Datenkatalog eingeführt, welcher Informationen über Signale und Aktuatoren der verschiedenen Steuergeräte, Fahrzeugdaten-haltende Systeme und Datenflüsse abbildet. Verfügbare Fahrzeugdaten werden hier im Datenkatalog, mit fachlichen und technischen Informationen angereichert, transparent gemacht und können für die Entwicklung von Kundenfunktionen (z.B.: Analysen des eigenen Fahrverhalten, etc.) genutzt werden. Auch der Freigabeprozess bei der Lizenzierung von Daten an dritte Parteien (z.B.: Signale von Steuergeräten an Zulieferer für eine verbesserte Produktenwicklung) wird im Datenkatalog abgebildet. Insbesondere fachliche Nutzer profitieren, da sie ohne technisches Vorwissen die zur Verfügung stehenden Fahrzeugdaten erkunden können.

Hauptmerkmale eines Datenkatalogs – Zusammenarbeit

Ein Datenkatalog unterstützt auch die Zusammenarbeit zwischen verschiedenen Rollen bei der Pflege und Nutzung von Datenbeständen. Solche Funktionen sind für alle Rollen relevant, die an der Umsetzung von KI-Use Cases beteiligt sind.

Die Bündelung logisch verbundener Daten, ungeachtet ihrer Quellsysteme, zur Virtualisierung auf Metaebene ist ein leistungsstarkes Werkzeug innerhalb eines Datenkatalogs. Da KI-Use Cases in der Regel logisch gruppierte Daten erfordern, spart dies insbesondere den Data Scientisten Zeit und gibt ihnen möglicherweise Hinweise auf Daten, die sie sonst nicht gefunden hätten. Zugang zu diesen Daten können sie direkt im Datenkatalog beantragen, der über ein Access Management die Anträge, Genehmigungen und deren Dokumentation Compliance-gerecht bearbeitet. Alle betroffenen Data Stewards werden automatisch benachrichtigt und können die Genehmigungen erteilen.

Für die Umsetzung der verschiedenen Use Cases haben die Data Scientisten des internationalen Automobil-Herstellers, nachdem sie sich über die verfügbaren Daten informiert haben, die Möglichkeit sich die relevanten Daten selbst zusammenzustellen und Zugriff darauf zu beantragen. Zum Beispiel konnten sich die Data Scientisten für die Entwicklung von Kundenfunktionen die benötigten Signale verschiedener Steuergeräte zusammenstellen. Der Freigabeprozess, in Abstimmung mit den beteiligten Data Stewards, ist transparent im Datenkatalog abgebildet, bis hin zur Freigabe der tatsächlichen Daten.

Hauptmerkmale eines Datenkatalogs – Pflege

Schließlich vereinfacht ein Datenkatalog den Import und die Pflege von Metadaten und unterstützt die entsprechenden Rollen bei der Katalogisierung, Anreicherung und Qualitätssicherung der Daten. Die Funktionen sind besonders für den Data Steward relevant, der mithilfe des Datenkatalogs die verfügbaren Daten aktiv verwalten kann.

Die Pflege von Datenbeständen ist von entscheidender Bedeutung für den Automotive-Sektor, um datenbasierte Geschäftsmodelle zu ermöglichen. Ein wichtiger Erfolgsfaktor dabei ist die Befähigung der Data Stewards. Ein Datenkatalog ermöglicht es den Data Stewards, Datenregeln proaktiv zu verwalten, die Qualität der Daten zu überwachen und organisationsspezifische Arbeitsabläufe mit anderen Beteiligten zu etablieren, die sowohl die Pflege als auch die Anreicherung von Metadaten gewährleisten.

Die Einführung eines Datenkatalogs bei einem internationalen Automobil-Hersteller hat an vielen Stellen im Unternehmen Diskussionen in Gang gesetzt, da verbesserungswürdige Pflegeprozesse transparent wurden und Zuständigkeiten klar zu benennen waren. Bespielsweise wurde in verschiedenen Bereichen die mangelhafte Verfügbarkeit von Verantwortlichkeiten für die Qualität und Verwendbarkeit der Daten adressiert. Im Ergebnis wurden die Data Stewards in die Lage versetzt, die Generierung und Nutzung ihrer Daten aktiv zu verwalten, indem der Datenkatalog das Zugriffsmanagement für alle Daten, für die sie verantwortlich sind, bündelt.

Einführung eines Datenkatalogs

Für die Etablierung eines Datenkatalogs zu den drei Aspekten empfiehlt sich ein Use Case-getriebener und agiler Ansatz in vier Phasen.

phasen-zur-einführung-eines-datenkatalogs-capgemini-invent
Abbildung 2: Phasen zur Einführung eines Datenkatalogs

Phase 1 grenzt die Datenkatalog-Initiative auf erste mögliche Use Cases ein. In der anschließenden Phase 2 werden die Use Cases priorisiert und für einen Proof of Concept (PoC) vorbereitet. Anschließend wird der PoC in Phase 3 mit ausgewählten Use Cases in einem Tool durchgeführt und parallel wird bereits die notwendige Governance rund um den Datenkatalog etabliert. Schließlich wird der Datenkatalog in einem kontinuierlichen Prozess durch die schrittweise Umsetzung zusätzlicher Use Cases in der Organisation skaliert.

Insgesamt haben von der Etablierung des Datenkatalogs bereits bei einer begrenzten Anzahl von Use Cases alle Rollen des internationalen Automobil-Herstellers profitiert. Die Use Case Owner konnten mehr Kundenfunktionen entwickeln, mehr Daten konnten an dritte Parteien monetarisiert und Behördenanfragen schneller beantwortet werden. Gleichzeitig hatten die Data Scientisten einen schnelleren und zielgerichteteren Zugang zu besseren Daten, während die Data Stewards die Daten effektiver managen und die Datenqualität verbessern konnten. Die Erwartung ist, dass die Vorteile, mit steigender Anzahl von KI-Use Cases, enorm steigen4.

Aufgrund unserer praktischen Erfahrung mit Datenkatalogen bei Kunden aus dem Automotive-Sektor kann Capgemini Invent die Etablierung eines Datenkatalogs von der Status-Quo-Analyse bis zur Skalierung der Lösungen unterstützen. Wenn Sie das Potenzial eines Datenkatalogs für Ihr Unternehmen besprechen möchten oder an einer Vorstellung unseres Lösungsportfolios interessiert sind, wenden Sie sich bitte an Dr. Katja Tiefenbacher.

Vielen Dank an den Co-Autoren Paul Schmidt.

Mehr Informationen zur Capgemini Invent’s Services aus dem Bereich Insights Driven Enterprise finden Sie hier.

1 Capgemini Research Institute, „Accelerating automotive’s AI transformation: How driving AI enterprise-wide can turbo-charge organizational value“, 2019

2 https://www.capgemini.com/de-de/2018/12/data-science-journey-data-management/

3 https://www.capgemini.com/de-de/2018/05/operating-models-in-a-digital-world-folge-8-information-data-management/

4 Quantifizierung des Geschäftswerts der Collibra Data Governance and Catalog Platform, IDC White Paper (2018)

Blog-Updates per Mail?

Abonnieren Sie unseren Newsletter und erhalten Sie alle zwei Monate eine Auswahl der besten Blogartikel.

Autorin

Dr. Katja Tiefenbacher

Senior Director | Head of Data Strategy & AI Operating Models, Capgemini Invent
Dr. Katja Tiefenbacher ist Direktorin bei Capgemini Invent und Leiterin des Teams Data Strategy und AI Operating Models. Seit über 13 Jahren berät sie Kunden branchenübergreifend in den Sektoren Automotive, Public, Retail und Financial Services. Zu ihren Themenschwerpunkten zählen die Erarbeitung von Datenstrategien von der Definition bis zur Umsetzung, das Design von Informationsarchitekturen sowie die Etablierung von Data-Governance-Strukturen und Analytics-Betriebsmodellen.

    Weitere Blogposts

    Daten & Künstliche Intelligenz

    Künstliche Intelligenz und Finanzkriminalität – Teil 1

    Crispijn Groeneveld
    16. Jan. 2024
    Daten & Künstliche Intelligenz

    Netzwerke bilden, Wissen teilen: Das Kundenforum Architektur in der Allianz Arena

    Dr. Eldar Sultanow
    19. Dez. 2023