Data Lake Governance: Geregelte Flexibilität

Publish date:

Der Data Lake bildet die Basis jeder professionellen Big-Data-Strategie. Aber vier wichtige Schritte trennen den Plan oft von der Praxis. Der dritte heißt Governance und ist essentiell, um eine stabile Plattform zu etablieren.

RSS-Feed abonnieren

Ähnlich dem Schritt Anwendungsdesign kommt auch bei der Governance dem Architecture Boardine tragende Rolle zu: Für Flexibilität sorgen und gleichzeitig so viel Stabilität schaffen, dass diverse Applikationen parallel laufen können. Oft ist das ein Drahtseilakt, weil die Vielzahl an Tools und ihre Nutzung eine große Menge an Stellschrauben bietet.

Stellen sie sich nun also vor, sie sind für die Data-Lake-Plattform verantwortlich und bekommen eine solche Anfrage aus dem Fachbereich:

Wie gehen Sie damit um? Was sich hier liest wie ausgedacht, ist in Wahrheit eine ganz gewöhnliche Anfrage. Häufig haben gerade die Fachbereiche bereits ein gewisses Bild von den Fähigkeiten des Data Lakes im Kopf, das stark durch die Marketingabteilungen geprägt ist. „Geht alles“ und „ganz einfach“ werfen Marketers hier gerne durch den Raum. Das ist zwar nicht ganz falsch, aber eben auch nicht ganz richtig. Denn obgleich sich ein ganzer Schwarm an verschiedenen Tools im Data Lake befindet, die einen extrem großen Bereich an Anwendungsfällen abdecken, möchten diese richtig genutzt werden. Und nicht immer sind auch automatisch alle der möglichen Tools auf der Platform aktiviert. Daher muss die Nutzung bzw. Aktivierung der Tools durch einen Change- und Governance-Prozess abgesichert werden.

Dieser Governance-Prozess eines Data Lakes besteht im Wesentlichen aus zwei Teilen:

  • Der Governance-Prozess der Data Lake-Plattform und
  • Der Governance-Prozess der fachlichen Applikationen auf dem Data Lake

Der Governance-Prozess der Data Lake-Plattform muss dafür sorgen, dass Veränderungen auf der Plattform geordnet ablaufen. Zu diesen gehören:

  • Updates auf der Plattform
  • Neue Features
  • Neue Komponenten
  • Geänderte Konfiguration

Für den Release-&-Change-Prozess ist vornehmlich das Architecture Board verantwortlich. Es sorgt dafür, dass auf der produktiven Umgebung nur die Komponenten und Konfigurationen freigegeben werden, die auch vorher auf entsprechenden Test-Umgebungen ausgiebig geprüft wurden. Schließlich setzen die fachlichen Applikationen eine stabile und funktionierende Umgebung voraus. Ein Teil des Governance-Prozesses ist das Befüllen des Sees mit Daten nach den Vorgaben der DSGVO. Was für Daten habe ich, woher kommen diese und wohin fließen sie? Diese Fragen müssen Sie sich immer stellen. Ganz wichtig in dem Zusammenhang: Welche der Daten sind personenbezogen und für zu welchen Zweck befinden sie sich überhaupt im Data Lake? Diese Fragen müssen Sie immer beantworten können.

Die Governance der fachlichen Anwendungen regelt das Architecture Board über den Approval-Prozess. Nur den Regeln des Data Lakes entsprechende Applikationen dürfen mit auf die Plattform. Diese Regeln müssen natürlich bekannt sein. Die Plattform-Architekten sollten die Architekten der fachlichen Applikationen durch Reviews, Empfehlungen und Tipps dabei unterstützen. Je nach Menge der fachlichen Applikationen, die entweder neu auf die Plattform kommen sollen oder einen wichtigen Meilenstein-Release haben, bei dem signifikante neue Funktionalitäten dazukommen, können solche Reviews häufiger oder seltener stattfinden. Für so ein Review sollen sich die fachlichen Applikationen bewerben und die notwendigen Informationen wie Skalierungsinformationen oder Architektur-Entscheidungen (inkl. notwendiger Architekturgrafiken) liefern. Dann entscheidet das Architecture Board über die Freigabe auf die produktive Plattform.

Das Architecture Board spielt also eine zentrale Rolle im Governance-Prozess des Data Lakes. Es regelt alle Change- und Approval-Prozesse an der Plattform und für die fachlichen Applikationen. Das verknüpft die notwendige Flexibilität für fachliche Anforderungen mit der Stabilität einer Multi-Projektplattform für Big-Data-Anwendungen. Es ist also essentiell, ein solches Architecture Board und zu etablieren und die dazugehörigen Governance-Prozesse zu definieren. Hat man dieses geschafft, steht einer erfolgreichen Nutzung der Data Lake-Plattform nichts mehr im Wege.

Details und strategische Tipps zum Thema Data Lake Governance gebe ich heute bei meinem Vortrag auf der TDWI Konferenz um 15.30 Uhr – einfach vorbeikommen!

Lesen Sie auch alle anderen meiner Artikel aus der Reihe Business Data Lake hinter diesem Link.

Weitere Posts

Artificial Intelligence

Befangene künstliche Intelligenz: Warum auch Bots in Schubladen denken

Reinoud Kaasschieter
Juli 13, 2018
KI-Systeme sind nicht per se analytisch und neutral. Sie denken und bewerten in denselben Schubladen, wie die Menschen, die sie schaffen – mit Konsequenzen.
Digital Transformation

Transformation braucht Innovation: Wo mitspielen, wie gewinnen?

Thomas Heimann
Juli 6, 2018
Wer sich nicht bewegt, der wird bewegt und zwar nach unten. Laut Gartner wird jedes vierte Unternehmen seine aktuelle Marktposition verlieren, weil digitale Kompetenzen fehlen.
IT-Trends

Logistik: Weniger Bauchgefühl, mehr Intelligenz

Stefan Sack
Juni 22, 2018
Die Logistikbranche erfindet sich gerade neu: neue digitale Geschäftsmodelle, neue Plattformen, neue Wettbewerber, dazu schwankende Preise. Robotic Process Automation und KI helfen in dieser volatilen Zeit, bis zu 35 Prozent effizienter zu werden.
cookies.

Mit dem Fortsetzen des Besuchs dieser Website akzeptieren Sie die Verwendung von Cookies.

Für mehr Informationen und zur Änderungen der Cookie-Einstellungen auf Ihrem Computer, lesen Sie bitte Privacy Policy.

Schließen

Cookie Information schließen