Beruf Data Engineer: Die Datenflut lenken

Data Engineers bereiten den Erfolg des ganzen Teams vor. Christian Janz erklärt, wie er die tägliche Datenflut sinnvoll ordnet, damit die Kolleg*innen mit ihr arbeiten können.

Oft sind sie die ersten, die in unübersichtlichen Datenmengen Muster, Logik und Ordnung erkennen. Christian Janz, seit 2014 bei Capgemini als Data Engineer und Data Architect, ist seit seiner Schulzeit von den Daten fasziniert, die sich hinter jeder Software verbergen. Im Interview erzählt er von erfüllenden Aufgaben und dem inspirierenden Umfeld, das Bewerber*innen bei Capgemini finden.

Data Engineering: Perfekter Start ins Berufsleben

Christian, wie bist du Data Engineer geworden?

Ich habe 2004 meine Ausbildung zum Fachinformatiker abgeschlossen und bin dann zum Studium an die FH Dortmund gegangen. Ich habe mich dort schon für Schnittstellen und Datenanalysen auf der technischen Ebene interessiert – den Kernbereich des Data Engineering. Für meinen Abschluss bin ich dieser Faszination weiter gefolgt und habe zum Thema Open Source ETL (Extract, Transform, Load) Tools gearbeitet, für das sogenannte Data Warehousing.

Wie sah dein Berufseinstieg aus?

Angefangen habe ich als Tester im Bereich Data Engineering. Anschließend bin ich als Data Engineer in eine mittelständische Unternehmensberatung eingestiegen. Dort waren meine Aufgaben allerdings sehr breit definiert, obwohl ich mich eigentlich auf reines Data Engineering fokussieren wollte. Deshalb bin ich zu Capgemini gekommen. Hier konzentriere ich mich auf meine Hauptinteressen.

Und wie hast du dein Profil bei Capgemini entwickelt?

Ich bin zunächst als Software Engineer Lead eingestiegen. Nach drei Jahren leitete ich mein erstes kleines Team, habe Junior Berater in Data Engineering ausgebildet und Qualitätssicherungsaufgaben übernommen. Seit neustem bin ich als Enterprise Architect u.a. in KI-Projekten tätig, die einen hohen Data Engineering-Anteil haben.

Als Data Engineer Aufgaben bewältigen – natürlich mit den richtigen Data Engineering Tools

Erzähl uns bitte mehr über die Herausforderungen des Data Engineerings.

Wir Data Engineers strukturieren und filtern die Daten, die in einem Projekt zur Verfügung stehen. Unser oberstes Ziel ist die Bereitstellung relevanter Daten für nachgelagerte Prozesse: Wir liefern unseren Kolleg*innen die Daten, die für die jeweiligen Projektziele erfolgsentscheidend sind. Wir prüfen, ob die Qualität, Mengengerüste und Bereitstellungsgeschwindigkeit der Daten genügt, damit anschließend damit gearbeitet werden kann.

Was reizt dich an dieser Arbeit?

Wir Data Engineers ermöglichen auf einer ganz grundsätzlichen Ebene, dass Software richtig funktioniert. Hinter jeder Software steckt eine Datenbank. Hinter jeder Software steckt eine Datenquelle. Diese Datenquelle muss für weitere Software verfügbar gemacht werden. Aber wie tauschen sich die betreffenden Softwareprodukte untereinander aus? Data Engineers müssen das wissen. Deshalb habe ich mich ganz auf Data Engineering spezialisiert.

Dabei ist Data Engineering ein sehr breites Feld, nicht wahr?

Richtig, es ist sehr komplex. Aber diese Vielfalt macht den Job spannend. Data Engineers müssen bereit sein, sich in Technologien einzufinden. So habe ich mich zunächst auf eine Produktpalette spezialisiert, etwa den Microsoft SQL Server Stack und die dazugehörigen Tools. Von dieser Basis aus hatte ich dann die Möglichkeit, neue Tools zu entdecken; auszuloten, welche Möglichkeiten es insgesamt gibt.

Welche Data Engineering Tools und Technologien benutzt du in deiner Arbeit?

Am Anfang habe ich in Microsoft SQL Server Stack Daten für Realtime Datawarehouses bereitgestellt. Mittlerweile nutze ich auch die vielen anderen Technologien, die unsere Partner anbieten. Zum Beispiel Informatica Power Center und PIM, verschiedene Oracle-Datenbanken, Programmiersprachen und Künstliche-Intelligenz-Systeme.

Beobachtest du Trends bei den Data Engineering Tools?

Derzeit entwickelt sich alles in Richtung Cloud. Alle unsere Partner – z.B. Microsoft, Informatica, Oracle, Amazon – bieten solche Cloud-Plattformen natürlich an, zusammen mit den passenden Tools. Aber bei einigen Capgemini-Kunden arbeiten wir noch auf den Servern vor Ort. Für mich persönlich sind die wichtigsten technischen Umfelder Microsoft Azure, Oracle Cloud Datenbanken und einige andere Software, die wir einsetzen. Tableau ist zum Beispiel eines von unseren häufig eingesetzten Reporting Tools.

Big Data Engineer in einem tollen Team

Wie würdest du die Atmosphäre bei Capgemini beschreiben?

Bei Capgemini arbeite ich mit tollen Kolleg*innen zusammen. Sie wissen immer genau, was sie tun. Das spornt mich enorm an. Andererseits habe ich hier das Gefühl, dass meine Fähigkeiten gebraucht werden. Egal, ob es um winzige Datenbanken oder das sprichwörtliche Big Data geht: Mein Beitrag wird immer wertgeschätzt.

Würdest du das Arbeitsumfeld auch als divers bezeichnen?

Wir haben tatsächlich einen relativ hohen Frauenanteil im Team, derzeit etwa ein Viertel der Kolleg*innen. Außerdem sind verschiedene Nationalitäten vertreten – aus Neuseeland und USA zum Beispiel – wobei wir trotzdem sehr gut auf Deutsch kommunizieren. Bei Capgemini ist es häufig so, dass wir Menschen aus der ganzen Welt zusammenbringen. Die Zusammensetzung der Teams ist von Projekt zu Projekt aber unterschiedlich, ich habe auch schon mit Spezialist*innen aus Tunesien und der Türkei gearbeitet.

Wie sind eure Teams zusammengesetzt?

Neuerdings bereite ich als Data Engineer Daten für unsere Spezialist*innen aus dem Bereich Künstliche Intelligenz (KI) vor. Hier haben wir Projektleiter*innen mit direktem Kundenkontakt. Dann sind da unsere Scrum Master, die Teamprozesse steuern. Als Data Engineer und Architect bin ich mit einem Kollegen zusammen Ansprechpartner für alle Datenbank-Fragen, die unsere Kunden stellen. Die Umsetzung übernehmen Programmierer*innen. Sie geben uns auch Rückmeldung, welche Daten noch benötigt werden. Dann gehören noch Tester*innen zum Team, die alle Ergebnisse auf Herz und Nieren prüfen.

Neben den Data Engineers gibt es ja auch noch die Data Architects und Data Scientists – wo genau verlaufen die Grenzen zwischen den verschiedenen Anforderungsprofilen?

Nehmen wir Data Engineers und Data Scientists. Beide analysieren Daten. Die Data Scientists haben aber einen fachlichen Blick. Sie bewerten Inhalte, also die Bedeutung der Daten, mit Hilfe statistischer Methoden. Wir Data Engineers prüfen hingegen die objektiven Eigenschaften der Daten, die ich bereits genannt habe, also Qualität und Menge. Wir stellen außerdem sicher, dass unsere Kolleg*innen auf die benötigten Daten zugreifen können. Dazu müssen wir Datenflüsse und Hardware-Schnittstellen kennen.

Du bist seit kurzem zusätzlich Data Architect. Was hat sich dadurch für dich geändert?

Als Data Architect erstelle ich eine Datenstruktur über mehrere Systeme hinweg, damit die betreffenden Systeme zusammenarbeiten können, beispielsweise SAP mit Microsoft CRM und andere. Ich führe also globale Datenstrukturen ein, ein „Enterprise Data Model“. Dazu arbeite ich häufig im MDM- und Datawarehouse-Umfeld im Insights & Data-Bereich hier bei Capgemini. Außerdem entwerfe ich die ganze Datenhaltung für unsere großen Softwareprojekte.

Get the future you want – als Data Architect

Mit unserem ganzheitlichen Ansatz Insights & Data helfen wir unseren Kunden die richtigen Business-Entscheidungen auf der Basis hochwertiger Datenbestände zu treffen. Dies beinhaltet die Domänen Cloud, Big Data, Analytics, Business Intelligence und Data Management. Bewirb dich jetzt als Entwickler mit Data Mesh, Java(Script) oder Python Skills.

Jetzt bewerben

Einen positiven Beitrag in einem engagierten Unternehmen leisten

Über deine Arbeit im KI-Bereich hast du schon gesprochen. Auf welches andere Projekt bist du stolz?

Ein Kunde aus der Chemie benötigte vor kurzem ein Echtzeit-Reporting über seine Rohstofflieferketten und Bestandsdaten aus den Warenhäusern. Für mich als Data Engineer bestand die Aufgabe darin, weltweite Datenquellen automatisiert zusammenzuführen und die Daten in einer Cloud abzulegen. Wir sprechen von Daten aus 132 Ländern, erhoben und gespeichert in unterschiedlicher Software. Niemand sollte sich mehr darum kümmern müssen, Daten aus Excel in das System zu überführen.

Wie seid ihr dabei vorgegangen?

Dieses Projekt haben wir als Agile Scrum geführt. In kleinen Teams haben wir in vielen Teilschritten ein Global Data Model erstellt, das weltweit alle Daten in Echtzeit erhebt. Darauf basierend haben wir dann extrem hilfreiche Cloud-Anwendungen entwickelt. Wenn der Kunde etwa einen bisherigen Rohstoff ersetzen möchte durch einen lokalen, nachhaltig gewonnenen Rohstoff, so kann die Lieferkette auf Risiken geprüft werden und die Produktionskostenplanung direkt mit optimiert werden. So können Capgemini-Kunden vorab simulieren, wie strategische Entscheidungen die Produktlandschaft beeinflussen, bevor sie an die Umsetzung gehen.

Stehen für dich technische Herausforderungen im Vordergrund oder siehst du in deiner Arbeit auch einen positiven Beitrag für die Zukunft?

Generationengerechtigkeit ist für mich persönlich ein wichtiges Thema. Dazu gehört auch, dass die heutigen Kinder als Erwachsene gute, sichere Arbeitsplätze haben. Bei Capgemini leiste ich insofern meinen Beitrag, dass wir große Unternehmen zukunftssicher aufstellen. Unser Hebel ist die Optimierung, beispielsweise von Lieferstrecken. Dabei geht es nicht nur darum, Produkte schnell von der Fertigung bis zu den richtigen Endkund*innen zu bringen. Wir gestalten z.B. auch Lieferwege neu, damit die Umwelt möglichst wenig belastet wird.

Engagierst du dich noch auf andere Weise?

Ich will die Zukunftsperspektive von Nachwuchsfachkräften in der IT positiv beeinflussen, deshalb engagiere ich mich für die Studierenden der FH Dortmund, wo ich selbst studiert habe. Ich nehme am Stammtisch und an Spieleabenden der Fachschaft teil und halte so Kontakt zu den Studierenden. Computerspiele und Gaming bieten sich hervorragend an, um IT-Denken und -Arbeitsweisen zu vermitteln. Deshalb bin ich auch in einer Community namens „Minecraft 4 Scrum“ aktiv. Im Rahmen von Capgemini expedITion Workshops können Studierende über mehrere Runden eine Stadt zusammen aufbauen und lernen dabei, Teams zu organisieren und kleine Aufgaben agil zu koordinieren, bis die Stadt am Ende steht.

Welche Entwicklungsperspektiven finden Data Engineers bei Capgemini?

Bei Capgemini werden alle Mitarbeitenden vom Start weg von einer oder einem People Development Lead (PDL) begleitet. Das sind Vorgesetzte, die den Mitarbeitenden dabei helfen, sich ständig fortzubilden. Vor allem unterstützen PDLs dabei, Fortbildungen zu finden, die zu den eigenen Tätigkeiten passen und Spielräume eröffnen, sich persönlich zu entfalten. Bei Capgemini gibt es immer wieder Gelegenheiten, sich in überraschende Richtungen zu entwickeln.

Wie ist das Fortbildungsprogramm für Data Engineers aufgebaut?

Bei uns gibt es drei Säulen der Wissensvermittlung. Als erstes ist da unsere firmeninterne Capgemini University, wo die individuellen Fähigkeiten der Kolleg*innen entwickelt und die Vernetzung über sogenannte Global Campus Events gefördert wird. Darüber hinaus dürfen die Kolleginnen und Kollegen die besten externen Angebote unserer Partner in Anspruch nehmen: Microsoft, Informatica, Oracle und viele mehr, wo sie exzellente Trainings erwarten. Capgemini wiederum gibt auch selbst Kurse und Schulungen bei Kunden. Wir sind nicht nur ein führender IT-Dienstleister, sondern auch Wissensvermittler.

**Seid neugierig: Tipps für Data Engineer Bewerber*innen**

**Was sagst du Capgemini-Interessent*innen, die dich fragen, ob Data Engineer ein erfüllender Beruf ist?**

Ich antworte ihnen: Alle Fragen des zukünftigen Setups von Maschinen und Geräten hängen maßgeblich von der Vorarbeit der Data Engineers ab. Wollen wir, dass unsere Kaffeemaschinen in Zukunft mit dem Kühlschrank kommunizieren? Dann brauchen wir Data Engineers. Sie sind es, die die Schnittstellen zwischen Kühlschrank, Kaffeemaschine, aber zum Beispiel auch Alexa oder anderen Smart Devices kennen, mit denen wir heute zu tun haben.

Du sagst ihnen im Prinzip, dass ihr Beitrag unentbehrlich ist?

Data Engineering ist meiner Meinung nach die spannendste Komponente eines jeden Projekts. Wir sehen Daten, die sonst kein anderer Mensch je zu Gesicht bekommt. Zusammenhänge, Auffälligkeiten – Data Engineers sind die ersten, denen sich neue Muster offenbaren. Darüber hinaus geben Data Engineers ihren Projekten die Richtung. Weil wir die Daten bereitstellen, hat unsere Stimme Gewicht im Entscheidungsprozess, wie mit diesen Daten weiter verfahren wird.

**Dann gib uns doch bitte noch einen handfesten Tipp für Bewerber*innen.**

Ich kann Bewerber*innen eigentlich nur eins mitgeben: Seid neugierig auf Datenstrukturen, Datenzusammensetzungen und die Kommunikation zwischen IT-Geräten und Software. Wer eine Affinität für dieses Themenspektrum hat, ist bei uns absolut richtig. Mit diesen Menschen wollen wir ins Gespräch kommen.

Bewirb dich jetzt!

Du bist fasziniert von Daten und willst in wegweisenden Projekten die Weichen stellen? Verstärke unser Capgemini-Team im Bereich Data Engineering. Bewirb dich jetzt als Data Architect DataBricks (w/m/d) oder Data IT Architect (w/m/d). Oder wirf einen Blick auf die vielen weiteren offenen Stellen in unserem Jobportal.

Jobportal

Data Architect DataBricks (w/m/d)

IT-Architect Defense (w/m/d)

Verstehen, wie alles zusammenhängt: Data Engineer bei Capgemini