Zum Inhalt gehen
VI 2
Zukunftsweisende Projekte

Catching the AI bug

Identifizierung von Insekten durch KI-gesteuerte Audioanalyse

Die Gewinner der Global Data Science Challenge 2023 berichten über ihre Erfahrungen mit dem Wettbewerb, bei dem es um die Entwicklung eines KI-gesteuerten Modells zur Identifizierung von Insektengeräuschen ging.

Du stehst mitten in einem Wald. Schließen Sie die Augen: Was hören Sie? Blätter rascheln im Wind, Vogelgezwitscher… das Zirpen winziger Flügel, die mit unvorstellbarer Geschwindigkeit vibrieren. Es könnte der Herzschlag der Natur selbst sein.

Diese winzigen Musiker – Insekten – könnten der Schlüssel zum Schutz unserer Natur sein, sagt Lucas Unterberger, Data Engineer im Insights & Data-Team von Capgemini in Österreich.

“Wissenschaftler haben einen Zusammenhang zwischen dem Vorkommen von Insekten an einem bestimmten Ort und der allgemeinen Artenvielfalt in diesem Gebiet festgestellt”, erklärt er. “Es gibt jedoch einfach nicht genügend ausgebildete Entomologen, um Insekten in großem Maßstab in situ zu klassifizieren.”

Könnten künstliche Intelligenz und maschinelles Lernen genutzt werden, um Insektenarten allein anhand ihres Zirpens zuverlässig zu identifizieren?

Der “Biodiversitäts-Buzz”

Diese Frage stand im Mittelpunkt der Global Data Science Challenge (GDSC) von Capgemini für das Jahr 2023, die in Zusammenarbeit mit Forschern des Naturalis Biodiversity Center in Leiden, Niederlande, ins Leben gerufen wurde.

Dominik Lemm, ein ebenfalls in Österreich ansässiger Datenwissenschaftler und Teil des Siegerteams, beschreibt die konkrete Aufgabe: “Die konkurrierenden Teams wurden gebeten, ein Modell zu entwickeln, das Audioaufnahmen von Zikaden- und Heuschrecken-‘Zirpen’ genau in eine von 66 Unterarten einordnen kann. Das Team mit der höchsten Erkennungsrate würde gewinnen.”

Laut Dominik ist dies nur ein kleiner Schritt auf dem Weg zu einem größeren Ziel: den Naturalis-Forschern zu helfen, ein wirtschaftlich tragfähiges System zur Identifizierung verschiedener Insektenarten durch die Analyse von Audiodateien zu entwickeln, die von Mikrofonen in der freien Natur aufgezeichnet wurden.

“Wenn Wissenschaftler mit Hilfe von KI Insektenarten schnell identifizieren können, werden sie in der Lage sein, die Bewertung der biologischen Vielfalt in einem Gebiet zu überwachen, was den globalen Naturschutzbemühungen Auftrieb geben wird”, erklärt er.

Datenwissenschaftler, kommt zusammen!

Der GDSC stieß erneut auf großes Interesse bei Capgemini-Kollegen aus aller Welt. Lucas, der schon früher teilgenommen hatte, sagt, dass die Zahl der Teilnehmer von einigen Hundert auf mehr als Tausend gestiegen ist. “Bei so viel internationaler Konkurrenz ist es unglaublich schwer, zu gewinnen. Aber es ist die perfekte Gelegenheit, neue Fähigkeiten und Technologien zu erlernen”, sagt er.

Als die diesjährige Veranstaltung angekündigt wurde, stellte er rasch ein “Dreamteam” zusammen, zu dem neben Dominik auch Raffaela Heily, eine Mathematikerin und Datenwissenschaftlerin, und Lukas Kemetinger gehörten, der als studentischer Berater mit Schwerpunkt KI teilnahm.

Dominik, der aus der Forschung im Bereich des maschinellen Lernens kommt, wurde fast sofort nach seinem Eintritt in das Unternehmen rekrutiert. “Es könnte mein erster Tag gewesen sein, als Lukas mich fragte, ob ich etwas über Audio-Maschinenlernen wüsste. Ich war fasziniert von der Herausforderung und wollte mich sofort in das Thema einarbeiten.”

Mit Lucas als Projektleiter – eine neue Erfahrung für ihn – teilte das Team schnell die Verantwortlichkeiten unter sich auf und konzentrierte sich auf ihre jeweiligen Spezialgebiete, und es wurden wöchentliche Treffen angesetzt, um Ideen und Fortschritte zu besprechen.

Ein Erfolgsrezept

“Das Naturalis-Team hatte den Datensatz für uns vorbereitet”, sagt Dominik. “Aber es lag an uns, den besten Weg zu finden, ihn zu verarbeiten. Im Rahmen der Regeln konnten wir Ressourcen von Amazon Web Services (AWS) im Wert von bis zu 100 Dollar pro Woche in Anspruch nehmen, um unsere Modelle zu verfeinern.”

Die Strategie des Teams, so schnell wie möglich einen Prototyp zu entwickeln, schien sich auszuzahlen. “Nachdem Lucas die Idee der Insektengeräusche erwähnt hatte, begann ich, mich in der Literatur zu informieren und über mögliche Ansätze nachzudenken”, sagt er. “Nach der zweiten oder dritten Woche hatten wir ein Modell, das recht gut funktionierte, so dass wir Zeit für die Feinabstimmung hatten.”

Die Tatsache, dass sie alle im Wiener Büro arbeiteten, verschaffte ihnen ebenfalls einen Vorteil. “Wir kommunizierten und harmonierten sehr gut”, bestätigt Lukas. “Wir haben zum Beispiel Freitagabends bei einem Bier über das Projekt diskutiert. Wir hatten ein tolles Verhältnis und einen tollen Teamgeist.”

Positive KI

Während ihre Lösung derzeit auf die Identifizierung von Zikaden und Heuschrecken beschränkt ist, könnte sie eines Tages auf die Identifizierung fast aller Insekten- oder Tiergeräusche erweitert werden. “Als Teil des Preises planen wir eine Reise in die Niederlande, um die Naturalis-Wissenschaftler zu treffen und zu besprechen, wie wir unser Modell auf die nächste Stufe bringen können”, sagt Lucas.

Und genau darum geht es beim GDSC: die Kluft zwischen wissenschaftlicher Forschung und Industrie zu überbrücken und die klügsten Köpfe der Datenwissenschaft auf der ganzen Welt auf ein einziges soziales oder ökologisches Problem zu konzentrieren. “Es ist eine wunderbare Möglichkeit, Innovationen im Bereich der Nachhaltigkeit voranzutreiben, und eine klare Demonstration der Vorteile, die das maschinelle Lernen bei der Bewältigung von Biodiversitätsproblemen bringen kann”, sagt Lucas. “Angesichts der vielen Unsicherheiten im Zusammenhang mit KI ist es großartig zu zeigen, wie diese Technologie eine bessere Zukunft gestalten könnte – für die Menschen und den Planeten.”

Inside Stories

DATA AND ARTIFICIAL INTELLIGENCE

Activate data. Augment intelligence. Amplify outcomes.