Saltar al contenido
VI 2

Descubriendo insectos gracias a la IA

Identificación de insectos mediante análisis de audio impulsado por IA

Los ganadores del Global Data Science Challenge 2023 comparten el proyecto ganador, que implicó el desarrollo de un modelo impulsado por inteligencia artificial para identificar sonidos de insectos.

Estás parado en medio de un bosque. Cierra los ojos: ¿qué oyes? Hojas susurrando con el viento, cantos de pájaros… el chirrido de diminutas alas vibrando a velocidades imposibles. Podría ser el latido del corazón de la naturaleza.

Estos diminutos insectos podrían ser la clave para proteger nuestros ecosistemas, afirma Lucas Unterberger, ingeniero de datos del equipo Insights & Data de Capgemini en Austria.

“Los científicos han encontrado un vínculo entre la variedad de insectos presentes en un lugar determinado y el nivel general de biodiversidad de ese espacio”, explica. “Sin embargo, simplemente no hay suficientes entomólogos capacitados para clasificar insectos in situ a gran escala”.

¿Podríamos usar la inteligencia artificial y el aprendizaje automático para identificar de forma fiable especies de insectos únicamente a través de sus zumbidos?

El “zumbido de la biodiversidad”

Esta fue la pregunta del Global Data Science Challenge (GDSC) de Capgemini para 2023, que se lanzó en conjunto con investigadores del Centro de Biodiversidad Naturalis en Leiden, Países Bajos.

Dominik Lemm, científico de datos también de Austria y parte del equipo ganador, describe la tarea específica: “Se pidió a los equipos competidores que diseñaran un modelo que pudiera clasificar con precisión las grabaciones de audio de los ‘chirridos’ de cigarras y saltamontes en uno de 66 subespecie. El equipo con la tasa de identificación más alta sería el ganador”.

Según Dominik, este es sólo un pequeño paso hacia un objetivo más amplio: ayudar a los investigadores de Naturalis a desarrollar un sistema económicamente viable para identificar diferentes tipos de insectos mediante el análisis de archivos de audio grabados por micrófonos colocados en ambientes exteriores.

“Si los científicos pueden identificar especies de insectos rápidamente utilizando IA, podrán monitorear la calificación de biodiversidad de un área, dando un impulso a los esfuerzos de conservación global”, explica.

¡Científicos de datos, reúnanse!

Una vez más, el GDSC fue muy bien acogido por parte de los colegas de Capgemini de todo el mundo. Lucas, que ya había participado anteriormente, dice que el número de participantes se disparó de unos pocos cientos a más de mil. “Con tanta competencia internacional, es increíblemente difícil ganar. Pero es la oportunidad perfecta para aprender nuevas habilidades y tecnologías”, afirma.

Cuando se anunció el evento de este año, rápidamente reunió un “equipo de ensueño”, que, además de Dominik, incluía a Raffaela Heily, matemática y científica de datos, y Lukas Kemetinger, quien participó como estudiante consultor con un enfoque en IA.

Dominik, con experiencia en investigación de aprendizaje automático, se sumó al resto casi al mismo tiempo de unirse a la empresa. “Quizás fue mi primer día de trabajo cuando Lucas me preguntó si sabía algo sobre el aprendizaje automático de audio. Me fascinó el desafío y tenía muchas ganas de trabajar directamente en el tema”.

Con Lucas como director de proyecto (una experiencia nueva para él), el equipo rápidamente dividió las responsabilidades, centrándose en sus especialidades, y programó reuniones semanales para discutir ideas y avances.

Una fórmula ganadora

“El equipo de Naturalis nos preparó el conjunto de datos”, afirma Dominik. “Pero dependía de nosotros encontrar la mejor manera de procesarlos. Según las reglas, pudimos recurrir a recursos de Amazon Web Services (AWS), por un valor de hasta 100 dólares por semana, para perfeccionar nuestros modelos”.

La estrategia del equipo de crear un prototipo lo más rápido posible pareció dar sus frutos. “Después de que Lucas mencionara la idea de los zumbidos de los insectos, comencé a leer sobre ello y a considerar posibles enfoques”, dice. “Después de la segunda o tercera semana, teníamos un modelo que funcionaba bastante bien, lo que nos dejó tiempo para realizar ajustes”.

El hecho de que todos trabajaran en la oficina de Viena también fue una ventaja. “Nos comunicamos y armonizamos de forma muy eficaz”, confirma Lukas. “Por ejemplo, los viernes por la tarde hablábamos del proyecto mientras tomábamos una cerveza. Tuvimos una gran relación y espíritu de equipo”.

IA Positiva

Si bien su solución actualmente se limita a la identificación de cigarras y saltamontes, algún día podría ampliarse para identificar casi cualquier sonido de insecto o animal. “Como parte del premio, estamos planeando un viaje a los Países Bajos para reunirnos con los científicos de Naturalis y hablar sobre cómo llevar nuestro modelo al siguiente nivel”, dice Lucas.

Y este es realmente el objetivo del GDSC: cerrar la brecha entre la investigación científica y la industria, enfocando intensamente a las mentes científicas de datos más brillantes del mundo en un solo problema social o ambiental. “Es una manera maravillosa de acelerar la innovación en el área de la sostenibilidad y una clara demostración de las ventajas que el aprendizaje automático puede aportar a los desafíos de la biodiversidad”, afirma Lucas. “Con tanta incertidumbre en torno a la IA, es fantástico mostrar cómo esta tecnología podría dar forma a un futuro mejor, para las personas y el planeta”.

Historias inspiradoras

DATOS E INTELIGENCIA ARTIFICIAL

Activar datos. Aumentar la inteligencia. Amplificar los resultados.