Abordar una vasta colección con desafíos únicos

Con colecciones de más de 33,5 millones de objetos, entre fotografías, documentos, películas y sonido, el Imperial War Museums (IWM) es una institución de renombre mundial dedicada a comprender las causas, el curso y las consecuencias de la guerra.

El museo ha invertido significativamente en la digitalización de sus colecciones en los últimos años. Esta inversión fue el punto de partida para modernizar aún más una parte de su colección de historias orales, una selección que comprende aproximadamente 8000 entrevistas con militares, hombres y mujeres, y civiles, realizadas entre 1945 y principios de la década de 2000. Esta colección de grabaciones presentó desafíos únicos, como acentos regionales, terminología militar especializada y calidad de audio variable.

El objetivo era demostrar que transcribir estos archivos históricos y hacerlos disponibles para un consumo público más fácil y descubrible era factible y tenía impacto.

“Nos enorgullece colaborar con los Museos Imperiales de la Guerra y Google Cloud en esta iniciativa de gran relevancia cultural. Este proyecto demuestra cómo la IA generativa puede revitalizar los archivos históricos, transformándolos en experiencias accesibles y cautivadoras. Subraya el poder de la tecnología para conectar el pasado y el presente, enriqueciendo nuestra comprensión de la historia para guiar mejor el futuro.”

Steven Webb
Director de Tecnología e Innovación de Capgemini en el Reino Unido

Trayendo la historia al presente con tecnología de IA

Junto con Google Cloud, Capgemini desarrolló una solución para transcribir estas grabaciones. Esto implicó la creación de un entorno de Google Cloud, lo que marcó la primera incursión del museo en la IA en Google Cloud.

Más allá de la transcripción básica, Capgemini desarrolló un proceso para procesar esta gran cantidad de archivos de audio: extrae metadatos y los pasa a través de Google Gemini para generar resúmenes completos de entrevistas, de los cuales se pueden extraer detalles de personas, lugares y eventos clave. Esto mejora significativamente la capacidad del IWM para hacer que su extensa colección de historia oral sea consultable, algo que habría llevado más de 20 años completar manualmente. La sofisticada ingeniería de indicaciones y Gemini 2.0 permitieron al equipo del proyecto gestionar desafíos como la calidad de la grabación, los acentos y los idiomas. La aplicación final permite a los usuarios buscar en entrevistas que antes solo eran accesibles en archivos de audio mediante transcripciones y metadatos con capacidad de búsqueda, escuchar grabaciones mientras visualizan transcripciones sincronizadas y acceder a información generada por IA sobre los idiomas, la duración de las grabaciones y el tema tratado, todo en una interfaz intuitiva.

Además, la innovadora función “Preguntar” permite a los usuarios formular preguntas en lenguaje natural sobre cualquier entrevista y recibir respuestas directamente del contenido. Esta función es especialmente valiosa para la investigación histórica, ya que el sistema muestra su proceso de razonamiento y proporciona citas directas a las partes relevantes de la transcripción, lo que garantiza la precisión y fiabilidad de las respuestas y permite a los usuarios abordar estas entrevistas de maneras completamente diferentes según sus intereses y necesidades.

“Google Cloud se compromete a dotar a organizaciones como los Museos Imperiales de la Guerra de herramientas de IA que transformen nuestra interacción con la historia. El uso de Gemini para procesar y comprender una colección de audio tan amplia y diversa demuestra las sofisticadas capacidades de la IA generativa para superar desafíos complejos y ofrecer resultados significativos.”

John Abel
Director General, Oficina del CTO, Google Cloud

Desbloqueando el pasado para comprender nuestro futuro

Con una notable precisión del 99% en palabras y del 94% en diarización del hablante (partición del audio según la identidad del hablante) en pruebas de transcripción, la solución representa un enfoque escalable que podría aplicarse a otras colecciones.

Las visiones futuras para la aplicación de la tecnología de IA en IWM incluyen expandir las capacidades de IA para incluir el reconocimiento de imágenes para fotografías, crear un flujo de trabajo amigable para los voluntarios que combine el análisis de IA con la experiencia humana y permitir una interacción inmersiva con el pasado a través del reconocimiento de imágenes y la tecnología de voz.

La digitalización y transcripción de la colección de historias orales del IWM mejorará significativamente la accesibilidad y la capacidad de búsqueda de estos valiosos recursos. Este proyecto permitirá al museo ofrecer al público un mejor contexto y comprensión de los conflictos históricos. No solo ha cumplido los objetivos inmediatos del IWM, sino que también ha allanado el camino hacia un futuro más conectado e informado.

“Gracias a esta increíble colaboración, hemos hecho que miles de horas de historias orales sean mucho más accesibles y fáciles de buscar. Al aprovechar la inteligencia artificial, permitimos que investigadores y el público en general conecten con estas perspectivas personales del conflicto de maneras nunca antes posibles. Este trabajo va más allá de la transcripción, posibilitando nuevas formas de descubrimiento digital.

Esta colaboración entre los Museos Imperiales de la Guerra, Google y Capgemini es la primera en utilizar esta tecnología de IA tan avanzada en el sector museístico. Será fundamental para cambiar la forma en que todos podemos acceder y aprender de nuestro pasado compartido.”

Nick Hodder
Director de Participación y Transformación Digital en los Museos Imperiales de la Guerra