Cómo traducir lenguas de hace 5.000 años con inteligencia artificial

A través de una combinación de modelos de lenguaje, la IA puede entender escrituras de diferentes épocas

Guardar
Babylonian Engine ha logrado traducciones con hasta un 96% de precisión. (Imagen Ilustrativa Infobae (REUTERS/Teba Sadiq)
Babylonian Engine ha logrado traducciones con hasta un 96% de precisión. (Imagen Ilustrativa Infobae (REUTERS/Teba Sadiq)

En un avance para la arqueología y la lingüística, un equipo de arqueólogos y científicos computacionales ha desarrollado un programa de inteligencia artificial capaz de traducir instantáneamente tablillas cuneiformes de 5.000 años de antigüedad.

Este logro, detallado en un artículo publicado en la revista PNAS Nexus de Oxford University Press, ha sido posible gracias a la aplicación de avanzados modelos de aprendizaje automático, marcando un antes y un después en el estudio de las antiguas civilizaciones de Mesopotamia.

Descubriendo la escritura más antigua gracias a la IA

El cuneiforme, considerado el sistema de escritura más antiguo conocido, fue inventado por los sumerios en el cuarto milenio antes de Cristo. Este sistema precede a los jeroglíficos egipcios y se utilizaba para escribir en tablillas de arcilla mediante un punzón o cincel.

Babylonian Engine ha logrado traducciones con hasta un 96% de precisión. (REUTERS/Teba Sadiq)
Babylonian Engine ha logrado traducciones con hasta un 96% de precisión. (REUTERS/Teba Sadiq)

Durante su larga historia de uso, que se extendió hasta el siglo I de nuestra era, el cuneiforme evolucionó de un sistema ideográfico a uno fonético (silábico), adaptándose a diversas lenguas, muchas de ellas sin relación entre sí. Esta evolución complicó la traducción de las tablillas, ya que los avances logrados con ciertos textos no siempre eran aplicables a otros encontrados en distintos yacimientos.

La vasta cantidad de tablillas cuneiformes descubiertas y la escasez de expertos en estas lenguas antiguas ha dejado a la mayoría de estos documentos sin traducir y fuera del alcance de la investigación. Sin embargo, la introducción de la inteligencia artificial promete cambiar esta situación de manera drástica.

En 2023, un equipo de investigadores aplicó un modelo de deep learning para traducir textos en acadio con un alto nivel de precisión. El acadio, una antigua lengua semítica, fue la más usada en los actuales Iraq y Siria, sustituyendo al antiguo sumerio. Este lenguaje se conserva en tablillas de arcilla que datan de 2500 a.C., escritas en cuneiforme.

El modelo de IA desarrollado ha mostrado una sorprendente precisión al traducir textos acadios formales, como decretos reales y presagios religiosos, debido a que estos siguen patrones fijos. Sin embargo, los textos literarios y poéticos presentan más dificultades, provocando que la IA genere resultados irrelevantes, un fenómeno conocido como “alucinación”.

Babylonian Engine ha logrado traducciones con hasta un 96% de precisión. (Imagen Ilustrativa Infobae)
Babylonian Engine ha logrado traducciones con hasta un 96% de precisión. (Imagen Ilustrativa Infobae)

Cómo la IA traduce estos textos

Babylonian Engine es la herramienta que permite realizar la traducción. Este sistema comienza con la imagen de una tablilla cuneiforme y termina con su transliteración y traducción.

Uno de los modelos publicados por los encargados del proyecto es Atrahasis, que se enfoca en restaurar los vacíos textuales en textos cuneiformes, un desafío común debido a la frecuente rotura o desgaste de las tablillas. Entrenado con registros económicos y administrativos de Babilonia bajo el Imperio Persa, Atrahasis predice con un 85% de precisión la palabra faltante y en un 94% de los casos incluye la palabra correcta entre las diez primeras sugerencias.

Otro sistema importante, Akkademia, incluye tres modelos de aprendizaje automático para transliterar y segmentar signos cuneiformes en Unicode. Estos signos son polivalentes, lo que significa que cada uno puede tener múltiples lecturas dependiendo del contexto. Con este modelo han logrado tasas de precisión de 89,5%, 94% y 96,7% y buenos resultados en textos de otros géneros y períodos.

Babylonian Engine ha logrado traducciones con hasta un 96% de precisión. (Imagen Ilustrativa Infobae)
Babylonian Engine ha logrado traducciones con hasta un 96% de precisión. (Imagen Ilustrativa Infobae)

La visión del equipo detrás del Babylonian Engine es revolucionar el campo de la asiriología. En algunos años, esperan que los arqueólogos y filólogos puedan tomar una fotografía de una tablilla cuneiforme recién descubierta y obtener una transliteración y traducción aproximadas, similar a lo que sucede hoy con sistemas como los de Google.

Además, planean ofrecer herramientas de edición en línea para que los investigadores mejoren los resultados iniciales de la IA, crear tours de realidad virtual de las antiguas capitales mesopotámicas y anatolias, y gamificar la experiencia de aprendizaje para los estudiantes.

Guardar