Google incluye quechua, guaraní y aimara en su traductor

Guardar

LIMA (AP) —

Unos 10 millones de personas hablan quechua, pero intentar la traducción automática de correos electrónicos y mensajes de texto a la familia de lenguas indígenas de uso más extenso en el continente americano fue prácticamente imposible durante mucho tiempo.

Eso cambió el miércoles, cuando Google agregó el quechua y otras lenguas a su servicio de traducción digital.

El gigante de internet dice que la nueva tecnología de inteligencia artificial le está permitiendo ampliar vastamente el repertorio de idiomas de su Traductor. La firma añadió 24 esta semana, incluyendo el quechua y otras lenguas indígenas sudamericanas como el guaraní y el aimara. Google también añadió varias lenguas de África y el sur de Asia que se hablan mucho y que no han estado presentes en productos tecnológicos populares.

“Pusimos atención a lenguas con poblaciones muy grandes desatendidas”, dijo a la prensa Isaac Caswell, científico investigador de Google.

La noticia anunciada en la muestra tecnológica anual I/O de la compañía de California podría ser celebrada en muchos rincones del mundo. Pero probablemente también recibirá críticas de quienes se sintieron frustrados con productos tecnológicos anteriores que no lograban detectar los matices de su lengua o cultura.

El quechua fue la lengua franca del imperio inca, que se extendía desde lo que hoy es el sur de Colombia hasta el centro de Chile. Su situación comenzó a declinar después de que los españoles conquistaran Perú hace más de 400 años.

La inclusión del quechua entre las lenguas reconocidas por Google es una gran victoria para activistas de esa lengua como Luis Illaccvanqui, un peruano que creó la página web Qichwa 2.0, que incluye diccionarios y recursos para aprenderla.

“Ayudará a colocar en el mismo estatus al quechua y al español”, señaló Illaccanqui, que no participó en el proyecto de Google y cuyo apellido significa en quechua “eres el rayo”.

Illaccanqui dijo que el traductor también ayudará a mantener viva esa lengua en una nueva generación de jóvenes y adolescentes “que hablan quechua y español al mismo tiempo y están fascinados por las redes sociales”.

Caswell consideró que la noticia es un “avance tecnológico muy grande” porque hasta hace poco era imposible añadir lenguas si los investigadores no podían encontrar un cúmulo de textos en línea lo suficientemente grande —como libros digitales, periódicos o mensajes difundidos en redes sociales— de los que sus sistemas de IA pudieran aprender.

Los gigantes tecnológicos de Estados Unidos no tienen un amplio historial de hacer que su tecnología de idiomas funcione bien fuera de los mercados más ricos, un problema que también les ha dificultado detectar desinformación peligrosa en sus plataformas. Hasta esta semana, el Traductor de Google servía para lenguas europeas como el frisio, el maltés, el islandés y el corso —cada uno de ellos con menos de un millón de hablantes_, pero no para lenguas del este de África como el oromo y el tigriña, que tienen millones de hablantes.

Las nuevas lenguas estarán disponibles esta semana. Aún no serán comprendidas por el asistente de voz de Google, lo que por ahora limitará el servicio a la traducción de texto a texto. La empresa dijo que está trabajando en el reconocimiento de voz y otras capacidades, tales como poder traducir letreros apuntándoles con la cámara.

Eso será importante para lenguas que en gran medida son orales como el quechua, en especial en el campo médico, porque muchos doctores y enfermeras peruanos que sólo hablan español laboran en zonas rurales y “no logran entender a los pacientes que hablan quechua mayoritariamente”, señaló Illaccanqui.

“La próxima frontera o desafío es trabajar en torno al habla”, dijo el peruano Arturo Oncevay, investigador de traducción automática de la Universidad de Edinburgo y cofundador de una coalición investigadora que busca mejorar la tecnología de las lenguas indígenas en el continente americano. “Las lenguas originarias del continente americano son tradicionalmente orales”.

En su anuncio, Google advirtió que la calidad de las traducciones en las lenguas incluidas recientemente “todavía dista mucho” de la de otras lenguas que ya tiene, tales como el inglés, el español y el alemán, y subrayó que los modelos “cometerán errores y exhibirán sus propios sesgos”. Pero la compañía sólo agrega lenguas si sus sistemas de IA cumplen cierto umbral de competencia, dijo Caswell.

“Si hay un número significativo de casos en los que está muy equivocada, entonces no la incluiríamos", agregó. “Incluso si el 90% de las traducciones son perfectas, pero 10% carecen de sentido, eso es un poco excesivo para nosotros”.

Google dijo que sus productos ya incluyen 133 lenguas. Las 24 más recientes son el mayor lote incluido desde que la compañía incorporó 16 en 2010. Lo que hizo posible la expansión es lo que Google llama un modelo de traducción automática de “intento cero” o “recurso cero”, que aprende a traducir otra lengua sin haber visto un ejemplo de ella.

Meta, la compañía matriz de Instagram y Facebook, introdujo el año pasado un concepto similar llamado Universal Speech Translator (Traductor Universal de Voz).

El modelo de Google funciona mediante el adiestramiento de un “solo modelo neural gigantesco de IA” en unas 100 lenguas distintas de las que hay abundantes datos, y después aplica lo aprendido a cientos de otras lenguas que desconoce, dijo Caswell.

“Imaginen que ustedes son unos grandes políglotas y después simplemente comienzan a leer novelas en otro idioma; pueden empezar a reconstruir lo que podría significar con base en sus conocimientos de idiomas en general”, señaló.

Dijo que el nuevo grupo incluye desde lenguas más pequeñas como la mizo, hablada en el noreste de la India por unas 800.000 personas, hasta lenguas que se hablan más como el lingala, utilizado por unos 45 millones de personas en el centro de África.

Hace más de 15 años, en 2006, Microsoft recibió algunos elogios en Sudamérica por un software que traducía menús y comandos familiares de la empresa a quechua. Pero eso fue antes de la actual ola de avances de IA en las traducciones en tiempo real.

Américo Mendoza Mori, investigador de lenguas de la Universidad de Harvard que habla quechua, dijo que el hecho de que Google haya prestado atención a esta lengua le da una visibilidad necesaria en lugares como Perú, donde los hablantes de quechua carecen todavía de muchos servicios públicos. La supervivencia de muchas de estas lenguas “dependerá de su uso en contextos digitales”, afirmó.

Otro lingüista, Roberto Zariquey, se dijo escéptico de que Google pueda crear una herramienta efectiva de revitalización de lenguas para el quechua, el aimara o el guaraní sin la estrecha participación de grupos comunitarios de la región.

Las lenguas están muy vinculadas a las vidas, culturas, grupos étnicos y organizaciones políticas, dijo Zariquiey, un linguista de la Pontificia Universidad Católica del Perú. Esto debería ser tomado en cuenta, afirmó.

—-

Las nuevas lenguas incluidas son asamés, aimara, bambara, bhoshpuri, dhivehi, dogrí, ewé, guarani, ilocano, konkaní, criollo sierraleonés, lingala, luganda, maithili, meiteilon (manipurí), mizo, oromo, quechua, sánscrito, sepedi, kurdo sorani, tigriña, tsonga y twi.

—-

O’Brien informó desde Providence, Rhode Island.

Guardar