El Traductor de Google trae 110 nuevos idiomas con IA: Descubre si está el tuyo

Gracias al modelo de inteligencia artificial PaLM 2 y el trabajo de lingüistas, algunas lenguas indígenas podrán mantenerse vivas en el tiempo

Guardar
Google acudió a varios lingüistas
Google acudió a varios lingüistas y hablantes nativos para agregar los nuevos idiomas al traductor. (Fotocomposición: Infobae)

Google añadió 110 nuevos idiomas a su Traductor. Desde el cantonés hasta el qʼeqchiʼ, estas lenguas representan a más de 614 millones de hablantes, lo que permite traducciones a alrededor del 8% de la población mundial.

Algunos son idiomas hablados por más de 100 millones de personas. Otros son utilizados por comunidades indígenas pequeñas, y algunos apenas tienen hablantes nativos, pero están siendo activamente revitalizados, explica Google.

Estos 110 nuevos idiomas se han incorporado al Traductor de Google mediante el uso del modelo de lenguaje avanzado PaLM 2, el cual es un tipo de inteligencia artificial diseñada para entender y generar texto en lenguaje natural de manera efectiva.

Google Translate admite más de
Google Translate admite más de 200 idiomas. (Traductor de Google)

Estos modelos son capaces de aprender patrones complejos del lenguaje a partir de grandes cantidades de datos y pueden aplicarse en tareas como la traducción automática, generación de texto, respuestas automáticas, entre otros usos avanzados.

Cuáles son los nuevos idiomas del Traductor de Google

Algunos de los idiomas recientemente admitidos en Google Translate son:

- Afar: Lengua hablada en Djibouti, Eritrea y Etiopía. De todos los idiomas en este lanzamiento, Afar tuvo la mayor cantidad de contribuciones comunitarias voluntarias, asegura Google.

- Cantonés: Fue por mucho tiempo uno de los idiomas más solicitados a Google. Debido a que dicho idioma suele superponerse con el mandarín en la escritura, es complicado encontrar datos y entrenar modelos.

Gracias a un gran modelo
Gracias a un gran modelo de lenguaje, el traductor de Google pudo recopilar los nuevos idiomas. (Imagen Ilustrativa Infobae)

- Manx: Lengua de la Isla de Man, dependencia autónoma de la Corona británica en el mar de Irlanda, entre Inglaterra e Irlanda. Casi se extinguió con la muerte de su último hablante nativo en 1974. Pero gracias a un movimiento de reactivación en toda la isla, ahora hay miles de hablantes.

- NKo: Es una forma estandarizada de las lenguas mandinga de África occidental que unifica muchos dialectos en un idioma común. Su alfabeto único se inventó en 1949 y hoy cuenta con una comunidad de investigación activa que desarrolla recursos para su aprendizaje.

- Punjabi (Shahmukhi): Idioma más hablado en Pakistán.

- Tamazight (amazigh): Lengua bereber que se habla en todo el norte de África. Aunque existen muchos dialectos, la forma escrita generalmente es comprensible para todos. Está estructurado en escritura latina y tifinagh, ambas compatibles con Google Translate.

- Tok Pisin es una fusión del inglés y de la lengua franca de Papua Nueva Guinea.

Google incluyó lenguas indígenas con
Google incluyó lenguas indígenas con el fin de preservarlas. (Imagen Ilustrativa Infobae)

Cómo buscar los nuevos idiomas del Traductor de Google

Para interactuar con el cantonés, afar, punjabi o con los 107 nuevos idiomas de Google Translate, basta con seguir estos pasos:

1. Ingresar al Traductor de Google.

2. En la barra de idiomas que se ubica en la parte de arriba, seleccionar el idioma de interés.

3. Empezar a interpretar textos, audios, documentos y sitios web.

Variedades lingüísticas: Qué son y cómo Google las elige

Las variedades lingüísticas se refieren a las diferentes formas en las que una lengua se manifiesta según el contexto social, cultural, geográfico o situacional en el que se utiliza. Un ejemplo claro de variedad lingüística sería el español hablado en diferentes regiones de América Latina y España.

PaLM 2 jugó en papel
PaLM 2 jugó en papel clave en la adición de 110 idiomas en el traductor de Google. (Imagen Ilustrativa Infobae)

Palabras como “computadora” (México) vs. “ordenador” (España), o el uso de “vosotros” (España) en lugar de “ustedes” (América Latina), son ejemplos de cómo las variedades lingüísticas se manifiestan dentro de una misma lengua.

“Nuestro enfoque ha sido priorizar las variedades más utilizadas de cada idioma”, señala Google. “Nuestros modelos producen texto más cercano al Vlax Romani sureño, una variedad comúnmente utilizada en línea. Pero también mezcla elementos de otros, como el Vlax del Norte y el Romaní de los Balcanes”, agrega la compañía.

PaLM 2 desempeñó un papel crucial al facilitar que Translate mejorara su capacidad para aprender de manera más efectiva idiomas estrechamente relacionados entre sí. Esto incluye idiomas cercanos al hindi, como el awadhi y el marwadi, así como criollos franceses como el criollo de Seychelles y el criollo de Mauricio.

“A medida que avance la tecnología y sigamos asociándonos con lingüistas expertos y hablantes nativos, con el tiempo admitiremos aún más variedades lingüísticas y convenciones ortográficas”, concluye Google.

Guardar