ChatGPT deberá mejorar el inglés y otros idiomas para evitar sesgos

Las compañías consideran que no es “justo” que los usuarios que hablen otra lengua no tengan la misma calidad de resultados

Guardar
En Europa quieren que la
En Europa quieren que la inteligencia artificial tenga una gran variedad de temas y que comprenda su historial cultural. (Pexels)

Con el crecimiento de la inteligencia artificial surgen peticiones de varias empresas en el mundo que solicitan a OpenIA y Google integrar en sus sistemas una amplia gama de idiomas, más allá del inglés.

Según Financial Times, Silo AI, una startup finlandesa, está lanzando una iniciativa para que los modelos de lenguaje como ChatGPT y Bard admitan idiomas como el sueco, islandés, noruego y danés.

Para lograrlo están reuniendo un equipo de expertos académicos en IA de toda Europa para que construyan, entrenen y operen estas lenguas en la supercomputadora LUMI, que es la más poderosa del continente y ha sido modificada para ejecutar software de inteligencia artificial generativa.

El objetivo no es solo permitir que el chatbot admita y reconozca el idioma, sino que entienda términos propios de la lengua, conozca la historia cultural y la ética de esos países.

Más idiomas, más usuarios

Si bien plataformas como ChatGPT admiten otros idiomas, como el español, desde la empresa italiana Translated aseguran que los principales chatbots habían sido programados para ofrecer sus mejores resultados en inglés, lo que no es “justo para el resto del mundo”.

Lo que ellos consideran un retroceso, a pesar de haber desarrollado una herramienta de traducción en vivo para este sistema para mejorar las respuestas.

“Es como un salto de cinco años hacia atrás, en términos de tecnología, para el mundo que no habla inglés, lo que efectivamente crea un mundo de dos velocidades”, aseguró Marco Trombetti, director ejecutivo de la compañía.

En Europa quieren que la
En Europa quieren que la inteligencia artificial tenga una gran variedad de temas y que comprenda su historial cultural. (Pexels)

Otras iniciativas que han hecho un llamado de atención son OpenGPT-X y LEAM de Alemania, quienes desarrollan modelos de lenguaje en código abierto, y advierten que las restricciones que ha puesto OpenAI para acceder a GPT-4 amenazan la “soberanía digital y la independencia del mercado” de Europa en IA y obstaculiza el progreso de otras empresas.

Finalmente, la Asociación de Procesamiento del Lenguaje Natural de Israel está trabajando en solucionar los problemas que hay en el reconocimiento de voz del hebrero en varios entornos tecnológicos.

El temor es que al haber una baja población que habla este idioma, las empresas dueñas de la inteligencia artificial no lo incluyan en sus plataformas, lo que para ellos “representa un obstáculo para la realización y aplicación de servicios avanzados” para estas poblaciones.

En Europa quieren que la
En Europa quieren que la inteligencia artificial tenga una gran variedad de temas y que comprenda su historial cultural. (Pexels)

Islandia usa IA para evitar perder su idioma

Islandia lleva varios años luchando para que su idioma nativo no desaparezca, debido al crecimiento digital y poca cantidad de personas que lo hablan. Una solución a este problema estaría en la implementación de la inteligencia artificial GPT-4, recientemente anunciada por OpenAI.

El uso de esta tecnología les permitiría entrenar sistemas para que aprendan su lengua y de esa forma desarrollar aplicaciones y entornos digitales para que los islandeses conserven sus tradiciones ante la invasión del inglés.

Una empresa local de tecnología llamada Miðeind ehf estuvo entrenando a GPT-3 para adaptar otros sistemas, pero el proceso no salió bien, por lo que con la nueva versión de la inteligencia artificial esperan tener mejores resultados debido a sus avances.

Para lograrlo, la compañía reunió un equipo de 40 de personas que se encargarán de entrenar al sistema en dos temas claves: la gramática y el conocimiento cultural sobre el islandés. Esto lo harán a través un proceso llamado “Aprendizaje de refuerzo a partir de la retroalimentación humana”, o RLHF, por sus siglas en inglés. Que consiste en que los humanos le dan a GPT-4 una serie de comandos para generar cuatro posibles respuestas, que luego son editadas y se escoge la mejor para crear una lista.

Guardar