Dos argentinas premiadas por crear un asistente virtual para mejorar la pronunciación en inglés

Recibieron un premio de Google que financiará su investigación durante un año. Cómo funcionará y por qué se necesitan lingüistas en ciencias de la computación.

Guardar

Es doctora en ingeniería electrónica de la Universidad de Stanford y trabajó en el instituto de investigación SRI International (conocido tiempo atrás, por sus siglas en español, como el Instituto de Investigación de Stanford). Allí, investigó sobre procesamiento de habla y pronunciation scoring, es decir, la tarea de generar puntajes para medir la calidad de pronunciación.

En 2014, ya en la Argentina, Luciana Ferrer continuó trabajando en el tema y escribió un PICT. Es un Proyecto de Investigación Científica y Tecnológica, financiado por el Fondo para la Investigación Científica y Tecnológica (FonCyT).

Cuatro años después, esa investigación sentó las bases de un proyecto que acaba de ser distinguido por Google, en el marco de LARA 2018 (Latin America Research Awards) en Belo Horizonte, Brasil. Son los premios a la investigación científica entregados por el gigante tecnológico.

Ferrer desarrollará, junto a su equipo académico, un tutor virtual (algo así como un maestro) para la práctica de pronunciación en inglés, destinado a argentinos. A través de la tecnología de machine learning (aprendizaje de máquina), el sistema podrá detectar problemas de pronunciación en ese idioma.

Ferrer, en el centro, respondiendo preguntas del director de ingeniería de Google sobre su proyecto (Nereu Jr/Google)
Ferrer, en el centro, respondiendo preguntas del director de ingeniería de Google sobre su proyecto (Nereu Jr/Google)

"Los sistemas de pronunciation scoring no son perfectos y hay cosas para mejorar. Hay que adaptarlos a los errores que cometemos los argentinos al hablar inglés. Es muy específico cómo se equivoca alguien al pronunciar inglés, dependiendo de su idioma madre", señala Ferrer en diálogo con Infobae. 

Continúa: "La dificultad respecto de la pronunciación es que no hay otra manera de aprender que personalmente, por ahora. Pero no puede ser solo un programa receptor de información. Porque uno le puede hablar a la máquina, mal, durante un hora, y jamás se va a enterar que le está hablando mal. Por eso se requiere un proyecto de investigación". 

La recopilación de datos, clave

La dupla de investigadoras Ferrer-Vidal Domínguez, premiadas por Google
La dupla de investigadoras Ferrer-Vidal Domínguez, premiadas por Google

De los 300 proyectos recibidos, LARA premió a 26 investigaciones. Cada una de éstas se compone de una dupla de académicos. El premio es el financiamiento del proyecto por un año, entregando USD750 por mes a la facultad, y USD1.200 a cada estudiante de doctorado.  

En este caso, la dupla de Ferrer la completa la lingüista Jazmín Vidal Domínguez. Está cursando su doctorado en Ciencias de la Computación en 1CC (Instituto de Ciencias de la Computación) de la facultad de Exactas de la Universidad de Buenos Aires.

Ferrer, investigadora adjunto del Consejo Nacional de Investigaciones Científicas y Técnicas (CONICET), a cargo del grupo de procesamiento de habla del 1CC, supervisa a Vidal Domínguez en el doctorado que cursa actualmente..

Actualmente, están avanzando en la recolección de datos de menores de edad y adultos argentinos hablando inglés. Lo hacen a través de un sitio en donde, creando un usuario, es posible grabar diferentes frases.

Así luce la home del sitio del proyecto de asistente de pronunciación en inglés, que hoy recopila audios con frases grabadas de usuarios.
Así luce la home del sitio del proyecto de asistente de pronunciación en inglés, que hoy recopila audios con frases grabadas de usuarios.

"De aquí a un año, terminaremos de anotar los datos, mejoraremos el sistema y empezaremos a cerrarlo a una aplicación web que ya se pueda usar, sería una demo, un prototipo", señala Ferrer.   

Explica que, además, antes de la creación de esta página web, tuvieron que diseñar cada frase corta en inglés. "Lo más complicado es anotar esos datos de la información recolectada. Anotar significa considerar si se pronunciaron bien o mal cada uno de los fonemas (la unidad mínima de cada palabra, de sonidos de esas palabras)", apunta.  

Continúa: "Entonces, primero hay que ubicar donde fue dicho cada fonema en la señal de audio, y luego escuchar cada uno y decir ´acá se equivocó´. Eso hay que anotarlo muy detalladamente y luego usar esos datos para entrenar el sistema de machine learning. Entrenarlo para evaluarlo".   

En los sistemas de aprendizaje de máquina la minuciosidad al cargar datos, precisos y exactos, es clave. "El tema es que donde metes basura, podes obtener basura, que es lo que puede pasar con estos sistemas. Si anotas las cosas mal, después el sistema no aprende nada", explica Ferrer.   

Quienes estén interesados en participar de la recolección de audios grabados en inglés pueden escribir a grabadosnet@gmail.com. La participación a nivel nacional es fundamental para el proyecto, para contar con diferentes tipos de pronunciación y entrenar al sistema de aprendizaje de máquina.  

¿Cómo funcionará?  

La web app que funciona hoy para recolectar los datos, servirá en el futuro para grabar el audio en inglés de un usuario, procesar esa información en el sistema y brindar un feedback de la pronunciación. "Falta el machine learning, el sistema que predice qué fonema fue bien dicho y cuál no", dice Ferrer.

La solución, tal como indicó en su presentación la investigadora, está dirigida, esencialmente, a alumnos de escuelas públicas, donde la carga horaria de aprendizaje del idioma inglés es escueta, aunque existen excepciones, según Ferrer. Cita, por ejemplo, al Instituto de Enseñanza Superior Lenguas Vivas. 

"Cuando ya esté en uso, será más valioso si esto se hace en el contexto de la escuela. La idea es llegar al Ministerio de Educación para llevar la iniciativa a cada institución pública", afirma Ferrer. 

Respecto de la etapa de desarrollo, las investigadoras señalan que deberá ser una solución atractiva y no descartan convertirla en un juego. "Podríamos hacer que el usuario compita con otro, que sume puntos. ¿Qué pasaría si le metemos un puntaje y sabe que está en posición 10 con respecto a los que están jugando esta semana?", se pregunta Ferrer. 

Equipo femenino 

Desde Google, admiten estar orgullosos de que la dupla de Ferrer y Vidal Domínguez sea la única integrada en su totalidad por mujeres en LARA.

"Hay otra chica tesista de licenciatura que forma parte del equipo. Está bueno porque ella está muy canchera programando. Es la tercera para que nos faltaba", dice Ferrer. 

Por otro lado, expresa: "Hay pocas alumnas en Computación, yo tengo 3 de ellas. Hay aproximadamene 15% de mujeres entre los alumnos, en el Departamento de Computación de Exactas, hay casos que son mejores. Es algo que se está trabajando y no se entiende del todo".   

"A mí me gusta mucho trabajar con profesoras mujeres. Armamos un grupo con las chicas de la facultad y ahí compartimos las experiencias. Y muchas dicen, no me animaba, pensaba que no podía programar", comenta Vidal Domínguez.  

Ferrer destaca que, en la década del 60 las mujeres eran mayoría en Computación. "Después, alrededor de los 80, cerca de los 90, comenzó a revertirse, y parece que coincidió con el momento en el que comenzó el auge de los videojuegos".  

Y fundamenta: "Por alguna razón, les hicieron marketing para chicos, y no para chicas, de pronto la computadora comenzó a verse como un producto para nenes. Es una teoría, imposible de probar".  

Lingüistas interesados en computación 

Vidal Domínguez expresa: "Terminando Letras, empecé a estudiar en Exactas. Me acerqué a Ferrer y me propuso este trabajo". Ferrer agrega:  "Es el proyecto perfecto para una lingüista que quiere hacer computación".  

La estudiante señala: "Para nosotros, en este año, fue muy difícil conseguir becas en general. A mí se me estaba dificultando bastante llegar a una beca de CONICET. Esto que me sucede con Google es la validación de que como lingüista, puedo hacer un trabajo en ciencias de la computación".  

Además, asegura que son muchas las personas que quieren hacer computación desde la lingüistica en la Argentina. "Hay un grupo de la facultad de Letras que se junta y estudia por su cuenta. Hacen un trabajo increíble. Estudian estadística por su cuenta, se anotan en cursos, pero es algo muy informal", añade. 

Ferrer afirma: "Es una carrera naciente, no hay un programa de lingüistica computacional establecido".  

Vidal Domínguez dice estar adquiriendo una nueva forma de pensar. "Estoy aprendiendo programación, hay que practicar. En las clases de la facultad, usamos lenguajes C++ y Phyton", indica. 

Más argentinos 

Además de Ferrer y Vidal Domínguez, otra dupla argentina fue premiada en LARA. Juan Pablo Galeotti e Iván Arcushin (también de 1CC) fueron distinguidos por su solución denominada Evolutiz. Es un sistema que localiza errores en aplicaciones de Android. 

Berthier Ribeiro Neto, director de ingeniería de Google en América Latina durante LARA 2018 (Nereu Jr/Google)
Berthier Ribeiro Neto, director de ingeniería de Google en América Latina durante LARA 2018 (Nereu Jr/Google)

El anuncio de los ganadores tomó lugar en Belo Horizonte donde se encuentra el único centro de ingeniería de Google en América Latina. Allí trabajan 130 ingenieros de distintos países latinoamericamos. Según señaló Berthier Ribeiro Neto a Infobae, director de ingenieria de Google para América Latina, en el próximo año planean llevar ese número a 200. 

MÁS SOBRE ESTE TEMA: 

Guardar