Un joven argentino inventó un sistema que resume textos en forma automática

Augusto Villa Monte, de 31 años, desarrolló la técnica y, con ella, obtuvo un doble doctorado con la máxima calificación en la Universidad de La Plata y en la Universidad de Castilla La-Mancha, España. Los detalles del invento

Guardar
Augusto Villa Monte logró un doctorado doble con su invento
Augusto Villa Monte logró un doctorado doble con su invento

Augusto Villa Monte obtuvo con la máxima calificación posible dos títulos al mismo tiempo: el de Doctor en Ciencias Informáticas de la Universidad Nacional de La Plata y el de Doctor en Tecnologías Informáticas Avanzadas de la Universidad de Castilla La-Mancha, España. ¿Cómo lo logró? Creó un sistema que permite hacer resúmenes automáticamente.

Su tesis doctoral se tituló: “Generación automática inteligente de resúmenes de textos con técnicas de Soft Computing”. Las dos universidades lo calificaron con un 10 e incluso la casa de estudios española lo condecoró con una mención Cum Laude.

Augusto identificó una necesidad en el campo científico: los textos se multiplican y multiplican en formato digital al punto de volverse imposible de procesar, de separar lo esencial de lo accesorio. Por eso, pensó, era imprescindible una herramienta que pudiera dar, en forma automática, una clasificación.

"La información dejó de ser algo tan estructurado como antes. En en ese sentido, sabiendo que el volumen es inmenso entre libros, papers, noticias trabajé en que se pudiera recrear el criterio del usuario a la hora de hacer un resumen. Más allá de que está pensado para el campo académico, se puede aplicar sin problemas a otros textos que tengan características extraíbles”, contó a Infobae Villa Monte.

Su tesis fue calificada con un 10 por las dos universidades
Su tesis fue calificada con un 10 por las dos universidades

Esas características son las de cualquier texto formal: un título y distintos párrafos. Lo único que hasta el momento no podría resumir son chats. Su funcionamiento es fácil de explicar, pero difícil de desarrollar. Después de hacer un resumen como referencia, el sistema toma una serie de criterios, aprende de ellos y los replica en los siguientes textos.

Villa Monte hoy tiene 31 años, pero su experiencia en la técnica ya había comenzado en la carrera de grado. La investigación se extendió durante los seis años que dura el doctorado. “Se pudo haber terminado antes, pero los doctorados tienen una serie de plazos burocráticos. Hay que realizar un montón de cursos que te van orientando, después escribir la tesis, después sigue la evaluación, la defensa y la publicación”, señaló.

En su caso, el doctorado fue doble porque su tesis fue cotutelada por la universidad platense y la española. Más allá de que la tesis es una, la defensa se da ante un jurado compuesto entre las dos instituciones.

Antes del doctorado, el joven se graduó en Sistemas en la UNLP. En la misma universidad trabaja. Se desempeña como investigador en el Laboratorio de Investigación en Informática. Allí creó una solución a través de inteligencia artificial, que clasifica la información de acuerdo a su importancia, sobre todo destinado a la medicina, donde la “investigación y la difusión de la información son fundamentales para su desarrollo”.

“La tesis que realicé desarrolla dos estrategias diferentes para construir resúmenes automáticos de textos, utilizando técnicas de soft computing que se emplean para solucionar problemas que manejan información incompleta, con incertidumbre y/o inexacta”, explicó Villa Monte.

La primera de ellas, agregó, “es una técnica de optimización mediante cúmulo de partículas que, a partir de la representación vectorial de los textos, construye un resumen extractivo combinando adecuadamente varias métricas de puntuación”.

La segunda metodología se vincula con el estudio de la causalidad. El análisis de los textos se hace a partir de la construcción de un grafo, a través del cual se obtienen relaciones causales. “Ambas estrategias implican fundamentalmente la clasificación de la información y reducen el volumen del texto considerando al receptor del resumen construido en cada caso. Por un lado, se identifican los criterios que utiliza el usuario para seleccionar las partes relevantes de un documento. Por el otro, se construye un grafo a partir de patrones textuales útiles para la toma de decisiones”, apuntó el investigador.

La herramienta todavía no está disponible. Por ahora, son solo códigos que requieren de una interfaz para que un usuario la pueda usar. Más allá de que podría ser un producto muy rentable, Villa Monte dice que no está entre sus planes hacer dinero con su invento. “Los investigadores no apuntamos a eso. Tratamos de generar desarrollos importantes para la sociedad”, comentó.

Seguí leyendo:

Guardar

Últimas Noticias

Cómo se escribe según la RAE: ¿australopiteco o Australopithecus?

La Real Academia Española se ha convertido en la institución más relevante para fomentar la unidad idiomática del mundo hispanohablante
Cómo se escribe según la RAE: ¿australopiteco o Australopithecus?

Maurilio Suárez: “Es urgente replantear los modelos pedagógicos, porque ya no funcionan”

En el V Seminario de Innovación Educativa organizado por Ticmas, el reconocido educador mexicano analizó cómo el enfoque STEM puede transformar la educación y los retos urgentes de los modelos pedagógicos actuales
Maurilio Suárez: “Es urgente replantear los modelos pedagógicos, porque ya no funcionan”

Formación docente: evaluarán más de 1300 institutos de todo el país

El Consejo Federal de Educación estableció que los profesorados deberán atravesar un proceso de evaluación y acreditación cada 6 años. El objetivo es que para 2030 todas las instituciones hayan pasado por este ciclo. Los gremios docentes rechazan la medida
Formación docente: evaluarán más de 1300 institutos de todo el país

¿Para qué sirven las pruebas Aprender y cuál es su impacto en el sistema educativo?

Implementadas desde varios años, buscan evaluar los logros educativos de estudiantes en todo el país. Sin embargo, su alcance y método generan debates sobre su representatividad y utilidad.
¿Para qué sirven las pruebas Aprender y cuál es su impacto en el sistema educativo?

Información educativa: solo 10 provincias tienen digitalizados los datos de todos los alumnos

Contar con los datos de cada estudiante en tiempo real es clave para poder hacer un mejor seguimiento de las trayectorias, tanto desde los ministerios como desde las escuelas. Un nuevo informe relevó varios desafíos y asimetrías entre las jurisdicciones, pero también avances
Información educativa: solo 10 provincias tienen digitalizados los datos de todos los alumnos