La Asociación Abuelas de Plaza de Mayo guarda un archivo periodístico con más de 10.000 artículos de diarios y revistas que acaba de abrir de manera digital al público en general (http://buscador-ia-por-la-identidad.fundacionsadosky.org.ar/). Para lograrlo, Abuelas y la Fundación Sadosky diseñaron el desafío Inteligencia Artificial por la Identidad. La iniciativa propuso a los y las estudiantes de universidades argentinas desarrollar un software que permite hacer búsquedas y transcribir (mostrar) la información que estaba en papel en un formato digital usable. Participaron más de 100 personas de 13 provincias que conformaron 22 equipos.
El archivo es obra de la abuela Raquel Radio de Marizcurrena que pasó 40 años, entre 1977 y 2017, seleccionando, recortando y pegando en carpetas artículos periodísticos relacionados con los derechos humanos y la búsqueda de hijos, hijas, nietos y nietas. Así lo hizo todos los días hasta que falleció en 2017 sin haber encontrado a su nieto o nieta.
Tras su muerte, el nieto recuperado Juan Pablo Moyano se dedicó a escanear todo el material que Raquel organizó y cuidó celosamente. “Luego nos preguntamos cómo podíamos buscar en este archivo. No teníamos ni idea. Entonces hicimos lo que nos enseñaron las Abuelas, cuando ellas no sabían algo pedían ayuda a la sociedad. Nos contactamos con la Fundación Sadosky y se generó el desafío”, contó Juan Pablo.
Te puede interesar: Leer Hora Libre, la newsletter de Educación de Infobae. Se envía todos los jueves y la podés recibir gratis en tu casilla de mail. Solo tenés que registrarte
Los 22 equipos que participaron del desafío IA por la Identidad “atravesaron los distintos retos siempre de manera colaborativa. Uno de ellos fue desarrollar un sistema que segmentara las noticias del resto del contenido que aparecía en el recorte —publicidades, por ejemplo—, etiquetara las diferentes partes de la noticia y ordenara el cuerpo de las publicaciones respetando el sentido de la lectura”, puntualizó Victoria Dumas, directora de Ciencias de Datos e Inteligencia Artificial (IA) de la Fundación Sadosky y quien coordinó el concurso.
Tres equipos fueron reconocidos por sus desarrollos. Conversé con los participantes del que salió primero. Compitieron con el nombre de Les Cigarres y lo integraron Julieta Goria, Sofía Goy y Francisco Sandalinas, de la Facultad de Ciencias Exactas y Naturales (UBA).
—¿De qué trata la solución que diseñaron?
—Francisco: “Existen lectores de texto pero que no sirven para leer artículos periodísticos. Solo leen de izquierda a derecha sin respetar, por ejemplo, que una nota tiene columnas de texto que deben diferenciarse o que un epígrafe no es lo mismo que el contenido del cuerpo del texto”.
Agregó Julieta: “Para lograr que leyera artículos periodísticos entrenamos una red neuronal, una IA que es un motor de reconocimiento de objetos. Para entrenarla, dibujamos una cajita alrededor del título, la etiquetamos con el nombre de Título y se la cargamos a la IA. Lo mismo hicimos con cada una de las partes de una nota. Así aprendió a detectar qué cosa era un título, el cuerpo de la nota, el epígrafe, la foto, etc.”.
Completó Sofía: “Como los diarios y revistas no tienen todos el mismo diseño, el título puede estar arriba o abajo de una foto o de una parte del texto. Nuestro desafío fue lograr que la IA detectara qué partes conforman una nota y pueda transcribirla respetando el sentido que tenía en el papel, más allá de su diseño original”.
—¿El objetivo es que cualquiera que esté investigando temas de derechos humanos pueda usar este archivo?
—”La idea es que cualquier persona pueda usarlo, que pueda buscar con palabras claves y el sistema le devuelva la información que el archivo tiene relacionada con su búsqueda”, dijo Francisco.
—¿Cuánto tiempo tardaron en desarrollar la solución?
—”Nos llevó poco más de un mes el desarrollo en sí. Pero antes de que arrancara la competencia, como sabíamos que íbamos a tener que entrenar a la IA, diseñamos nuestra propia plataforma para etiquetar. A su vez, a esta plataforma la pusimos a disposición de los demás equipos que competían porque el espíritu era trabajar de manera colaborativa. De hecho otro equipo lo usó, detectó un error, nos avisó y lo corregimos”, detalló Sofía.
—¿Qué es lo que más los motivó a participar de este desafío?
—“Fran y yo ya teníamos algo de experiencia haciendo cosas con imágenes y consideramos que esta era una oportunidad de aprender más sobre cómo funciona el reconocimiento de objetos. Creo que terminamos en el primer puesto porque le dedicamos mucho tiempo a leer y a buscar artículos sobre el tema, a ver si era un problema que otras personas ya habían intentado resolver”, contó Julieta.
Siguió Francisco: “Cómo procesar los archivos de los diarios papel es un problema en el mundo que se sigue investigando, es un problema abierto. Para mí, lo más interesante de este desafío fue tomarnos la propuesta como una labor de investigación real, hacer un paneo del estado del arte, del conocimiento desarrollado, y ver qué estaba funcionando y qué no estaba funcionando”.
Acotó Julieta: “Tuvimos una etapa de debate entre nosotres, de ver qué tomábamos y qué no de cada desarrollo ya existente para terminar creando algo nuevo, un desarrollo que solucionara de la mejor manera posible el problema”.
—¿La temática del archivo les llamó la atención?
—“Sí, con Juli fuimos a la secundaria juntes y ya entonces para nosotres era importante el tema de la memoria. Después yo milito en la facultad, en una agrupación que se llama Identidad pensando en la lucha de las Abuelas. Es algo que me mueve mucho”, contó Sofía. Enseguida Francisco agregó: “Vengo de un colegio judío y si hay algo que estudiamos ahí es cómo, cuando se olvidan los genocidios o las matanzas, estos vuelven a perpetuarse”.
El segundo y tercer puesto fue para los equipos Ana Teresa Diego y Three Data Scientists, respectivamente.
Los equipos fueron premiados en un acto que se realizó en el espacio Cero + Infinito de la Facultad de Ciencias Exactas y Naturales de la UBA, en Ciudad Universitaria. Ahí estuvieron presentes Buscarita Roa y Abel Madariaga, vicepresidenta y secretario respectivamente de Abuelas de Plaza de Mayo, el presidente de la Fundación Sadosky y ministro de Ciencia, Daniel Filmus, el decano de la Facultad, Guillermo Durán y el director ejecutivo de la Fundación Sadosky, Fernando Schapachnik. También participaron la nieta restituida de la abuela Buscarita, Claudia Poblete, y los nietos Juan Pablo Moyano y Leonado Fossatti.
Los integrantes de los tres equipos ganadores recibieron como premio computadoras laptop con procesadores de alto nivel de rendimiento y memoria RAM de gran capacidad. Durante la entrega de los equipos, Fernando Schapachnik sostuvo: “todo lo que pasa en relación con los derechos humanos, le pasa a la Argentina y también a nosotros como científicos y científicas”.
Te puede interesar: Jorge Carrión: “Lo que hizo la tecnología es propiciar un giro emocional, hablamos de los sentimientos más que nunca”
Si seguís la newsletter Hora Libre desde hace meses, sabés que me preocupa lo que puede representar la IA para las democracias y para la búsqueda de un mundo más equitativo en el reparto de sus riquezas. Por eso te comparto un tramo del discurso de Daniel Filmus, que alentó al debate sobre el papel de la inteligencia artificial:
“Va a depender, como todo avance de la ciencia y la tecnología, de los hombres y las mujeres que construyen la historia. Va a depender de una pugna entre quienes buscamos que se democratice y quienes no. En esto el Estado tiene un papel fundamental y nosotros tenemos una posición muy clara respecto de ello. La ciencia y la tecnología por sí solas no mejoran las condiciones de vida de la población sino que es nuestra acción y la de nuestros científicos y científicas la que puede hacer posible que sus avances no polaricen a las sociedades sino que sirvan para hacer un mundo más justo e igualitario”, dijo el ministro.
El archivo periodístico de Abuelas ya está disponible. En las tres imágenes que siguen te muestro el paso a paso para hacer búsquedas. Empezá por entrar a este enlace: http://buscador-ia-por-la-identidad.fundacionsadosky.org.ar/ y experimentá el desarrollo que hicieron los y las estudiantes.
Paso 1. Escribí la o las palabras sobre las que estás buscando información.
Paso 2. Si hay información catalogada con la palabra que estás buscando, te aparecerá un listado como este. Clickeá sobre ellos.
Paso 3. Podrás acceder a cada artículo tal como te muestra esta imagen.
Esta vez, de la mano de estudiantes de distintas partes del país, la inteligencia artificial sirve para abrir caminos a la memoria.