Walter Sosa Escudero es uno de los referentes en Estadística en la Argentina. Con varios trabajos académicos, tiene también varios libros de divulgación sobre el tema: Qué es (y que no es) la estadística, Big Data: breve manual para conocer la ciencia de datos que ya invadió nuestras vidas, y Borges, Big Data y yo. Es profesor de la Universidad de San Andrés y, como buen docente, tiene la capacidad de explicar conceptos con ejemplos claros, sin, por eso, reducir la complejidad ni subestimar a quien lo escucha. Si, como dice Melina Furman, se entiende algo cuando es posible explicarlo, evidentemente Sosa Escudero entiende.
Desde que apareció ChatGPT en noviembre del año pasado, las noticias en torno a la inteligencia artificial se suceden en una serie interminable. Apocalípticos e integrados debaten sobre el futuro: del trabajo, de la educación, de la humanidad. Cada vez sabemos más, pero también permanecen dudas que, por ser demasiado estructurales, no terminan de ser respondidas. Hay frases, ideas y palabras que entran en nuestro léxico cotidiano con cierta desconfianza, como si estuviéramos contrabandeándolas. ¿Cómo entrar en ese mundo sin perderse en un laberinto de tecnología?
En el marco del ciclo que organizaron Ticmas y UdeSA, Sosa Escudero intentó responder algunas de esas cuestiones.
—¿De qué manera la inteligencia artificial está relacionada con el Big Data?
—Yo creo que de lo último que queremos hablar, es de definiciones demasiado precisas. Dónde termina la estadística, dónde termina la inteligencia artificial, dónde termina Big Data y machine learning. Es una especie de comarca en donde las cosas tienen más en común de lo que se distinguen. Y lo que tienen en común es que hay algoritmos, hay datos, hay preguntas, hay respuestas. Dependiendo de cuánto más tenga de cada cosa, el dado caerá más cerca de machine learning, de Big Data, etcétera. Pongamos, como ejemplo, jugar al ajedrez. La gente más cercana a la estadística y machine learning buscaría partidas de ajedrez para ver las que se ganaron, las que se perdieron, y así inferir las estrategias; la inteligencia artificial intentaría captar las reglas del ajedrez y explotarlas al máximo. Pero, en definitiva, potato poteito: llega un momento que son cosas bastante más parecidas que diferentes.
—Hablando de ajedrez, antes se decía que una computadora nunca le iba a ganar a un hombre porque no tenía inventiva, pero ahora, con la capacidad de cómputo, ya es imposible ganarle a la máquina. ¿Los datos cambiaron esa capacidad?
—Quizás sea un poco temprano de decir, pero la tecnología de ChatGPT es justamente una celebración de esa lógica. A la larga, ChatGPT son símbolos que entran y símbolo que salen. Yo le doy un montón de símbolos, letras, espacios, signo puntuación y le digo: “Seguí”. Si le digo: “mi mamá me”, se pone a buscar todas las veces que alguien dijo “mi mamá me…” y va a encontrar que la mayoría dijo “mima”. Entonces me va a decir: “mima”. ChatGPT es una especie de versión explotada de esa lógica. ¿Qué tiene que ver inteligencia artificial y machine learning? Todo esto surge de una brutal carrera en espiral entre el crecimiento los datos y la potencia de los algoritmos. Esto no pudo haber pasado antes, porque ahora entramos en una especie de distancia donde los algoritmos muy sofisticados, para funcionar correctamente, demandan muchísimos datos, y los muchísimos datos convocan algoritmos muy complejos para ser analizados. En esta espiral llegamos al momento en donde la cantidad de datos creció lo suficiente y los algoritmos se complejizaron tanto que era natural que el problema se resolviera de una manera satisfactoria.
—¿De dónde toma los datos la inteligencia artificial para construirse, y cuánto aprenden de nosotros?
—La respuesta a la primera pregunta es: de dónde no. Somos una máquina brutal de dejar huellas. Si a cualquiera que esté le preguntamos qué está haciendo, va a responder que está en la charla de un personaje que habla de Big Data. Nadie en su sano juicio respondería: Estoy dejando datos. Pero convengamos que, mientras estemos interconectados, estamos dejando datos de todo tipo. Lo que hemos hecho en los últimos años fue construir una mega gigantesca piedra de Rosetta. Tenemos un enorme catálogo de preguntas y respuestas, que los algoritmos utilizan justamente para interpolar y extrapolar. Los años de andar interactuando con cosas interconectadas fueron una enorme pista de entrenamiento. Y, obviamente, la interacción mejora muchísimo. Con los algoritmos pasa lo que pasa con los mozos de los restaurantes o los árbitros de fútbol: no se habla de ellos hasta que se mandan una macana. Fijate cómo ya casi no tenés spam en tu email: el algoritmo hace un muy buen trabajo, pero cada tanto se equivoca. Esa instancia de error es la instancia de aprendizaje, y es increíble la tasa a la cual este tipo de objetos aprende. Si a ChatGPT le decís que no te gustó la respuesta que te dio sobre “mi mamá me mima”, va a ubicarte dentro del tipo de personas que están dispuestas a escuchar respuestas un poco más venturosas.
—¿Por qué hoy es tan importante la profesión de ingeniero en prompt? (Prompt es la orden que se le da a la inteligencia artificial).
—Nuevos nombres para objetos viejos: ¡esa es la ciencia! La ciencia es la máquina de preguntar. La gran desilusión que tiene cualquiera que se acerca a la ciencia es que te pasaste toda la primaria, la secundaria, la universidad, el doctorado, respondiendo las preguntas que te hacen hasta que un día te das cuenta que lo que realmente demanda el mercado y la comunidad científica tiene que ver, no con tu habilidad de responder, sino con tu habilidad de preguntar. Me resulta gracioso que el prompt engineering sea la gente que diseña preguntas correctas para Chat. Frente a eso, yo no sé qué postura tomar. Porque, por un lado, me reconforta que ser curioso y disruptivo sea la herramienta mejor paga del mercado. Si estudiaste Medicina, Filosofía, Derecho, Biología, y te formaste en hacer preguntas, resulta que hoy llueve sopa y vos tenés cucharón en la mano. Pero también me pone nervioso, porque esa lógica exacerba la diferencia entre las personas. Un patrón que estoy encontrado entre mis alumnos es que los que mejor aprovechan ChatGPT son los que están mejor preparado. Si antes había diferencias, esto las amplió.
—¿Cómo se arma una pregunta en estadística?
—Es la gran tensión entre la deducción y la inducción. Los datos y los algoritmos te van a permitir encontrar patrones… y pelearte con los patrones. Y eso, muchas veces, hizo crecer a la ciencia. Big Data y ChatGPT nos llaman la atención porque nos permiten encontrar patrones rápido, y —no lo estoy subestimando— pero eso nos fascina porque es como ver fotos viejas de tu abuelo. Te llama muchísimo la atención, hasta que, en algún momento, te das cuenta de que las historias están ausentes. Me parece que el próximo paso tiene que ver con construir las historias que hilan esos patrones, y esa es una tarea sofisticada. No es para menospreciar el rol de los algoritmos y los datos; al contrario: la inducción, la observación, la clasificación, la taxonomía ocuparon y ocupan un lugar muy importante en la historia del conocimiento.
LEER MÁS