SAN FRANCISCO -- Una tarde reciente, Tudor Achim le hizo un ejercicio de ingenio a un robot de inteligencia artificial llamado Aristóteles.
Se trataba de una tabla de 10 por 10 con cien números. Si tomas el número más pequeño de cada fila y el más grande de cada columna, preguntó, ¿podría el mayor de los números pequeños ser mayor que el menor de los números grandes?
El robot respondió correctamente "No". Pero no era de extrañar. Los chatbots populares como ChatGPT también pueden dar la respuesta correcta. La diferencia fue que Aristóteles había demostrado que su respuesta era correcta. El bot generó un programa informático detallado que verificó que "No" era la respuesta correcta.
Los chatbots como ChatGPT de OpenAI y Gemini de Google pueden responder preguntas, escribir poesía, resumir artículos de noticias y generar imágenes. Pero también cometen errores que desafían el sentido común. A veces inventan cosas, un fenómeno llamado alucinación.
Achim, director ejecutivo y cofundador de una empresa de Silicon Valley llamada Harmonic, forma parte de un esfuerzo creciente por construir un nuevo tipo de IA que nunca alucine. En la actualidad, esta tecnología se centra en las matemáticas. Pero muchos investigadores destacados creen que pueden extender las mismas técnicas a la programación informática y otras áreas.
Dado que las matemáticas son una disciplina rígida con maneras formales de demostrar si una respuesta es correcta o incorrecta, empresas como Harmonic pueden construir tecnologías de IA que comprueben sus propias respuestas y aprendan a producir información confiable.
Google DeepMind, el laboratorio central de IA del gigante tecnológico, hace poco presentó AlphaProof, un sistema que funciona de esta manera. En la Olimpiada Internacional de Matemáticas, la principal competencia matemática para estudiantes de secundaria, el sistema obtuvo la "medalla de plata" al resolver cuatro de los seis problemas de la competencia. Fue la primera vez que una máquina alcanzaba ese nivel.
"Este es un camino para evadir las alucinaciones", comentó David Silver, científico investigador principal de Google DeepMind. "La demostración es una forma de verdad".
Usando técnicas similares, algunos investigadores creen que pueden terminar por construir un sistema de IA que sea mejor en matemáticas que cualquier humano. Ese es el objetivo de Achim y su cofundador Vlad Tenev, más conocido como director ejecutivo de Robinhood, una empresa de comercio de acciones en línea. Su nueva empresa, Harmonic, ha obtenido 75 millones de dólares de financiamiento de Sequoia Capital y otros inversionistas.
Otros, como Silver, creen que estas técnicas pueden extenderse aún más, dando lugar a sistemas de IA capaces de verificar verdades físicas además de matemáticas.
Alrededor de 2017, empresas como Google, Microsoft y OpenAI comenzaron a construir grandes modelos de lenguaje. Estos sistemas de IA a menudo pasaban meses analizando texto digital extraído de internet, incluidos libros, artículos de Wikipedia y registros de chat. (The New York Times demandó a OpenAI y Microsoft en diciembre por infracción de derechos de autor de contenido periodístico relacionado con los sistemas de IA).
Al detectar patrones en todo ese texto, estos sistemas aprendieron a generar texto propio, como trabajos académicos, poesía y código informático. Incluso podían mantener una conversación.
Sin embargo, la tecnología también parecía tonta a veces. Parecía limitarse a escupir lo que había aprendido de internet, incapaz de verificar si la información era correcta o incorrecta, real o completamente inventada.
Este mes, OpenAI presentó una nueva versión de ChatGPT diseñada para razonar las preguntas. Pasa tiempo "pensando", probando diferentes estrategias en un esfuerzo por llegar a la respuesta correcta. Pero sigue equivocándose e inventando cosas.
Investigadores como Achim están empezando a abordar estos problemas por medio de las matemáticas. Con las matemáticas se puede demostrar formalmente si una respuesta es correcta o incorrecta.
Hace más o menos una década, un investigador de Microsoft llamado Leonardo de Moura creó un lenguaje de programación específico para demostrar expresiones matemáticas. Este lenguaje de programación, llamado Lean, era originalmente una herramienta para matemáticos humanos. Pero, ahora que los sistemas de IA son tan hábiles que generan su propio código informático, también pueden utilizar Lean.
Harmonic está diseñando un gran modelo de lenguaje que puede generar sus propias demostraciones Lean. El código Lean que genera no siempre es perfecto. Pero mediante el método de ensayo y error, puede aprender a verificar una solución.
"Se parece mucho a un ser humano", explicó Achim. "Si intentas resolver un problema matemático, pruebas ciertos pasos. Y, si fallan, intentas otros, hasta que aciertas".
Cuando se le pide a Aristóteles que responda problemas matemáticos, puede comprobar las respuestas. Pueden ser preguntas sencillas como "¿Cuánto es 2+2?". O pueden ser rompecabezas más complejos, como el de la cuadrícula de números de 10 en 10.
"Si el sistema puede dar una respuesta, está garantizado que es correcta", afirmó Achim.
Como Aristóteles comprueba sus propias respuestas, se convierte en una forma de generar enormes cantidades de datos digitales fiables que pueden utilizarse para enseñar a los sistemas de IA. En otras palabras, Aristóteles puede generar datos que sirvan para mejorarse a sí mismo.
Los investigadores los llaman "datos sintéticos", es decir, datos producidos por la IA que luego pueden utilizarse para entrenar a la IA. Muchos investigadores creen que este concepto será parte vital del desarrollo de la IA.
Achim y Tenev creen que, tras años de entrenamiento, Aristóteles será mejor en matemáticas que cualquier humano. "Queremos que sea tan inteligente como el conjunto de todos los matemáticos del mundo", aseguró Tenev. "Queremos que resuelva problemas que nunca se han resuelto".
Vlad Tenev y Tudor Achim, fundadores de Harmonic, posan para un retrato en las oficinas de su empresa en Palo Alto, California, el 5 de septiembre de 2024. (Gabriela Hasbun/The New York Times)
Vlad Tenev y Tudor Achim, fundadores de Harmonic, posan para un retrato en las oficinas de su empresa en Palo Alto, California, el 5 de septiembre de 2024. (Gabriela Hasbun/The New York Times)