Los chatbots podrían estar 'alucinando' con más frecuencia de lo que muchos creen

Guardar

SAN FRANCISCO -- Cuando OpenAI, la empresa emergente de San Francisco, presentó su chatbot en línea ChatGPT a finales del año pasado, millones quedaron cautivados por la forma cuasi humana en que respondía preguntas, escribía poesía y conversaba sobre casi cualquier tema. Pero lo que la mayoría de la gente tardó en darse cuenta es que este nuevo tipo de chatbot a menudo inventa cosas.‌Cuando Google presentó un chatbot similar varias semanas después, generó datos sin sentido sobre el telescopio espacial James Webb. Al día siguiente, el nuevo chatbot Bing de Microsoft ofreció todo tipo de información falsa sobre Gap, la vida nocturna mexicana y la cantante Billie Eilish. Luego, en marzo, ChatGPT citó media docena de casos judiciales falsos mientras redactaba un escrito legal de 10 páginas que un abogado presentó ante un juez federal en Manhattan.‌Ahora, una nueva empresa emergente llamada Vectara, fundada por exempleados de Google, está tratando de descubrir con qué frecuencia los chatbots se desvían de la verdad. La investigación de la compañía estima que incluso en situaciones diseñadas para evitar que esto suceda, los chatbots inventan información al menos el 3 por ciento de las veces y hasta un 27 por ciento.‌Los expertos llaman a este comportamiento de chatbots "alucinación". Puede que no sea un problema para las personas que juegan con chatbots en sus computadoras personales, pero es un asunto grave para cualquiera que use esta tecnología con documentos judiciales, información médica o datos comerciales confidenciales.‌Debido a que estos chatbots pueden responder a casi cualquier solicitud de un número ilimitado de formas, no hay manera de determinar con total certeza la frecuencia con la que alucinan. "Habría que revisar toda la información del mundo", dijo Simon Hughes, el investigador de Vectara que dirigió el proyecto.‌Hughes y su equipo pidieron a estos sistemas que realizaran una tarea única y sencilla que se pudiera verificar fácilmente: resumir artículos de noticias. Incluso en estos casos, los chatbots inventaron información de forma persistente.‌"Le proporcionamos al sistema entre 10 y 20 datos y le pedimos un resumen de esos datos", comentó Amr Awadallah, director ejecutivo de Vectara y exejecutivo de Google. "Que el sistema todavía pueda introducir errores es un problema fundamental".‌Los investigadores sostienen que cuando estos chatbots realizan otras tareas --más allá del mero resumen-- las tasas de alucinación pueden ser más altas.‌Su investigación también mostró que las tasas de alucinación varían ampliamente entre las principales empresas de IA. Las tecnologías de OpenAI tuvieron la tasa más baja, alrededor del 3 por ciento. Los sistemas de Meta, propietaria de Facebook e Instagram, rondaron el 5 por ciento. El sistema Claude 2 ofrecido por Anthropic, un rival de OpenAI también con sede en San Francisco, superó el 8 por ciento. Un sistema de Google, Palmchat, tuvo la tasa más alta con un 27 por ciento.‌Una portavoz de Anthropic, Sally Aldous, declaró: "Hacer que nuestros sistemas sean útiles, honestos e inofensivos, lo que incluye evitar alucinaciones, es uno de nuestros principales objetivos como empresa".‌Google se negó a hacer comentarios y OpenAI y Meta no respondieron de inmediato a las solicitudes de comentarios.

Con esta investigación, Hughes y Awadallah quieren mostrarle a la gente que debe tener cuidado con la información que proviene de los chatbots e incluso del servicio que Vectara vende a las empresas. Muchas compañías ofrecen actualmente este tipo de tecnología para uso empresarial.‌Con sede en Palo Alto, California, Vectara es una empresa emergente de 30 personas respaldada por 28,5 millones de dólares en financiación inicial. Uno de sus fundadores, Amin Ahmad, exinvestigador de inteligencia artificial de Google, ha estado trabajando con este tipo de tecnología desde 2017, cuando se incubó dentro de Google y un puñado de otras empresas.‌Así como el chatbot de búsqueda Bing de Microsoft puede recuperar información del internet abierto, el servicio de Vectara puede recuperar información de la colección privada de correos electrónicos, documentos y otros archivos de una empresa.‌Los investigadores también esperan que sus métodos --los cuales comparten públicamente y seguirán actualizando-- ayuden a estimular esfuerzos en toda la industria para reducir las alucinaciones. OpenAI, Google y otros están trabajando para minimizar el problema mediante una variedad de técnicas, aunque no está claro si podrán eliminarlo.

Los chatbots como ChatGPT funcionan con una tecnología llamada grandes modelos de lenguaje (LLM, por su sigla en inglés) que adquiere sus habilidades mediante el análisis de enormes cantidades de texto digital, incluidos libros, artículos de Wikipedia y registros de chat en línea. Al identificar patrones en todos esos datos, un LLM aprende a hacer una cosa en particular: adivinar la siguiente palabra en una secuencia de palabras.‌Debido a que el internet está repleto de información falsa, estos sistemas repiten las mismas falsedades. También se basan en probabilidades: ¿cuál es la probabilidad matemática de que la siguiente palabra sea "dramaturgo"? De vez en cuando lo que adivinan es incorrecto.‌La nueva investigación de Vectara muestra cómo puede suceder esto. Al resumir artículos de noticias, los chatbots no repiten falsedades de otras partes de internet. Simplemente, se equivocan en el resumen.

Empresas como OpenAI, Google y Microsoft han desarrollado formas de mejorar la precisión de sus tecnologías. Por ejemplo, OpenAI intenta perfeccionar su tecnología con observaciones de evaluadores humanos, quienes califican las respuestas del chatbot, al separar las respuestas útiles y veraces de las que no lo son. Luego, utilizando una técnica llamada aprendizaje por refuerzo, el sistema pasa semanas analizando las calificaciones para comprender mejor qué es verdadero y qué es ficción.‌Sin embargo, los investigadores advierten que las alucinaciones de los chatbots no son un problema fácil de resolver. Debido a que los chatbots aprenden de patrones en los datos y operan con base en probabilidades, se comportan de maneras no deseadas al menos en algunas ocasiones.‌Para determinar con qué frecuencia los chatbots alucinaban al resumir artículos de noticias, los investigadores de Vectara utilizaron otro gran modelo de lenguaje para verificar la precisión de cada resumen. Solo así se podía comprobar con eficacia un número tan grande de resúmenes.‌Pero James Zou, profesor de Informática de la Universidad de Stanford, dijo que este método conlleva una advertencia. El modelo de lenguaje que realiza la verificación también puede cometer errores.‌"El detector de alucinaciones podría ser engañado o alucinar él mismo", afirmó.

Simon Hughes, investigador de Vectara, construyó un sistema que tiene como objetivo mostrar con qué frecuencia los chatbots "alucinan". (Lyndon French/The New York Times).

Amr Awadallah, director ejecutivo de Vectara, en su oficina en Palo Alto, California, el 31 de octubre de 2023. (Cayce Clifford/The New York Times).

New York Times BC SPA CHATBOTS BOGUS INFO ART NYT

Últimas Noticias

Un hombre guatemalteco es acusado de prenderle fuego a una mujer en el metro de Nueva York

Reportajes Especiales - News

Noche de paz, noche de ¿Adán?

Reportajes Especiales - Lifestyle

Liverpool y la familia Nordstrom llegan a un acuerdo para comprar la cadena homónima

Reportajes Especiales - Business

Trump ofrece una visión triunfalista de su victoria y augura una nueva 'época dorada' para EE. UU.

Reportajes Especiales - News

Biden conmuta 37 condenas a muerte de presos federales

Reportajes Especiales - News

MÁS NOTICIAS

Los chatbots podrían estar 'alucinando' con más frecuencia de lo que muchos creen

Reportajes Especiales - Business

Últimas Noticias

Un hombre guatemalteco es acusado de prenderle fuego a una mujer en el metro de Nueva York

Noche de paz, noche de ¿Adán?

Liverpool y la familia Nordstrom llegan a un acuerdo para comprar la cadena homónima

Trump ofrece una visión triunfalista de su victoria y augura una nueva 'época dorada' para EE. UU.

Biden conmuta 37 condenas a muerte de presos federales

ÚLTIMAS NOTICIAS

“Es inaceptable”: Carlos Fernando Galán estalló tras la liberación de Fabio Ochoa, excapo del cartel de Medellín

Escuelas más seguras: 193 instituciones educativas certificadas por el programa Escuelas Felices

Ordenan prisión preventiva contra 15 personas detenidas tras evasión de alcalde en Edomex

Isabella Santodomingo reveló, entre lágrimas, secuelas de una intervención quirúrgica: “Esto te aisla”

Cierre de la mezcla mexicana de petróleo de este lunes 23 de diciembre

INFOBAE AMÉRICA

El chef Jamie Oliver retira un libro infantil tras ofender a los indígenas australianos

Biden dice que "uno no puede amar a su país solo cuando gana"

El Ejército israelí ordena la evacuación de cinco barrios del norte de Gaza

La temperatura del Mediterráneo subió más de 1 grado en 25 años, según estudios italianos

Boric felicita a Trump y espera estrechar la relación "en favor del cuidado de la democracia"

ENTRETENIMIENTO

La idea que tenía Chris Columbus para “Gremlins” y que Steven Spielberg no permitió

Quien es Justin Baldoni, el actor al que Blake Lively denunció por acoso sexual

Paul McCartney ya planea un nuevo disco para 2025

Amber Heard defendió a Blake Lively tras acusaciones contra Justin Baldoni: “Aterrador y destructivo”

La Toya Jackson generó inquietud por su aparente cambio físico tras la muerte de su hermano Tito

Temas Relacionados

Últimas Noticias

Un hombre guatemalteco es acusado de prenderle fuego a una mujer en el metro de Nueva York

Noche de paz, noche de ¿Adán?

Liverpool y la familia Nordstrom llegan a un acuerdo para comprar la cadena homónima

Trump ofrece una visión triunfalista de su victoria y augura una nueva 'época dorada' para EE. UU.

Biden conmuta 37 condenas a muerte de presos federales

ÚLTIMAS NOTICIAS

“Es inaceptable”: Carlos Fernando Galán estalló tras la liberación de Fabio Ochoa, excapo del cartel de Medellín

Escuelas más seguras: 193 instituciones educativas certificadas por el programa Escuelas Felices

Ordenan prisión preventiva contra 15 personas detenidas tras evasión de alcalde en Edomex

Isabella Santodomingo reveló, entre lágrimas, secuelas de una intervención quirúrgica: “Esto te aisla”

Cierre de la mezcla mexicana de petróleo de este lunes 23 de diciembre

INFOBAE AMÉRICA

El chef Jamie Oliver retira un libro infantil tras ofender a los indígenas australianos

Biden dice que "uno no puede amar a su país solo cuando gana"

El Ejército israelí ordena la evacuación de cinco barrios del norte de Gaza

La temperatura del Mediterráneo subió más de 1 grado en 25 años, según estudios italianos

Boric felicita a Trump y espera estrechar la relación "en favor del cuidado de la democracia"

ENTRETENIMIENTO

La idea que tenía Chris Columbus para “Gremlins” y que Steven Spielberg no permitió

Quien es Justin Baldoni, el actor al que Blake Lively denunció por acoso sexual

Paul McCartney ya planea un nuevo disco para 2025

Amber Heard defendió a Blake Lively tras acusaciones contra Justin Baldoni: “Aterrador y destructivo”

La Toya Jackson generó inquietud por su aparente cambio físico tras la muerte de su hermano Tito