![Investigadores de Oxford usan chatbots](https://www.infobae.com/resizer/v2/XMQFC7E3HJCVXORFQTVERBHIEE.jpg?auth=a2b74d509bb15cacd0d40d9eceef4986fd1b2fdd5071b573a5701ff6951c1d19&smart=true&width=350&height=197&quality=85)
Los chatbots de IA se sienten cada vez más cómodos en el arte de la conversación humana. El problema, dicen los expertos, es que son propensos a dar respuestas inexactas o sin sentido, lo que se conoce como “alucinaciones”. Ahora, los investigadores han encontrado una posible solución: usar chatbots para detectar errores que otros chatbots han cometido.
Sebastian Farquhar, científico informático de la Universidad de Oxford, es coautor de un estudio publicado el miércoles en la revista Nature que postula que los chatbots como ChatGPT o Gemini de Google pueden usarse para eliminar falsedades de la IA.
Los chatbots utilizan grandes modelos de lenguaje, o LLM, que consumen grandes cantidades de texto de Internet y pueden usarse para diversas tareas, incluida la generación de texto prediciendo la siguiente palabra en una oración. Los robots encuentran patrones mediante prueba y error, y luego se utiliza la retroalimentación humana para ajustar el modelo. Pero hay un inconveniente: los chatbots no pueden pensar como humanos y no entienden lo que dicen.
![Chatbots pueden identificar inconsistencias en](https://www.infobae.com/resizer/v2/PTMZPG3D25FO7MSDMR2QEVOSZY.jpg?auth=bc249a232eab35c1a377ed26745493c1852bddaec602a54a1801df73f1c846d9&smart=true&width=350&height=233&quality=85)
Para probar esto, Farquhar y sus colegas hicieron preguntas a un chatbot y luego utilizaron un segundo chatbot para revisar las respuestas en busca de inconsistencias, de manera similar a la forma en que la policía podría intentar hacer tropezar a un sospechoso haciéndole la misma pregunta una y otra vez. Si las respuestas tenían significados muy diferentes, eso significaba que probablemente estaban confusas.
Dijo que al chatbot se le hizo una serie de preguntas de trivia comunes, así como problemas planteados de matemáticas de la escuela primaria.
Los investigadores verificaron la precisión de la evaluación del chatbot comparándola con la evaluación humana en el mismo subconjunto de preguntas. Descubrieron que el chatbot coincidía con los evaluadores humanos el 93% de las veces, mientras que los evaluadores humanos coincidían entre sí el 92% de las veces, lo suficientemente cerca como para que los chatbots que se evaluaban entre sí “no fueran preocupantes”, dijo Farquhar.
Farquhar dijo que para el lector medio, identificar algunos errores de la IA es “bastante difícil”. A menudo tiene dificultades para detectar tales anomalías cuando utiliza LLM para su trabajo porque los chatbots “a menudo te dicen lo que quieres escuchar, inventan cosas que no solo son plausibles, sino que serían útiles si fueran ciertas, algo que los investigadores han etiquetado como ‘adulación’”, dijo en un correo electrónico.
![Uso de un segundo chatbot](https://www.infobae.com/resizer/v2/5HFBWPDZ2JE5LAVZJJUVMODDXQ.jpg?auth=1eb3474fd5054b7bb9ec92c4ec89f28215b5980e58f08577d04e915592104bcb&smart=true&width=350&height=197&quality=85)
Las respuestas poco confiables son una barrera para la adopción generalizada de chatbots de IA, especialmente en campos médicos como la radiología, donde “podrían representar un riesgo para la vida humana”, dijeron los investigadores. También podrían dar lugar a precedentes legales inventados o noticias falsas.
No todo el mundo está convencido de que utilizar chatbots para evaluar las respuestas de otros chatbots sea una gran idea. En un artículo adjunto de News and Views en Nature, Karin Verspoor, profesora de tecnologías informáticas en la Universidad RMIT en Melbourne, Australia, dijo que existen riesgos al “combatir el fuego con fuego”.
La cantidad de errores producidos por un LLM parece reducirse si un segundo chatbot agrupa las respuestas en grupos semánticamente similares, pero “usar un LLM para evaluar un método basado en LLM parece circular y podría estar sesgado”, escribió Verspoor.
“Los investigadores tendrán que lidiar con la cuestión de si este enfoque realmente controla la producción de los LLM o, sin darse cuenta, alimenta el fuego al superponer múltiples sistemas que son propensos a alucinaciones y errores impredecibles”, añadió.
Farquhar lo ve “más como construir una casa de madera con vigas transversales de madera como soporte”. “No hay nada inusual en tener componentes de refuerzo que se apoyen entre sí”, dijo.
Últimas Noticias
Científicos detectan un misterioso mensajero del cosmos
Un neutrino con una energía sin precedentes fue identificado en un observatorio submarino en el Mediterráneo, según un estudio publicado en Nature. La partícula, que viajó casi a la velocidad de la luz, podría haberse generado en un evento cósmico extremo. Qué implica este hallazgo
![Científicos detectan un misterioso mensajero](https://www.infobae.com/resizer/v2/P7P62V6TWRBXBC357PNF4PV44Y.jpg?auth=255bffd0d8ed00cb46a59d0d74e5559742211779a1c5a4f0d5572ede4f36f130&smart=true&width=350&height=197&quality=85)
Hallaron más de 170 bombas de la Segunda Guerra Mundial bajo un parque infantil del Reino Unido
Los artefactos sin estallar fueron descritos como “bombas de práctica” que aún llevan carga y deben ser retiradas por profesionales
![Hallaron más de 170 bombas](https://www.infobae.com/resizer/v2/RKYB3ATJOBHZZGC2JTXMOGSZR4.jpg?auth=31d57f444c6ff4f286af9b328146966821e90533754177894eab9801e8cbc0c6&smart=true&width=350&height=197&quality=85)
Prisioneros invisibles: la tragedia oculta de los ucranianos detenidos en cárceles rusas
Decenas de miles de civiles han desaparecido en un sistema sin garantías legales, enfrentando torturas y aislamiento en una de las mayores violaciones a los derechos humanos de la guerra
![Prisioneros invisibles: la tragedia oculta](https://www.infobae.com/resizer/v2/G3ZH25K6OZB47LUD7T4KYMUHHI.jpg?auth=426ed41ea864ec89247a6b910e34569a189ae9bc0535edec113019a7ac174620&smart=true&width=350&height=197&quality=85)
Mientras Ucrania lucha por conseguir soldados, los centros de reclutamiento son atacados
Kiev insiste en que los ataques están orquestados por Rusia, pero el país se muestra cada vez más reacio a unirse a la lucha a medida que se prolonga la guerra
![Mientras Ucrania lucha por conseguir](https://www.infobae.com/resizer/v2/JQDCICLUFW4JOCBUYLN6U53VWQ.jpg?auth=1c3ad96bbd981de843c12bddb2320574d4b1e1c7f4eadaf0c316f41338d045b0&smart=true&width=350&height=197&quality=85)
Un juez bloqueó temporalmente el plan de renuncias de la Administración Trump para empleados federales
El fallo del magistrado George A. O’Toole Jr frenó la estrategia de la Casa Blanca para reducir el aparato estatal y deja en el aire el futuro de millones de empleados públicos
![Un juez bloqueó temporalmente el](https://www.infobae.com/resizer/v2/AD44IURF6NAMVIYGFJNMTDUKME.jpg?auth=eeda03e8fe79687079faa66f2364da816ba299cc6ba9352eac4362ba05ac1e24&smart=true&width=350&height=197&quality=85)