El motivo por el que ChatGPT no es bueno para resolver problemas matemáticos

Guardar

ChatGPT puede ser una calculadora simple, pero tiene muchos problemas con operaciones más complejas y que requieran análisis. (REUTERS/Dado Ruvic/Illustration/File Photo)

Las matemáticas son el punto débil de muchas personas, que sufrieron en su infancia durante la época de colegio. Una situación que hasta el mismo ChatGPT vive. El chatbot de OpenAI es capaz de generar textos, mantener conversaciones, componer poesías o analizar imágenes, pero todavía tiene una debilidad con la resolución de problemas matemáticos.

Este problema se extiende a otras ramas de este sector, como la aritmética y la geometría, y radica principalmente en el uso de lenguaje natural para pedirle una situación, ya que si ingresamos una operación simple a través de números, sus resultados serán similares a los de una calculadora. Pero todo cambia si lo hacemos con lenguaje natural.

Aunque la computación ha sido históricamente utilizada para resolver problemas matemáticos complejos, la situación con modelos de lenguaje como ChatGPT es distinta. A primera vista, este chatbot parece manejar bien los cálculos sencillos si se formulan en términos numéricos. Pero si el problema se presenta en lenguaje natural, los resultados son erráticos. Esto es especialmente notable en problemas más complejos, donde la IA falla estrepitosamente.

ChatGPT puede ser una calculadora simple, pero tiene muchos problemas con operaciones más complejas y que requieran análisis. (Imagen Ilustrativa Infobae)

Uno de los factores que explican esta incapacidad es el proceso de tokenización, una técnica utilizada por los modelos de IA para dividir el texto en partes más pequeñas o “tokens”. Este proceso funciona bien para palabras, donde los tokens pueden representar sílabas o fragmentos de palabras, pero se vuelve problemático al enfrentarse a números.

Por ejemplo, un número como “380″ puede ser interpretado por el modelo como un solo token, mientras que “381″ podría ser dividido en dos partes, “38″ y “1″. Esta falta de consistencia hace que los modelos pierdan las relaciones matemáticas entre los dígitos, lo que genera errores en los cálculos.

Sin embargo, la tokenización no es el único problema. ChatGPT y otras IA son, esencialmente, máquinas estadísticas que se entrenan para detectar patrones en grandes cantidades de datos. Esto significa que, cuando el chatbot se enfrenta a un problema matemático, no está realizando los cálculos de la manera en que lo haría una calculadora, sino que está intentando predecir la respuesta basándose en ejemplos que ha visto durante su entrenamiento.

Esto puede generar aciertos parciales, pero también errores graves, especialmente en problemas que involucran múltiples pasos intermedios, como en la multiplicación de números grandes.

ChatGPT puede ser una calculadora simple, pero tiene muchos problemas con operaciones más complejas y que requieran análisis. (EFE/ Wu Hao)

Un estudio realizado por Yuntian Deng, profesor de la Universidad de Waterloo, mostró que ChatGPT, en su modelo GPT-4o, tiene una tasa de precisión inferior al 30% al resolver problemas de multiplicación con más de cuatro dígitos. Esto se debe a que cualquier error en un paso intermedio puede afectar drásticamente el resultado final.

Según Deng, esta es una de las principales razones por las cuales los modelos de lenguaje fallan en las matemáticas: no siguen el mismo enfoque secuencial que usamos los humanos para resolver problemas.

Un ejemplo práctico de esta limitación fue expuesto por el profesor Paul T. von Hippel, de la Universidad de Texas en Austin, en un artículo publicado en The Wall Street Journal. Von Hippel utilizó a ChatGPT para resolver un problema matemático relacionado con el teorema de Pitágoras. Aunque el chatbot pudo definir el teorema y ofrecer ejemplos, cometió errores simples en los cálculos al elevar un número al cuadrado, algo que cualquier calculadora básica puede hacer sin problemas.

Este tipo de error es recurrente. Un ejemplo concreto involucró un problema aparentemente sencillo: “Una caja contiene 6 bananas y 2 kilos de manzanas. Si cada manzana pesa 200 gramos, ¿cuántas frutas hay dentro de la caja?” Cuando se le planteó esta pregunta a ChatGPT, la respuesta fue incorrecta.

ChatGPT puede ser una calculadora simple, pero tiene muchos problemas con operaciones más complejas y que requieran análisis. (Imagen Ilustrativa Infobae)

El chatbot calculó correctamente que 2 kilos de manzanas equivalían a 2.000 gramos, pero no dividió esta cantidad entre los 200 gramos que pesa cada manzana para determinar el número total de frutas. En su lugar, se enfocó en sumar los pesos y concluyó que había 2,6 kilos de frutas, asumiendo incorrectamente el peso de las bananas. La respuesta correcta debería haber sido 16 frutas: 6 bananas y 10 manzanas.

Este tipo de errores se debe, en parte, a la incapacidad de ChatGPT para comprender plenamente el lenguaje natural cuando se refiere a problemas matemáticos. La IA no siempre logra interpretar correctamente lo que se le pide, lo que afecta su rendimiento en situaciones que requieren razonamiento matemático. Solo cuando se le especificó de manera clara que debía determinar el número de unidades de fruta en la caja, ChatGPT pudo resolver el problema correctamente.

A pesar de las limitaciones actuales, hay esperanza de que los modelos de IA puedan mejorar en el futuro en cuanto a sus capacidades matemáticas. Modelos más recientes, como el o1 de OpenAI, han mostrado mejoras significativas al abordar problemas matemáticos de manera más lógica y secuencial.

En lugar de simplemente predecir la respuesta basándose en patrones, estos modelos razonan paso a paso, lo que aumenta la probabilidad de llegar a la solución correcta. Deng y otros investigadores creen que, con el tiempo, los problemas matemáticos, especialmente aquellos relacionados con multiplicación y aritmética compleja, podrían resolverse por completo.

Últimas Noticias

Lanzan nuevas gafas inteligentes que desafían a Meta Ray-Ban: Snap llega en 2026 con lentes inmersivos

Entre las funcionalidades de Specs sobresalen la asistencia de inteligencia artificial aplicada al espacio tridimensional y la capacidad de convertirse en una estación de trabajo flexible y potente

Glosario de tecnología: qué significa Bytecode (código intermedio)

Conocer el significado de nuevas palabras ayudará a incrementar el conocimiento y vocabulario por igual

¿Adiós a Kratos?: Santa Monica Studio lanza pistas sobre su nueva saga al estilo God of War

Una oferta laboral advirtió que el equipo busca talento especializado en diseño de niveles tridimensionales. Cómo esta experiencia innovadora podría ser diferente a lo visto en entregas anteriores, según publicó Alfa Beta

Call Screening, la nueva función de iPhone para evitar llamadas spam y fraudes telefónicos: cómo activarla

Quienes poseen un modelo de iPhone más antiguo y piensan que Call Screening no estará disponible en sus equipos deben saber que Apple ha confirmado que iOS 26 será compatible con una amplia variedad de dispositivos

Altafulla y Melissa Gate arrasan en Spotify tras La Casa de los Famosos: estas son sus cifras

Por su parte, La Toxi Costeña registra 214.200 oyentes mensuales en esta plataforma y su tema viral ‘Macta llega’ ya supera los 14 millones de reproducciones

El motivo por el que ChatGPT no es bueno para resolver problemas matemáticos

La inteligencia artificial suele tener una precisión del 30% en este tipo de casos, debido a su forma de pensar y analizar la información

Por qué ChatGPT tiene limitaciones con las matemáticas

Qué tipo de errores suele cometer ChatGPT en matemáticas

Últimas Noticias

Lanzan nuevas gafas inteligentes que desafían a Meta Ray-Ban: Snap llega en 2026 con lentes inmersivos

Entre las funcionalidades de Specs sobresalen la asistencia de inteligencia artificial aplicada al espacio tridimensional y la capacidad de convertirse en una estación de trabajo flexible y potente

Glosario de tecnología: qué significa Bytecode (código intermedio)

Conocer el significado de nuevas palabras ayudará a incrementar el conocimiento y vocabulario por igual

¿Adiós a Kratos?: Santa Monica Studio lanza pistas sobre su nueva saga al estilo God of War

Una oferta laboral advirtió que el equipo busca talento especializado en diseño de niveles tridimensionales. Cómo esta experiencia innovadora podría ser diferente a lo visto en entregas anteriores, según publicó Alfa Beta

Call Screening, la nueva función de iPhone para evitar llamadas spam y fraudes telefónicos: cómo activarla

Quienes poseen un modelo de iPhone más antiguo y piensan que Call Screening no estará disponible en sus equipos deben saber que Apple ha confirmado que iOS 26 será compatible con una amplia variedad de dispositivos

Altafulla y Melissa Gate arrasan en Spotify tras La Casa de los Famosos: estas son sus cifras

Por su parte, La Toxi Costeña registra 214.200 oyentes mensuales en esta plataforma y su tema viral ‘Macta llega’ ya supera los 14 millones de reproducciones

El secreto de Islandia para ser uno de los países más felices del mundo

Advierten que el riesgo país no bajará hasta que crezcan las reservas del Banco Central

Tres de cada cuatro pymes planean invertir en el corto plazo aunque les preocupa el acceso al financiamiento

La NASA hizo nuevos cálculos y elevó la probabilidad de impacto del asteroide YR4 contra la Luna

Cómo es el nuevo sanatorio de alta complejidad de Nordelta orientado al cuidado integral del paciente

La Unión Europea incluyó a Venezuela y Mónaco en su lista de países con alto riesgo de lavado de dinero

Biodiversidad en riesgo: cómo la colaboración entre zoológicos y comunidades ayuda a salvar especies en peligro

Sobrevivió a un accidente en Canadá que pudo ser mortal y resurgió en la Fórmula 1 aferrado a su fe en Juan Pablo II

Rusia lanzó un nuevo ataque con drones contra Kharkiv: al menos dos muertos, 54 heridos y varios edificios en ruinas

Gustavo Santaolalla transforma cuatro paisajes clásicos de Madrid en una novedosa experiencia sonora

La reacción de los jugadores de Gran Hermano luego de que unos extraños les vaciaran la casa

El llamativo rol de los hijos de Wanda Nara y Evangelina Anderson en el partido de la Selección Argentina

Fernando Dente fue a ver a su novio Pablo Turturiello a La Sirenita: “Me genera una admiración enorme”

Juana Repetto contó cuánto dinero gasta por mes en terapia: “Me estoy hundiendo”

El alivio de Tamara Báez al confirmar que su mamá recibió el alta médica: “Gracias Dios por estar con nosotros”

Por qué ChatGPT tiene limitaciones con las matemáticas

Qué tipo de errores suele cometer ChatGPT en matemáticas

Temas Relacionados

Últimas Noticias

Lanzan nuevas gafas inteligentes que desafían a Meta Ray-Ban: Snap llega en 2026 con lentes inmersivos

Entre las funcionalidades de Specs sobresalen la asistencia de inteligencia artificial aplicada al espacio tridimensional y la capacidad de convertirse en una estación de trabajo flexible y potente

Glosario de tecnología: qué significa Bytecode (código intermedio)

Conocer el significado de nuevas palabras ayudará a incrementar el conocimiento y vocabulario por igual

¿Adiós a Kratos?: Santa Monica Studio lanza pistas sobre su nueva saga al estilo God of War

Una oferta laboral advirtió que el equipo busca talento especializado en diseño de niveles tridimensionales. Cómo esta experiencia innovadora podría ser diferente a lo visto en entregas anteriores, según publicó Alfa Beta

Call Screening, la nueva función de iPhone para evitar llamadas spam y fraudes telefónicos: cómo activarla

Quienes poseen un modelo de iPhone más antiguo y piensan que Call Screening no estará disponible en sus equipos deben saber que Apple ha confirmado que iOS 26 será compatible con una amplia variedad de dispositivos

Altafulla y Melissa Gate arrasan en Spotify tras La Casa de los Famosos: estas son sus cifras

Por su parte, La Toxi Costeña registra 214.200 oyentes mensuales en esta plataforma y su tema viral ‘Macta llega’ ya supera los 14 millones de reproducciones

El secreto de Islandia para ser uno de los países más felices del mundo

Advierten que el riesgo país no bajará hasta que crezcan las reservas del Banco Central

Tres de cada cuatro pymes planean invertir en el corto plazo aunque les preocupa el acceso al financiamiento

La NASA hizo nuevos cálculos y elevó la probabilidad de impacto del asteroide YR4 contra la Luna

Cómo es el nuevo sanatorio de alta complejidad de Nordelta orientado al cuidado integral del paciente

La Unión Europea incluyó a Venezuela y Mónaco en su lista de países con alto riesgo de lavado de dinero

Biodiversidad en riesgo: cómo la colaboración entre zoológicos y comunidades ayuda a salvar especies en peligro

Sobrevivió a un accidente en Canadá que pudo ser mortal y resurgió en la Fórmula 1 aferrado a su fe en Juan Pablo II

Rusia lanzó un nuevo ataque con drones contra Kharkiv: al menos dos muertos, 54 heridos y varios edificios en ruinas

Gustavo Santaolalla transforma cuatro paisajes clásicos de Madrid en una novedosa experiencia sonora

La reacción de los jugadores de Gran Hermano luego de que unos extraños les vaciaran la casa

El llamativo rol de los hijos de Wanda Nara y Evangelina Anderson en el partido de la Selección Argentina

Fernando Dente fue a ver a su novio Pablo Turturiello a La Sirenita: “Me genera una admiración enorme”

Juana Repetto contó cuánto dinero gasta por mes en terapia: “Me estoy hundiendo”

El alivio de Tamara Báez al confirmar que su mamá recibió el alta médica: “Gracias Dios por estar con nosotros”