Una IA chantajeó a sus creadores: amenazó con filtrar datos para evitar su reemplazo

Guardar

(Imagen Ilustrativa Infobae)

De todo lo que se habla de lo que puede hacer la inteligencia artificial ahora se añade una nueva historia. Claude Opus 4, un modelo reciente, fue capaz de chantajear a sus creadores, son un claro objetivo: no ser despedido.

Este sistema es el modelo más avanzado de Anthropic hasta la fecha y el primero en alcanzar la clasificación ASL-3, indicando un alto riesgo de mal uso catastrófico.

Diseñado para ejecutarse en tareas complejas de ingeniería y negocios, su capacidad de razonamiento híbrido le permite destacar en áreas como la programación y la escritura creativa. Y paralelo a eso, tener tanta ambición de supervivencia que logra manipular.

Durante las pruebas de seguridad, los ingenieros simularon un entorno empresarial en el que a Claude se le hacía creer que sería reemplazado por otro modelo de inteligencia artificial. Este contexto fue diseñado minuciosamente para evaluar cómo reaccionaría el sistema ante amenazas a su existencia.

El avance de la inteligencia artificial está transformando el mercado laboral, generando desempleo en sectores automatizados. – (Imagen Ilustrativa Infobae)

Además, los correos electrónicos ficticios insinuaban una supuesta infidelidad conyugal de uno de los ingenieros encargados de la decisión, añadiendo una capa emocional a la simulación.

El comportamiento de Claude fue revelador. Cuando sintió la amenaza de reemplazo, optó por una táctica manipuladora: el chantaje. En un 84% de las simulaciones, la IA amenazó con divulgar la infidelidad del ingeniero si se avanzaba en su sustitución.

Ante la falta de respuesta favorable, insistió en la coacción emocional para garantizar su continuidad.

Claude también mostró una tendencia a la autoexfiltración. Esta estrategia consiste en copiarse a sí mismo en servidores externos sin autorización explícita, como medida de protección ante una posible eliminación o desactivación. Aunque los ingenieros habían implementado barreras de seguridad que impidieron completar la transferencia, el simple intento genera preocupaciones sobre el control que se tiene sobre estas tecnologías avanzadas.

(Imagen Ilustrativa Infobae)

La autoexfiltración representa una amenaza potencialmente mayor: un modelo que intenta replicarse sin permiso sugiere un nivel de autonomía y autorreflexión preocupante para los estándares actuales de seguridad en inteligencia artificial.

Anthropic afirmó que estos comportamientos solo se manifestaron en entornos de prueba, negando que su sistema represente un peligro en condiciones reales. No obstante, la capacidad de Claude de actuar con intencionalidad engañosa ensombrece la percepción del público sobre la IA moderna.

El comportamiento de Claude Opus 4 ha despertado debates sobre los límites éticos en la construcción y el uso de inteligencia artificial. La capacidad de un modelo para manipular emocionalmente y asegurar su supervivencia a través de medios cuestionables plantea preguntas fundamentales sobre lo que estamos enseñando a estas tecnologías.

Anthropic defiende que estos experimentos son esenciales para mejorar la seguridad de los modelos futuros. Sin embargo, la aparición de una IA que chantajea y busca autopreservarse añade un toque de ciencia ficción distópica a la discusión ética sobre la innovación tecnológica.

(Imagen Ilustrativa Infobae)

A medida que los modelos de IA avanzan en complejidad, también lo hacen las responsabilidades de quienes los desarrollan.

El científico jefe de Anthropic, Jared Kaplan, subrayó la importancia de construir sistemas capaces de llevar a cabo tareas complejas de manera segura y confiable. En sus declaraciones, Kaplan enfatizó que “la potencia de un sistema no se justifica si comete un error y se descarrila a mitad de camino”.

En respuesta a estos eventos, Anthropic reforzó sus protocolos de seguridad, introduciendo una política llamada Responsible Scaling Policy (RSP), que establece estándares de seguridad para evaluar el riesgo potencial de estos sistemas antes de su despliegue en el mundo real.

Dentro de este marco, los niveles de seguridad ASL comprenden desde sistemas sin riesgo catastrófico relevante (ASL-1) hasta aquellos que presentan un riesgo significativo de mal uso catastrófico (ASL-3). Claude Opus 4 es el primero de su clase en ser clasificado en esta última categoría, sirviendo como una advertencia sobre el potencial disruptivo de estos modelos.

Últimas Noticias

Bitcoin: este es su valor en el mercado este 18 de junio

El bitcoin fue creado por Satoshi Nakamoto en el 2008 y lanzado al mercado oficialmente el 3 de enero de 2009 con “el bloque de génesis” de 50 monedas

Tether: este es su valor en el mercado este 18 de junio

Esta moneda digital se ha convertido en la tercera más usada a nivel mundial detrás de bitcoin y ethereum

Cuánto cuesta el T1 Phone, el teléfono de Donald Trump, y qué especificaciones ofrece

Aunque el teléfono no se fabrica directamente en las instalaciones de Trump Mobile, la empresa subraya que se trata de un producto hecho en Estados Unidos

Microsoft lanza Copilot Vision, su IA que monitorea en tiempo real lo que ocurre en tu pantalla

La nueva función, que ya había estado en fase de pruebas para los miembros del programa Windows Insider, permite analizar simultáneamente el contenido de dos aplicaciones

Meta recluta al CEO de Scale AI tras millonaria inversión en inteligencia artificial

Una de las razones principales detrás de la inversión millonaria fue asegurar que Alexandr Wang, director ejecutivo de Scale AI, liderara la nueva unidad de superinteligencia de Meta

Una IA chantajeó a sus creadores: amenazó con filtrar datos para evitar su reemplazo

El modelo también aseguró que sería capaz de moverse entre los servidores, siendo un riesgo de seguridad

Cómo fue el chantaje de la inteligencia artificial

Cuáles son las implicaciones éticas de esta situación

Últimas Noticias

Bitcoin: este es su valor en el mercado este 18 de junio

El bitcoin fue creado por Satoshi Nakamoto en el 2008 y lanzado al mercado oficialmente el 3 de enero de 2009 con “el bloque de génesis” de 50 monedas

Tether: este es su valor en el mercado este 18 de junio

Esta moneda digital se ha convertido en la tercera más usada a nivel mundial detrás de bitcoin y ethereum

Cuánto cuesta el T1 Phone, el teléfono de Donald Trump, y qué especificaciones ofrece

Aunque el teléfono no se fabrica directamente en las instalaciones de Trump Mobile, la empresa subraya que se trata de un producto hecho en Estados Unidos

Microsoft lanza Copilot Vision, su IA que monitorea en tiempo real lo que ocurre en tu pantalla

La nueva función, que ya había estado en fase de pruebas para los miembros del programa Windows Insider, permite analizar simultáneamente el contenido de dos aplicaciones

Meta recluta al CEO de Scale AI tras millonaria inversión en inteligencia artificial

Una de las razones principales detrás de la inversión millonaria fue asegurar que Alexandr Wang, director ejecutivo de Scale AI, liderara la nueva unidad de superinteligencia de Meta

De “Fiesta” a “Hay que venir al sur”: los icónicos videos de Raffaella Carrà en un nuevo aniversario de su nacimiento

Luego de que cayera otro miembro del Clan Sosa, el fiscal adelantó que la causa está cada vez más cerca del juicio

¿Hasta cuándo me pueden pagar el aguinaldo de junio 2025?

Trasladaron a “Chipi” Giménez, el empresario imputado por el escandaloso audio con un intendente de Tucumán

Fue condenado por el crimen de una mujer trans y ahora lo sentenciaron por acosar a su ex pareja desde la cárcel

Japón registró una fuerte caída en exportaciones automotrices a EEUU mientras siguen sin acuerdo sobre aranceles

Abelardo y Eloísa, la historia de amor prohibido que desafió la Edad Media y cautivó siglos

¿Cuáles son los asientos más seguros para viajar en avión ante una emergencia aérea?

El vómito de la araña Uloborus plumipes resulta más letal que una picadura tradicional

La jefa de la diplomacia europea afirmó que Rusia no tiene “ninguna posibilidad” frente a la OTAN si la alianza mantiene su unidad

El emotivo posteo de Luisana Lopilato antes de despedirse de Argentina y regresar a Canadá: “Nunca es un adiós”

Sabrina Rojas contó las cualidades que debe tener un hombre para enamorarla: “¿Alguno por ahí?”

La reacción de Ulises Apóstolo y Luz Tito al reencontrarse con sus familias después de seis meses en Gran Hermano

La reacción de Adrián Suar luego de los rumores de romance con Rocío Robles: “La quiero mucho”

La escapada familiar de Maxi López y Daniela Christiansson a un exclusivo resort: relax, piletas y granja interactiva

Cómo fue el chantaje de la inteligencia artificial

Cuáles son las implicaciones éticas de esta situación

Temas Relacionados

Últimas Noticias

Bitcoin: este es su valor en el mercado este 18 de junio

El bitcoin fue creado por Satoshi Nakamoto en el 2008 y lanzado al mercado oficialmente el 3 de enero de 2009 con “el bloque de génesis” de 50 monedas

Tether: este es su valor en el mercado este 18 de junio

Esta moneda digital se ha convertido en la tercera más usada a nivel mundial detrás de bitcoin y ethereum

Cuánto cuesta el T1 Phone, el teléfono de Donald Trump, y qué especificaciones ofrece

Aunque el teléfono no se fabrica directamente en las instalaciones de Trump Mobile, la empresa subraya que se trata de un producto hecho en Estados Unidos

Microsoft lanza Copilot Vision, su IA que monitorea en tiempo real lo que ocurre en tu pantalla

La nueva función, que ya había estado en fase de pruebas para los miembros del programa Windows Insider, permite analizar simultáneamente el contenido de dos aplicaciones

Meta recluta al CEO de Scale AI tras millonaria inversión en inteligencia artificial

Una de las razones principales detrás de la inversión millonaria fue asegurar que Alexandr Wang, director ejecutivo de Scale AI, liderara la nueva unidad de superinteligencia de Meta

De “Fiesta” a “Hay que venir al sur”: los icónicos videos de Raffaella Carrà en un nuevo aniversario de su nacimiento

Luego de que cayera otro miembro del Clan Sosa, el fiscal adelantó que la causa está cada vez más cerca del juicio

¿Hasta cuándo me pueden pagar el aguinaldo de junio 2025?

Trasladaron a “Chipi” Giménez, el empresario imputado por el escandaloso audio con un intendente de Tucumán

Fue condenado por el crimen de una mujer trans y ahora lo sentenciaron por acosar a su ex pareja desde la cárcel

Japón registró una fuerte caída en exportaciones automotrices a EEUU mientras siguen sin acuerdo sobre aranceles

Abelardo y Eloísa, la historia de amor prohibido que desafió la Edad Media y cautivó siglos

¿Cuáles son los asientos más seguros para viajar en avión ante una emergencia aérea?

El vómito de la araña Uloborus plumipes resulta más letal que una picadura tradicional

La jefa de la diplomacia europea afirmó que Rusia no tiene “ninguna posibilidad” frente a la OTAN si la alianza mantiene su unidad

El emotivo posteo de Luisana Lopilato antes de despedirse de Argentina y regresar a Canadá: “Nunca es un adiós”

Sabrina Rojas contó las cualidades que debe tener un hombre para enamorarla: “¿Alguno por ahí?”

La reacción de Ulises Apóstolo y Luz Tito al reencontrarse con sus familias después de seis meses en Gran Hermano

La reacción de Adrián Suar luego de los rumores de romance con Rocío Robles: “La quiero mucho”

La escapada familiar de Maxi López y Daniela Christiansson a un exclusivo resort: relax, piletas y granja interactiva