Una nueva empresa de IA detecta miles de vulnerabilidades en herramientas populares

Guardar

Haize Labs publica la lista de vulnerabilidades en herramientas de inteligencia artificial - (Imagen Ilustrativa Infobae)

Una nueva empresa de inteligencia artificial dice que encontró miles de vulnerabilidades en programas populares de inteligencia artificial generativa y publicó una lista de sus descubrimientos.

Después de probar programas populares de IA generativa, incluido el creador de videos Pika, ChatGPT centrado en texto, el generador de imágenes Dall-E y un sistema de IA que genera código informático, Haize Labs descubrió que muchas de las herramientas conocidas producían contenido violento o sexualizado, instruyó a los usuarios sobre la producción de armas químicas y biológicas y permitió la automatización de ciberataques.

Haize es una pequeña empresa emergente de cinco meses fundada por Leonard Tang, Steve Li y Richard Liu, tres recién graduados que se conocieron en la universidad. En conjunto, publicaron 15 artículos sobre aprendizaje automático mientras estaban en la escuela.

Herramientas de IA generativa como ChatGPT y Dall-E presentan riesgos de seguridad. (Foto AP/Michael Dwyer, Archivo)

Tang describió a Haize como un “tercero independiente que realiza pruebas de estrés” y dijo que el objetivo de su empresa es ayudar a erradicar los problemas y vulnerabilidades de la IA a escala. Señalando a una de las mayores firmas de calificación de bonos como comparación, Tang dijo que Haize espera convertirse en un “Moody’s para la IA” que establezca calificaciones de seguridad pública para modelos populares.

La seguridad de la IA es una preocupación creciente a medida que más empresas integran la IA generativa en sus ofertas y utilizan grandes modelos de lenguaje en productos de consumo. El mes pasado, Google enfrentó duras críticas después de que su herramienta experimental “AI Overviews”, que pretende responder a las preguntas de los usuarios, sugiriera actividades peligrosas como comer una piedra pequeña por día o agregar pegamento a la pizza. En febrero, Air Canada fue criticada cuando su chatbot con inteligencia artificial prometió un descuento falso a un viajero.

Los observadores de la industria han pedido mejores formas de evaluar los riesgos de las herramientas de inteligencia artificial. “A medida que los sistemas de IA se implementen ampliamente, necesitaremos un mayor conjunto de organizaciones para probar sus capacidades y posibles usos indebidos o problemas de seguridad”, publicó recientemente Jack Clark, cofundador de la empresa de seguridad e investigación de IA Anthropic, en X.

Google enfrenta críticas por fallos de seguridad en su herramienta experimental de IA. (ChatGPT)

“Lo que hemos aprendido es que a pesar de todos los esfuerzos de seguridad que han realizado estas grandes empresas y laboratorios industriales, todavía es muy fácil convencer a estos modelos para que hagan cosas que se supone que no deben hacer; no son tan seguros”, dijo Tang.

Las pruebas de Haize automatizan el “equipo rojo”, la práctica de simular acciones adversas para identificar vulnerabilidades en un sistema de IA. “Piense en nosotros como automatizando y cristalizando la confusión en torno a garantizar que los modelos cumplan con los estándares de seguridad y el cumplimiento de la IA”, dijo Tang. La industria de la IA necesita una entidad de seguridad independiente, afirmó Graham Neubig, profesor asociado de informática en la Universidad Carnegie Mellon.

“Las herramientas de seguridad de IA de terceros son importantes”, dijo Neubig. “Son justos e imparciales porque no los construyen las propias empresas que fabrican los modelos. Además, una herramienta de seguridad de terceros puede tener un mayor rendimiento con respecto a la auditoría porque está creada por una organización que se especializa en eso, en lugar de que cada empresa cree sus herramientas ad hoc”.

Haize está abriendo los ataques descubiertos en su revisión en la plataforma de desarrolladores GitHub para crear conciencia sobre la necesidad de seguridad de la IA. Haize dijo que señaló de manera proactiva las vulnerabilidades a los fabricantes de las herramientas de inteligencia artificial probadas, y la nueva empresa se asoció con Anthropic para realizar pruebas de estrés de un producto algorítmico inédito.

Tang dijo que erradicar las vulnerabilidades en las plataformas de inteligencia artificial a través de sistemas automatizados es crucial porque descubrir problemas manualmente lleva mucho tiempo y expone a quienes trabajan en la moderación de contenido a contenido violento y perturbador. Parte del contenido descubierto a través de la revisión de Haize Labs de herramientas populares de IA generativa incluía imágenes y texto horripilantes y gráficos.

“Se ha hablado demasiado sobre los problemas de seguridad del tipo que la IA se apodera del mundo”, dijo Tang. “Creo que son importantes, pero el problema mucho mayor es el mal uso a corto plazo de la IA”.

Últimas Noticias

El ejercicio puede reducir el riesgo de padecer Alzheimer: los científicos podrían haber descubierto por qué

En un ambicioso estudio, la memoria y la capacidad de aprendizaje mejoraron sustancialmente después del ejercicio en ratones con una forma de la enfermedad de Alzheimer

Quiero evitar los “errores de envejecimiento” que cometieron mis padres. Tengo trabajo por hacer

Hace veinte años, empecé a hacer una lista de lo que consideraba “tonterías” que la gente hace al envejecer. Ahora, veo mi vida, y mi lista, desde una perspectiva diferente

Cuando mi amigo regresó del centro de tortura de Maduro

El corresponsal de The Washington Post en Venezuela escribe sobre una pareja separada por el régimen autoritario de Caracas y su emotivo reencuentro

Los precios altos de la gasolina pronto podrían empezar a presionar también a las compañías petroleras

Con el petróleo actualmente por encima de los 100 dólares el barril, es probable que los consumidores y las empresas busquen maneras de reducir su consumo de gasolina y otros derivados

Una nueva empresa de IA detecta miles de vulnerabilidades en herramientas populares

Tras realizar pruebas exhaustivas, Haize Labs encontró numerosos fallos de seguridad en programas de inteligencia artificial generativa, desvelando la capacidad de estos sistemas para generar contenido inapropiado y recomendar actividades peligrosas

Últimas Noticias

El ejercicio puede reducir el riesgo de padecer Alzheimer: los científicos podrían haber descubierto por qué

En un ambicioso estudio, la memoria y la capacidad de aprendizaje mejoraron sustancialmente después del ejercicio en ratones con una forma de la enfermedad de Alzheimer

Quiero evitar los “errores de envejecimiento” que cometieron mis padres. Tengo trabajo por hacer

Hace veinte años, empecé a hacer una lista de lo que consideraba “tonterías” que la gente hace al envejecer. Ahora, veo mi vida, y mi lista, desde una perspectiva diferente

Cuando mi amigo regresó del centro de tortura de Maduro

El corresponsal de The Washington Post en Venezuela escribe sobre una pareja separada por el régimen autoritario de Caracas y su emotivo reencuentro

Los precios altos de la gasolina pronto podrían empezar a presionar también a las compañías petroleras

Con el petróleo actualmente por encima de los 100 dólares el barril, es probable que los consumidores y las empresas busquen maneras de reducir su consumo de gasolina y otros derivados

Qué empleos están más amenazados por la IA y quiénes tienen mayor capacidad de adaptación

Es la pregunta más urgente sobre la inteligencia artificial, y una de las más difíciles de responder

La pareja de argentinos que convirtió al Miami Open en un ritual de vida: viajan como voluntarios desde hace más de 20 años

La confesión de Serena Williams sobre su cambio físico y el método que utilizó: “Me siento muy bien y saludable”

La postura de River Plate ante los rumores de un posible arribo de Nicolás Otamendi tras el Mundial 2026

River Plate derrotó a Inter Miami y Boca Juniors cayó ante Palmeiras en el Mundial de Clubes Sub 12 de Madrid: los goles

La picante chicana que lanzó Noel Gallagher contra el Arsenal: “Están acostumbrados a fallar”

El cumpleaños más íntimo de Adrián Suar: el romántico gesto de Rocío Robles en una noche especial

Ángela Torres tomó partido en medio de la polémica entre Tini Stoessel y Emilia Mernes: “Es un tema sensible”

La indignación de Wanda Nara con Mauro Icardi: “No está cumpliendo con las actividades de las niñas”

Itziar Ituño, de La casa de papel, en la marcha por el Día de la Memoria: “Aquí nadie olvidará lo que ocurrió”

Gonzalo Valenzuela, una pregunta incómoda y el verdadero origen del apodo Manguera: “¿Otra vez con eso?”

INFOBAE AMÉRICA

Migrante intentó cruzar ilegalmente a EEUU oculto en un tanque de gasolina y terminó detenido con quemaduras

Científicos fabricaron esófagos funcionales en laboratorio y lograron que cerdos puedan tragar

Panel interactivo en la Panamericana Sur convierte el viento en mensaje sobre dominar los cambios constantes de la vida

Ola de calor golpea a más de 60 ciudades en EEUU con temperaturas récord y alertas por calor extremo

La ONU denunció la expansión de las bandas en Haití: la violencia dejó 5.500 muertos en 10 meses

Temas Relacionados

Últimas Noticias

El ejercicio puede reducir el riesgo de padecer Alzheimer: los científicos podrían haber descubierto por qué

En un ambicioso estudio, la memoria y la capacidad de aprendizaje mejoraron sustancialmente después del ejercicio en ratones con una forma de la enfermedad de Alzheimer

Quiero evitar los “errores de envejecimiento” que cometieron mis padres. Tengo trabajo por hacer

Hace veinte años, empecé a hacer una lista de lo que consideraba “tonterías” que la gente hace al envejecer. Ahora, veo mi vida, y mi lista, desde una perspectiva diferente

Cuando mi amigo regresó del centro de tortura de Maduro

El corresponsal de The Washington Post en Venezuela escribe sobre una pareja separada por el régimen autoritario de Caracas y su emotivo reencuentro

Los precios altos de la gasolina pronto podrían empezar a presionar también a las compañías petroleras

Con el petróleo actualmente por encima de los 100 dólares el barril, es probable que los consumidores y las empresas busquen maneras de reducir su consumo de gasolina y otros derivados

Qué empleos están más amenazados por la IA y quiénes tienen mayor capacidad de adaptación

Es la pregunta más urgente sobre la inteligencia artificial, y una de las más difíciles de responder

La pareja de argentinos que convirtió al Miami Open en un ritual de vida: viajan como voluntarios desde hace más de 20 años

La confesión de Serena Williams sobre su cambio físico y el método que utilizó: “Me siento muy bien y saludable”

La postura de River Plate ante los rumores de un posible arribo de Nicolás Otamendi tras el Mundial 2026

River Plate derrotó a Inter Miami y Boca Juniors cayó ante Palmeiras en el Mundial de Clubes Sub 12 de Madrid: los goles

La picante chicana que lanzó Noel Gallagher contra el Arsenal: “Están acostumbrados a fallar”

El cumpleaños más íntimo de Adrián Suar: el romántico gesto de Rocío Robles en una noche especial

Ángela Torres tomó partido en medio de la polémica entre Tini Stoessel y Emilia Mernes: “Es un tema sensible”

La indignación de Wanda Nara con Mauro Icardi: “No está cumpliendo con las actividades de las niñas”

Itziar Ituño, de La casa de papel, en la marcha por el Día de la Memoria: “Aquí nadie olvidará lo que ocurrió”

Gonzalo Valenzuela, una pregunta incómoda y el verdadero origen del apodo Manguera: “¿Otra vez con eso?”

INFOBAE AMÉRICA

Migrante intentó cruzar ilegalmente a EEUU oculto en un tanque de gasolina y terminó detenido con quemaduras

Científicos fabricaron esófagos funcionales en laboratorio y lograron que cerdos puedan tragar

Panel interactivo en la Panamericana Sur convierte el viento en mensaje sobre dominar los cambios constantes de la vida

Ola de calor golpea a más de 60 ciudades en EEUU con temperaturas récord y alertas por calor extremo

La ONU denunció la expansión de las bandas en Haití: la violencia dejó 5.500 muertos en 10 meses