OpenAI presentó la tercera versión de su inteligencia artificial para generar imágenes a partir de texto, la cual llega con varias mejoras y nuevas características. Entre las cuales se destaca que DALL-E 3 ahora se integra de forma nativa en ChatGPT, permitiendo a los usuarios crear mejores prompts, solicitud o instrucción dada a un modelo de IA para que genere una respuesta, directamente desde el chatbot.
De acuerdo con la startup de Sam Altman, esta herramienta evoluciona considerablemente en comparación con su predecesora a la hora de interpretar las solicitudes de los usuarios. De hecho, al producir una imagen se podrá pedirle a al sistema de chat que la genere o que cree una indicación más extensa y detallada, que permitirá que DALL-E 3 la interprete mejor y ofrezca resultados más precisos.
Además, también dejará que los usuarios tengan la posibilidad de perfeccionar una creación como si estuvieran pidiendo cambios a un artista, gracias a esta integración con ChatGPT, que comprende mejor cómo debe componer una escena y cuál es la vinculación entre los elementos que forman parte de la misma.
Cómo funciona la integración
DALL-E utiliza lo que se conoce como un modelo de difusión con el fin de predecir cómo renderizar una imagen para una solicitud determinada. Con cantidades suficientemente grandes de datos, puede producir imágenes complejas, coherentes y estéticamente agradables.
La novedad de Dall-E 3 es que elimina parte de la complejidad necesaria para refinar el texto que se envía al programa, lo que se conoce como “ingeniería de prompts”, y permite a los usuarios introducir mejoras a través de la interfaz conversacional de ChatGPT.
“Los sistemas modernos de conversión de texto a imagen tienden a ignorar palabras o descripciones, lo que obliga a los usuarios a aprender ingeniería de prompts. DALL·E 3 representa una evolución en nuestra capacidad de generar imágenes que se adhieran exactamente al texto que proporcionas”, afirma OpenAI.
Por ejemplo, esta herramienta produjo la siguiente imagen en respuesta a la siguiente petición: “Una ilustración de un corazón humano hecho de cristal translúcido, de pie sobre un pedestal en medio de un mar tormentoso. Los rayos de sol atraviesan las nubes, iluminan el corazón y revelan un pequeño universo en su interior. La cita “Encuentra el universo dentro de ti” está grabada en negritas en el horizonte”.
Otro resultados notable es esta imagen surrealista que se generó con la ayuda de ChatGPT, a partir de esta sugerencia: “Un vasto paisaje hecho enteramente de diversas carnes se extiende ante el espectador. Tiernas y suculentas colinas de carne asada, árboles de muslos de pollo, ríos de tocino y rocas de jamón crean una escena surrealista pero apetitosa. El cielo está adornado con un sol de pepperoni y nubes de salami”.
Normalmente, esto requeriría un enorme esfuerzo de ingeniería de prompts, sin embargo con Dall-E 3, es ChatGPT se el encarga de crear ese mensaje más sofisticado.
DALL-E 3 promete mejores resultados y más seguridad
DALL-E 3 promete mejores resultados al incluir texto dentro de los dibujos, como también al lidiar con partes del cuerpo humano que antes fallaba en interpretar correctamente. Por ejemplo, las manos.
Además, también implementó medidas de seguridad más robustas con el fin de mitigar los sesgos e impedir el uso de la herramienta para crear contenidos potencialmente dañinos como deepfakes, que puede ser un video, una imagen o un audio generado que imita la apariencia y el sonido de una persona. De hecho, la herramienta se se negará a crear imágenes de figuras públicas a partir de su nombre.
Open AI también informó que ofrecerá a los artistas la posibilidad de eliminar sus obras de futuros entrenamientos de Dall-E 3, que además evitará que los usuarios intenten generar una obra de arte con el estilo de un artista conocido y cuenta con barreras para impedir que los usuarios generen obras de arte pornográficas o gráficamente violentas.
La nueva versión de la IA generativa llegará en octubre a los suscriptores de ChatGPT Plus y Enterprise a través de su API.