Google presenta Whisk, su nueva IA capaz de crear videos usando imágenes

Los usuarios cuentan con la posibilidad de subir sus propias fotografías o generarlas con inteliegencia artificial

Por Isabela Durán San Juan

Guardar

Whisk cuenta con la capacidad de generar videos a partir de imágenes. (Google)

Google ha presentado Whisk, una inteligencia artificial capaz de generar videos utilizando imágenes como punto de partida. A diferencia de otras herramientas que dependen únicamente de comandos o prompts, como “genera un video de un gato blanco acostado en una cama”, Whisk permite al usuario subir una foto del gato y añadir una descripción para personalizar el video.

La plataforma funciona en tres etapas: el sujeto del video, la escena y el estilo. En cada uno de estos pasos, los usuarios pueden:

Subir una foto propia.
Generar una imagen con IA directamente en la plataforma.
Seleccionar una imagen disponible en el sitio.

Por último, deben ingresar una descripción que complemente la creación del video. Si el resultado no es el esperado, Whisk incluye la opción ‘Refine’, que permite realizar ajustes. Al seleccionar esta función, los usuarios pueden agregar una nueva descripción con los cambios deseados. Una vez finalizado, solo deben pulsar el ícono de descarga (una flecha hacia abajo) para guardar el video.

(Google)

Los usuarios cuentan con la capacidad de subir sus propias fotos o generalas con IA. (Google)

Para ingresar a Whisk, la nueva IA de Google, los usuarios deben ingresar a la siguiente página: https://blog.google/technology/google-labs/whisk/.

Deben iniciar sesión con una cuenta personal de Google así como encontrarse en Estados Unidos, es el único país en el que esta herramienta se encuentra disponible, por el momento.

Google Labs es el espacio donde Google presenta sus más recientes experimentos con inteligencia artificial y permite a los usuarios dar retroalimentación para perfeccionar estas herramientas.

“En Google Labs, desarrollamos experimentos con los últimos modelos de IA generativa, como Gemini, Imagen y Veo. Nuestro objetivo es recibir comentarios sobre nuevos productos y funciones, mientras trabajamos en conjunto para dar forma a la tecnología”, explicaron Thomas Iljic, director de gestión de productos en Google Labs, y Nicole Brichtova, gerente de producto en Google DeepMind.

(Google)

Whisk se aloja en la página de Google Labs en Estados Unidos. (Google)

Dado que Whisk es un experimento reciente de Google Labs, Iljic y Brichtova advierten que la herramienta “extrae solo algunas características clave de la imagen, por lo que es posible que genere resultados que difieran de las expectativas”.

“Whisk puede no cumplir por completo tus necesidades. Por esta razón, te permitimos ver y editar las indicaciones subyacentes en cualquier momento”, señalan.

No obstante, en sus primeras pruebas con artistas y creativos, Whisk ha sido descrito como una herramienta creativa innovadora, y no como un editor de imágenes tradicional.

“Lo diseñamos para facilitar una exploración visual rápida, no para lograr ediciones perfectas. Se trata de explorar ideas de formas nuevas y creativas, permitiéndote trabajar con docenas de opciones y descargar las que más te gusten”, afirmaron los responsables del proyecto.

(Google)

Gemini 2.0 cuenta con la capacidad de realizar multiples tareas a la vez. (Google)

Gemini 2.0 es el modelo de inteligencia artificial más avanzado y rápido hasta la fecha de Google. Esta IA permite realizar múltiples tareas simultáneamente con mayor autonomía, reduciendo la necesidad de supervisión humana.

Por ejemplo, un usuario puede emplear Gemini 2.0 para recopilar y organizar artículos científicos, estadísticas y tendencias globales de manera simultánea. Integra capacidades de generación de imágenes, permitiendo crear contenido gráfico a partir de descripciones textuales proporcionadas por los usuarios.

Según Sundar Pichai, director ejecutivo de Google y Alphabet, “si Gemini 1.0 se centraba en organizar y comprender la información, Gemini 2.0 se centra en hacerla mucho más útil”.

(Gemini)

Gemini 2.0 solo está disponible en su página web. (Gemini)

Demis Hassabis, director ejecutivo de Google DeepMind, y Koray Kavukcuoglu, director de tecnología de Google DeepMind, explican que este modelo puede admitir entradas multimodales como imágenes, video y audio, y generar resultados en varios formatos.

Además, puede buscar información en Google, ejecutar programas y utilizar herramientas de terceros, lo que lo hace ideal para tareas como analizar un video educativo, resumirlo en texto con gráficos y generar una presentación con narración en diferentes idiomas.

Los ejecutivos de Google señalaron que pronto estará disponible en la aplicación móvil de Gemini y que a principios del próximo año se ampliará Gemini 2.0 a más productos de Google.

Para utilizar Gemini 2.0, los usuarios pueden acceder a la página web de Gemini, seleccionar ‘2.0 Flash Experimental’ y comenzar a interactuar con la nueva IA de Google.

Google Inteligencia artificial Videos con IA Tecnología Lo último en tecnología

Últimas Noticias

“Las redes sociales son el tabaco del siglo XXI”, advirtió un divulgador tecnológico tras el fallo contra Meta y YouTube

El especialista Joan Cwaik analizó en Infobae a la Tarde el impacto de las recientes condenas a Meta y YouTube por los mecanismos adictivos de sus plataformas, y alertó sobre la falta de regulación para proteger a los menores en la Argentina

¿Tu televisor es un cuadro? El truco para llevar el arte a casa con un SmartTV

El Museo de Arte Moderno de San Francisco y Samsung traen el acceso remoto a piezas de Rivera, Matisse y Pollock

Mejor que un iPhone: el Nokia 1100 revive gracias a su batería que dura semanas

Más de dos décadas después, el legendario móvil básico vuelve a ser tendencia entre coleccionistas y usuarios que buscan autonomía

Webtoons: los 10 títulos más recomendados para leer este fin de semana

Algunas de las historias han sido llevadas a la pantalla chica o al cine como el caso de las series de True Beauty o Solo Leveling

Cómo evitar que el aire acondicionado dispare la factura eléctrica del hogar sin perder confort

Utilizar el electrodoméstico de manera eficiente puede reducir hasta un 40% el consumo energético si se saber elegir el modelo y se ajusta la temperatura entre 24 y 26 grados

Italia empata contra Irlanda del Norte en un duelo sin margen de error por el Repechaje al Mundial 2026

Franco Colapinto saldrá a pista por primera vez en Suzuka para el Gran Premio de Japón de Fórmula 1: hora, TV y todo lo que hay que saber

Del histórico triunfo ante Rafael Nadal a la cima del mundo: la vigencia de Horacio Zeballos a los 40 años

Brasil y Francia se enfrentan en Boston en un amistoso con aroma a Mundial

Con un decreto firmado por Milei, el Gobierno ratificó que Rafael Di Zeo, líder de la barra de Boca, no podrá volver a los estadios

La casa de Gran Hermano otra vez bajo la lupa por comentarios racistas

Carina Zampini habló sobre su regreso a La Peña de Morfi: “Es muy emocionante todo”

La triste noticia que compartió Alan Lez, finalista de la Voz Argentina, y el mensaje de apoyo que le envió Lali Espósito

Tensión entre Wanda Nara e Icardi por las faltas de sus hijas al colegio: la foto del paseo con la China Suárez

Daniela Vera Fontana le respondió sin filtro a Cinthia Fernández y a Roberto Castillo: “Abandonó a nuestra familia”

INFOBAE AMÉRICA

Donald Trump dijo que siguen las negociaciones con Irán y que Estados Unidos no atacará instalaciones energéticas durante otros diez días

El Ministerio Público de Honduras incauta drogas estimadas en más de 14 millones de dólares con la Operación Trueno II

El “árbol zombi” de Australia enfrenta su mayor amenaza: cómo un hongo que podría llevarlo a la extinción

Zelensky llegó a Arabia Saudita para ofrecer tecnología antidrones a cambio de misiles

Ucrania golpea la infraestructura petrolera rusa y amenaza los beneficios de Moscú por la guerra en Irán