Google revela Lumiere, una inteligencia artificial que crea videos realistas

En su plataforma Github, la compañía presentó el modelo de inteligencia artificial que da vida a imágenes estáticas y a textos

Guardar
La nueva herramienta permite modificar los videos en tiempo real. (YouTube: Inbar Mosseri)

Gracias a la inteligencia artificial se han desarrollado plataformas capaces de crear imágenes a partir de video, pero Google ha dado un paso adelante con Lumiere.

Presentado en la plataforma Github, este modelo de IA tiene la capacidad de dar vida a palabras e imágenes estáticas, transformándolas en secuencias de video bastante realistas.

Antes, los intentos por crear videos realistas dejaban mucho que desear. La falta de dinamismo y la evidente artificialidad de los movimientos eran sencillos de detectar. A primera vista, se notaba que los videos eran creaciones digitales, limitando su uso y afectando la experiencia del espectador.

Conscientes de estas limitaciones, los ingenieros de Google reinventaron el enfoque, creando un nuevo modelo capaz de construir el video en su totalidad de una sola vez.

La herramienta combina creatividad y tecnología impulsada con IA. (Github)

Este cambio técnico ha sido crucial. Ahora, el modelo no depende de la unión de fotogramas separados ni de aumentar artificialmente su resolución para crear una ilusión de conexión. Lumiere teje cada instante del video con una habilidad sin precedentes, haciendo que el resultado final fluya con naturalidad.

Las implicaciones de este avance son amplias y prometedoras. Desde la industria del entretenimiento hasta la educativa, la capacidad de generar videos realistas y dinámicos de forma sencilla y efectiva abre un abanico de posibilidades casi ilimitado.

Funciones de Lumiere

Aunque Lumiere aún no está disponible para el público en general, las expectativas en torno a sus capacidades son altas. Se anticipa que esta herramienta de inteligencia artificial permitirá a los usuarios generar videos a partir de simples textos o imágenes con resultados de alta fidelidad. Las funciones esperadas son:

- Crear estilos nuevos: a partir de una foto de referencia, se podrían inventar imágenes en movimiento o quizás, darles un toque de dibujo animado. Por ejemplo, se pueden hacer perros de flores.

A partir de una imagen original, la persona puede pedir que se modifique la apariencia. (Github)

- Dar vida a fotos fijas: en una muestra, se ve cómo Lumiere puede hacer que una imagen de una mariposa reposando en una planta o de las llamas de una fogata se muevan, como si cobraran vida.

- Completar videos: Lumiere también ha demostrado ser capaz de terminar videos que están incompletos o tienen partes eliminadas, rellenando con gran precisión los espacios faltantes.

- Hacer cambios al instante: si la persona quisiera modificar la ropa que lleva en un video, solo tiene que escoger la parte que quieres cambiar y la inteligencia artificial le permitirá sustituirla por otro atuendo, con solo describir lo que se busca.

Entonces, los usuarios se encuentran ante un montón de nuevas formas de hacer videos más creativos y con mejor edición.

Esta IA fue creada por Google Research en colaboración con la Universidad de Tel Aviv. (Github)

Por ahora, Lumiere no está disponible para que todos la usen; lo que sus creadores han hecho es publicar un informe detallado que muestra los avances que han logrado.

El robot de Google que cocina

La Universidad de Stanford ha revelado una nueva herramienta tecnológica que podría transformar las tareas cotidianas en el hogar. Se trata de Mobile ALOHA, un robot capaz de realizar actividades domésticas como cocinar camarones, lavar los platos y doblar la ropa.

Este sistema robótico amplía las posibilidades de las máquinas para manipular objetos con ambas manos y se puede controlar a distancia con facilidad y a un bajo costo.

El robot es capaz de manipular objetos filosos como cuchillos. (Universidad de Stanford)
El robot es capaz de manipular objetos filosos como cuchillos. (Universidad de Stanford)

Mobile ALOHA representa un paso adelante en el desarrollo de robots, ya que combina la movilidad con habilidades avanzadas de manipulación, y está basado en el sistema ALOHA (A Low-cost Open-source Hardware System for Bimanual Teleoperation) de Google DeepMind, uno de los sistemas de aprendizaje automático más avanzados en la robótica actual.

Este sistema añade la capacidad de desplazarse y una interfaz que permite controlar al robot imitando los movimientos humanos. Esto es un avance respecto a los métodos antiguos de aprendizaje automático, que usualmente se practicaban solo en entornos teóricos y no en condiciones reales.

Guardar