Un video generado por inteligencia artificial muestra a la Mona Lisa, la célebre obra de Leonardo Da Vinci, interpretando un rap escrito y realizado por Anne Hathaway.
Se trata de un desarrollo tecnológico que promete revolucionar la manera en se interactúa con las imágenes y el audio, introducido por Microsoft: una nueva inteligencia artificial capaz de dar vida a fotografías estáticas mediante la generación de videos realistas en los que los personajes hablan.
Esta herramienta, conocida como VASA-1, no solo logra una perfecta sincronización de los labios con el audio proporcionado sino que también imita movimientos naturales de la cabeza, los ojos y la cara. La presentación de esta tecnología, que también es aplicable a caricaturas e ilustraciones, se realizó el pasado 16 de abril de 2024, según difundió CNN.
La creación de la Mona Lisa de VASA-1 se basó en el entrenamiento con numerosos videos de personas hablando, lo que permitió al modelo aprender y reproducir los movimientos naturales de la expresión facial, incluidos gestos sutiles como la dirección de la mirada y el parpadeo.
Una publicación en la red social X que presentaba el clip de la Mona Lisa, alcanzó rápidamente siete millones de vistas en cuatro días. Las reacciones no se hicieron esperar, divididas entre la admiración y el asombro. Algunos usuarios expresaron su deleite, con comentarios como que el video los había hecho “revolcarse de risa en el suelo”, mientras que otros lo encontraron “salvaje, espeluznante y escalofriante todo a la vez”, una combinación de fascinación y preocupación hacia los avances que representa esta tecnología.
Los investigadores detrás de VASA-1 de Microsoft aseguraron que no planean lanzar una demostración en línea ni un producto “hasta que estemos seguros de que la tecnología será utilizada de manera responsable y de acuerdo con las regulaciones adecuadas”, citó TIME Magazine. “Estamos en contra de cualquier comportamiento que cree contenidos engañosos o perjudiciales de personas reales”, añadieron.
Sin embargo, las consideraciones éticas no detienen a Microsoft en su investigación, ya que también destacan el potencial positivo de su tecnología. Entre los beneficios citados se incluyen la mejora de la equidad educativa, la mejora de la accesibilidad para personas con dificultades de comunicación, y la provisión de compañía o apoyo terapéutico, entre muchos otros. El enfoque está puesto en “desarrollar AI de manera responsable, con el objetivo de avanzar en el bienestar humano”.
Cabe destacar que este desarrollo llega en un momento crítico a nivel global, donde los gobiernos se esfuerzan por regular estas nuevas tecnologías. Un ejemplo de la urgencia de estas medidas es el creciente problema del deepfake pornográfico, que afecta la privacidad y reputación de individuos sin su consentimiento, un asunto que incluso ha afectado a celebridades como Taylor Swift.
En Estados Unidos, aunque diez estados criminalizan los deepfakes, la ley federal aún no lo hace, aunque se han introducido múltiples propuestas en el Congreso para abordar este problema. En marzo, la Unión Europea adoptó el Acto de Inteligencia Artificial, que establece salvaguardas específicas para la IA, incluyendo sistemas de identificación biométrica, puntuación social y derechos a la queja y a la transparencia