Zuckerberg entrena su inteligencia artificial junto a Taylor Swift y su hijo Max

V-JEPA tiene la habilidad de predecir movimientos en los videos y se encuentra disponible para todo el mundo

Guardar
Esta es una de las canciones favoritas de su hija Max. (Instagram: zuck)

Mark Zuckerberg publicó un video a Instagram en el que muestra su talento para tocar la guitarra y cómo estaría entrando una futura inteligencia artificial.

En el video, sale tocando ‘How You Get the Girl’ de Taylor Swift en la guitarra, y no está solo, sino que lo acompaña su hija.

Pero no solo quiso compartir un momento musical familiar; también tenía una sorpresa tecnológica. Zuckerberg enseñó cómo se entrenó V-JEPA, una inteligencia artificial enfocada en el análisis de videos.

Entrenando una IA al ritmo de Taylor Swift

V-JEPA, la inteligencia artificial, aprende mirando muchos videos por sí misma. Lo hace de una manera especial: trata de adivinar qué pasa en partes de los videos que no puede ver porque están cubiertas.

La IA podría tener la habilidad de predecir movimientos humanos. (Instagram: zuck)

Imagina que estás viendo el video que Mark Zuckerberg compartió, tocando la guitarra junto a su hija. Si en un momento dado, una parte de ese video se tapa—por ejemplo, no puedes ver las cuerdas de la guitarra que él está pulsando—V-JEPA tratará de adivinar qué notas está tocando Zuckerberg en esa parte oculta, basándose en lo que ha aprendido de otros videos de personas tocando la guitarra.

Así, aunque no pueda ver todo el video, puede entender y predecir lo que está sucediendo.

“V-JEPA es un paso hacia una comprensión más sólida del mundo para que las máquinas puedan lograr un razonamiento y una planificación más generalizados”, dice el vicepresidente y científico jefe de IA de Meta, Yann LeCun, quien propuso las arquitecturas predictivas de integración conjunta (JEPA) originales en 2022.

V-JEPA no fue diseñado para entender solo un tipo de acción en los videos. En realidad, aprendió de una gran variedad de ellos mediante un método de aprendizaje donde observa y descubre por sí mismo, sin que nadie le diga exactamente qué buscar.

La IA se entrenó con una gran cantidad de videos. (Fotocomposición: Infobae)
La IA se entrenó con una gran cantidad de videos. (Fotocomposición: Infobae)

El equipo detrás de V-JEPA pensó mucho en cómo enseñarle. Descubrieron que si solo ocultan partes pequeñas o muy específicas del video, el aprendizaje se vuelve muy sencillo y V-JEPA no logra entender cosas más complejas sobre cómo funcionan el movimiento en el mundo real.

Además, se dieron cuenta de que en la mayoría de los videos los elementos no cambian tan rápido de un momento a otro.

Si escondían una parte del video pero solo por un instante muy breve, la IA podía ver lo que pasaba justo antes y después de ese momento, entonces aprender se volvía demasiado fácil.

La IA puede predecir movimientos. (Meta)
La IA puede predecir movimientos. (Meta)

Por eso, eligieron ocultar partes del video no solo en diferentes lugares sino también en diferentes momentos. Esto obligaba a V-JEPA a esforzarse más para entender y predecir lo que iba a pasar, ayudándole a desarrollar una mejor comprensión del mundo.

Posibles aplicaciones reales de V-JEPA

Para bien o para mal, como dice la canción de Taylor Swift que Zuckerberg toca en el video, esta inteligencia artificial podría tener alcances inesperados en varios sectores.

Una posible aplicación concreta de V-JEPA sería en el campo de la seguridad y vigilancia. Se podría implementar en sistemas de cámaras de seguridad que operan las 24 horas del día, tanto en ambientes públicos como privados.

Estas cámaras suelen generar volúmenes enormes de video, imposibles de monitorear en su totalidad por personas en tiempo real. V-JEPA, con su capacidad para aprender y hacer predicciones a partir de videos, podría analizar estos flujos de video continuos.

La IA es de código abierto. (Github)
La IA es de código abierto. (Github)

En situaciones donde la vista de la cámara se vea obstruida, ya sea por el paso de una persona enfrente de ella o por un objeto que caiga y bloquee parte de la escena, V-JEPA podría utilizar su aprendizaje para prever qué está ocurriendo en las partes no visibles.

Supervisión estricta de los videos dados

Aunque la IA V-JEPA tiene el potencial de ser usada para aplicaciones muy beneficiosas, como mejorar la seguridad y la vigilancia, existe la posibilidad de que también se le dé un uso no tan positivo.

Por esta razón, Meta ha destacado la importancia de revisar de manera estricta los videos utilizados para entrenarla, especialmente considerando que esta IA es de código abierto y está disponible para el público en GitHub.

Guardar