MusicGen, la inteligencia artificial de Meta y Google que crea música con texto

Los audios generados tienen una duración de 12 segundos y se pueden mezclar con archivos propios

Guardar
La plataforma es de acceso gratuito en una versión que aún está en desarrollo. (Freepik)
La plataforma es de acceso gratuito en una versión que aún está en desarrollo. (Freepik)

Meta apuesta por una nueva inteligencia artificial llamada MusicGen para crear música a través de descripciones. El proyecto es gratuito y las pistas de audio que genera son de corta duración.

Para desarrollar esta plataforma, la empresa creó un modelo de lenguaje basado en Transformer de Google, que fue entrenado con 20.000 horas de música, tomando como referencia 10.000 pistas de audio de alta calidad y datos de Shutterstock y Pond5, repositorios de audio licenciado.

Además de generar pistas con texto, se pueden realizar mezclas con archivos de audio personales para que el sistema tome esa referencia y la combine con la descripción para generar el resultado esperado.

Cómo fusiona MusicGen

Al igual que la mayoría de páginas de IA generativa, cuenta con una caja de texto donde se escribe la indicación y a un costado la plataforma empieza a generar la pista de audio, que tiene una duración de 12 segundos aproximadamente.

El sitio no está pensado para crear una canción completa o una lista de producción, sino pequeñas pistas que sirvan de inspiración o para momentos puntuales. Aunque es posible extender esa duración por unos segundos más si luego se añade un archivo de audio de referencia para que el sistema haga una mezcla.

La plataforma es de acceso gratuito en una versión que aún está en desarrollo. (Freepik)
La plataforma es de acceso gratuito en una versión que aún está en desarrollo. (Freepik)

MusicGen es capaz de analizar el texto que escribe el usuario para entender las palabras más importantes y desde ahí empezar la composición de la pequeña pieza musical, lo que hace de la descripción el elemento fundamental para recibir un resultado acorde a lo deseado.

Además, si se vuelve a usar la misma descripción, el resultado cambiará cada vez porque el proceso lo hace desde cero, especialmente si en la petición se añaden archivos de audio propios.

Cómo usar esta IA

En este momento MusicGen continúa en desarrollo, pero hay acceso a una demo gratuita en el portal de proyectos de IA Hugging Face, por lo que de momento no tiene un sitio o una aplicación oficial.

Para interactuar con la IA hay que seguir estos pasos:

1. Ir a huggingface.co.

2. En la página inicial buscar la sección de las organizaciones que utilizan la plataforma, donde se encuentra el logo de Meta.

3. Al ingresar allí se abrirán todos los proyectos que tiene la empresa en la página y en la parte superior aparecerá MusicGen. Dar clic en ese banner.

La plataforma es de acceso gratuito en una versión que aún está en desarrollo.
La plataforma es de acceso gratuito en una versión que aún está en desarrollo.

En ese momento se abre una página con una caja de texto sencilla donde se debe describir en inglés la idea de audio que tenemos. Al lado está la casilla para agregar un archivo de audio desde la computadora y luego una tercera sección donde se genera la pista.

El proceso de creación, luego de agregar la instrucción, puede tardar varios minutos y no es inmediato como en otras plataformas, por lo que hay que esperar para luego tener la opción de escuchar y descargar la pieza de audio generada.

En caso de no tener una idea de qué generar y solo empezar a probar la IA, abajo de la caja de texto, el sitio ofrece algunos ejemplos que se pueden usar para empezar a interactuar con ella.

MusicGen cuenta con código abierto, por lo que es posible conocer el modelo que está detrás y está disponible GitHub y se permite el uso comercial para que los interesados en llevar el sistema a otras plataformas o estudiarlo por cuenta propia en profundidad.

Guardar