La nueva red neuronal de Stable Audio genera música a partir de descripciones de texto

· 2 min de lectura
La nueva red neuronal de Stable Audio genera música a partir de descripciones de texto

Stability AI, conocida sobre todo por sus redes neuronales para generar imágenes (Stable Diffusion, Stable Doodle y otras), ha lanzado una nueva red neuronal llamada Stable Audio. Como su nombre indica, genera clips de audio.

Todo funciona más o menos igual que los generadores de imágenes basados en descripciones de texto. El usuario especifica las palabras clave (por ejemplo, "hip-hop lo-fi melódico, melódico, 85 BPM" o "death metal con potentes riffs de guitarra y batería rápida"), la duración deseada y espera el resultado.

Se basó en el mismo modelo que Stable Diffusion, pero se entrenó con música en lugar de imágenes. En total, se alimentó con unas 800.000 canciones del sitio de música de archivo AudioSparx, es decir, unas 19.500 horas de sonidos diversos.

Los creadores señalan que la principal característica de Stable Audio es su capacidad para generar canciones de una duración determinada. Antes, las redes neuronales sólo funcionaban con duraciones fijas: si se entrenaban con clips de audio de 30 segundos, sólo podían generar canciones de 30 segundos. Para poder ajustar la duración de la pista, los desarrolladores tenían que cambiar el modelo y añadir metadatos para el principio y el final de la canción.

Stable Audio se ofrece en tres modelos. La versión gratuita permite generar un máximo de 20 pistas de hasta 45 segundos al mes. También hay una suscripción Profesional, que ofrece crear hasta 500 pistas de hasta 90 segundos por 12 dólares al mes (≈1.200 rublos) y una opción Enterprise para empresas con la posibilidad de seleccionar el volumen de generación y el precio individualmente. Sin una suscripción de pago, la música generada no puede utilizarse con fines comerciales.

Al igual que otras redes neuronales similares, Stable Audio está dirigida a creadores de contenidos más que a músicos profesionales. Estas herramientas son adecuadas para crear rápidamente música de fondo para podcasts y vídeos cuando no se dispone de tiempo o presupuesto para colaborar con un compositor. También puede sustituir a los sonidos de stock, si lo que quieres es una risa única o el estruendo de la multitud.

Puedes probar Stable Audio en el sitio web oficial. Tendrás que registrarte o iniciar sesión con una cuenta de Google. Al principio, el acceso puede interrumpirse debido a la gran carga del servidor.

Stable Audio →