Introduction

Stability AI, la société derrière Stable Diffusion, lance une nouvelle famille de modèles audio appelée Stability Audio 3.0. Le modèle le plus avancé peut générer de la musique de professionnels d'une durée de plus de six minutes, selon l'entreprise.

Contexte Technique

La société propose quatre nouveaux modèles sous le nom de Stable Audio 3.0 : small SFX (459M paramètres), small (459M paramètres), moyen (1,4 milliard de paramètres) et grand (2,7 milliards de paramètres). Les deux modèles petits sont adaptés pour la génération de sons et de musique sur appareil jusqu'à deux minutes. Les modèles moyen et grand peuvent créer des compositions complètes de 6 minutes 20 secondes qui peuvent maintenir la structure musicale et la tonalité mélodique.

Stability AI met à disposition les modèles small SFX, small et moyen avec des poids ouverts pour que chacun puisse les utiliser et les modifier. Le modèle grand est disponible uniquement via l'API et les services d'hébergement autonome payants. Les entreprises avec plus d'un million de dollars de chiffre d'affaires devront obtenir une licence d'entreprise.

Analyse et Implications

De nombreuses entreprises, dont Google et ElevenLabs, publient des modèles et des outils autour de la génération de musique. Cependant, comme les batailles judiciaires en cours entre Suno et Udio l'ont prouvé, la licence de données et les partenariats avec les labels de musique pourraient devenir une partie clé de la survie à long terme de ces services.

Stability AI a conclu des accords avec Warner Music Group et Universal Music Group pour développer des modèles et des outils de création de musique. L'entreprise a déclaré que son dernier ensemble de modèles audio est construit sur des données entièrement licenciées.

Perspective

Stability AI développe une nouvelle gamme de produits pour les musiciens professionnels, mais n'a pas fourni plus de détails sur ses fonctionnalités. Ethan Kaplan, ancien directeur numérique d'Universal Audio et Fender, rejoint l'entreprise pour diriger l'offre musicale professionnelle de Stability.

Un certain nombre de sociétés d'IA tentent de renforcer leurs références en embauchant des dirigeants de l'industrie musicale. Plus tôt cette année, Suno a embauché l'ancien PDG de Merlin, Jeremy Sirota, en tant que directeur commercial. ElevenLabs a également embauché Derek Cournoyer de l'éditeur de musique indépendant Kobalt en tant que responsable de la stratégie pour son activité musicale.