Introduction
L'application Gemini de Google DeepMind vient de franchir une nouvelle étape dans la création de contenu personnalisé en intégrant la génération de musique customisée grâce à son modèle Lyria 3. Cette fonctionnalité permet aux utilisateurs de créer des morceaux de musique uniques en fonction de leurs idées ou de photos uploadées.
Contexte Technique
Lyria 3 améliore la génération audio par rapport aux modèles précédents en offrant trois avancées majeures : la génération automatique de paroles en fonction de la prompt, un contrôle créatif accru sur les éléments tels que le style, les voix et le tempo, ainsi que la possibilité de créer des pistes plus réalistes et musicalement complexes. Les utilisateurs peuvent créer des pistes de 30 secondes avec des artworks de couverture personnalisés générés par Nano Banana.
Analyse et Implications
L'intégration de Lyria 3 dans l'application Gemini ouvre de nouvelles possibilités pour les créateurs de contenu, notamment sur YouTube avec Dream Track, où les créateurs peuvent utiliser Lyria 3 pour améliorer la qualité des bandes sonores de leurs Shorts. De plus, Google a mis en place des capacités de vérification audio pour identifier le contenu généré par l'IA, avec un watermark imperceptible appelé SynthID, et permet aux utilisateurs de vérifier si un fichier a été généré à l'aide de l'IA de Google.
Perspective
L'objectif de cette technologie est de fournir un outil de création de contenu personnalisé et amusant, plutôt que de produire des chefs-d'œuvre musicaux. Cependant, Google est conscient des défis liés aux droits d'auteur et aux accords de partenariat, et a mis en place des filtres pour vérifier les sorties contre le contenu existant. L'application Gemini est disponible pour les utilisateurs de 18 ans et plus dans plusieurs langues, avec des plans d'expansion pour d'autres langues et une meilleure qualité.