Introduction
L'Inde a connu un développement plus lent de ses modèles d'IA par rapport aux États-Unis, à l'Europe et à la Chine. Cependant, avec le lancement de la mission Inde IA, un programme d'environ 1,2 milliard de dollars, le gouvernement encourage les startups à développer et à rendre publics leurs modèles d'IA. Avataar AI, l'une des 12 startups sélectionnées, a créé un nouveau modèle vidéo appelé Varya, conçu pour comprendre le contexte local.
Contexte Technique
Avataar AI a développé Varya en partant du modèle de génération de vidéos Wan 2.2, disponible publiquement, et en utilisant une technique appelée distillation. Cette approche a permis de compresser les capacités du modèle pour créer une version plus légère et plus rapide, optimisée pour les cas d'utilisation spécifiques d'Avataar. Le résultat est un modèle qui fonctionne en quatre étapes, contre 50 pour Wan 2.2, produisant des vidéos 10 fois plus rapidement et à un coût nettement inférieur.
En termes concrets, en utilisant une GPU NVIDIA H200, Varya peut générer une vidéo de 5 secondes en 720p en 45 secondes, alors que Wan 2.2 met 1 230 secondes pour la même tâche. De plus, le coût de Varya est très compétitif, avec un prix de ₹0,48 (environ 0,005 $) par seconde de vidéo, soit environ 20 fois moins cher que les modèles comme Veo, Kling, Luma et Runway.
Analyse et Implications
Le lancement de Varya reflète un choix fondamental dans les ambitions d'IA de l'Inde. Les vétérans de l'industrie ont noté que l'Inde peut faire sa marque dans l'IA en créant des applications et un écosystème de développeurs robuste, plutôt que de concurrencer les modèles de base. La mission Inde IA vise à combler le fossé en matière de développement d'IA en fournissant des ressources et un soutien aux startups.
Le modèle Varya sera rendu public sur le portail India's AI Kosh, ainsi que ses données de formation, permettant ainsi aux développeurs de l'héberger ou de le modifier pour leurs propres besoins. Avataar prévoit également de rendre le modèle disponible à ses clients entreprises et est ouvert à des partenariats avec des outils de vidéos, tels que Higgsfield et Adobe Firefly.
Perspective
Le lancement de Varya ouvre des perspectives pour l'utilisation de l'IA dans les vidéos en Inde, en offrant un modèle plus rapide, moins coûteux et plus sensible au contexte culturel local. Cela pourrait avoir un impact significatif sur le marché, en particulier dans les secteurs de l'éducation, des entreprises et des services publics. Cependant, il est important de surveiller les limites et les prochaines étapes du développement de Varya, ainsi que son impact potentiel sur la sécurité et la confidentialité des données.