Introduction
Decart, une startup spécialisée dans l'intelligence artificielle (IA), a présenté Oasis 3, son dernier modèle de monde interactif capable de générer des environnements de conduite photoréalistes en temps réel. Ce modèle est actuellement disponible via une API.
Contexte Technique
Oasis 3 est conçu pour les entreprises de véhicules autonomes qui ont besoin de simuler des scénarios de conduite rares à grande échelle. Le modèle repose sur la fondation du modèle vidéo en temps réel de Decart, appelé Lucy, et représente la poussée de l'entreprise dans l'IA physique. L'accès est facturé à 0,02 $ par seconde, et les tarifs d'entreprise dépendent des cas d'utilisation.
Decart joue dans un domaine de plus en plus compétitif, avec des acteurs tels que Google, Fei-Fei Li's World Labs et des startups de génération de vidéos comme Luma et Runway. L'avantage d'Oasis 3 réside dans la photoréalisme de ses modèles et sa capacité de génération infinie, due à une optimisation efficace du logiciel Decart Optimization Stack (DOS) qui permet aux modèles de fonctionner efficacement sur le matériel Nvidia, Amazon et Google.
Analyse et Implications
Oasis 3 génère des environnements physiquement précis et multi-caméras pour la formation et les tests de systèmes. Cependant, le modèle présente certaines limites, telles qu'une dégradation significative de la cohérence thématique au fil du temps et des problèmes de physique dans l'environnement, comme la capacité des voitures à traverser d'autres véhicules.
Ces problèmes sont attribués à la nature auto-régressive du modèle, qui génère un cadre à la fois et se réfère à ce qui a été généré précédemment pour décider de ce qui vient ensuite. L'équipe de Decart travaille à améliorer la longueur de la mémoire du modèle pour résoudre ces problèmes de cohérence.
Perspective
Malgré ces limites, Decart mise sur la communauté des développeurs pour avancer le domaine des modèles de monde. En offrant l'accès à l'API dès le premier jour, l'entreprise espère créer un écosystème de développeurs autour des modèles de monde, similaire à ce qui a été réalisé avec les modèles de langage. Les prochaines étapes incluent l'amélioration de la cohérence du modèle et l'exploration de nouvelles applications pour les modèles de monde.