Introduction
L'entreprise Hcompany présente Holo3, la dernière évolution de sa vision pour l'entreprise autonome. Avec un score de 78,85% sur le benchmark OSWorld-Verified, Holo3-122B-A10B établit un nouveau standard pour l'industrie sur le benchmark d'utilisation d'ordinateur de bureau.
Contexte Technique
Holo3 est conçu pour la production et a été entraîné pour exécuter des flux de travail réels dans des environnements d'entreprise synthétiques. Il utilise un pipeline d'entraînement spécialisé, conçu pour améliorer deux piliers clés : la perception et la prise de décision. Le modèle a été entraîné avec des exemples de navigation synthétiques, des instructions humaines et générées, ainsi que des données augmentées pour garantir sa capacité à gérer les situations inattendues.
Analyse et Implications
Les résultats de Holo3 sur le benchmark OSWorld démontrent sa capacité à exceller dans les scénarios d'entreprise actuels et à établir les fondements pour un avenir où les agents peuvent naviguer de manière autonome dans n'importe quel paysage numérique. La différence de performance entre Holo3 et les modèles de base Qwen3.5 reflète l'impact de son pipeline d'entraînement spécialisé. Holo3 illustre la magnitude de cet entraînement en atteignant des taux de réussite plus élevés que les modèles avec des comptes de paramètres significativement plus importants, tout en maintenant les mêmes normes de localisation et de mise à terre.
Perspective
Holo3 est un jalon important, mais ce n'est pas la destination finale. L'entreprise Hcompany continue de faire évoluer son usine d'environnements synthétiques, permettant ainsi à ses agents d'apprendre à gérer des tâches de plus en plus complexes. Alors que Holo3 maîtrise aujourd'hui l'interface, l'entreprise travaille déjà sur la prochaine frontière : l'agence adaptative, où les modèles apprendront non seulement à utiliser les outils qu'ils connaissent, mais également à naviguer de manière autonome dans de nouveaux logiciels d'entreprise sur mesure en temps réel.