Introduction

Les robots tels que le chien robotique Spot de Boston Dynamics peuvent désormais lire avec précision les thermomètres et les manomètres analogiques tout en se déplaçant dans les usines et les entrepôts. Ces améliorations sont rendues possibles grâce au nouveau modèle d'IA robotique de Google DeepMind, conçu pour améliorer les capacités de raisonnement des robots dans les environnements physiques.

Contexte Technique

Le modèle Gemini Robotics-ER 1.6, annoncé le 14 avril, est un modèle de raisonnement de haut niveau pour les robots, capable de planifier et d'exécuter des tâches. Ce modèle débloque également la capacité de lire avec précision les instruments tels que les jauges complexes et de réaliser des inspections visuelles à l'aide de verres de vue qui offrent une fenêtre transparente pour regarder à l'intérieur des réservoirs et des tuyaux.

Le modèle Gemini Robotics-ER 1.6 fournit aux robots une « vision agente » qui combine le raisonnement visuel avec la capacité d'exécuter du code pour créer un « tampon visuel » pour inspecter et manipuler des images. Cette vision agente a été introduite dans le modèle Gemini 3.0 Flash de Google en janvier 2026.

Analyse et Implications

La capacité de vision agente du modèle Gemini Robotics-ER 1.6 améliore considérablement les performances des robots dans les tâches de lecture d'instruments, passant de 23 % dans le modèle Gemini Robotics-ER 1.5 à 98 % dans le nouveau modèle. Le modèle de base Gemini Robotics-ER 1.6 peut encore atteindre une précision de 86 % dans la lecture des instruments, même sans vision agente, en utilisant un processus de pointage vers différents éléments d'une image visuelle pour traiter des tâches complexes.

Perspective

Les améliorations apportées par le modèle Gemini Robotics-ER 1.6 ouvrent de nouvelles perspectives pour les applications de robots dans les environnements industriels. Il est important de surveiller les prochaines étapes dans le développement de cette technologie, notamment en termes de sécurité et de fiabilité, pour garantir une intégration efficace et sûre des robots dans les processus industriels.