Introduction
L'utilisation d'ordinateur est désormais une fonctionnalité intégrée dans Gemini 3.5 Flash, offrant les meilleures performances pour les tâches d'utilisation d'ordinateur agentic. Cette fonctionnalité était précédemment disponible sous la forme d'un modèle d'utilisation d'ordinateur Gemini 2.5 autonome.
Contexte Technique
Gemini 3.5 Flash intègre désormais l'utilisation d'ordinateur de manière native, permettant aux développeurs de créer des agents personnalisés capables de voir, de raisonner et d'agir dans les environnements de navigateur, mobile et de bureau. Cette intégration permet d'améliorer les performances pour les tâches d'automatisation à long terme et les tâches d'entreprise, telles que les tests de logiciels continus et le travail du savoir dans les applications professionnelles.
La version 3.5 Flash utilise l'utilisation d'ordinateur pour analyser l'application Gemini et renvoyer une liste catégorisée de fonctionnalités. De plus, 3.5 Flash avec l'utilisation d'ordinateur peut auditer sa propre documentation pour les problèmes d'accessibilité.
Analyse et Implications
Pour atténuer les risques d'injection de requêtes pour les agents fonctionnant dans des environnements réels, Gemini 3.5 Flash utilise une formation adverse ciblée pour l'utilisation d'ordinateur. Deux systèmes de sauvegarde d'entreprise optionnels sont également mis à disposition pour permettre aux entreprises d'exiger une confirmation explicite de l'utilisateur pour les actions sensibles ou irréversibles et d'arrêter automatiquement les tâches si une injection de requête indirecte est détectée.
Ces mesures de sécurité sont essentielles pour garantir un usage sûr de l'utilisation d'ordinateur dans les environnements d'entreprise. Les développeurs sont encouragés à combiner ces fonctionnalités avec des mesures de sécurité telles que le sandboxing sécurisé, la vérification humaine et les contrôles d'accès stricts.
Perspective
Les clients commencent déjà à tirer parti de l'utilisation d'ordinateur dans Gemini 3.5 Flash. Pour commencer à développer avec l'utilisation d'ordinateur, les développeurs peuvent tester les capacités dans un environnement de démonstration hébergé par Browserbase ou plonger dans la mise en œuvre de référence et la documentation via l'API Gemini et la plate-forme d'agent d'entreprise Gemini.