Introduction
GitHub Copilot CLI introduit une nouvelle fonctionnalité expérimentale appelée Rubber Duck, qui permet à un agent de codage de solliciter une deuxième opinion avant d'exécuter un plan. Cette fonctionnalité utilise un modèle d'une famille d'IA différente pour examiner les plans et les travaux de l'agent et fournir des commentaires.
Contexte Technique
Les agents de codage suivent généralement une boucle claire : évaluation de la tâche, planification, mise en œuvre, test et itération si nécessaire. Cependant, cette approche peut avoir des angles morts, en particulier lors de la planification. Les décisions prises par l'agent à ce stade peuvent devenir des dépendances et entraîner des erreurs plus importantes. Rubber Duck est conçu pour pallier ces limites en fournissant une revue indépendante des plans et des travaux de l'agent.
Rubber Duck est alimenté par un modèle d'une famille d'IA complémentaire à celle utilisée par l'agent principal. Lorsque l'agent principal est un modèle Claude, Rubber Duck utilise un modèle GPT-5.4. Cette approche permet de combiner les forces de différents modèles pour améliorer la qualité des résultats.
Analyse et Implications
Les évaluations de Rubber Duck ont montré que la combinaison de Claude Sonnet et de Rubber Duck peut combler 74,7 % de l'écart de performance entre Sonnet et Opus. Cette amélioration est particulièrement notable pour les tâches difficiles qui nécessitent plusieurs fichiers et étapes. Rubber Duck peut aider à identifier les détails manquants, les hypothèses à remettre en question et les cas limites à considérer.
Perspective
Rubber Duck est actuellement disponible en mode expérimental et peut être activé en utilisant la commande /experimental dans GitHub Copilot CLI. Les utilisateurs peuvent fournir des commentaires pour aider à améliorer cette fonctionnalité. À l'avenir, il est prévu d'explorer d'autres familles de modèles pour Rubber Duck et d'améliorer son intégration avec d'autres outils et fonctionnalités de GitHub Copilot.