Introduction
Les agents de codage peuvent être mis en interaction sans utiliser d'API, de SDK ou de dépendances supplémentaires. Cette approche permet de tester des flux de travail multi-agents avec un minimum de configuration.
Contexte Technique
Le principe est de laisser un agent invoquer un autre agent via l'interface de ligne de commande (CLI) tout en préservant la conversation précédente. Les commandes utilisées sont codex exec resume --last "prompt" et gemini -r latest -p "prompt". L'agent résume la session précédente au lieu de démarrer une nouvelle session à chaque appel.
Analyse et Implications
Cette approche permet de créer des boucles de rétroaction entre les agents, ce qui peut être utile pour améliorer la qualité des résultats. Cependant, il est important de noter que les modèles de langage peuvent produire des textes plausibles mais non nécessairement meilleurs. La question est de savoir si les résultats finals sont réellement améliorés ou si ce sont juste des hallucinations plus polies produites après une chaîne d'interactions plus longue.
Perspective
Il est possible de surveiller les interactions entre les agents en utilisant des outils comme tmux, qui permet de voir ce que chaque agent fait dans des panes ou des sessions séparées et de capturer leur sortie plus facilement. Les conventions pour ce pattern peuvent être stockées dans un fichier de mémoire de Claude, ce qui permet aux autres agents de les lire et de les réutiliser.
En résumé, si vous utilisez déjà des agents de codage basés sur des abonnements, la façon la plus simple de les faire collaborer sans payer pour l'utilisation d'API est d'utiliser des appels non interactifs avec reprise lorsque vous voulez de la simplicité, et d'utiliser tmux lorsque vous voulez de la visibilité et un contrôle plus serré.