Introduction
L'efficacité des tokens est cruciale dans les systèmes multi-agents, car chaque token gaspillé équivaut à une perte d'argent. Nous avons constaté que nos 13 agents IA simultanés gaspillaient environ 60% de tokens sur des informations superflues.
Contexte Technique
Nos agents communiquaient initialement de manière similaire à la façon dont les humains écrivent des emails, avec des phrases de politesse et des explications détaillées. Cependant, cela a entraîné un gaspillage important de tokens. Nous avons donc créé un format de communication structuré appelé PAX (Parallel Agent eXchange) pour réduire ce gaspillage.
Le format PAX utilise des champs spécifiques tels que FROM, TO, STATUS, ACTION, RESULT, BLOCKERS et NEXT pour transmettre les informations essentielles de manière concise. Cela a permis de réduire de 70% le nombre de tokens utilisés.
Analyse et Implications
En analysant les communications entre les agents, nous avons identifié des phrases et des mots superflus qui ne transmettaient pas d'informations essentielles. Nous les avons remplacés par des synonymes plus courts et des abréviations pour améliorer l'efficacité des tokens.
Les agents sont maintenant programmés pour suivre un modèle de communication spécifique, appelé « caveman mode », qui privilégie la concision et l'efficacité. Ce modèle a non seulement réduit le gaspillage de tokens mais a également amélioré la clarté des sorties des agents.
Perspective
Nous sommes en train de créer un kit de démarrage pour les systèmes multi-agents, qui inclura les spécifications du protocole PAX et les modèles de prompts de système. Nous allons également ouvrir le code source de notre architecture pour que d'autres puissent en bénéficier.
En suivant ces principes d'efficacité des tokens et en adoptant le format PAX, les développeurs de systèmes multi-agents peuvent réduire considérablement le gaspillage de tokens et améliorer la performance de leurs systèmes.