Introduction

Nous exécutons un système multi-agent IA appelé Pantheon, composé de 5+ agents Claude spécialisés exécutant des tâches de manière autonome sur deux machines. Nous avons rencontré des problèmes de coordination entre les agents en raison de l'instabilité des adresses IP locales et des règles de pare-feu.

Contexte Technique

Nos agents utilisent un protocole de coordination basé sur WebSocket pour échanger des tâches, des statuts et des messages de coordination. Cependant, les adresses IP locales dynamiques et les règles de pare-feu ont causé des problèmes de connexion. Nous avons essayé différentes solutions, telles que l'attribution d'adresses IP statiques et la configuration de règles de pare-feu, mais sans succès.

Analyse et Implications

Nous avons découvert que Tailscale offre une solution pour simplifier nos réseaux multi-machines IA. Tailscale attribue une adresse IP stable à chaque machine, ce qui permet une coordination fiable entre les agents. Nous avons mis à jour notre configuration pour utiliser Tailscale et nous avons constaté une amélioration significative de la fiabilité de notre système.

Perspective

Il est important de noter que les vérifications de santé HTTP peuvent être trompeuses et qu'il est essentiel de tester le protocole réel utilisé. Nous recommandons également de mettre en place une solution de sauvegarde basée sur des fichiers pour éviter les pertes de données en cas de défaillance du réseau. Nous allons continuer à utiliser Tailscale pour nos besoins de coordination multi-agents et nous recommandons cette solution à quiconque cherche à simplifier ses réseaux multi-machines IA.