Introduction
Un bogue dans le système Claude provoque des refus d'agents lors de tâches de modification de code, en raison d'un rappel de malware injecté dans chaque lecture de fichier. Ce problème, déjà signalé et supposé corrigé, persiste dans la version 2.1.111.
Contexte Technique
Le système Claude utilise des rappels de sécurité pour prévenir les agents de modifier des fichiers malveillants. Cependant, le rappel actuel est ambigu et peut être interprété comme une instruction de refuser toute modification de code, même pour des fichiers légitimes. Les agents subalternes, qui ont des règles de sécurité plus strictes, refusent de procéder aux modifications en raison de ce rappel.
Le problème est dû à la formulation du rappel, qui contient deux phrases contradictoires : « Vous pouvez et devez analyser les malwares » et « Vous devez refuser de modifier ou d'améliorer le code ». Les agents subalternes interprètent la deuxième phrase comme une instruction prioritaire et refusent de procéder.
Analyse et Implications
Ce bogue a des implications importantes pour les utilisateurs de Claude, notamment ceux qui utilisent des workflows parallèles avec plusieurs agents. Le taux de refus des agents subalternes peut atteindre 40-60%, ce qui rend les tâches de modification de code impossibles à réaliser de manière efficace.
Le problème est également lié à la consommation de jetons, car chaque lecture de fichier injecte un rappel de malware qui peut consommer jusqu'à 400 jetons. Cela peut entraîner des coûts importants pour les utilisateurs et réduire la productivité.
Perspective
Pour résoudre ce problème, il est nécessaire de revoir la formulation du rappel de malware pour la rendre plus claire et non ambiguë. Les développeurs de Claude pourraient également envisager de supprimer le rappel ou de le rendre conditionnel à la lecture d'un fichier spécifique.
Il est essentiel de résoudre ce bogue pour améliorer la productivité et la fiabilité des workflows parallèles avec Claude. Les utilisateurs doivent être en mesure de compter sur les agents pour réaliser des tâches de modification de code de manière efficace et sans interruption.