Optimisation de l'efficacité des jetons dans les flux de travail GitHub Agentic

Introduction

Les flux de travail GitHub Agentic sont comme une équipe de nettoyeurs de rues qui nettoient les petits désordres dans votre référentiel. Ces équipes améliorent considérablement l'hygiène et la qualité du référentiel, mais comme pour tout travail agentic, le coût est une préoccupation croissante pour les développeurs. Heureusement, rendre les automatisations plus efficaces est plus facile que pour les sessions de bureau interactives.

Contexte Technique

Les flux de travail agentic sont entièrement spécifiés en YAML et se répètent à chaque exécution. Nous utilisons des centaines de flux de travail agentic dans nos référentiels pour la maintenance et l'intégration continue. Chaque flux de travail émet des journaux dans un format différent, et les données d'utilisation peuvent être incomplètes pour les exécutions historiques. Nous avons utilisé un proxy API pour capturer l'utilisation des jetons dans un format normalisé.

Analyse et Implications

Nous avons créé deux flux de travail d'optimisation quotidienne : un auditeur de l'utilisation des jetons et un optimiseur de jetons. L'auditeur lit les artefacts d'utilisation des jetons des exécutions de flux de travail récentes, agrège la consommation par flux de travail et publie un rapport structuré. L'optimiseur examine le code source et les journaux récents du flux de travail pour créer un problème GitHub avec des descriptions concrètes d'inefficacités et des propositions d'optimisation.

Les résultats préliminaires montrent que la principale inefficacité est l'enregistrement inutile d'outils MCP. Nous avons identifié que les appels MCP pour les opérations de récupération de données peuvent être remplacés par des appels à l'interface de ligne de commande GitHub, ce qui réduit considérablement l'utilisation des jetons.

Perspective

Il est essentiel de surveiller les limites et les prochaines étapes de l'optimisation des flux de travail agentic. Nous devons nous assurer que les changements apportés améliorent réellement l'efficacité et ne réduisent pas simplement la quantité de travail effectuée. Nous utilisons une métrique d'jetons efficaces (ET) pour prendre en compte les différences de coût entre les modèles et les types de jetons.

Optimisation de l'efficacité des jetons dans les flux de travail GitHub Agentic

Introduction

Contexte Technique

Analyse et Implications

Perspective

Articles similaires

GitHub et PNUD : développement ouvert au Ghana

Transition numérique : l'expérience d'un ingénieur chez GitHub

Évaluation de GitHub Copilot

GitHub défend l'open source face à la loi californienne sur la transparence de l'IA

Optimisation de l'efficacité des jetons dans les flux de travail GitHub Agentic

Introduction

Contexte Technique

Analyse et Implications

Perspective

Articles similaires

GitHub et PNUD : développement ouvert au Ghana

Transition numérique : l'expérience d'un ingénieur chez GitHub

Évaluation de GitHub Copilot

GitHub défend l'open source face à la loi californienne sur la transparence de l'IA

Sauvegarder l'article