Introduction

Grafana Labs Inc. annonce le lancement de nouvelles capacités pour améliorer l'observabilité des modèles d'intelligence artificielle (IA) et renforcer la confiance et le contrôle dans la production.

Contexte Technique

Les entreprises intègrent de plus en plus d'agents d'IA dans leurs flux de travail pour améliorer l'automatisation, mais cela présente des défis en termes d'observabilité. Les applications d'IA se comportent différemment des logiciels traditionnels, ce qui rend difficile l'utilisation des outils de surveillance existants.

Grafana propose de traiter les sessions d'agents et les conversations de modèles de langage comme des signaux de télémétrie standard, similaires aux journaux, métriques et traces associés aux applications traditionnelles.

Analyse et Implications

La nouvelle capacité d'observabilité de l'IA de Grafana permet de surveiller le comportement des agents d'IA, y compris leurs entrées, sorties et flux d'exécution, pour détecter les réponses de mauvaise qualité, les violations de politiques et les activités anormales.

Les développeurs pourront apprécier la nouvelle ligne de commande GCX, qui permet d'accéder directement à l'assistant Grafana dans les environnements de développement.

Perspective

Grafana se positionne pour devenir le superviseur des agents d'IA dans les entreprises, en formant une unité dédiée à l'IA et en développant de nouvelles fonctionnalités pour améliorer l'observabilité et la confiance dans les systèmes d'IA.

La société publie également un outil de benchmarking appelé o11y-bench pour mesurer les performances des agents d'IA dans des tâches réelles.