Introduction

CoreWeave, un opérateur de cloud d'intelligence artificielle, a annoncé le lancement d'une nouvelle offre qui permet aux entreprises de déployer des agents IA capables d'apprendre et de s'améliorer de manière autonome à l'aide de données du monde réel.

Contexte Technique

Le cycle de vie actuel des agents IA fonctionne par une mécanique lente et itérative d'évaluations et de fine-tuning basés sur la révision de métriques. Cela est dû au fait que les modèles de langage génératifs IA, les « cerveaux » qui sous-tendent les agents, peuvent se comporter différemment entre les scénarios de test et les scénarios réels.

CoreWeave a décidé de court-circuiter ce processus en éliminant le goulet d'étranglement et en permettant aux entreprises de lancer des agents qui peuvent apprendre et s'adapter sur le terrain. La nouvelle plate-forme propose un apprentissage par renforcement sans serveur, un mécanisme par lequel les modèles de langage sont formés et affinés pour la fiabilité.

Analyse et Implications

La nouvelle offre de CoreWeave peut réduire les coûts de plus de 40 % et accélérer la formation d'environ 1,4 fois sans perte de qualité. La formation et l'inférence s'exécutent toujours sur des instances séparées, de sorte que les cycles d'itération ne se disputent pas les uns avec les autres.

Les entreprises sont de plus en plus nombreuses à travailler avec plusieurs agents à la fois qui s'appellent les uns les autres pour orchestrer des tâches plus importantes. Cette complexité supplémentaire signifie que les agents sont personnalisés, exécutés à long terme et exploités dans des conditions changeantes où leur fine-tuning sur les données augmente avec le nombre d'agents dans le réseau.

Perspective

CoreWeave affirme que sa plate-forme est conçue pour permettre cette nouvelle ère en donnant aux développeurs un avantage à grande échelle. Les agents n'ont pas besoin de passer lentement de la phase de test à la production, mais peuvent s'adapter, apprendre et se fine-tuner en production. À mesure que les données et les outils d'entreprise changent, les flottes d'agents s'ajustent pour correspondre, réduisant ainsi l'écart.