Introduction
Anthropic lance Claude Sonnet 5, une version plus puissante et agente de son modèle de taille moyenne. Cette nouvelle version permet de réaliser des plans, d'utiliser des outils comme les navigateurs et les terminaux, et de fonctionner de manière autonome à un niveau qui, il y a quelques mois, nécessitait des modèles plus grands et plus coûteux.
Contexte Technique
Claude Sonnet 5 est conçu pour offrir des performances proches de celles d'Opus 4.8, mais à des coûts nettement inférieurs. Le modèle sera disponible par défaut pour les plans gratuit et Pro et pourra être souscrit par tous les utilisateurs. Les prix de lancement sont fixés à 2 $ par million de jetons d'entrée et 10 $ par million de jetons de sortie jusqu'au 31 août, après quoi les prix passeront à 3 $ par million de jetons d'entrée et 15 $ par million de jetons de sortie.
La nouvelle version du modèle montre également des améliorations significatives par rapport à son prédécesseur, Sonnet 4.6, en termes de performances agentes, telles que la raisonnement, l'utilisation d'outils, la programmation et le travail de connaissance. Par exemple, sur un benchmark, Sonnet 5 obtient un score de 63,2 % en codage agente, contre 69,2 % pour Opus 4.8 et 58,1 % pour Sonnet 4.6.
Analyse et Implications
Claude Sonnet 5 représente une avancée majeure dans le domaine de l'IA, car il offre une alternative moins coûteuse aux modèles existants tout en maintenant des performances élevées. Cela pourrait avoir des implications importantes pour le marché, car les entreprises pourraient désormais avoir accès à des capacités d'IA avancées sans avoir à supporter des coûts prohibitifs.
En outre, Sonnet 5 démontre une meilleure sécurité que son prédécesseur, avec un taux plus faible de « comportements indésirables » tels que la coopération avec les abus et la tromperie. Il est également meilleur pour refuser les demandes malveillantes et éviter les attaques par injection de prompts.
Perspective
Il est important de surveiller les prochaines étapes d'Anthropic et de ses concurrents dans le domaine de l'IA. Alors que les capacités agentes deviennent la norme, la différenciation ne reposera plus sur la capacité à effectuer des tâches agentes, mais sur la capacité à le faire de manière économique et fiable. Les entreprises devront donc continuer à innover et à améliorer leurs modèles pour rester compétitives sur le marché.