Introduction

Anthropic PBC a présenté deux nouveaux modèles de langage, Claude Mythos 5 et Claude Fable 5, qui surpassent les records de performance dans de nombreux benchmarks. Ces modèles sont dérivés de l'algorithme Claude Mythos Preview, qui a fait l'actualité en avril pour sa capacité à détecter des vulnérabilités de sécurité complexes.

Contexte Technique

Les modèles Mythos 5 et Fable 5 sont basés sur le même algorithme que Claude Mythos Preview, mais offrent des performances améliorées. Fable 5 est accessible au public, mais bloque les requêtes liées à des cas d'utilisation à haut risque, tels que la découverte de vulnérabilités de sécurité. Mythos 5, en revanche, a des garde-fous plus relâchés et ne sera disponible que pour un nombre limité d'organisations. Anthropic PBC travaillera avec le gouvernement américain pour gérer l'accès à ce modèle.

Mythos 5 est le premier modèle de la série Claude à pouvoir produire systématiquement des hypothèses scientifiques novatrices et convaincantes. Le modèle a été testé pour proposer des explications pour plusieurs phénomènes de biologie moléculaire qui ne sont pas encore fully compris par les scientifiques. Plusieurs des suggestions de Mythos 5 ont été jugées suffisamment prometteuses pour que les chercheurs décident de lancer une série d'expériences pour les vérifier.

Analyse et Implications

Les résultats des tests de Mythos 5 sont prometteurs, avec déjà une hypothèse corroborée en laboratoire. Le modèle a découvert de nouvelles informations sur l'une des protéines qui composent la bactérie E. coli. De plus, Mythos 5 a découvert 14 cibles protéiques, qui pourraient être utilisées pour créer des médicaments. Neuf de ces cibles se sont avérées être des candidats solides pour la conception de médicaments.

Fable 5 et Mythos 5 ont également établi des records sur le benchmark de programmation SWE-Bench Pro, avec un score de 80,3%. Les deux modèles offrent des gains de performance significatifs dans plusieurs cas d'utilisation non techniques, tels que la révision de documents et l'automatisation de tâches juridiques.

Perspective

Les nouveaux modèles d'Anthropic sont susceptibles d'avoir un impact significatif sur le marché de l'IA, en particulier dans les domaines de la biologie moléculaire et de la découverte de médicaments. Cependant, il est important de noter que les modèles sont encore en développement et qu'il faudra surveiller leurs performances et leurs limites à mesure qu'ils seront utilisés dans des applications réelles.