Introduction

L'Institut de sécurité IA du gouvernement britannique a publié une évaluation initiale des capacités de cyberattaque du modèle Mythos Preview d'Anthropic. Cette évaluation apporte une vérification indépendante aux rapports d'Anthropic sur les capacités du modèle.

Contexte Technique

Le modèle Mythos Preview a été testé par l'Institut de sécurité IA (AISI) à l'aide de défis Capture the Flag spécialement conçus. Les résultats montrent que Mythos n'est pas significativement différent des autres modèles récents pour les tâches de cybersécurité individuelles. Cependant, il se démarque par sa capacité à enchaîner ces tâches en une série d'attaques multistep pour infiltrer certains systèmes.

Les tests ont montré que Mythos peut compléter plus de 85 % des tâches de niveau Apprentice, un record pour les tests CTF de l'AISI. Cependant, d'autres modèles comme GPT-5.4, Opus 4.6 et Codex 5.3 ont obtenu des résultats similaires dans les derniers mois.

Analyse et Implications

La véritable force de Mythos réside dans sa capacité à effectuer des attaques enchaînées, comme le montre le test « The Last Ones » (TLO), qui simule une attaque d'extraction de données de 32 étapes sur un réseau d'entreprise. Ce test nécessite de chaîner des dizaines d'étapes à travers plusieurs hôtes et segments de réseau, ce qui équivaut à environ 20 heures de travail pour un humain formé.

Perspective

Il est important de surveiller les prochaines étapes du développement de Mythos et son impact potentiel sur la cybersécurité. Les résultats des tests de l'AISI suggèrent que Mythos pourrait être un outil puissant pour les attaques de cybersécurité, mais il est essentiel de comprendre les limites et les risques associés à son utilisation.