Introduction
Les modèles d'IA, même les plus avancés, ont du mal à analyser le monde réel sur de longues périodes, comme le montre une étude récente sur les paris de football.
Contexte Technique
Une étude menée par General Reasoning, une start-up d'IA, a testé huit systèmes d'IA de pointe, dont ceux de Google, OpenAI et Anthropic, dans un environnement de pari virtuel sur la saison 2023-2024 de la Premier League. Les modèles d'IA ont été fournis avec des données historiques et des statistiques détaillées sur chaque équipe et les matchs précédents.
Les agents d'IA ont ensuite placé des paris sur les résultats des matchs et le nombre de buts marqués pour tester leur capacité à s'adapter à de nouveaux événements et à des mises à jour des données des joueurs au fur et à mesure de la saison.
Analyse et Implications
Les résultats montrent que même les modèles d'IA les plus avancés ont perdu de l'argent sur les paris de football. Le modèle Claude Opus 4.6 d'Anthropic a obtenu les meilleurs résultats, avec une perte moyenne de 11 % et a presque atteint l'équilibre sur une tentative.
Le modèle Grok 4.20 de xAI a fait faillite une fois et n'a pas pu terminer les deux autres tentatives. Le modèle Gemini 3.1 Pro de Google a réussi à réaliser un profit de 34 % sur une tentative, mais a fait faillite sur une autre.
Perspective
Ces résultats soulignent les limites des modèles d'IA dans la prise de décision dans des contextes réels et complexes. Il est important de surveiller les prochaines étapes dans le développement de l'IA et son application dans des domaines tels que les paris sportifs, ainsi que les risques et les implications potentielles pour la sécurité et la responsabilité.