Introduction
Un article récent de Forbes a laissé entendre qu'Anthropic, l'entreprise derrière le modèle de langage Claude Code, perdrait environ 5 000 $ par mois pour chaque utilisateur de son plan Max, en raison des coûts élevés de l'inférence. Cependant, cette affirmation ne résiste pas à une analyse plus approfondie.
Contexte Technique
Les prix de l'API d'Anthropic pour Opus 4.6 sont de 5 $ par million de jetons d'entrée et de 25 $ par million de jetons de sortie. Cependant, ces prix ne reflètent pas les coûts réels de l'inférence. Pour estimer ces coûts, il est plus judicieux de regarder les prix des modèles de poids ouverts similaires sur OpenRouter, où plusieurs fournisseurs concourent sur les prix.
Un modèle comparable, Qwen 3.5 397B-A17B, coûte environ 0,39 $ par million de jetons d'entrée et 2,34 $ par million de jetons de sortie sur OpenRouter, soit environ 10 fois moins cher que les prix de l'API d'Anthropic.
Analyse et Implications
Ces prix suggèrent que les coûts réels de l'inférence pour Anthropic sont probablement d'environ 10 % des prix de l'API, ce qui signifie qu'un utilisateur lourd de Claude Code Max qui consomme 5 000 $ de jetons par mois au tarif de l'API coûterait en réalité environ 500 $ à Anthropic.
Cela représente une perte de 300 $ par mois pour les utilisateurs les plus extrêmes, et non 4 800 $. La plupart des utilisateurs ne consomment pas autant de jetons, et Anthropic a déclaré que moins de 5 % des abonnés seraient affectés par les limites hebdomadaires.
Perspective
Il est important de ne pas prendre les prix de l'API à face valeur pour comprendre les économies réelles de l'inférence. Les prix des modèles de poids ouverts sur OpenRouter offrent une estimation plus précise des coûts réels. L'idée selon laquelle l'inférence est un gouffre financier joue en fait dans les mains des laboratoires de pointe, en décourageant la concurrence et en rendant les marges bénéficiaires plus importantes qu'elles ne le sont en réalité.