Introduction

Anthropic a réduit discrètement le TTL (Time To Live) de cache de 1 heure à 5 minutes autour du 6 mars 2026, entraînant une inflation des quotas et des coûts.

Contexte Technique

L'analyse des fichiers JSONL de sessions de Claude Code entre le 11 janvier et le 11 avril 2026 montre que Anthropic a modifié le TTL de cache par défaut de 1 heure à 5 minutes. Auparavant, Claude Code recevait des écritures de cache avec un TTL de 1 heure, qui était considéré comme le comportement par défaut.

Les données proviennent de deux machines (un poste de travail Linux et un ordinateur portable Windows, avec des comptes et des sessions différents), totalisant 119 866 appels API. Chaque message d'assistant contient une ventilation de l'utilisation de la création de cache éphémère à 5 minutes et à 1 heure, permettant d'observer le niveau de TTL par appel.

Analyse et Implications

La réduction du TTL de cache a entraîné une augmentation de 20 à 32 % des coûts de création de cache et une augmentation significative de la consommation de quotas pour les utilisateurs de plans d'abonnement qui n'avaient jamais atteint leurs limites auparavant.

Les données montrent que le comportement de 1 heure de TTL était le comportement par défaut intentionnel d'Anthropic, et que la régression à 5 minutes a commencé autour du 6 mars 2026.

Le coût de la création de cache à 5 minutes est 12,5 fois plus élevé que le coût de lecture de cache pour les modèles Sonnet et Opus. Cela crée une pénalité cumulative pour les sessions de codage longues et complexes, qui sont le cas d'utilisation principal de Claude Code.

Perspective

Il est essentiel de surveiller les modifications apportées au TTL de cache et leurs impacts sur les coûts et les quotas. Les utilisateurs de plans d'abonnement doivent être conscients des limites de leurs quotas et des coûts potentiels liés à la création de cache.

Anthropic devrait confirmer ou infirmer si un changement de défaut de TTL de cache a été effectué en février 2026 et rétabli en mars 2026, et fournir des informations sur les raisons de ce changement et les mesures prises pour atténuer les impacts sur les utilisateurs.