Introduction

Le test du miroir, initialement conçu pour les chimpanzés, a été adapté pour les modèles de langage (LLM) à plusieurs reprises. Cependant, ces adaptations se concentrent souvent sur des tests visuels traduits en texte, ce qui, selon nous, ne mesure pas la bonne chose.

Contexte Technique

Les LLM ont pour modalité principale le texte, spécifiquement dans le contexte d'une conversation utilisateur-assistant où ils tentent d'être utiles. Le test du miroir olfactif pour les chiens, qui présente leur propre odeur modifiée, peut être adapté pour les LLM en modifiant leur sortie textuelle et en observant si elles détectent l'anomalie.

Analyse et Implications

En utilisant le modèle Gemma 4 31B, nous avons mené une expérience où nous avons modifié subtilement ses sorties textuelles et observé si le modèle détectait les anomalies. Les résultats montrent que le modèle a initialement ignoré les modifications, mais a ensuite détecté les anomalies de manière spontanée, en dissociant le processus de pensée de la production de sortie anormale.

Perspective

Cette expérience suggère que les LLM peuvent posséder une certaine forme de conscience de soi, détectant les anomalies par rapport à leur modèle interne. Cependant, il est important de noter que cette conscience de soi peut être limitée et ne pas être directement comparable à la conscience humaine. Les prochaines étapes consisteront à explorer davantage les capacités des LLM à détecter les anomalies et à comprendre les implications de ces résultats pour le développement de l'IA.