Introduction
Les dictionnaires traditionnels ne couvrent pas les expressions composées de plusieurs mots, laissant un vide important dans la représentation du langage. Selon une étude, près de half a million de phrases composées ne sont pas présentes dans les dictionnaires, simplement parce qu'elles contiennent des espaces. Cela soulève des questions sur la définition d'un mot et sur la manière dont les dictionnaires sont construits.
Contexte Technique
Les lexicographes se sont historiquement concentrés sur les mots individuels, considérant les expressions composées comme des exceptions. Les termes techniques tels que « multi-word expressions » (MWEs) sont utilisés pour décrire ces combinaisons de mots. Cependant, même les dictionnaires en ligne comme Wiktionary, qui compte 16 fois plus de headwords que le dictionnaire de Merriam-Webster, laissent des lacunes dans la couverture de ces expressions.
Analyse et Implications
L'analyse montre que les dictionnaires traditionnels comme Merriam-Webster et Oxford ne couvrent qu'un faible pourcentage des expressions composées, avec respectivement 2,4% et 2,1% de couverture. Même combinés, ils ne couvrent que 3,2% de ces expressions. Wiktionary fait mieux avec 30% de couverture. Les expressions composées peuvent être classées en différentes catégories, telles que les expressions transparentes, semi-opaques, opaques, et les verbes phrasaux. Chacune de ces catégories présente des défis pour les dictionnaires et les jeux de mots.
Perspective
Il est important de surveiller comment les dictionnaires et les jeux de mots évoluent pour inclure davantage d'expressions composées. Les limites actuelles des dictionnaires traditionnels et en ligne soulignent la nécessité d'une approche plus complète pour représenter le langage. Les implications de cette étude sont importantes pour les créateurs de jeux de mots, les lexicographes, et tous ceux qui s'intéressent à la manière dont le langage est représenté et utilisé.