Introduction

Meta, la société mère de Facebook, est confrontée à une action en justice de la part de cinq grands éditeurs de livres et d'un auteur, qui l'accusent d'avoir commis l'une des plus importantes violations de droits d'auteur de l'histoire en formant ses modèles d'IA Llama.

Contexte Technique

Les éditeurs, dont Macmillan, McGraw Hill, Elsevier, Hachette et Cengage, ainsi que l'auteur Scott Turow, affirment que Meta a copié à plusieurs reprises leurs livres et articles de journaux sans autorisation. Ils allèguent que Meta a utilisé des sites notoirement pirates tels que LibGen, Anna's Archive, Sci-Hub, Sci-Mag, et d'autres, pour alimenter son modèle d'IA.

Le procès accuse également Meta d'avoir formé Llama avec des informations provenant du jeu de données Common Crawl, qui contiendrait des copies non autorisées d'œuvres protégées par le droit d'auteur. En conséquence, Llama reproduit mot pour mot des matériaux protégés par le droit d'auteur.

Analyse et Implications

Ceci n'est pas le premier cas de ce type, puisque plusieurs auteurs ont déjà poursuivi Meta pour violation présumée de droits d'auteur. Un juge fédéral a récemment statué en faveur de Meta dans l'un de ces procès, mais a souligné que sa décision ne signifiait pas que l'utilisation par Meta de matériaux protégés par le droit d'auteur pour former ses modèles de langage était légale.

Un groupe d'auteurs a également poursuivi Anthropic pour violation de droits d'auteur, et un juge fédéral a autorisé les auteurs à poursuivre une action en justice collective pour les millions d'œuvres que Anthropic aurait piratées. Anthropic a accepté de payer 1,5 milliard de dollars aux écrivains l'année dernière pour régler l'affaire.

Perspective

Les éditeurs et l'auteur demandent des dommages et intérêts et demandent au tribunal d'ordonner à Meta de bloquer ses activités présumées illégales. Ils demandent également au tribunal d'exiger que Meta fournisse une liste des livres, des articles de journaux et des autres œuvres protégées par le droit d'auteur utilisées pour former ses modèles d'IA Llama.

Meta a déclaré qu'il lutterait contre ce procès avec vigueur, affirmant que les tribunaux ont trouvé que la formation d'IA sur des matériaux protégés par le droit d'auteur peut être considérée comme une utilisation équitable.