Introduction

Le développement de logiciels libres est confronté à un nouveau défi avec l'émergence des modèles de langage (LLM) capables de générer du code. Le projet OpenBSD a récemment fait face à une tentative d'intégration d'une implémentation LLM-générée du système de fichiers ext4, ce qui a soulevé des questions sur la propriété intellectuelle et les risques de contamination de licence.

Contexte Technique

Le code en question, proposé par Thomas de Grivel, prétend offrir une implémentation complète du système de fichiers ext4, y compris la lecture et l'écriture, mais sans prise en charge du journaling. Cependant, les déclarations de copyright incluses dans le code n'explicitent pas son origine. De Grivel a ultérieurement révélé que le code avait été généré à l'aide de modèles de langage, notamment ChatGPT et Claude-code, sans avoir consulté les fichiers source Linux.

Les préoccupations concernant la licence et la propriété intellectuelle ont été exprimées par plusieurs membres de la communauté OpenBSD, notamment Christian Schulte et Theo de Raadt. La principale inquiétude concerne la possibilité que le code généré par l'IA soit considéré comme un produit dérivé du code Linux sous licence GPL, malgré les affirmations de de Grivel selon lesquelles aucun fichier source Linux n'a été consulté.

Analyse et Implications

L'analyse de cette situation met en lumière les complexités juridiques entourant la génération de code par l'IA. Le statut de copyright de tels codes est incertain, car il n'est pas clair si un copyright peut être attribué à un produit généré par une intelligence artificielle. Cela pose des problèmes pour les projets open source comme OpenBSD, qui nécessitent des garanties claires sur les droits de redistribution du code.

Damien Miller et Theo de Raadt ont souligné les risques liés à l'intégration de code généré par l'IA, notamment en ce qui concerne la propriété intellectuelle et les licences. La communauté OpenBSD a finalement décidé de ne pas accepter le code en question en raison de ces incertitudes.

Perspective

Cet épisode souligne l'importance de clarifier les règles entourant la génération de code par l'IA et son intégration dans les projets open source. À mesure que l'utilisation de ces outils devient plus répandue, il est crucial de comprendre les implications juridiques et les risques potentiels pour les projets à long terme. La communauté du logiciel libre doit être vigilante pour éviter les pièges potentiels posés par ces nouvelles technologies.