Introduction

L'écosystème open-source IA en Chine a connu des avancées significatives depuis le « moment DeepSeek » de janvier 2025. Les entreprises chinoises ont fait des choix architecturaux et matériels importants pour répondre aux besoins de l'open-source. Cet article analyse ces choix et leurs implications pour les chercheurs, les développeurs et les décideurs.

Contexte Technique

Les modèles de pointe de la communauté chinoise ont adopté presque unanimement les architectures Mixture-of-Experts (MoE), telles que Kimi K2, MiniMax M2 et Qwen3. Les MoE permettent une répartition dynamique des ressources de calcul en fonction de la complexité des tâches et des valeurs. Cela permet une meilleure flexibilité et une réduction des coûts. Les modèles MoE sont également plus faciles à déployer et à mettre à jour, ce qui les rend plus attractifs pour les entreprises.

Analyse et Implications

L'adoption des architectures MoE et la diversification des modalités (texte, image, audio, vidéo) ont des implications importantes pour l'écosystème open-source IA en Chine. Les modèles plus petits (0,5-30 milliards de paramètres) sont plus faciles à exécuter localement et à intégrer dans les systèmes d'entreprise. Les grandes entreprises chinoises utilisent des modèles MoE plus grands (100-700 milliards de paramètres) comme référence pour distiller les capacités dans des modèles plus petits. Les licences plus permissives, telles que Apache 2.0, facilitent l'utilisation et la modification des modèles dans les systèmes de production.

Perspective

Les prochaines étapes de l'écosystème open-source IA en Chine seront marquées par une poursuite de la diversification des modalités et des architectures. Les entreprises chinoises devront gérer les contraintes de calcul et les coûts pour maintenir leur compétitivité. Les décideurs devront surveiller les évolutions de l'écosystème et les implications pour les politiques de recherche et de développement. Les signaux clés à suivre incluent l'adoption de nouvelles architectures, la croissance de l'utilisation des modèles plus petits et la poursuite de la diversification des modalités.