Introduction
Le modèle GLM-5.2 vient de sortir et constitue une nouvelle étape pour les modèles ouverts. Pour évaluer ses capacités, nous l'avons comparé à Claude Opus 4.8 en leur demandant de créer un jeu de plateforme 3D en WebGL brut à partir de zéro.
Contexte Technique
GLM-5.2 est le dernier modèle phare de Z.ai, doté de poids ouverts sous licence MIT, ce qui permet de le télécharger, de l'exécuter soi-même ou de l'appeler via l'API de Z.ai. Il est conçu pour les tâches à long horizon, nécessitant des capacités de codage et de raisonnement avancées.
Opus, en revanche, est un modèle plus établi, capable de traiter des tâches multimodales, y compris la lecture d'images. Les deux modèles ont été testés avec la même invite : créer un jeu de plateforme 3D en WebGL brut sans utiliser de moteur de jeu ou de bibliothèque 3D.
Analyse et Implications
Les résultats montrent que Opus a terminé le jeu en moitié moins de temps que GLM-5.2 et a produit un jeu plus propre et plus correct. Cependant, GLM-5.2 a démontré ses capacités en créant un jeu fonctionnel, même s'il était moins poli.
En termes de coût, GLM-5.2 est nettement moins cher que Opus, ce qui en fait une option intéressante pour les utilisateurs qui ont des contraintes budgétaires. De plus, les poids ouverts de GLM-5.2 signifient qu'il peut être exécuté localement sans dépendre d'une API.
Perspective
En conclusion, GLM-5.2 et Opus sont deux modèles IA puissants avec des forces et des faiblesses différentes. Alors que Opus excelle dans les tâches multimodales et la création de jeux plus polis, GLM-5.2 offre une alternative plus abordable et flexible pour les utilisateurs qui ont besoin de capacités de codage et de raisonnement avancées.
Il est important de noter que les limites de GLM-5.2, telles que son incapacité à lire les images, peuvent être un inconvénient pour certaines applications. Cependant, son potentiel pour les tâches à long horizon et son coût réduit en font un outil intéressant à surveiller pour l'avenir.