Introduction

Une expérience récente a montré que Qwen3.6-35B-A3B, un modèle de IA développé par Alibaba, est capable de générer des illustrations de meilleure qualité que Claude Opus 4.7, développé par Anthropic, notamment pour des tâches spécifiques comme dessiner un pélican sur un vélo.

Contexte Technique

Les deux modèles ont été testés sur la tâche de dessiner un pélican sur un vélo, un benchmark humoristique mais révélateur des capacités des modèles de IA. Qwen3.6-35B-A3B, avec une taille de 20,9 Go, a été exécuté sur un MacBook Pro M5 via LM Studio, tandis que Claude Opus 4.7 a été testé dans son environnement propriétaire.

Analyse et Implications

Les résultats montrent que Qwen3.6-35B-A3B surpasse Claude Opus 4.7 dans cette tâche spécifique, ce qui soulève des questions sur la manière dont les modèles sont entraînés et évalués. Même si le benchmark du pélican sur un vélo est humoristique, il reflète une corrélation entre la qualité des illustrations générées et l'utilité générale des modèles.

Perspective

Il est important de noter que ces résultats ne signifient pas nécessairement que Qwen3.6-35B-A3B est plus puissant ou plus utile que Claude Opus 4.7 dans tous les contextes. Cependant, pour des tâches spécifiques comme la génération d'illustrations vectorielles, Qwen3.6-35B-A3B pourrait offrir des avantages, notamment en termes de flexibilité et d'accès, puisqu'il peut être exécuté sur un laptop.