Introduction

OpenAI a lancé GPT-5.4, un nouveau modèle de langage qui améliore les capacités de vision par ordinateur et d'utilisation d'outils. Ce modèle est désormais disponible dans ChatGPT, l'outil de programmation Codex et l'interface de programmation d'OpenAI.

Contexte Technique

GPT-5.4 utilise moins de tokens que son prédécesseur, GPT-5.2, ce qui réduit les coûts de calcul d'inférence. Le modèle peut également traiter des requêtes avec jusqu'à 1 million de tokens et est mieux équipé pour traiter les images, avec la possibilité d'ingérer des images de plus de 10 millions de pixels sans compression.

Le modèle dispose d'une nouvelle fonctionnalité de recherche qui permet de trouver automatiquement les outils nécessaires pour effectuer une tâche, ce qui élimine la nécessité de télécharger des listes détaillées d'outils et réduit les coûts d'inférence. Les capacités de vision améliorées de GPT-5.4 permettent également une meilleure interaction avec les applications via leurs interfaces utilisateur.

Analyse et Implications

Les améliorations de GPT-5.4 pourraient avoir un impact significatif sur le marché, en particulier dans les domaines de la productivité et de l'automatisation. Les capacités de vision par ordinateur améliorées pourraient également ouvrir de nouvelles opportunités pour les applications qui nécessitent une interaction avec des images ou des vidéos.

Cependant, il est important de noter que les coûts d'utilisation de GPT-5.4 pourraient être élevés, en particulier pour les utilisateurs qui ont besoin de traiter de grandes quantités de données. Les coûts sont de 2,5 $ par million de tokens d'entrée et de 12 $ par million de tokens de sortie.

Perspective

Il est important de surveiller les prochaines étapes d'OpenAI et les améliorations futures de GPT-5.4. Les limites actuelles du modèle, telles que les coûts élevés et les limitations de la capacité de traitement, devraient être abordées pour permettre une adoption plus large.