OpenAI lance GPT-5.4 avec vision par ordinateur et améliorations

Introduction

OpenAI a lancé GPT-5.4, un nouveau modèle de langage qui améliore les capacités de vision par ordinateur et d'utilisation d'outils. Ce modèle est désormais disponible dans ChatGPT, l'outil de programmation Codex et l'interface de programmation d'OpenAI.

Contexte Technique

GPT-5.4 utilise moins de tokens que son prédécesseur, GPT-5.2, ce qui réduit les coûts de calcul d'inférence. Le modèle peut également traiter des requêtes avec jusqu'à 1 million de tokens et est mieux équipé pour traiter les images, avec la possibilité d'ingérer des images de plus de 10 millions de pixels sans compression.

Le modèle dispose d'une nouvelle fonctionnalité de recherche qui permet de trouver automatiquement les outils nécessaires pour effectuer une tâche, ce qui élimine la nécessité de télécharger des listes détaillées d'outils et réduit les coûts d'inférence. Les capacités de vision améliorées de GPT-5.4 permettent également une meilleure interaction avec les applications via leurs interfaces utilisateur.

Analyse et Implications

Les améliorations de GPT-5.4 pourraient avoir un impact significatif sur le marché, en particulier dans les domaines de la productivité et de l'automatisation. Les capacités de vision par ordinateur améliorées pourraient également ouvrir de nouvelles opportunités pour les applications qui nécessitent une interaction avec des images ou des vidéos.

Cependant, il est important de noter que les coûts d'utilisation de GPT-5.4 pourraient être élevés, en particulier pour les utilisateurs qui ont besoin de traiter de grandes quantités de données. Les coûts sont de 2,5 $ par million de tokens d'entrée et de 12 $ par million de tokens de sortie.

Perspective

Il est important de surveiller les prochaines étapes d'OpenAI et les améliorations futures de GPT-5.4. Les limites actuelles du modèle, telles que les coûts élevés et les limitations de la capacité de traitement, devraient être abordées pour permettre une adoption plus large.

OpenAI lance GPT-5.4 avec vision par ordinateur et améliorations

Introduction

Contexte Technique

Analyse et Implications

Perspective

Articles similaires

DataBahn lève 40M$ pour son plan de contrôle de données

Upwind ajoute la analyse de contexte pour les agents IA

Protopia et Rafay proposent une multitenance pour usines d'IA partagées

3D Pinball pour Windows réédité

OpenAI lance GPT-5.4 avec vision par ordinateur et améliorations

Introduction

Contexte Technique

Analyse et Implications

Perspective

Articles similaires

DataBahn lève 40M$ pour son plan de contrôle de données

Upwind ajoute la analyse de contexte pour les agents IA

Protopia et Rafay proposent une multitenance pour usines d'IA partagées

3D Pinball pour Windows réédité

Newsletter TechFi24

Sauvegarder l'article