Introduction
OpenAI a récemment dévoilé son premier processeur d'intelligence, appelé Jalapeño, conçu en partenariat avec Broadcom. Ce processeur est spécifiquement destiné aux serveurs d'IA pour traiter les requêtes de modèles de langage de grande échelle.
Contexte Technique
Jalapeño est un circuit intégré à application spécifique (ASIC) conçu pour l'inférence d'IA, qui permet aux modèles de traiter les requêtes des utilisateurs pour exécuter des agents comme Codex ou offrir des réponses à partir de ChatGPT. La conception de ce processeur vise à réduire la dépendance d'OpenAI aux unités de traitement graphique (GPU) d'Nvidia, qui sont en quantité limitée.
Analyse et Implications
La sortie de Jalapeño intervient neuf mois après l'annonce du partenariat entre OpenAI et Broadcom pour la création de leurs propres puces. Selon le PDG de Broadcom, Hock Tan, les performances de Jalapeño sont comparables à celles des puces Blackwell d'Nvidia et des unités de traitement de tenseurs de Google. D'autres entreprises d'IA, comme Microsoft, Meta et Amazon, ont également lancé des puces d'IA conçues sur mesure pour alimenter leurs serveurs, mais elles sont toujours en retard par rapport aux puces d'Nvidia en termes de performances globales.
Perspective
OpenAI considère Jalapeño comme le « premier pas dans une plate-forme de calcul multi-génération » qu'elle prévoit de déployer d'ici la fin de 2026. Les tests préliminaires montrent que Jalapeño devrait offrir des performances par watt nettement supérieures à celles des technologies actuelles. Il sera important de surveiller les prochaines étapes dans le développement de cette technologie et son impact potentiel sur le marché de l'IA.