Introduction

Meta Platforms Inc. a révélé avoir conçu 4 puces personnalisées pour alimenter ses charges de travail internes d'intelligence artificielle (IA). Cette annonce intervient moins d'un mois après que Meta ait accepté d'acheter des milliards de dollars de processeurs à Nvidia Corp. et Advanced Micro Devices Inc.

Contexte Technique

Les quatre puces, appelées MTIA 300, MTIA 400, MTIA 450 et MTIA 500, sont conçues pour exécuter des modèles de recommandation et de classement, ainsi que des logiciels d'IA générative tels que les grands modèles de langage. La puce MTIA 300 peut fournir 1,2 petaflops de performance lors du traitement de données au format MX8 et dispose de 216 gigaoctets de mémoire HBM.

La puce MTIA 500, la plus avancée de la gamme, peut fournir 10 petaflops de performance lors du traitement de données MX8 et prend en charge un format de données plus efficace appelé MX4. Elle effectue des calculs à l'aide de quatre chiplets logiques entourés de plusieurs piles de mémoire HBM pouvant stocker jusqu'à 516 gigaoctets de données.

Analyse et Implications

L'utilisation de ces puces personnalisées par Meta devrait améliorer les performances et la sécurité de ses charges de travail d'IA. Les puces MTIA 400, 450 et 500 utilisent le même châssis, le même rack et les mêmes infrastructures réseau, ce qui facilite la transition de la conception à la mise en production.

Meta utilise des compilateurs personnalisés pour optimiser les modèles d'IA pour ses puces MTIA. Un autre module logiciel personnalisé, la bibliothèque de communications collectives Hoot, gère le flux de données entre les processeurs et effectue certains calculs à l'aide de transistors situés à proximité des cellules de mémoire, ce qui réduit les temps de parcours des données et améliore les performances.

Perspective

La sortie de ces puces personnalisées par Meta montre l'importance de l'IA et du machine learning dans l'industrie technologique. Les entreprises doivent surveiller de près les progrès de l'IA et les innovations dans le domaine des puces pour rester compétitives. Les limites de ces puces, telles que la consommation d'énergie et la complexité, doivent également être prises en compte pour garantir une mise en œuvre efficace et sécurisée.