Introduction

L'émergence de l'IA agentic est en train de modifier les règles de l'informatique d'entreprise. Les entreprises passent d'une phase d'expérimentation à des déploiements à grande échelle, ce qui nécessite une révision des hypothèses d'infrastructure. AMD et Dell estiment que l'architecture hybride d'IA est la clé pour relever ce défi.

Contexte Technique

La puissance de calcul des centres de données est limitée, avec environ 70 % des centres de données ayant une densité de puissance inférieure à 30 kilowatts. Pour répondre à ces contraintes, AMD propose la carte GPU MI350P, conçue pour être intégrée dans les serveurs existants, permettant ainsi de traiter des modèles d'inférence de grande échelle de manière efficace.

Les entreprises doivent également prendre en compte la répartition des charges de travail entre les différents emplacements, tels que les centres de données, les périphériques et les fournisseurs de services cloud. L'architecture hybride d'IA permet de créer une plate-forme scalable pour les entreprises, leur permettant de démarrer avec de petits modèles et de les faire évoluer vers des modèles plus importants.

Analyse et Implications

L'évolution de l'IA agentic a modifié le ratio CPU/GPU, passant de 8:1 à 1:1, voire à l'inverse. Cela signifie que les tâches de planification, d'orchestration et d'exécution de outils dans les flux de travail d'agents sont des tâches sérielles qui favorisent l'architecture CPU plutôt que la calcul parallèle GPU.

Cela implique que les entreprises doivent réévaluer leur infrastructure pour prendre en compte ces nouvelles exigences. L'utilisation de cartes GPU comme la MI350P peut aider à répondre à ces besoins, tout en minimisant les coûts et en maximisant l'efficacité.

Perspective

À l'avenir, il faudra surveiller l'évolution de l'IA agentic et son impact sur l'informatique d'entreprise. Les entreprises devront continuer à adapter leur infrastructure pour répondre aux nouvelles exigences de calcul et de stockage. L'architecture hybride d'IA sera probablement au cœur de cette évolution, permettant aux entreprises de créer des plate-formes scalables et efficaces pour soutenir leurs déploiements d'IA.