Introduction
L'adoption de l'IA par les entreprises a franchi un seuil : la question n'est plus de savoir si investir, mais comment le faire de manière sage. Alors que les charges de travail intelligentes se multiplient et que les coûts d'inférence augmentent, le choix de l'IA - la capacité à faire correspondre les charges de travail au bon calcul plutôt que de recourir par défaut à l'infrastructure la plus puissante disponible - est devenu une priorité croissante pour les grandes organisations.
Contexte Technique
Le partenariat entre Advanced Micro Devices Inc. et Red Hat Inc. a longtemps été axé sur la fourniture de flexibilité aux entreprises dans des environnements hybrides, mais cette mission a pris une nouvelle urgence à mesure que les budgets IA menacent de se briser. La gamme d'options de calcul maintenant disponibles sur les CPU, les GPU rentables et les accélérateurs de haute finition change la façon dont les entreprises pensent au coût total de possession, selon John Hampton, vice-président exécutif des ventes techniques mondiales pour les entreprises chez AMD.
« Chaque jour, j'entends : j'ai besoin d'une alternative - j'ai besoin de choix. Avec Red Hat, nous apportons ce choix dans un environnement très ouvert par rapport à une approche propriétaire et fermée », a-t-il déclaré. « Imaginez pouvoir mapper ces cas d'utilisation de l'IA aux CPU, ou aux GPU à faible puissance et à faible coût. La bonne nouvelle pour AMD est que nous avons une gamme complète de solutions à travers cette inférence que les entreprises se concentrent maintenant, nous pouvons donc les mapper à la solution la plus optimale pour eux. »
Analyse et Implications
Le choix de l'IA et l'économie des jetons redéfinissent la stratégie de calcul des entreprises. De nombreuses entreprises ont fait des choix d'infrastructure précoces qui s'avèrent maintenant coûteux à grande échelle, a noté Hampton. Maintenant, ces grappes génèrent des coûts que peu de budgets anticipaient - un problème que l'industrie a appelé l'économie des jetons, où chaque requête IA comporte un prix cumulatif mesurable.
La réponse d'AMD est un portefeuille de calcul à spectre complet soutenu par la pile logicielle ouverte de Red Hat. L'AMD Instinct MI350P - une GPU basée sur PCIe conçue comme une alternative rentable et refroidie par air pour les serveurs existants - complète maintenant la gamme d'inférence, tandis que Red Hat AI fournit une plate-forme d'entreprise pour déployer et mettre à l'échelle les agents IA à travers des environnements cloud hybrides.
Perspective
À l'avenir, le prochain chapitre du récit émergent de l'IA est probablement défini par le choix et les résultats concrets. « Je pense que l'histoire est toute à propos du choix », a déclaré Hampton. « [AMD] veut être là en tant que conseiller de confiance pour travailler sur tous ces sujets difficiles, toute cette complexité. Allons-y et exécutons un concept de preuve ensemble. Déterminons ce qu'il peut faire pour vous, l'impact financier qu'il apporte à votre entreprise et l'impact technologique qu'il apporte également. »