Introduction
L'intelligence artificielle (IA) est en train de révolutionner le paysage technologique, avec des systèmes autonomes qui nécessitent des architectures informatiques entièrement repensées. CoreWeave et Nvidia ont récemment annoncé une étape importante dans la validation d'un système d'échelle de rack entièrement nouveau, basé sur la technologie Nvidia Vera Rubin.
Contexte Technique
La technologie Vera Rubin représente une approche fondamentalement différente de l'infrastructure informatique, conçue pour supporter des charges de travail qui raisonnent en continu, s'étendent de manière imprévisible et fonctionnent en production 24 heures sur 24. Cette approche repose sur 72 processeurs graphiques (GPUs) Rubin, 36 processeurs Vera, et 260 téraoctets par seconde de bande passante NVLink 6 à l'intérieur d'un seul rack.
CoreWeave a développé des solutions innovantes telles que Valvey, un système de refroidissement liquide qui surveille le débit, la température, la pression et la détection de fuites en temps réel, ainsi que Racky, un appareil de contrôle de rack unifié qui permet de gérer l'alimentation, le refroidissement et les capteurs environnementaux de manière standardisée.
Analyse et Implications
La validation de la technologie Vera Rubin par CoreWeave ouvre une nouvelle ère pour l'informatique à l'échelle des racks, avec des implications importantes pour les marchés de l'IA et de l'informatique en général. Cette technologie permet de supporter des charges de travail d'IA à grande échelle, avec des performances d'inférence qui peuvent prendre en charge l'IA agente en production.
La collaboration entre CoreWeave, Nvidia et Dell Technologies a permis de développer une plate-forme de calcul à l'échelle des racks qui intègre les serveurs PowerEdge XE9812 de Dell, les processeurs graphiques Nvidia et les unités de traitement de données (DPUs) BlueField-4 pour des opérations cloud sécurisées et multi-locataires.
Perspective
À l'avenir, il faudra surveiller l'évolution de l'IA et de l'informatique à l'échelle des racks, en particulier dans le contexte de l'adoption croissante de l'IA agente et de l'importance croissante de la densité de calcul. Les prochaines étapes incluront probablement le développement de nouvelles architectures et de nouvelles technologies pour supporter les charges de travail d'IA à grande échelle et les applications de production.