Introduction

Nvidia a annoncé un investissement de 2 milliards de dollars dans Nebius Group NV, un fournisseur de services cloud néerlandais spécialisé dans les charges de travail d'intelligence artificielle (IA). Cette décision vise à renforcer l'infrastructure de data center de Nebius.

Contexte Technique

Nebius prévoit de déployer des serveurs équipés des dernières unités de traitement graphique (GPU) Rubin et des unités centrales de traitement (CPU) Vera d'Nvidia. L'adoption de la série de puces BlueField permettra également d'offloader des tâches auxiliaires telles que la gestion du matériel de stockage à partir du CPU d'un serveur.

Les cartes graphiques les plus avancées que Nebius propose actuellement à ses clients sont de la série Blackwell. La nouvelle GPU Rubin exécute les charges de travail d'inférence 10 fois plus efficacement sur le plan coût. La CPU Vera, qui sera déployée aux côtés de Rubin, offre également une meilleure efficacité que sa prédécesseuse.

Analyse et Implications

Cet investissement d'Nvidia dans Nebius reflète la tendance croissante vers l'adoption de solutions cloud pour les charges de travail d'IA. Les entreprises cherchent à améliorer leur capacité à traiter de grandes quantités de données et à développer des modèles d'IA plus complexes.

La collaboration entre Nvidia et Nebius permettra de proposer des services gérés pour faciliter le développement de modèles d'IA, notamment une version gérée de MLFlow et une implémentation cloud de Jupyter Notebook. L'offre de Nemotron 3 Super via le service Token Factory de Nebius offre une solution puissante pour les agents d'IA.

Perspective

Il est important de surveiller l'évolution de cette collaboration et son impact sur le marché du cloud et de l'IA. Les limites de cette analyse incluent la disponibilité des détails sur les plans de déploiement futurs de Nebius et les implications spécifiques de cet investissement pour les clients et les concurrents d'Nvidia.