Introduction
Aranya Inc., une startup spécialisée dans les systèmes d'exploitation à l'échelle de cluster, a lancé son système d'exploitation ClusteredOS, conçu pour répondre à la demande croissante de supercalculateurs pour l'intelligence artificielle (IA). Le système d'exploitation vise à simplifier le déploiement et la gestion des infrastructures de calcul distribué pour les applications d'IA.
Contexte Technique
Le système d'exploitation ClusteredOS d'Aranya est basé sur Kubernetes, un standard pour l'orchestration de calcul distribué pour les applications modernes. Cependant, le déploiement de Kubernetes pour l'inférence d'IA reste complexe et gourmand en ressources. ClusteredOS comble cette lacune en offrant un système d'exploitation distribué open-source qui transforme le calcul brut en supercalculateurs d'IA prêts à la production.
Le système d'exploitation gère le cycle de vie complet du cluster, y compris le démarrage, la maintenance et la mise à niveau, avec un minimum d'effort. Il fournit également un cadre simple pour ajouter et versionner des applications cloud natives distribuées, configurables via des indicateurs de fonctionnalités de niveau élevé.
Analyse et Implications
La partnership entre Aranya et Hydra Host, un partenaire cloud d'Nvidia Corp., vise à offrir une solution complète pour le déploiement et la mise à l'échelle de charges de travail réelles avec moins de complexité. Le système d'exploitation ClusteredOS a déjà réduit le temps de configuration du cluster de production de deux à six semaines à moins de 48 heures pour Hydra Host.
Les partenaires d'Aranya déployeront déjà ClusteredOS sur plus de 1 700 unités de traitement graphique pour exécuter des pipelines d'inférence critiques à grande échelle, avec une surveillance 24/7, des correctifs de sécurité et des intégrations personnalisées qui éliminent le besoin d'une équipe de plate-forme dédiée.
Perspective
À l'avenir, Aranya prévoit un scénario dans lequel les assistants d'IA seront profondément intégrés dans les flux de travail quotidiens, nécessitant ainsi des ressources de calcul importantes pour chaque développeur. Le système d'exploitation ClusteredOS est conçu pour gérer la couche d'infrastructure et gérer le cycle de vie complet du cluster avec un minimum de surcharge, permettant ainsi aux développeurs de se concentrer sur la création de modèles d'IA innovants.