Introduction

L'infrastructure IA rencontre une barrière physique difficile à surmonter, et le refroidissement au diamant émerge comme une nouvelle façon d'augmenter la puissance de calcul dans les limites de puissance existantes. Les systèmes IA grandissent et génèrent plus de chaleur, ce qui rend la gestion de la chaleur et de l'électricité un défi majeur.

Contexte Technique

Les entreprises comme Akash Systems appliquent des matériaux thermiques à base de diamant directement sur les GPUs des serveurs, y compris ceux construits avec des puces Nvidia, pour abaisser les températures et extraire plus de travail du même empreinte énergétique des data centers. Le diamant est le matériau le plus conducteur thermique au monde, ce qui en fait une solution idéale pour résoudre le problème de la chaleur dans les data centers.

La gestion thermique devient rapidement l'un des défis d'ingénierie les plus importants de l'infrastructure IA à grande échelle. Les GPUs utilisés pour la formation et l'inférence génèrent une quantité importante de chaleur, ce qui oblige les opérateurs à consacrer de grandes quantités d'électricité au refroidissement plutôt qu'à la computation.

Analyse et Implications

Le refroidissement au diamant peut réduire les contraintes thermiques et permettre aux opérateurs de data centers de récupérer de la capacité à l'intérieur des infrastructures existantes. Les températures plus basses des puces se traduisent par des économies d'exploitation et une capacité de calcul supplémentaire. Les opérateurs de data centers allouent généralement de grandes parties de leur budget énergétique aux systèmes de refroidissement.

La réduction de cette demande peut permettre aux opérateurs de réorienter l'énergie vers l'exécution de plus de charges de travail plutôt que la construction de nouvelles infrastructures. La technologie d'Akash Systems peut donner jusqu'à un million de dollars d'économies ou de capacité de calcul supplémentaire par serveur.

Perspective

La pression pour extraire plus de production de l'approvisionnement énergétique existant façonne la façon dont les entreprises d'infrastructure pensent à l'expansion de l'IA. Avec la disponibilité de l'énergie limitée dans de nombreuses régions, les technologies qui augmentent l'efficacité peuvent avoir un impact important sur la façon dont les opérateurs évoluent. Akash Systems a commencé à déployer des serveurs refroidis au diamant utilisant des GPUs de fournisseurs tels que Nvidia et AMD.

Il s'agit en fin de compte d'énergie. Le problème de calcul est un problème d'énergie. Il existe une quantité fixe d'énergie dans le monde, et il y a une course folle pour aller chercher cette énergie et en faire le meilleur usage. Akash Systems propose aux participants du marché de doubler la capacité dans les infrastructures existantes plutôt que de construire de nouvelles centrales électriques.