Introduction
L'agence spatiale américaine, NASA, a développé un ordinateur tolérant aux pannes pour la mission Artemis II. Cette architecture innovante repose sur des principes de redondance et de détection d'erreurs pour assurer la sécurité et la fiabilité du système.
Contexte Technique
Le système d'Artemis II utilise huit modules de calcul avec plusieurs scénarios de sauvegarde. Chaque module est équipé de deux processeurs qui fonctionnent en parallèle et sont conçus pour détecter les erreurs de calcul dues aux événements de radiation. Le système est également équipé de mémoires triple-modulaires redondantes qui corrigent les erreurs de bits simples à chaque lecture.
La communication entre les modules est assurée par des cartes d'interface réseau qui utilisent deux voies de trafic constamment comparées pour détecter les erreurs de transmission. Le réseau lui-même est triple-redondant avec trois plans séparés, et tous les commutateurs de réseau utilisent des stratégies de détection d'erreurs.
Analyse et Implications
La conception de l'ordinateur d'Artemis II met en œuvre des principes de redondance et de détection d'erreurs pour minimiser les risques de pannes et assurer la sécurité du système. Le système est conçu pour fonctionner même en cas de perte de trois modules de calcul en 22 secondes.
La redondance dissimilaire est également utilisée pour mitiger les défaillances de mode commun, telles que les bogues de logiciel ou les événements catastrophiques qui pourraient affecter tous les canaux principaux simultanément. Le système de logiciel de vol de secours (BFS) est implanté sur un matériel différent, utilise un système d'exploitation différent et utilise un logiciel de vol simplifié développé indépendamment.
Perspective
La conception de l'ordinateur d'Artemis II offre des enseignements précieux sur l'importance de la planification de la redondance dans les architectures techniques. Bien que les coûts de cette planification soient élevés, ils sont justifiés pour les missions spatiales où la sécurité et la fiabilité sont cruciales.
Il est important de noter que la planification de la redondance doit être adaptée aux cas d'utilisation spécifiques. Les principes de redondance et de détection d'erreurs utilisés dans la conception de l'ordinateur d'Artemis II peuvent être appliqués à d'autres domaines, tels que l'aérospatiale, la défense et les systèmes critiques, pour améliorer la sécurité et la fiabilité des systèmes.