Accueil Témoignages Témoignage – Comment le CERN stocke le gigantesque volume de données générées...

Témoignage – Comment le CERN stocke le gigantesque volume de données générées par son accélérateur de particules

La salle de serveurs du CERN.
La salle de serveurs du CERN. Source CERN

Le plus grand laboratoire de physique du monde conserve, chaque seconde, des centaines de téraoctets de données générées par les expériences du LHC, son grand collisionneur de hadrons (Large Hadron Collider ou LHC), un accélérateur circulaire de particules d’un rayon de 4,3 km. 

Le grand collisionneur de hadrons (LHC) du CERN est à l’avant-garde de la recherche en physique. Les données issues des phases « Run 1 » et « Run 2 » ont déjà été utilisées pour démontrer l’existence d’une particule subatomique non encore détectée et élargir notre compréhension de l’univers et de sa formation. En 2012, il a notamment confirmé l’existence du boson de Higgs.
Un milliard de collisions de particules peuvent avoir lieu chaque seconde au sein des détecteurs de l’expérience LHC. Et les collisions génèrent 1 pétaoctet de données par seconde. Même après avoir uniquement filtré les événements intéressants, l’installation nécessite environ 10 Po de nouvelles données à stocker pour être analysées chaque mois. Ces données sont stockées au centre de données du CERN et sont partagées avec un réseau d’environ 170 centres de données à des fins d’analyse, cela grâce à la grille de calcul mondiale pour le LHC (Worldwide LHC Computing Grid ou WLCG). La configuration de stockage actuelle du CERN réside en des mémoires tampons de disques durs comprenant 3 200 JBOD (châssis de disques) contenant 100 000 disques durs, pour un total de 350 Po. Les séries de tests LHC doivent perdurer et, à chaque nouvelle exécution, le stockage de données augmente considérablement. 

Le CERN met à l’échelle son stockage au fur et à mesure 

Depuis 2014, les disques durs de Toshiba sont utilisés par le CERN pour gérer d’énormes volumes de données. Trois générations de technologie de disque dur Toshiba lui ont permis d’accroître la capacité dont il a besoin. Et cela va continuer. « Les mises à niveau planifiées de la machine LHC nécessiteront une mise à l’échelle des ressources de calcul et de stockage dépassant ce que la technologie actuelle peut offrir », souligne Eric Bonfillou, Responsable de la planification des installations et des achats au département informatique au CERN.
En 2013-2014, le CERN a organisé une phase d’arrêt planifiée pour préparer le « Run 2 ». Au cours de cette période, il a mis à niveau ses systèmes de stockage en ajoutant 24 baies JBOD 4U équipées des disques durs MG03SCA400 de Toshiba. Avec une capacité de 4 To par disque dur, tournant chacun à 7200 tr/min et recevant des données via une interface de 6 Go/s, le CERN a gagné 96 To par unité d’extension JBOD. Le délai moyen de défaillance du disque dur (MTTF) était de 1,2 million d’heures, ce qui se traduit par un taux de défaillance annualisé prévu de 0,72%.

Avec le lancement du « Run 2 » en 2015, le besoin de stockage de données a considérablement augmenté. Le CERN a ajouté une nouvelle capacité de stockage grâce au nouveau modèle SATA de 6 To de Toshiba, le MG04ACA600E. Là encore, installée dans un chargeur frontal JBOD à 24 baies 4U, la capacité de stockage brute totale a été portée à 144 To par unité. Le MTTF de ce modèle a été amélioré à 1,4 million d’heures, donnant un AFR prévu de 0,62%.

Une augmentation significative des demandes de stockage attendue
MG07SCA14TE
MG07. Source Toshiba

En 2018, la mise à niveau du stockage du CERN a coïncidé avec le lancement de la gamme MG07 de Toshiba, le premier disque dur sur serveur au monde avec une capacité pouvant atteindre 14 To. Avec l’achat de la variante à 12 To, le CERN a doublé sa capacité par JBOD à 288 To. Le MG07 augmente la capacité sans changer le format et en utilisant de l’hélium plutôt que de l’air. Cela permet d’utiliser des plateaux plus minces sans les flatteries associées, avec un maximum de neuf par disque. Le MTTF de la gamme MG07 a considérablement augmenté atteignant 2,5 millions d’heures.

En 2019, la machine du LHC s’est à nouveau arrêtée pour installer d’autres mises à niveau avant de redémarrer pour le « Run 3 » en 2021. Une augmentation significative des demandes de stockage est attendue, avec une accélération des données générées. Les prochains disques de Toshiba au format 3,5 pouces offriront au CERN l’accès au stockage 16 To et 18 To, ajoutant 432 To de nouvelle capacité par JBOD. A plus long terme, le CERN pourra bénéficier d’une technologie d’enregistrement magnétique de nouvelle génération qui étendra encore les capacités à plus de 20 To par disque dur, tout en maintenant le format de 3,5 pouces.

Le déploiement du stockage Toshiba au CERN