Accueil Administration/Réseau AVIS D’EXPERT – Quels sont les débits de transfert de données réellement...

AVIS D’EXPERT – Quels sont les débits de transfert de données réellement offerts par les disques durs ?

Rainer W. Kaese, responsable senior du développement des activités HDD chez Toshiba Electronics Europe. Crédit : Toshiba Electronics

Pour chaque modèle de disque dur, les fabricants indiquent un « débit de données soutenu » dans la fiche technique. Mais quelle est la pertinence de cette valeur en pratique ? Et comment les conditions d’utilisation réelles, telles que les configurations RAID ou les types de charges de travail, affectent-elles les performances ? Décryptage par Rainer W. Kaese, responsable senior du développement des activités HDD chez Toshiba Electronics Europe.

Avec la fiabilité et la consommation d’énergie, les performances constituent l’une des caractéristiques essentielles des disques durs. En effet, ces derniers doivent stocker et fournir des données le plus rapidement possible afin de ne pas ralentir les utilisateurs ou les applications. Les fiches techniques offrent une base utile pour comparer différents modèles de disques durs, car elles mentionnent systématiquement le « débit de données soutenu ». Pour les disques durs d’entreprise les plus récents, ce débit se situe généralement entre 280 et 310 Mo/s.

Cependant, ces valeurs ne concernent que la lecture et l’écriture sur les pistes externes du disque et ne peuvent donc pas être atteintes en permanence. Sur les pistes internes, les débits de transfert chutent à environ deux tiers de la valeur maximale. La raison est simple : les pistes externes sont plus longues et peuvent donc stocker davantage de bits. Lors d’une rotation complète, les têtes de lecture/écriture peuvent traiter un volume de données plus important sur les pistes externes que sur les pistes internes. C’est pourquoi les disques durs écrivent toujours les données en priorité sur les zones externes, ce qui explique la baisse de performance à mesure que le disque se remplit.

De plus, ces débits de transfert élevés ne sont atteints que lors de la lecture ou de l’écriture de fichiers ou de blocs de données volumineux, car dans ce cas, les têtes de lecture/écriture peuvent traiter les bits séquentiellement sans se repositionner. Lors du passage d’une opération de lecture à une opération d’écriture, ou lors du traitement de nombreux petits fichiers et blocs, les têtes doivent se déplacer constamment vers les pistes appropriées et attendre, en moyenne, une demi- rotation que le secteur requis passe en dessous. Ce processus est long et réduit les performances.

Des capacités accrues pour des vitesses supérieures

Les disques durs d’entreprise actuels fonctionnent à 7 200 tours par minute (tr/min). Les modèles hautes performances à 10 500 ou 15 000 tr/min ont quasiment disparu du marché, supplantés par les SSD, désormais utilisés partout où des performances très élevées sont requises.

De plus, les disques durs 7 200 tr/min actuels offrent déjà des performances comparables, voire supérieures, à celles des anciens modèles haute vitesse, notamment grâce à leurs capacités de stockage accrues. Ces capacités supérieures sont rendues possibles par une densité de données plus élevée. Une densité plus élevée sur chaque piste signifie qu’un plus grand nombre de bits peuvent être lus ou écrits par unité de temps à vitesse de rotation égale, tandis que des pistes plus rapprochées réduisent les distances parcourues par les têtes de lecture/écriture.

Le nombre de disques dans un lecteur n’affecte pas les performances car, contrairement à une idée reçue, les données ne sont lues ou écrites que sur une seule surface de disque à la fois. La raison en est que, du fait de la réduction progressive de la taille des pistes, qui exige un positionnement extrêmement précis des têtes de lecture/écriture, les pistes correspondantes sur différents plateaux sont rarement alignées avec une précision suffisante pour un accès parallèle.

L’importance de la configuration RAID

En définitive, le débit de données soutenu n’a qu’une importance limitée car il s’applique à un seul disque dur. Or, les serveurs et les systèmes de stockage contiennent généralement plusieurs disques fonctionnant ensemble, ce qui permet un débit nettement supérieur. Par exemple, un système JBOD (Just a Bunch of Disks) avec 78 disques durs peut atteindre près de 17 Go/s.

Les performances dépendent donc à la fois du nombre de disques durs et de leur configuration. Dans la plupart des cas, les disques sont configurés en RAID (Redundant Array of Independent Disks) afin de garantir la disponibilité des données même en cas de panne d’un ou plusieurs disques durs. L’exemple le plus simple est le RAID 1, dans lequel les données d’un disque sont dupliquées sur un autre. Les données étant stockées sur deux disques, elles peuvent être lues plus rapidement que depuis un seul disque. Le RAID 1 n’offre cependant aucun avantage en termes de performances d’écriture, car les opérations d’écriture ne peuvent pas être réparties entre les deux disques.

partir de quatre disques, les autres niveaux de RAID sont généralement préférables car ils offrent une plus grande capacité utilisable, des performances supérieures et/ou une disponibilité accrue. Les configurations RAID 5 et RAID 10 sont les plus courantes. Le RAID 5 répartit les blocs de données et les informations de parité sur tous les disques disponibles. Dans un système à quatre disques durs, la parité est calculée à partir de trois bandes stockées sur trois disques distincts, puis écrite sur le quatrième disque. Ainsi, 75 % de la capacité totale est disponible pour les données, contre seulement 50 % pour le RAID 1. Les données peuvent être lues en parallèle sur trois disques, ce qui garantit des performances de lecture élevées. L’écriture des données est également possible simultanément sur trois disques, bien que les calculs de parité réduisent les performances d’écriture.

Le RAID 10, en revanche, est constitué de plusieurs grappes RAID 1 combinées en un RAID 0, permettant la répartition des données sur des paires de disques en miroir. Bien que seulement 50 % de la capacité totale soit disponible pour le stockage des données, plusieurs disques durs peuvent tomber en panne s’ils appartiennent à des paires RAID 1 différentes. Le RAID 10 ne tolère pas la panne simultanée des deux disques durs d’une même paire RAID 1.

Grâce à la répartition des données, qui permet la lecture en parallèle sur tous les disques, le RAID 10 offre des performances de lecture élevées. Les performances en écriture sont toutefois inférieures à celles du RAID 5 car les données ne sont écrites que sur la moitié des disques durs.

Le réseau peut devenir un goulot d’étranglement

 

Outre le niveau RAID, le contrôleur système ou le logiciel de stockage utilisé influe également sur les performances réelles. Des tests réalisés sur différents systèmes et configurations avec quatre disques durs, par exemple, montrent que les contrôleurs RAID matériels offrent de meilleures performances que les systèmes NAS prêts à l’emploi. En configuration RAID 5, ils atteignent également des vitesses d’écriture nettement supérieures, plus de 700 Mo/s, à celles du RAID 10. Les performances en lecture séquentielle, quant à elles, varient selon le contrôleur et peuvent dépasser 900 Mo/s. En cas de charges de travail mixtes, les performances chutent considérablement, bien que le RAID 10 reste près de 50 % plus rapide que le RAID 5, à un peu moins de 120 Mo/s. Les solutions RAID logicielles offrent des performances similaires aux contrôleurs matériels lors des accès séquentiels et ne sont distancées que sous des charges de travail mixtes, un problème qui peut être atténué par un cache SSD.

Pour exploiter pleinement les performances offertes par plusieurs disques durs fonctionnant ensemble, l’infrastructure réseau doit également fournir une bande passante suffisante. L’Ethernet Gigabit (GbE) et le 2,5 GbE sont insuffisants car leurs débits de transfert respectifs ne sont que d’environ 100 Mo/s et 250 Mo/s. Par conséquent, même les systèmes équipés de seulement quatre disques durs nécessitent une connexion 10 GbE. À partir de huit disques durs, une connexion 25 GbE est nécessaire, tandis que les systèmes comportant plus de 50 disques durs requièrent une connexion 100 GbE afin d’éviter que le réseau local ne devienne un goulot d’étranglement.

Les performances réelles d’un système de stockage ne peuvent être qu’estimées approximativement, car elles dépendent de facteurs tels que les modèles de disques durs utilisés, leur nombre, le contrôleur système, le niveau RAID et les charges de travail. De plus, les systèmes de stockage sont rarement configurés uniquement pour des performances maximales ; ils doivent également répondre à des exigences de capacité, de disponibilité et de consommation énergétique. Les tests pratiques, par exemple dans les laboratoires des fabricants de disques durs comme Toshiba, jouent donc un rôle important dans l’évaluation et l’optimisation des performances en fonction des différents besoins. Néanmoins, la fiche technique d’un disque dur constitue déjà une base de décision initiale utile, car un disque annoncé comme plus rapide qu’un autre modèle offrira également de meilleures performances au sein d’une grappe RAID.