Accueil Le stockage des prestataires Cloud inspire l’entreprise

Le stockage des prestataires Cloud inspire l’entreprise

Les bénéfices du Cloud gagnent les logiciels de gestion du stockage numérique. Tour d’horizon des approches Software Defined Storage et des motivations pour les adopter dans l’entreprise.

 

En matière de stockage partagé, l’entreprise pourrait bien calquer ses choix technologiques sur ceux des prestataires Cloud, prompts à délivrer plusieurs classes de stockage à la demande grâce aux offres Software Defined Storage (SDS) en cours de maturation. Leurs fonctionnalités reposent sur une couche IaaS (Infrastructure as a Service) telles OpenStack, CloudStack ou OpenNebula et sur des logiciels répartis sur des fermes de serveurs x86 non spécialisés, équipés de disques durs ou reliés à des baies classiques, sans intelligence particulière.

Rappelons que les services Cloud se caractérisent par une large accessibilité aux ressources, en self-service. Ils sont conçus pour de multiples bénéficiaires en quête de larges volumes disponibles et tolérants aux pannes, sans point de défaillance unique. Outre les fichiers classiques, de multiples charges applicatives et une variété de flux en temps réel déferlent en provenance d’Internet, d’objets connectés ou des réseaux sociaux. Le défi actuel consiste à simplifier l’administration, la distribution et la sauvegarde de toutes ces données.

Les équipementiers propriétaires revoient donc leur copie pour concilier une large volumétrie évolutive, exploitable à moindre coût. Ainsi, NetApp suggère son logiciel Storage Grid WebScale qui “dépose les données sur une baie joignable en mode bloc, sur un serveur physique ou dans une infrastructure Cloud. Grâce à cette couche logicielle, nos clients disposent d’une grille de stockage débordant sur le Cloud”, décrit Jérôme Fournier, manager avant-vente grands comptes chez NetApp.

Jérôme Fournier, NetApp« Peu de clients stockent toutes leurs données au même endroit. Ils maintiennent une copie chez eux, une autre dans le Cloud ou bien ils externalisent uniquement les données de plus de trois mois. »
Jérôme Fournier, NetApp

 

Pour sa part, Amazon Web Services a développé l’infrastructure S3 (Simple Storage Service) afin de délivrer, via une interface Web, plusieurs téraoctets de données à la demande. Ce socle IaaS intègre du stockage objet. Les données placées dans la grille de stockage sont réparties sur des supports distincts et sur plusieurs sites pour éviter toute perte d’informations. En complément, les limites des SGBD sont repoussées par DynamoDB, un gestionnaire NoSQL apportant sur S3 des performances rapides et prévisibles, en particulier via l’usage de disques SSD (Solid State Disks) également répliqués sur plusieurs sites.

Oodrive marie disques et bandes

L’importance croissante du stockage distribué a conduit le français Oodrive à acquérir en août 2014 son compatriote ActiveCircle. Ce dernier propose “un stockage mixte à base de disques et de bandes magnétiques conçu pour délivrer de grands volumes de façon économiquement concurrentielle”, résume Philippe Motet, directeur technique d’Oodrive. La combinaison technologique présente un coût modique au téraoctet, une faible consommation électrique et des débits bruts très corrects. Les clients d’Oodrive stockent ainsi plusieurs centaines de teraoctets de données scientifiques ou médicales, sur leur site et même jusqu’à 2 petaoctets de fichiers vidéo pour la post-production, le cinéma ou la télévision.

Sans chercher à rivaliser avec Amazon, Oodrive loue des solutions collaboratives orientées métiers exploitant des services de partage, de synchronisation et de sauvegarde de fichiers. Il s’appuie sur “des baies Isilon-EMC performantes et évolutives par simples ajouts de nœuds de stockage. Ces équipements participent à instaurer un Cloud de confiance, via un stockage local et des transferts chiffrés, dans le pays du client”.

La sauvegarde d’Oodrive est verticalisée par types d’entreprise, de la TPE jusqu’au groupe du CAC40. Le logiciel AD Backup est commercialisé par près d’un millier de revendeurs en France. Il existe aussi en marque blanche, griffé dans ce cas par Boulanger, Darty, la Fnac ou d’autres enseignes devenant vCSP (virtual Cloud Service Provider).

Les entreprises utilisatrices combinent volontiers Clouds privé et public : “Le Cloud hybride est en marche. Nos clients placent leurs données dans notre Cloud pour leur PRA (plan de reprise d’activités) ou pour l’archivage à long terme, observe Philippe Motet. Un simple disque réseau est présenté à l’utilisateur qui ne voit pas la ferme de serveurs mise en œuvre en arrière-plan ni le système de stockage distribué”. Pour ce qui concerne le stockage objet, une interface est en cours de développement, prévue début 2016.

Swift pilote le stockage objet d’OVH

“Il existe plusieurs types de données et de stockage pour le Cloud répondant aux différents besoins des utilisateurs”, confirme Jean-Daniel Bonnetot, évangéliste Cloud chez OVH. Plus que les performances pures, le stockage objet apporte de grands volumes à bas coût, des espaces évolutifs et accessibles via le protocole HTTP, un serveur de métadonnées facilitant la recherche de l’objet sur une ferme de serveurs répartis. Pour leur part, les volumes rattachés aux instances exécutées dans le Cloud fonctionnent en mode bloc. En quittant une formule d’hébergement classique pour s’orienter vers le Cloud, l’entreprise est amenée à réfléchir, à son tour, sur la pertinence de migrer vers le stockage objet et sur l’usage d’API Swift ou S3.

“La brique de stockage objet Swift d’OpenStack offre plusieurs avantages dont l’évolutivité et la flexibilité, en particulier au niveau des applicatifs à haute disponibilité. On peut faire des clusters transatlantiques par exemple comme nous l’avons fait sur notre offre hubiC. Nous implémentons et mettons en avant ce logiciel open source car le modèle objet est moins connu de nos clients que le stockage de fichiers NAS ou le stockage de blocs sur un réseau SAN aux coûts de maintenance élevés.”

Pour fournir une volumétrie aux instances d’applications exécutées dans le Cloud, les utilisateurs se tournent naturellement vers ce qu’ils connaissent le mieux, c’est-à-dire des disques avec un formatage mené par le système de fichiers. Un réflexe déjà mis en pratique pour les contenus de leurs serveurs Web. OVH cherche à les orienter vers le stockage objet, plus simple à administrer pour le client final. En revanche, une adaptation reste nécessaire chez le prestataire Cloud, car le déplacement de grands volumes distribués nécessite des conditions précises et des connexions performantes.

En pratique, une ferme de stockage objet évolue sur trois échelons, précise l’expert openstack : les serveurs frontaux (proxy), le gestionnaire de tenants (comptes locataires) et les nœuds de stockage d’objets. Ces trois strates sont évolutives indépendamment les unes des autres. OVH déploie des serveurs distincts, personnalisés par échelon. Depuis plus d’une décennie, l’hébergeur français construit aussi ses propres serveurs NAS compatibles avec les protocoles NFS, CIFS et Samba.

VSphere trône sur les Clouds privés

La question à se poser pour choisir son stockage Cloud est la suivante, note l’évangéliste : “Mes données sont-elles modifiables fréquemment – comme des journaux systèmes ou des bases de données – ou bien s’agit-il de documents bureautiques, de fichiers Web ou vidéo plus statiques ? Tout ce qui entre dans la seconde catégorie est éligible au stockage objet.”

Avec son adressage à plat, le modèle objet ne présente pas d’effet palier. Le coût d’acquisition évolue progressivement car on le déploie sur de simples serveurs x86 ordinaires. En comparaison, un système NAS requiert l’ajout de baies de plusieurs To qui vont rester quasiment vides, plusieurs mois après leur acquisition. Le NAS a aussi besoin, en frontal, de coûteux contrôleurs pour garantir une haute disponibilité du système.

OVH propose une offre Cloud privé s’appuyant sur l’environnement VMware, avec des cartes flash à proximité de l’hyperviseur. Ce cache de données permet d’éviter de redescendre systématiquement via le réseau à chaque sollicitation d’une machine virtuelle. Du coup, on trouve une cohabitation de nœuds indifférenciés formant les fermes de serveurs d’applications et de stockage. La production peut déplacer les données simplement entre les serveurs, bien que la technologie VSAN ne soit pas exploitée, mais à l’étude.

Ceph fait converger blocs et objets

Outre Swift, le monde open source fourmille de logiciels de stockage avancés, tels OpenIO pour soutenir les messageries volumineuses, OpenFiler pour combiner NAS et SAN, oVirt pour le stockage virtualisé, ou encore ZFS, le système de fichiers répandu sur de nombreuses distributions linux.

L’éditeur Inktank a été acquis en mai 2014 par Red Hat. Son logiciel Ceph permet à l’entreprise de bâtir des fermes de stockage objet sur de multiples serveurs banalisés. Plutôt que de fusionner son système de fichiers GlusterFS avec Ceph, Red Hat parachève une interface d’administration unifiée pour faciliter l’allocation de ressources en modes fichiers, blocs ou objets.

Jean-Daniel Bonnetot, OVH« Passer du système de fichiers partagé au stockage objet n’est pas très compliqué, même si l’outillage est encore un peu léger. »
Jean-Daniel Bonnetot, OVH

 

Chez OVH, la ferme de stockage distribué permet la réplication de données et fournit des mécanismes d’autoréparation, en cas de soucis sur un nœud : “Le programme Ceph s’avère robuste pour la gestion des volumes et des instances. Son mode de prédilection reste le stockage en mode bloc. Il permet d’attacher des disques virtuels aux instances pour les exploiter via des systèmes de gestion de base de données ou simplement par le système de fichiers. Ces disques virtuels, dont on peut modifier la taille, sont rejoints par une simple adresse IP, grâce au protocole iSCSI”, apprécie Jean-Daniel Bonnetot.

Les fermes de stockage distribué peuvent conduire à abandonner les baies de disques redondants de type RAID. Mais ce n’est pas le choix d’OVH : “Sur les baies de disques RAID, on multiplie les canaux et les écritures sont menées en parallèle. Ce n’est pas une simple redondance de données. Nous tenons à conserver cette source de performances.”

Joris Dedieu,  NFrance
Joris Dedieu,
NFrance

NFrance retient ZFS et ownCloud

Les grands comptes seront les premiers à migrer vers le stockage objet, en suivant l’exemple de CSP comme NFrance, estime Joris Dedieu, responsable Recherche & Développement de l’hébergeur toulousain : “Les grands industriels comme Airbus commencent à envisager d’autres formes de stockage. Ils ont besoin d’un PRA ou cherchent à faire des économies d’échelle.”

NFrance fournit peu de services de stockage largement mutualisés, ses clients préférant disposer d’une infrastructure dédiée pour des raisons de confidentialité et de maîtrise des coûts. Le stockage objet convient néanmoins pour gérer de grandes volumétries de données : il est donc capable d’absorber la fin de l’ère des grands systèmes et d’accompagner l’essor du Big Data prévoit l’ingénieur : “Plus l’architecture est distribuée, plus le stockage objet devient fiable et performant, résiliant et économique.”

Face aux baies propriétaires, les fermes de stockage distribué évoluent à moindre coût, elles requièrent des investissements moins importants et moins constants.

Pour héberger dans plusieurs départements les ENT – les espaces numériques de travail des collégiens -, NFrance coopère étroitement avec son partenaire, l’éditeur Kosmos. Il assemble, à chaque projet, des baies de stockage personnalisées en fonction des attentes. Elles sont bâties autour de la technologie ZFS afin de faire des snapshots rapides et de déplacer simplement des volumes d’une machine à une autre, d’une salle à une autre, voire d’un site à un autre. Le partage et la synchronisation des fichiers reposent sur le logiciel ownCloud. “Avec le stockage autour de briques open source, on pouvait avoir des solutions rapides sans tolérance de pannes ou bien l’inverse. Grâce à la démocratisation des SSD et avec la percée du réseau Ethernet multi-gigabit, on peut concevoir et mettre en œuvre, sans matériel propriétaire, une solution présentant les deux qualités.”

NFrance a construit une infrastructure maison avec un stockage local proche de l’hyperviseur et avec des disques SSD en cache. Les bases de données et certaines machines virtuelles exigeantes sont hébergées en améliorant le niveau des entrées-sorties. Enfin, un stockage passif et massif sert à la sauvegarde des machines virtuelles des clients. Une combinaison flexible qui pourrait convenir aussi aux datacenters privés de nombreuses entreprises.

 

Focus sur les technologies et les solutions associées

Focus sur les technologies et les solutions associées