RAID En construction

Redondant Array of Inexpensives Disks

Augmenter la capacité / Améliorer les performances / Tolérance de panne / Combinaison redondance et distribution des données
Les différents niveaux de RAID / Raid 0 / Raid 1 / Raid 2 / Raid 3 /Raid 4 / Raid 5 / Orthogonal Raid 5 / Raid 6 / Raid 10 / Raid S / Raid H /

Avantages et inconvénients des différents niveaux de RAID
Les solutions / PortWell /
Bibliographie / Liens

Raid a été développé pour permettre d'outrepasser les capacités limites des unités de disques durs, pour améliorer les performances et pour augmenter la fiabilité en apportant la tolérance de panne.

Augmenter la capacité.

RAID permet de mettre "bout à bout" des disques durs, ce qui permet d'accroître la taille du volume.

Par exemple, avec deux disques d'un Go, on peut créer un seul volume de 2Go.

Améliorer les performances.

Les données sont écrites sur plusieurs disques à la fois. Ainsi, chacun des disque n'a qu'une partie des données à inscrire.

Exemple: Soit un fichier de 10Mo. S'il est écrit sur un disque ayant un débit de 5mo/s, il sera écrit en 2 secondes. Si l'écriture est partagée entre deux disques, le temps total ne sera plus que d'une seconde. Si on utilise 5 disques, le temps est réduit à 40/100èmes de secondes. Ce raisonnement est un peu théorique, les gains observés n'étant pas aussi spectaculaires à cause de la gestion du système RAID, de l'écriture d'informations de tolérance de panne, et surtout de goulets d'étranglement ne permettant pas toujours l'arrivée suffisamment rapide des données au disques.

Apporter la tolérance de panne.

Certaines configurations RAID permettent de se prémunir contre les défaillances d'un disque. Cette fonctionnalité est très importante, car sinon, la panne d'un seul des disques d'un ensemble RAID entraîne la perte des données de tous les disques. C'est d'ailleurs ce qui arrive au niveau de RAID 0.

Combinaison redondance et distribution des données (par Renaud Hilleret)

	Adressage Indépendant	Segments de données de taille réduite	Segments de données de grande taille
Pas de redondance	Conventionnel		RAID 0
Duplication (x2)	RAID 1
Parité Disque		RAID 3	RAID 4
Parité Distribuée			RAID 5
2 codes de Reed-Solomon			RAID 5 + RAID 6
Code de Hamming		RAID 2

Les différents niveaux de RAID.

* Les articles en vert sont tirés de l'excellent ouvrage de Renaud Hilleret sur les disques RAID disponible chez Hermès.

RAID 0

C'est le plus dangereux. Il consiste à mettre bout à bout des partitions. Les utilisateurs de NT WorkStation le connaissent car c'est l'agrégat de partition sans contrôle de parité proposé dans l'administrateur de disques.

En cas de défaillance de l'un des disques, l'ensemble des données de l'agrégat est perdu.

Les données étant réparties sur les deux disques, le débit est amélioré.

RAID 1

Ce niveau de RAID a été développé dans le soucis d'accroître la sécurité des données en dupliquant sur un deuxième disque qui conservera les mêmes données. Si un des disques tombe en panne, l'autre, censé être identique servira de secours. En cas de grave erreur système, je ne sais pas trop ce qui peut arriver, mais en tout cas, vous aurez deux disques pour vos tentatives de récupération ;-)

C'est donc un dispositif de miroir. La capacité et le débit ne sont pas augmentés.

RAID 2

C'est encore un miroir, sauf qu'un seul des disques est sollicité lors des opérations de lecture. Ils écrivent tous les deux, mais lors de la lecture un des disque se " repose " ce qui est censé améliorer sa fiabilité. Il nécessite en général une carte spéciale.

RAID 3

Raid 3 fonctionne suivant le même principe que Raid 0, sauf que l'on utilise un troisième disque servant à stocker des indications de parité (c'est l'agrégat à bande avec parité de NT Serveur). Cependant, une solution matérielle aura le bénéfice de moins ralentir le serveur. Il est impératif d'utiliser un disque très solide, pour assurer le contrôle de parité, car c'est celui qui travaille le plus (+-2x plus que les autres). Si l'un des deux autres disque tombe en panne, le contrôle de parité servira à reconstruire les données.

Si le disque de contrôle de parité tombe en panne on se retrouve en Raid 0, ce qui n'est pas totalement catastrophique.

RAID 4 (par Renaud Hilleret)

Un système de disques RAID 4 ne présente quune différence de structure des données avec un RAID 3. Les informations sont regroupées dans des segments de taille variable, d'un ou plusieurs secteurs. Cela permet d'assurer le traitement de demandes de lecture de taille inférieure au segment en parallèle sur plusieurs disques physiques.

Lors d'écritures de taille inférieure à la taille des segments, le contrôleur doit mettre à jour les données de parité. Cette opération nécessite entre autre une lecture de lancienne parité suivie de lécriture de la nouvelle. Ces deux opérations impliquent lunique disque de parité, le transformant en goulot détranglement. Pour cette raison, les matrices à parité distribuée sur l ensemble des disques (RAID 5) sont toujours préférées aux systèmes RAID de niveau 4.

RAID 5

Le "disque de contrôle" est réparti entre tous les disques, donc tous les disques travaillent autant (en théorie). Vous avez tous les avantages. Le système est n fois plus rapide (n = le nombre de disque, enfin à peu près...), si un (et un seul) disque tombe en panne, il suffit de l'enlever et de le remplacer par un tout beau, les données seront régénérées à partir des autres disques... Attention, cette manoeuvre nécessite bien sûr un équipement hotplug (branchement à chaud).

Notez toutefois que l'espace total de stockage sera diminué de l'équivalent d'un disque (pour le contrôle), donc il vaut mieux utiliser 7 disques que 3. Avec trois disque on perd un tiers de l'espace, avec 7, seulement un 7^ème. CQFD.

Il est possible d'opter pour une solution logicielle, très pénalisante du point de vue temps CPU (surtout en cas de panne). Une solution plus performante consiste à se faire offrir une belle tour Raid (non il n'y a pas de faute) avec tout plein de jolis disques à l'intérieur et richement dotée en mémoire. D'ailleurs, je recherche des gentils mécènes pouvant m'offrir quelques petites tours Raid en échange de ma gratitude ;-)

Orthogonal RAID 5 (par Renaud Hilleret)

Le système ORTHOGONAL RAID 5 a été proposé par IBM. Dautres niveaux ont été proposés par différents constructeurs de matériels informatiques. Le système proposé par IBM est basé sur une technique logicielle qui utilise un contrôleur par disque dur appartenant à une matrice. Le reste de la configuration est identique à une matrice RAID5. Ainsi, la matrice peut continuer à fonctionner malgré la panne dun disque (RAID5), mais aussi dun contrôleur de disque (un contrôleur par disque).

RAID 6 (par Renaud Hilleret)

La définition des systèmes RAID 6 présente un des cas pour lesquels plusieurs définitions sont proposées par différents acteurs.

Larticle de CHEN [Chen94] propose que ces systèmes utilisent deux codes de redondance (dun type différent de celui des RAID 2) qui leur permettent de continuer à fonctionner après les pannes simultanées de deux des disques de la matrice. Ces matrices sont organisées comme des matrices de niveau RAID 5. On nomme aussi ces systèmes matrices à redondance P+Q. Ce principe a été mis en oeuvre par la société StorageTek sur sa gamme de matrice de disques Iceberg destinées aux sites centraux IBM.

IBM donne une toute autre définition dun système RAID 6 (ou HYBRID RAID 1) [Dodson93]. Ce système est basé sur une configuration RAID 1. La copie des informations contenues dans le segment numéro 1 est située sur le segment numéro 2, mais décalée dun disque vers la droite.

RAID 10

C'est une combinaison entre l'agrégat et le miroir. Il est donc le plus sûr et le plus performant.

Il est rapide car les données sont réparties sur plusieurs disques, il est sûr car le contrôle de parité est réparti sur tous les disques.

RAID S

Si vous avez des infos, qui pourraient me permettre de le différencié du RAID 3 En effet, ce niveau de RAID comprend aussi un disque de contrôle dédié.

RAID H

Ce niveau de RAID est à l'état de prototype, vous ne devriez donc pas le trouver à la FNAC, ni même chez DARTY.

Avantages et inconvénients des principaux niveaux de RAID (par Renaud Hilleret)

NIVEAU	AVANTAGES	INCONVENIENTS
RAID 1	Les meilleures performances	Espace disque pour redondance
RAID 3	Débit Espace disque pour redondance	Performances en entrées-sorties
RAID 5	Entrées / Sorties Espace disque pour redondance	Performances en écriture
RAID 6	Disponibilité > RAID 5 Entrées / Sorties	Performances en écriture

Solutions RAID

Adaptec

Carte RAID Adaptec AAA-132 (2 canaux W). Remarquez en bas les quatre connecteurs (2 wides et deux narrows) et sur la droite le connecteur wide externe. En haut à gauche, un emplacement pour de la mémoire cache (ici occupé par une barrette 72 pins).

PortWell

Boîtier RAID PortWell RPC-600FT
Élément RAID rackable (19 pouces) de la société PortWell. Ce chassis RPC-600FT peut accepter neuf disques SCSI dont 8 hotpluggables. Il peut être piloté par différents processeurs Intel en fonction des cartes processeurs enfichables sur un des slots (ISA ou PCI) de la ca rte passive. Les chassis de cette société présentent l'avantage d'être économiques, même si l'on peut regretter que la ventilation soit un petit peu faible (3 ventilateurs, mais qui donnent dans le compartiment arrière du boîtier où se trouvent le CPU et l'alimentation. De plus, les tiroirs en plastique ne dissipent pas bien la chaleur (les capots métalliques sont au contact les uns des autres et seules les parties en plastique reçoivent la ventilation).

Bibliographie

Je ne suis pas un pro du RAID, et l'expérience de professionnels des gros systèmes est indispensable pour donner un aperçu plus complet du domaine.

Stockage de données distribuées / les disques RAID, Renaud Hilleret, Hermes, Paris, 1996, 72 p.
Sommaire du livre
Ce livre est la publication d'une étude réalisée par Renaud Hilleret pour le CNAM.

Liens

Dernière mise à jour : 13/12/99 00:09:21 +0100