La technologie RAID (Redundant Array of Independent Disks) a été créée en 1987 pour remplacer les coûteux disques de 6.5 et 9.5 pouces par des ensembles formés de disques de 3.5 pouces beaucoup moins chers.
Le but du RAID est de rassembler plusieurs disques durs physiques en une seule unité logique. En clair le système d'exploitation ne verra qu'un seul disque dans le poste de travail. Le RAID fonctionne avec au minimum deux disques (RAID 0). Il existe plusieurs configurations RAID qui rassemblent différemment les données sur l'ensemble des disques et permettent donc d'avoir des performances, une capacité ou une sécurité différentes. En fonction de la configuration RAID on peut :
* multiplier par deux la capacité du disque le plus petit pour obtenir une capacité plus grande
* obtenir un disque (virtuel) plus performant
* Sécuriser au maximum les données (par exemple on peut avoir seulement la capacité du disque le plus petit et dupliquer les données sur l'autre disque, mais il y a d'autres techniques)
* Augmenter la capacité, les performances et la sécurité en même temps (ceci nécessite plus de disques)
La technologie RAID peut être mise en place au niveau matériel ou logiciel. Elle fonctionne avec des disques durs ATA (IDE actuels), SATA (serial ata) et SCSI
Voyons maintenant les différentes configurations de RAID :
Le JBOD (Just A Bunch Of Disks) :
Ce mode permet de rassembler vos disques durs pour n'en former qu'un de capacité égale à l'ensemble de vos disques durs : si par exemple vous avez un disque de 12 Go, un autre de 26 Go et le dernier de 4Go, vous aurez en tout une capacité de 42 Go
Le RAID 0 (ou stripping) :
Ce niveau de RAID permet de bénéficier de toute la capacité des disques :
Il se comporte comme le JBOD mais avec des performances améliorées. Prenons un exemple : nous avons trois disques durs de 100 Go chacun, et nous souhaitons copier un fichier de 300 Mo. Le RAID 0 va copier 100 Mo sur chaque disque. Théoriquement, nous allons donc 3 fois plus vite. En pratique, c'est loin d'être le cas (des gains de 40 % avec deux disques sont déjà énormes).
Les performances de votre configuration dépendent des disques durs : il faut de préférence des disques de même capacité, et de mêmes modèles. Si un disque lent est utilisé avec un disque rapide, le disque le plus lent sera utilisé comme étalon et ralentira tout le système. Les performances ne seront pas alors de ce qu'on est en droit d'attendre d'un tel système.
Nous avons vu que les fichiers sont répartis sur les disques. En fait, il existe un paramètre appelé Strip Size, Chunk Size ou encore Block Size et qui permet de fixer la taille des segments qui seront copiés sur chacun des disques. Ce paramètre va de 512 octets à plusieurs méga-octet. Une taille plus petite favorise le temps d'accès et l'ouverture de petits fichiers.
Bien sûr mettre une taille de 4 Mo pour lire des petits fichiers est catastrophique sur le plan des performances. Plus la taille des segments est petite, moins vous perdez d'espace disque en cas de fichiers ayant une taille inférieure à celle d'un segment.
L'accroissement des performances est fonction du nombre de disques et de leurs performances. L'inconvénient du RAID 0 est qu'il ne tolère pas les pannes. En clair un seul disque qui tombe en panne et toutes vos données sont perdues.
Le RAID 1 (ou mirroring) :
L'avantage du RAID 1 est qu'il gère les pannes. Si vous avez par exemple un disque dur qui lâche, le disque en état de fonctionnement est utilisé pour lire et écrire les données. Les performances en lecture sont améliorées (proportionnellement au nombre de disques et à leurs performances), mais comme les données sont écrites de manière synchrone sur tous les disques, les performances en écriture ne varient pas.
Inconvénient du RAID 1, la capacité totale est égale à la capacité du disque le plus petit de votre agrégat (ensemble). Autant prendre comme pour le RAID 0 des disques de même capacité. Si vous avez un disque de 20 Go et l'autre de 50, vous n'aurez que 20 Go utilisés, et la capacité perdue sera de 30 Go.
Le RAID 2 :
Le RAID 2 est une alternative au RAID 1. En effet, le RAID 2 est identique au RAID 1 sauf sur un point : lors des opérations de lecture, un seul des disques travaille ce qui permet aux autres disques de s'user moins rapidement et augmente donc leur durée de vie. Il y a aussi un système de correction des erreurs. La baisse de performances et l'utilité relative de ce niveau de RAID ont provoqué son abandon.
Le RAID 3 :
Le RAID 3 apporte les avantages du RAID 0 (performances élevées) et du RAID 1 (tolérance de pannes). Il faut au moins trois disques. La taille des segments n'est pas modifiable, elle est de 512 octets. Il y a un disque qui est utilisé pour stocker les informations de parité (processus algorithmique).
Si un disque tombe en panne quel qu'il soit, le système fonctionne comme en mode RAID 0 jusqu'à l'ajout d'un nouveau disque, dans ce cas les informations sont reconstruites. Si deux disques tombent en panne, les données sont perdues. Les informations du disque le moins performant sont utilisées (comme le RAID 0) pour définir la capacité utile.
A chaque écriture sur les disques, le disque de parité travaille au minimum deux fois plus pour écrire les informations. Dans un ensemble composé de x disques, le disque de parité travaille (x-1) fois plus que les autres disques. Les performances en écriture sont donc bridées par le disque de parité.
Le RAID 4 :
Ce mode nécessite au moins trois disques tout comme le RAID 3. Il y a seulement une différence au niveau de l'organisation des données : la taille des segments se modifie en temps réel. Les informations de parité sont donc mises à jour à chaque fois que la taille des segments change. Il y a donc encore plus de travail pour le disque de parité.
Le RAID 5 :
Ce mode est proche du RAID 3, seulement les informations de parité sont stockées de manière égale sur l'ensemble des disques. Les performances en écriture sont ainsi plus élevées. Ce mode gère la perte d'un disque dur. La capacité utilisable est égale à celle du disque le plus petit multiplié par (x-1) disques. Si vous avez trois disques de 120 Go, la capacité utilisable est de 120*2=240 Go, car il faut 120 Go pour stocker les informations de parité.
L'orthogonal RAID 5 :
Ce mode permet d'avoir un contrôleur par disque, donc une meilleure sécurisation des données. Si un contrôleur lâche, le mode RAID 5 fonctionne encore.
Le RAID 6 :
Le RAID 6 enregistre deux fois les informations de parité au lieu d'une pour le RAID 5, c'est la seule différence entre ces deux modes. A nombre de disques équivalent, les performances en écriture du RAID 6 sont inférieures à celles du RAID 5. Ce mode nécessite au moins 4 disques pour fonctionner. La capacité utilisable est la capacité de votre disque le plus petit multiplié par le nombre de disques -2. Si par exemple vous avez quatre disques de 60 Go, vous avez une capacité utilisable de 60*(4-2) = 120 Go
Le RAID 7 :
C'est le summum des niveaux de RAID : il permet la gestion de 48 disques. Le nombre de disques destinés au stockage des données et de la parité est paramétrable. Les performances en écriture sont de 2 à 6 fois supérieures et celles en lecture sont elles aussi très élevées grâce à la présence d'un cache. Cette solution est toutefois peu utilisée car elle est très coûteuse à mettre en oeuvre.
Le RAID 01 :
Il cumule l'avantage du Raid 0 et 1 : il y a dans notre exemple 4 disques. On met les disques en Raid 0 deux par deux. Les disques logiques crées (deux dans notre cas) sont mis en Raid 1. Résultat : des performances en lecture et écriture largement améliorées et la possibilité de perdre deux disques (dans notre cas on peut perdre les deux disques d'un ensemble Raid 0)
Le RAID 10 :
C'est l'inverse du Raid 01, dans le sens ou les disques sont d'abord placés en Raid 1 pour ne former qu'une unité en Raid 0. On obtient ensuite une capacité égale aux deux disques Raid 1 si ceux ci sont de même capacité. Cette configuration permet la perte de deux disques.
Le Raid X0 :
Ce mode désigne en fait des niveaux comme le Raid "50" ou encore "10" (cf. ci dessus). Dans le cas du mode 50, on prend un ensemble Raid 5 monté ensuite en Raid 0. Pour le "10", on constate que ce sont des disques en Raid 1 qui sont ensuite placés en Raid 0. Méthode simple : le premier chiffre désigne le mode de Raid des disques placés en bas dans la hiérarchie, et le deuxième le Raid 0 qui sera en haut de la hiérarchie.
Vous pouvez commenter ce tutorial ici