Suchen

RAID | Redundant Array of Independent Disk | RAID-Level | Festplattenverbund

| Redakteur: Gerald Viola

Unter dem Begriff RAID werden diverse Konfigurationen gekoppelter Festplatten zusammengefasst. Die verschiedenen Konfigurationen nennt man Level und kennzeichnet diese mit einer nachfolgenden

Firma zum Thema

Unter dem Begriff RAID werden diverse Konfigurationen gekoppelter Festplatten zusammengefasst. Die verschiedenen Konfigurationen nennt man Level und kennzeichnet diese mit einer nachfolgenden Ziffer. Häufig benutzte Array-Konfigurationen sind RAID Level 1 und RAID Level 5. Jeder Level hat spezifische Vorteile bei den drei Parametern Geschwindigkeit, Datenverfügbarkeit, Speicherkapazität und Kosten. Nach außen hin sieht ein Festplattenverbund wie eine einzelne Festplatte, da der RAID-Festplattencontroller die physische Festplatte virtualisiert.

Als das „Redundant Array of Independent Disks“ entwickelt wurde, lag die Betonung auf Array, heute liegt die Betonung auf Redundant. Dadurch entstand das Verständnisproblem, das RAID Level 0, kurz auch RAID-0 genannt, keine Redundanz besitzt, so dass auf diesem Level keine wichtigen Daten gespeichert werden sollten. RAID-0 ist für den schnellen Datenzugriff optimiert.

RAID (Ausnahme RAID-0) verbessert die Datenverfügbarkeit. Jede Konfiguration von RAID-1 bis RAID-5 verkraftet den Ausfall einer Festplatte.

Dieser Datenverfügbarkeit untergeordnet sind Gesichtspunkte wie Kosten, optimierte Speicherkapazität und Zugriffszeit.

Das ist schön an den beiden Leveln 1 und 5 zu studieren:

Bei RAID-1 werden zwei Festplatten-Volumes gespiegelt, die somit identische Inhalte haben. Das bedeutet: Die Kosten pro Gigabyte verdoppeln sich aufgrund der halbierten Speicherkapazität; die Zugriffszeit entspricht derjenigen einer einzelnen Festplatte. Die Daten sind bei Ausfall einer Festplatte ohne Einschränkungen benutzbar.

Bei RAID-5 sind mindestens drei Festplatten zu koppeln, die obere Grenze liegt meistens bei zwölf bis 14 Disks. Die Daten werden über die Festplatten „gestript“, d.h. jeder einzelne Datenblock wird über drei und mehr Festplatten verteilt. RAID-5 arbeitet mit rotierender Parität, die über alle Disks verteilt wird.

Beispiel: Datenblock eins von Festplatte A und Datenblock eins von Festplatte B erzeugen einen Paritätsblock auf Festplatte C. Dieses Verfahren wird rotierend angewandt. Bei RAID-5 verfügt man im Falle von drei Festplatten über Zweidrittel der addierten Speicherkapazität. Die allgemeine Formel zur Berechnung der Speicherkapazität lautet: (n-1)/n; n>=3.

RAID-5 ist damit kostengünstiger als RAID-1. Da die Daten gestript sind, ist die Lesegeschwindigkeit höher als bei RAID-1, beim Schreiben dagegen langsamer, da die Berechnung der Parität zusätzliche Lese- und Schreibvorgänge benötigt.

Nachteile von RAID

Grundsätzliches Problem der RAID-Technik ist die steigende Speicherkapazität von Festplatten. Fällt eine Festplatte im Verbund aus, müssen alle Daten auf der Austausch-Festplatte wiederhergestellt werden. Dieser Rebuild erfordert sehr viele Lese-, Berechnungs und Schreibvorgänge, sodass die Zeitdauer für die Wiederherstellung aller Dateninformationen bei Ein-Terabyte-Festplatten zwölf bis 24 Stunden dauern kann. In dieser Zeit gibt es keine Redundanz mehr, ein weiterer Fehler würde zum Verlust aller Daten führen.

Die Speicherbranche hat auf dieses Problem mit der Entwickung von RAID-6 respektive RAID-DP (NetApp) reagiert. Alternative Verfahren sind die Spiegelung von RAID-Konfigurationen oder Grid-Storage. Die Entwicklung redundanter Konzepte für hochkapazitive Festplatten ist noch nicht abgeschlossen.

Kurzbeschreibung aller RAID-Level:

Es gibt mindestens neun RAID-Typen und eine nicht-redundante Anordnung (RAID-0):

  • RAID-0: Diese Technik umfasst das Striping, bietet jedoch keine Datenredundanz. Sie bietet die beste Arbeitsleistung, jedoch keine Fehlertoleranz.
  • RAID-1: Dieser Typ ist auch als Festplattenspiegelung bekannt und besteht aus mindestens zwei Festplatten, von denen eine die Kopie der Daten speichert. Hier gibt es kein Striping. Die Leseleistung ist verbessert, da jede Festplatte zur gleichen Zeit gelesen werden kann. Die Schreibleistung ist die gleiche wie die bei der Speicherung auf nur einer Festplatte. RAID-1 bietet die beste Arbeitsleistung und die beste Fehlertoleranz in einem Multi-User-System.
  • RAID-2: Dieser Typ arbeitet mit dem Striping und bei einigen Festplattenspeichern mit der Fehlerüberprüfungs- und Korrekturinformation (Error Checking and Correcting – ECC). Gegenüber RAID-3 hat dieser Typ keine Vorteile.
  • RAID-3: Diese Variante verwendet Striping und reserviert eine Festplatte für das Speichern von Paritätsinformation. Die Embedded Error Checking (ECC)-Informationen werden für die Fehlerermittlung gebraucht. Die Datenwiederherstellung wird durch die Berechnung des exklusiven OR (XOR) der von anderen Festplatten aufgezeichneten Informationen erreicht. Weil eine I/O-Operation alle Festplatten zur gleichen Zeit adressiert, kann RAID-3 den I/O nicht überlagern. Aus diesem Grund ist RAID-3 am besten für Single-User-Systeme mit langen Datensätzen geeignet.
  • RAID-4: Dieser Typ verwendet große Stripes, was bedeutet, dass man die Datensätze von jeder Festplatte lesen kann. Dadurch kann man die Vorteile des überlagerten I/O für Leseoperationen nutzen. Weil alle Schreiboperationen die Paritätsfestplatte aktualisieren müssen, ist hier keine I/O-Überlagerung möglich. RAID-4 bietet gegenüber RAID-5 keine Vorteile.
  • RAID-5: Dieser Typ beinhaltet ein rotierendes Paritäts-Array und behebt daher die Schreibbegrenzung in RAID-4. Daher können alle Lese- und Schreiboperationen überlagert werden. RAID-5 speichert Paritätsinformationen, aber keine redundanten Daten (allerdings können die Paritätsinformation zur Rekonstruktion der Daten herangezogen werden). RAID-5 benötigt für das Array mindestens drei und meistens fünf Festplatten. Sie ist am besten für Multi-User-Systeme geeignet, bei denen die Performance unkritisch ist oder die nur wenige Schreiboperationen ausführen.
  • RAID-6: Dieser Typ ist dem RAID-5 ähnlich, er beinhaltet aber ein zweites Paritätsschema, das auf verschiedene Festplatten verteilt ist und daher eine extrem hohe Fehler- und Ausfalltoleranz im Bezug auf die Festplatten bietet.
  • RAID-7: Dieser Typ umfasst ein integriertes Echtzeit-Betriebssystem als Controller, Caching über einen Hochgeschwindigkeitsbus und weitere Eigenschaften eines Stand-Alone-Computers. Dieses System wird von einem Hersteller angeboten.
  • RAID-10: Die Kombination aus RAID-0 und RAID-1 wird oft als RAID-10 bezeichnet und bietet eine höhere Arbeitsleistung als RAID-1 – allerdings zu viel höheren Kosten. Es gibt zwei Subtypen: In RAID-0+1 werden die Daten auf mehrere Festplatten gestript, dann werden die Datensätze gespiegelt. In RAID-1+0 werden die Daten gespiegelt und die Spiegel gestript.
  • RAID-50 (oder RAID-5+0): Dieser Typ besteht aus einer Reihe von RAID-5 Gruppen und nutzt Striping wie RAID-0; so wird die Arbeitsleistung von RAID-5 verbessert, ohne dass sich der Datenschutz verringert.
  • RAID-53 (oder RAID-5+3): Dieser Typ verwendet Striping (im RAID-0-Stil) für die virtuellen Disk-Blocks von RAID-3. Das bietet eine höhere Arbeitsleistung als bei RAID-3, aber zu viel höheren Kosten.
  • RAID-S (auch als Parität-RAID bekannt): Das ist eine alternative, proprietäre Methode für Striped-Parity von EMC Symmetrix, die heute nicht mehr aktuell ist. Mit einigen Leistungsverbesserungen, die teilweise durch einen Hochgeschwindigkeits-Festplatten-Cache im Disk-Array ergeben, scheint es ansonsten dem RAID-5 ähnlich zu sein.

In dieserAuflistung fehlen noch RAID-Z von Suns Dateisystem ZFS und RAID-X von IBMs Speichersystem XIV.

(ID:2021313)