also lieber blackghost, du hast da einen ganz schlechten Stand,
das liegt nicht an dir, sondern an raid-5. Raid-5 ist nunmal einfach nicht besser. Und es ist bei dem, was raid unter anderem bietet, nämlich Datensicherheit, einem raid-6 um Längen unterlegen.
Aber eines, muss ich doch bemerken, hätte ich so lieber nicht gesagt an deiner stelle, nämlich:
"Da man also eh ein Backup haben sollte/muss und man im Heimbereich mit einer kleineren Verfügbarkeit der Daten durchaus leben"
Denn das klingt so, als hättest du selbst nicht so genau verstanden, wieso du eigentlich ein raid-5 verwendest und kein raid-0. Ich kann dir sagen, warum. Nicht wegen der höheren Verfügbarkeit (von raid-5 gegenüber raid-0), denn die ist dir gerade als home-user doch eigentlich ziemlich schnuppe, sondern wegen der höheren Datensicherheit und dem damit ersparten Ärger. Siehst du, und raid-6 ist genau dasselbe wie raid-5, nur viel, viel besser.
Raid-6 schützt vor dem, was jeder raid-5 user fürchten muss, den zeitgleichen oder nahe beieinanderliegenden Ausfall zweier Platten, und es schützt vor den Folgen von Bit Errors während eines Rebuild.
Das rebuild von Daten der ausgefallenen Platte erfordert, dass sämtliche Daten aller anderen Platten vollkommen intakt und fehlerfrei sind. Ein einziger Fehler in einem einzigen Sector irgendeiner der verbliebenen Platten führt dazu, dass die Daten auf dem Ersatz-laufwerk nicht rekonstruiert werden können, das bedeutet Datenverlust.
Und die Wahrscheinlichkeit dafür steigt mit der Anzahl und der Kapazität der Platten in einem raid-5.
Wie oft Fehler dieser Art vorkommen auf platten wird in BER (bit error rate) angegeben. Schon einfache Berechnungen zeigen, dass die Chance auf Datenverlust wegen BER viel grösser ist als wegen aller anderen Fehlerquellen zusammengenommen. Consumer platten produzieren 10mal mehr solcher Fehler als nearline platten, und 100mal mehr solcher Fehler als Enterprise platten. Consumer Sata Platten haben typischerweise eine Fehlerrate von 10^14 bits.
Aber schon eine bloss 1 TB grosse Platte enthält fast 10^13 bits. Das bedeutet, dass beim rebuild in einem 10-1TB-platten array nahezu garantiert ein bit error auftritt. Diese Situation verschlechtert sich bei 2TB ersichtlich
um das Doppelte, denn diese Platten enthalten doppelt so viele bits. 3TB-Platten werden nicht lange brauchen um im Mainstream anzukommen und verschärfen die Situation noch weiter, 1TB-Platter sind bereits produzierbar
und 4TB- oder gar 5TB-Platten nicht sehr weit von der Produktion entfernt.
Raid-5 ist dieser Entwicklung nicht gewachsen.
Daher gibt es Raid-6, Raid-6 toleriert den zeitgleichen ausfall zweier platten ohne Verlust von Nutzdaten.
Und selbstverständlich hat Raid mit Datensicherheit zu tun. Das intuitive verständnis von Usern dahingehend, dass Daten auf einer Anlage, die den Ausfall von gleich zwei platten ohne Datenverlust verkraftet, sicherer sind als auf einer anlage, die den Ausfall nur einer Platte aushält, und diese wiederum sicherer sind als auf einer Anlage, die keinen einzigen Plattenausfall toleriert, dieses Verständnis von Datensicherheit ist völlig korrekt.
Denn verfügbarkeit basiert auf Datensicherheit und auf sonst nichts.
Gäbe es keine ausfalltoleranten raid-level, müssten die Daten aus backup-bändern wiederhergestellt werden, mit der folge einer fürchterlichen downtime (fürchterlich ärgerlich für den home-user und fürchterlich teuer für den business-user).
Raid heisst Vermeidung von downtime mithilfe von Datensicherheit,
Sicherheit gegen fehlerhafte Platten auf MTBF-Ebene und auf BER-Ebene. Raid-6 bietet auch Sicherheit gegen Fehlbedienung (abziehen des falschen Plattensteckers bei Plattenausfall, womit praktisch eine zweite platte ausfällt, was raid-6 aber verkraftet), und mehr Sicherheit gegen Systemfehler wie mangelhaftes Datenkabel, schlechtes Stromkabel, partiell mangelhafte
Kühlung, vibrierendes Bauteil, etwa Lüfter, der Platten in der näheren Umgebung zu schaffen macht.
Zweifellos ist Datensicherheit auch der Zweck von backups, aber Sicherheit in erster Linie gegen ganz andere Arten von "Fehlern", nämlich Katastrophen wie Bltzschlag, Brand, Wasserschaden, Virenbefall, Irrtümer wie z.B. irgendwelche Daten löschen oder alte Datenversionen zurückspielen. Backups bieten Sicherheit gegen diese Art Fehler (gegen manche dieser Fehler aber auch nur, wenn sie geeignet aufbewahrt werden), aber natürlich auch indirekt gegen Fehler der oben genannten art. Das jedoch liegt einfach in der Natur von Kopien (und nebenbei bemerkt, was sind paritäts-informationen eines raid funktional gesehen anderes als die blaupausen für kopien höherer stufe?)
Raid ist von Datensicherheit nicht zu trennen, und ich würde sogar sagen jede andere Behauptung ist grob irreführend. Das Mittel, mit dessen Hilfe Raid Verfügbarkeit gewährleistet, ist Datensicherheit.
Und man sollte keinesfalls bereit sein, den Begriff der Datensicherheit im Zusammenhang mit Raid aufzugeben.
Raid (ausser raid-0) sichert Daten gegen die Fehlerquellen MTBF und BER; Backup primär gegen andere Arten von Fehlern.
Wer einen Zweck angibt, muss auch die Mittel angeben, wie dieser Zweck zu erreichen ist. Denn der erste Zweck von Raid mag Verfügbarkeit sein, aber diese ist nicht ohne Datensicherheit zu haben, und wer den obersten Zweck von Raid daher in der Verfügbarkeit sieht, für den ist die Datensicherheit des Raid das Mittel zu diesem Zweck.
Daher kann jetzt sogar höchstens noch die Frage sein, was eigentlich dagegen spricht, als obersten Zweck eines Raid nicht die Verfügbarkeit, sondern die Datensicherheit selbst anzusehen.
Es gibt eine Menge User, die das annehmen würden, und tatsächlich auch nicht völlig grundlos. Aber diese weitergehende Frage kann mal dahingestellt bleiben.
Festzustellen bleibt, dass raid (je nach raid-level) auf engste mit Datensicherheit zusammenhängt.
Verkraftet ein raid den Ausfall von zwei platten ohne Datenverlust (wie bei raid-6), ist die datensicherheit dieses raid höher als die eines raid, bei dem der ausfall zweier Platten unweigerlich zum Datenverlust führt (wie bei raid-5).
Angeblich soll plötzlich die Grenze vom home-bereich hinter raid-5 und vor raid-6 verlaufen, wenn es nach blackghost ginge.
Komisch nur, dass vor nicht allzu langer zeit eben diese homebereichgrenze noch deutlich vor raid überhaupt, aber jedenfalls vor raid-5 verlief.
Die zeit bleibt eben auch technisch nicht stehen und warum sich blackghost hier gegen das offensichtliche sperrt, mag im Dunkeln bleiben, auf der höhe der zeit bleibt man so aber nicht.
Für grösser werdende arrays und grösser werdende consumer platten ist raid-6 ideal. Mit minimalem Zusatzaufwand (dem Gegenwert von 2TB) und ohne nennenswerte Performanceeinbusse (lediglich beim zugriffsmuster kurzes zufälliges schreiben ist die performance merklich geringer, aber hier ist schon die raid-5 performance ärmlich, daher wird für anwendungen mit überwiegend
solchen zugriffsmustern ohnehin raid-10 eingerichtet) erhält man sehr sichere Raid-Arrays (soweit ein ausreichend dimensionierter controller vorliegt).
Raid-5 ist von gestern, und aus Sicherheitsgründen nur noch für kleine
arrays aus drei bis vier (möglichst kleinen) Platten zu empfehlen. Und das, aufgrund seiner Performance-Eigenschaften, eiegntlich auch nur für sequentielle Daten. Diese Art Daten neigen aber zufälligerweise gerade dazu sehr grosse Daten zu sein, die, angehäuft, eigentlich gar nicht zu kleineren Platten passen wollen. Von daher würde ich sogar sagen, dass Raid-5 ziemlich tot ist, oder das jedenfalls sein sollte.
Zumal Raid-6 Arrays aus consumer platter enorm viel an Datensicherheit gegenüber raid-5 arrays aus enterprise gerät gutmachen können.