[Guide] Unterschied von normalen und "Enterprise grade" HDDs

@dv2130n
ein Raid besteht aus n Platten, ein degradetes Raid besteht weiterhin aus n Platten, wovon 1 Platte ausgefallen ist.

Ein degradetes RAID enthält per Definition alle Nutzdaten!
Es ist hierbei völlig unerheblich, ob es sich um die Originaldaten oder um die via Parität wiederhergestellten Daten handelt.
(Als Beweis kannst du ja mal bei einem degradetem RAID ein Backup ziehen und dir das Ergbenis anschauen = NUTZDATEN)


Somit bleibt es auch bei dieser allgemein gültigen Definition:

Bruttokapazität = Kapazität über alle Laufwerke des vollständigen Raids
Nettokapazit = Nutzkapazität (n-1) bzw (n-2)
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Es gilt bei einer "10[SUP]14[/SUP] Platte" (Bits gelesen: WSK):
  • 7,9 * 10[SUP]13[/SUP]: 0,546
  • 10[SUP]14[/SUP]: 0,632
  • 10[SUP]15[/SUP]: 0,99995

Bei einer "10[SUP]15[/SUP] Platte":
  • 7,9 * 10[SUP]13[/SUP]: 0,076
  • 10[SUP]14[/SUP]: 0,095
  • 10[SUP]15[/SUP]: 0,632

was soll das errechnen?

Diese Rechnung kann schon deshalb nicht stimmen, weil beim Lesen von 10[SUP]15[/SUP] Bits dann eine "Wahrscheinlichkeit" von 10 (1000%) für einen Lesefehler beim Rebuild bestehen würde. Bekanntlich liegen Wahrscheinlichkeiten aber per Definition zwischen 0 und 1.


Wie erläutert beinhalten 9 verbleibende Platten eines degradeten raid-5 array aus ursprünglich 10 Platten noch exakt 7,9 * 10^13 bit an sowohl Nutzdaten wie Paritätsdaten.
Da jede einzelne im angenommenen Array eine Lesefehlerrate (BER) von gleichmäßig 10^14 bits hat, erstreckt sich diese Lesefehlerrate in gleichmäßiger Weise auf die gesamte Speicherfläche von 7,9*10^13 bits. Folglich resultiert eine Wahrscheinlichkeit für einen solchen Fehler von 7,9*10^13 / 10^14 = 0,79. 0,79 bedeuten 79% Wahrscheinlichkeit.

Möchtest du noch mal deine Rechenkünste oder deine Lese-/Versteh-Fertigkeiten überprüfen?

---------- Post added at 16:58 ---------- Previous post was at 16:54 ----------

@dv2130n
ein Raid besteht aus n Platten, ein degradetes Raid besteht weiterhin aus n Platten, wovon 1 Platte ausgefallen ist.

Ein degradetes RAID enthält per Definition alle Nutzdaten!
Es ist hierbei völlig unerheblich, ob es sich um die Originaldaten oder um die via Parität wiederhergestellten Daten handelt.
(Als Beweis kannst du ja mal bei einem degradetem RAID ein Backup ziehen und dir das Ergbenis anschauen = NUTZDATEN)

der Beweis ist ungültig, weil ein Backup Daten auf Dateisystemebene zieht, eine Backup-Software sieht nur das, was das OS sieht
und ein OS sieht keine Paritätsdaten oder sonst irgendwas auf Controller-Ebene
sollte dir eigentlich klar sein

bei früheren ansätzen zum herstellen von parity raid lagen die paritätsdaten tatsächlich auf einer separaten dedizierten disk, einer "parity disk"
und auf den restlichen disks befanden sich ausschließlich nutzdaten
fiel nun ausgerechnet die parity disk aus, dann waren noch keine Nutzdaten verloren, aber das verbleibende array im degraded status ist so verwundbar wie ein raid-0
(also nichts anderes wie bei heutigen raid-5 im degraded status)
im rebuid dieser früheren art parity raid werden also ausschließlich parity daten neu berechnet aus den ja noch allesamt vorhandenen Nutzdaten

bei heutigen raid-5 werden aber sowohl die nutzdaten als auch die paritätsdaten über alle platten des array verteilt/gestriped,
daher fallen beim ausfall einer Platte sowohl nutzdaten weg als auch paritätsdaten
da sich auf jeder Platte des arrays sowohl nutzdaten wie auch paritätsdaten befinden hat jede Platte auch eine Bruttokapazität (= Gesamtkapazität der Platte)
und eine Nettokapazität (= die Bruttokapazität - die Menge der Paritätsdaten auf der Platte)
Daher ist es bei heutigen raid-5 und raid-6 streng genommen nicht mehr zulässig, von "parity disks" zu sprechen, die gibt es nämlich schlicht und ergreifend
nicht mehr, sondern man spricht tatsachengetreu genauer von "Paritydaten im Umfang einer bzw. zwei Disk/s" bei raid-5 bzw. raid-6.

Brutto- und Netto-Kapazität eines intakten und eines degradeten raid-5 array aus ursprünglich 10 mal 1TB Platten
da sowohl die Nutzdaten als auch die Paritätsdaten im raid-5 gestriped, also über alle Platten verteilt werden:
enthält folglich jede Platte 9/10*1TB = 0,9 TB Nutzdaten und 1/10*1TB = 0,1 TB Paritätsdaten
Fällt 1 Platte im Array aus, fehlen 0,1 TB an Paritätsdaten und 0,9TB an Nutzdaten, beide Datenarten müssen rekonstruiert werden im Rebuild.

die 9TB der 9 verbliebenen Platten (nach einem Plattenausfall) enthalten 9 * 9/10 * 1TB an Nutzdaten und 9 * 1/10 * 1TB an Paritätsdaten
9 * 9/10 * 1TB = 8,1 TB
9 * 1/10 * 1TB = 0,9 TB
Die verbliebenen 9 Platten nach einem Plattenausfall enthalten also 8,1TB Nutzdaten und 0,9TB Paritätsdaten und stellen somit nach Definition ganz klar eine Bruttokapazität dar,
weil sie sowohl Nutzdaten als auch Paritätsdaten enthalten. Und beide müssen in vollem Umfang eingelesen und via xor-operationen verarbeitet werden, sonst ist kein rebuild
möglich.
 
Antwort

Da jede einzelne im angenommenen Array eine Lesefehlerrate (BER) von gleichmäßig 10^14 bits hat, erstreckt sich diese Lesefehlerrate in gleichmäßiger Weise auf die gesamte Speicherfläche von 7,9*10^13 bits. Folglich resultiert eine Wahrscheinlichkeit für einen solchen Fehler von 7,9*10^13 / 10^14 = 0,79. 0,79 bedeuten 79% Wahrscheinlichkeit.

Das ist eben nicht so und ich habe die Begründung dafür m.E. in meinem Beitrag bereits genügend ausgeführt.
 
Können wir uns auf folgende Definitionen in einem Raid 5/6 einigen
Bruttokapazität = Kapazität über alle Laufwerke des vollständigen Raids
Nettokapazit = Nutzkapazität (n-1) bzw (n-2)
Das ist mWn die allgemein gültige Definition!
Was ist Brutto und was ist Netto in einem degradierten Array? Das Dilemma hat dv2130n schon aufgezeigt.

ein unrecoverable read error (ure) ist ein Fehler auf Hardware-Ebene, also Platten-Ebene, und bedeutet, dass die Platte den Fehler nicht mehr korrigieren kann,
nicht korrigierbar also auf die Platte bezogen, daher ist die BER zb. von 10^14 auch eine Plattenangabe und noch keine Raid-Array-Angabe
das bedeutet aber gerade nicht, dass dieser Fehler auch nicht mehr auf Raid-Array-Ebene korrigierbar ist
[...]
Ich bin mir nicht sicher, was das mit dem Zitat zu tun hat, daß du diesem Beitrag vorangestellt hast. Du bestätigst damit nur, was ich eh schon geschrieben habe, nämlich das es keine UWEs gibt und damit gilt folgendes nicht:
Die URE gilt nicht nur für Lese- sondern auch Schreibvorgänge.

Aber das sagt ja schon die Langversion: Unrecoverable Read Error.
Ein Schreibfehler ist immer korrigierbar, da die Quelle die Daten ja noch hat.
 
Zuletzt bearbeitet:
Ich klinke mich aus.
Ihr habt recht, und ich meine Ruh, da Argumente einfach übergangen werden.
 
Zuletzt bearbeitet:
*Startpost aktualisiert*

Ich denke einmal, wir alle hatten das Problem, anzunehmen dass das Raidset im angegeben Beispiel aus 5 HDDs besteht bevor eine HDD ausgefallen ist.

Die beiden Autoren sind leider nicht mehr unter ihren angegebenen Adressen erreichbar.

Willis Whittington
Sr Mgr Interface Planning
Seagate Technology
willis.whittington@seagate.com

Jeff Mastro
Program Manager
Microsoft Corporation
jmastro@microsoft.com

http://www.t10.org/ftp/t10/document.05/05-165r1.htm#8.2 die Auflistung der Firmen ist auch interessant :)

Er hat zumindest einen Linked in - Account: Jeff Mastro | LinkedIn
Senior Program Manager/Staff Engineer at Western Digital
 
Ehrlich gesagt verstehe ich nicht genau was ihr mit Brutto und Netto Kapazität wollt, aber die Rechnung ist in meinen Augen trotzdem falsch.
Wenn man ein Raid5 mit 5 Platten hat und eine davon ausfällt und rekonstruiert werden soll (ich geh mal davon aus das war gemeint), dann muss von 4 Festplatten gelesen werden, auf 1 geschrieben.
Jeweilt 500GB -> 1/25 Chance auf Ausfall -> 24/25 Chance auf keinen Ausfall.
(24/25)^5 = Chance dass keine ausfällt: ~81,5%
=> Chance, dass mindestens eine ausfällt: ~18,5%

Oder habe ich bei Stochastik nicht gut genug aufgepasst?
 
Uuuhm...es kommt doch immer einer vorbei, der das mühsam aufgebaute Kartenhaus wieder einreißt... :rolleyes: Ob Stochastik oder nicht, es nützt nichts, blind irgendwas zu rechnen, ohne genau zu wissen, um was es eigentlich geht bzw. die "Aufgabe" erfasst zu haben. Dazu steht nämlich u.a. etwas in den Beiträgen davor, die offensichtlich von dir nicht ausreichend durchgelesen worden sind... Dein Nick scheint insofern begründet zu sein, scheinst dich selbst gut zu kennen... :d
 
Das erschließt sich klar aus dem oben bereits gesagten, und folgt genauer gesagt aus der logischen Äquivalenz von Nutzdaten und Paritätsdaten. Es können sowohl (wegen Plattenausfall)
fehlende Paritätsdaten wieder "vorgerechnet" werden, als auch (wegen Plattenausfall) fehlende Nutzdaten wieder "zurückgerechnet" werden. Paritätsdaten sind in keiner Weise
gegenüber den Nutzdaten ausgezeichnet oder umgekehrt. Diese Äquivalenz ist der Grund, weswegen natürlich auch die Paritätsdaten gestriped und im Fall des Fehlens
wegen Festplattenausfall eben wieder errechnet werden können, genauso wie die Nutzdaten.

Alle Sektoren durchgehen und mit xor die neue Festplatte mit den Informationen beschreiben die sie vorher gehabt haben muss.

Oder willst du mir erzählen, dass Paritätsdaten eigentlich nur Deko sind, zum wiederherstellen nicht gebraucht werden und deshalb abgezogen werden dürfen?
 
Schöner Thread!

Ich bin ja ganz erstaunt dass das Thema hier mal angesprochen wird, ich wurde erst vor kurzem wieder durch einen Artikel über RAID in einer der letzten c'ts darauf aufmerksam.
Auch hier im Forum hatte ich - ich sag mal so in den letzten ~3 Jahren - trotz dem der Tatsache dass wir hier bei "Hardwareluxx" sind den Eindruck gewonnen dass die Geiz-ist-geil-Mentalität gerade beim Festplattenkauf für größere RAID-Systeme klar die Oberhand hat und zu > 80% reine Desktopplatten in RAID-Systemen zum Einsatz kommen, egal ob 2, 4, 8 oder mehr Laufwerke.

Auch wenn ich mich noch nicht derart fundiert mit dem Thema befasst habe wie das aktuell hier zum Glück der Fall ist setze ich in meinem Server seit Inbetriebnahme vor grob überschlagen 6 oder 7 Jahren ausschließlich Festplatten mit 24/7 Freigabe vom Hersteller und explizierter Eignung für RAID-Systeme ein (genauer: WD Raptor und RE Serie).

Ganz klar zahlt man dann mal leicht ~50% mehr für die Platten, beim sparen sind immer alle gleich mit dabei aber wenn's hinterher Ärger macht ist das Geschrei dann gleich ganz groß.
Gerade mit den heutigen Festplattenkapazitäten wird das Thema natürlich noch wichtiger.

Ich stelle mir ernsthaft die Frage ob es nicht auf Dauer auch Sinn macht auf ZFS und die damit verbundenen Mechnamismen zur Feststellung der Datenintegrität zu wechseln.

Im übrigen führt Synology bei den Home-Systemen sehr wohl auch Desktopplatten in der Kompatibilitätsliste, nicht aber bei den Enterprise Geräten.
Aber das ist halt in der IT typisch, und nicht nur im Privatbereich: Es wird wider besserem theoretischem Wissen falsch gehandelt weil's ja billiger ist und dabei an der falschen Stelle gespart. Hinterher ist das Geschrei groß und gespart ist gar nichts.
 
Swp2000 das wurde schon wo anders oft genug erklärt.
Die MTBF (mean time between failures) also die mittlere Zeit zwischen zwei Ausfällen wird von den Herstellern ermittelt.
Es werden dazu 1000 Festplatten so lange betrieben bis mindestens zwei ausgefallen sind. Die Zeit zwischen diesen beiden Ausfällen ist dann z.B. 1200h und die MTBF dazu sind dann 1,2 Millionen Stunden. Die Zahl ist eher hilfreich in größeren Umgebungen, damit man abschätzen kann wie viele HDDs man pro Woche oder am Tag austauschen muss. Je höher die MTBF Zahl in Stunden ist, desto seltener ist dies der Fall. Hitachi hat mit 2 Millionen Stunden HDDs im Angebot, die so gesehen seltener ausfallen. Weswegen selbst die günstigeren DeskStars in der Vergangenheit sehr oft empfohlen wurden.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh