NAS im Eigenbau

Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
@Sylencer...ein FEHLER!

Wer sich einmal die Mühe macht und alle Daten seines Systems ausliest, der wird erkennen, dass ein RAM-Schreibfehler häufiger vorkommt als man meint! Und "S320E" hat vollkommen recht. In einem NAS gehört als Speichermedium keine SSD...wenn dann nurzu einem...nämlich als ZIL!

@b0mba...dann kann man alles in Frage stellen, was in der Industrie als Standard benutzt wird! Und in keinem Unternehmen, was eine funktionelle und gute IT-Infrastruktur hat, würde man ein NAS mit NON-ECC-RAM finden. Ich bin seit fast 3 Jahrzehnten im IT-Vertrieb tätig und habe Unternehmensressourcen bei Sizings dutzende Male begleitet. Und niemand kam auf die Idee KEIN ECC zu sizen.

@Sylencer...Du must es natürlich selbst wissen. Aber ich würde es an Deiner Stelle ganz einfach machen. Hole Dir einen gebrauchten Proliant N54L...denn bekommst Du in der Bucht schon für 100€. Der hat ECC und Du kannst gar bis zu 6 HD´s einbauen. Das reicht für bis zu 60TB...LOL!

Derzeit steht einer in "Kleinanzeigen". Der will für das fertig erstellte System mit 16TB Kapazität 450€ haben. Da nur 4GB ECC drin sind...noch ein 8er rein (nicht mischen!) und Du hast ein tolles System, was Dich Jahre begleiten wird

- - - Updated - - -

@Sylencer,

nein...dieses Board unterstützt kein ECC...aber das hier:Gigabyte GA-X150M-PRO ECC
Liegt unter 100€!!!

- - - Updated - - -
 
Da ja die c't verlinkt wurde, bin ich wieder mal am vorletzten Satz des verlinkten Artikels hängengeblieben. Da steht von CIW geschrieben: "Andererseits sind NAS ohne ECC-RAM beliebt und seit Jahren verbreitet, ohne dass viele Fehler bekannt geworden wären, die sich auf gekippte RAM-Bits zurückführen ließen."

Ohne ECC-RAM bzw entsprechenden Komponenten läßt sich überhaupt kein Bitfehler feststellen und von daher lassen sich gekippte RAM-Bits auch auf nichts zurückführen. Bei Problemen hat also wieder mal das NAS Schuld, aber derselbe Redakteur hatte auch beim Thema Raid sehr zweifelhafte Aussagen getroffen... Fest steht jedoch, daß die Speichergrössen um den Faktor 100-1000 zugenommen haben und die Fehlerraten sich kaum verändert haben. 10^-14 hatten Desktop-HDDs bereits vor 10 Jahren und rechnet man die Fehlerrate mal um, kommt man auf 1 Fehler pro 12,5TB. Aktuell werden 14TB-Laufwerke bemustert. Damit ergibt sich schon rein rechnerisch 1 Fehler pro nicht ganz vollgeschriebenen Laufwerk und es kauft sich ja niemand diese grossen und somit teuren Laufwerke, damit diese in 10 Jahren mal gefüllt werden könnten. Die Fehlerhäufigkeit wird also noch weiter zunehmen.
 
Tja. die c't sinkt im Niveau immer weiter Richtung "Computer Bild"
Wenn nur 0,01 % der Fehler und Probleme in den Supportforen der NAS Hersteller auf nicht erkannte ECC-Fehler im RAM zurückzuführen wären, wäre daß immer noch eine ziemliche Menge.
Da ECC-Fehler im RAM ohne ECC Speicher nicht nachweisbar sind gehe ich von einem deutlich höherem Prozentsatz aus.
Viele der Probleme liegen sicherlich ehr im im Layer 8.


So sieht sowas z.B. bei ESXi aus:
Code:
2017-07-20T19:55:48.771Z cpu13:49366)MCE: 190: cpu13: bank7:  status=0x8c00004000010090: (VAL=1, OVFLW=0, UC=0, EN=0, PCC=0, S=0,  AR=0), Addr:0x138f3dccc0 (valid), Misc:0x150525286 (valid)
2017-07-20T19:55:48.771Z  cpu13:49366)MCE: 199: cpu13: bank7: MCA recoverable error (CE): "Memory  Controller Read Error on Channel 0."
2017-07-20T19:55:51.745Z  cpu3:49363)MCE: 1012: cpu3: MCA error detected via CMCI (Gbl  status=0x0): Restart IP: invalid, Error IP: invalid, MCE in progress:  no.
 
Zuletzt bearbeitet:
Ja die Sache mit dem ECC...
Ich persönlich werde beim Storage nie mehr auf ECC verzichten. Habe hier eine Menge alter Urlaubsfotos, welche Pixelfehler haben oder gar nicht mehr geöfnet werden können. Keine Ahnung, ob das wegen dem damals noch fehlenden ECC ist. Schlussendlich kann das zum Glück jeder für sich entscheiden.
Einen Punkt finde ich jedoch seehr wichtig (wurde hier auch schon geschrieben): Wenn auf ECC verzichtet wird, dann soll bitte auch auf selbstheilende Filesysteme wie z.B. ZFS verzichtet werden. Auf einem "dummen" Filesystem ist das Risiko überschaubar, da ist die potentiell betroffene Datenmenge sehr gering. Wenn das Filesystem jedoch versucht die Fehler zu reparieren, dann kanns echt übel werden.
 
Einen Punkt finde ich jedoch seehr wichtig (wurde hier auch schon geschrieben): Wenn auf ECC verzichtet wird, dann soll bitte auch auf selbstheilende Filesysteme wie z.B. ZFS verzichtet werden. Auf einem "dummen" Filesystem ist das Risiko überschaubar, da ist die potentiell betroffene Datenmenge sehr gering. Wenn das Filesystem jedoch versucht die Fehler zu reparieren, dann kanns echt übel werden.

Eine verbreitete Meinung die sich meist auf einen einzigen User im FreeNAS Forum zurückverfolgen läßt und eine Meinung die ich für falsch halte.

Unabhängig vom Dateisystem führt ein RAM-Fehler beim Schreiben immer zu einem Fehler auf dem Storage, unabhängig vom Dateisystem - entweder einer korrupten Datei oder im schlimmsten Fall zu einem korrupten Dateisystem bei Metadatenfehlern. ZFS verringert hier die Gefahr durch doppelte Metadaten.

Ein RAM-Fehler beim Lesen führt ohne ZFS/Prüfsummen immer zu einem korrupten Lesevorgang. Tritt der Fehler mit ZFS nach der Prüfsummenauswertung auf so hat man ebenfalls einen vergleichbaren korrupten Lesevorgang.

Falls der Fehler mit ZFS vor der Prüfsummenauswertung passiert, so wird der Datenblock als defekt erkannt und ZFS ließt die Daten erneut aus der Redundanz. Tritt da kein weiterer Fehler auf, werden korrekte Daten geliefert und der vermeintlich defekte neu geschrieben. Für einen wirksamen Fehler ist also ein erneuter RAM-Fehler notwendig.

Die These des "Scrub to Death" geht davon aus, dass dauerhafte RAM Fehler zu dauerhaften fehlerhaften Reparaturvorgängen führen. Theoretisch denkbar. Ein erneuter Lesefehler führt aber zuerst einfach zu einem Hinweis dass die Datei defekt ist. Noch wahrscheinlicher ist ein Kernelpanic/ Absturz. Ein Überschreiben korrekter Daten durch falsche Reperaturversuche ist extrem unwahrscheinlich, setzt vorraus dass der zweite Leseversuch aus Redundanz erfogreich ist und der RAM-Fehler nur beim erneuten (Über)-Schreiben auftritt.

Daher
Ohne ECC kann es Datenkorruption bei Lesen und Schreiben geben, unabhängig vom Dateisystem. ZFS verringert das Problem aber - auch ohne ECC. RAM-Fehler ist aber eins der wenigen Probleme gegen die auch ein so fortschrittliches Dateisystem wie ZFS nicht hilft.

Ich halte es da mit
Will ZFS and non-ECC RAM kill your data? JRS Systems: the blog
 
Zuletzt bearbeitet:
@gsavel

Da haben wir ja was gemeinsames.... ich arbeite zufällig auch im IT-Vertrieb, aber davon mal ab reden hier irgendwie alle am Thema vorbei.

ZFS und ECC sind ganz tolle Erfindungen, letzteres halte ich sogar für Pflicht im gewerblichen Bereich. Wenn hier aber jemand schreibt, dass er sich ein Datengrabe für Movies basteln will, dann braucht er nun mal wirklich alles andere als ECC-RAM. Das ist nun mal so. Und wenn das so ein großes Manko wäre, dann würden all die Fertigbüchsen von Qnap, Synology und wie sie alle heissen auch mit ECC-RAM daher kommen. Tun sie aber nicht. Und in all den Magazinen, wo diese Teile regelmässig getestet wird, liest man noc nicht mal was über fehlenden ECC-RAM.

Ich sags ja immer wieder "Sinn und Unsinn" von einander unterscheiden zu können, ist eine Kunst für sich. ;)

Es gibt auch eine Welt jenseits von ECC und ZFS. ;)
 
Hallo und guten Abend,

@b0mba...die Meinung mit den "Fertigbüchsen" teile ich nur teilweise. Um sich einen kompletten Überblick zu schaffen, kann man mal auf dem Onlin-Shop eines äußerst großen IT-Unternehmens aus dem Badischen schauen. Von 55 dort aufgelisteten Tower-NAS-Systemen sind immerhin 11 mit ECC ausgestattet. Bei den Rack-Versionen ist ECC erwartungsgemäß in der Überzahl.

Es stellt sich hier wie immer die Frage, was ich mit meinen zur Verfügung stehenden Ressourcen, in dem Falle Geld, anzufangen gedenke. Wenn ich nur 250€ investiere und glaube dafür eine einigermaßen ausfallsichere NAS-Lösung zu bekommen, dem attestiere ich bestenfalls Unwissenheit. Und selbst da gibt es Möglichkeiten (siehe Microserver N54L).
Ich bin in meinen Jahren der Backups und der "Datengräber" schon öfter in vermeintliche "Waterloo´s" gewatschelt. Dass sich Dateien nicht mehr öffnen ließen...oder Headcrash´s...aber auch durch Eigenschuld.

Für mich stellt sich immer die Frage: Was kann ich mit dem mir zur verfügung stehendem Geld am besten erreichen. Und in diesem Falle heißt es nicht etwas zu wählen, bei dem das Risiko Datenverluste zu bekommen größer ist.
FÜR MICH IST ZFS UND ECC NICHT DAS ALLHEILMITTEL....aber wie bei einer Versicherung kann ich mein Risiko versuchen zu verringern. Nicht mehr und nicht weniger!
 
@matrickz,

es könnte auch sein, dass Dir mit dem G4600 das gleiche passiert wie mir. Auf meinem Board mit dem 1151er Sockel...werden obwohl DDR4 ECC bereits unterstützt wird, nur Skylake unterstützt...kein Kaby Lake. Ich würde es vorher prüfen...oder einfach den G4400 wählen.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh