Den ECC Speicher braucht man nur, wenn ein Software Raid verwendet wird welches den RAM als Schreibcache nutzt.
Das ist doch totaler Blödsinn, sage doch einfach das Du keine Ahnung hast und einfach auch was schreiben wolltest
RAM Fehler können immer und überall zuschlagen, ohne ECC RAM hat man nicht einmal eine Chance sie zu bemerken, allenfalls danach deren Auswirkungen. Außerdem ist zwischen den Soft- und Hard Errors zu unterscheiden und allenfalls für die Soft-Errors gilt was Du schreibst, aber alle modernen OS macht das. Damit hängt das Risiko ohne ECC also vor allem vom der Menge des RAMs ab, welches für verfügbar ist. Trotzdem können gerade auch Hard-Errors die Daten schon nach dem Empfang übers Netz und noch vor dem Schrieben korrumpieren und dann nutzt keine Prüfsumme mehr etwas, die wird dann schon über die korrupten Dateien gebildet und wiegt den Besitzer dann auch noch in falsche Sicherheit die Daten wären korrekt, obwohl das schon im Moment des Schreibens gar nicht der Fall war.
Wer mehr Sicherheit vor Datenkorruption will als Consumer HW bietet, verzichtet nicht auf ECC RAM, wer darauf verzichtet, sollte nicht versuchen mit anderen Methode wie Filesysteme mit Prüfsummen und Fehlerkorrekturen rumdoktern, damit kann man die Sicherheit die ECC-RAM bietet nicht kompensieren und wer das glaubt, der muss seinen Fehler hoffentlich nie bereuen, auch wenn es für so manchen wohl der einzige Weg wäre es zu lernen.
Jedoch gibt es bei ZFS und anderen Dateisystemen noch weitere Funktionen welche der Datenintegrität zuträglich sind (Checksummen etc.) und fehlendes ECC im RAM kompensieren können.
Genau da können sie nicht und wie sollte das auch gehen? Wenn die Daten korrumpiert werden, bevor das Filesystem überhaupt Zugriff darauf hatte? Das kann nicht gehen und wenn es wirklich regelmäßig RAM Fehler gibt, weil eben ein Hard-Error vorliegt, die können auch erst nach einige Zeit bei RAMs auftreten wie vorher ok waren, dann ist der Pool meist sowieso bald Schrott, denn dann korrigiert die Fehlerkorrektur die Daten kaputt.
Anderseits: Was für mysteriöse Fehler gibt es überhaupt, die Daten korrupt werden lassen? Da steht das RAM wohl an erster Stellen, die HDDs selbst sind sehr sicher, die schreiben hinter jeden Sektor eine ECC und damit liefern sie dann allenfalls eine Lesefehler, wenn die Daten nicht zur ECC passen und nicht sicher damit korrigiert werden können, wie oft das sein kann sagt die UBER aus, aber praktisch niemals inkorrekte Daten die zur ECC passen aber doch falsch sind. Ebenso sichert SATA die Übertragung pro Frame (FIS) mit maximal 8192 Bytes Nutzdaten mit einer CRC32 und da entkommt nur einer in über 10^40, dazu müsste man mehr Daten mit Kommunikationsfehlern übertragen als bisher an HDD Kapazität produziert wurde. Da die Übertragungswiederholungen die Performance massiv bremsen und die HDD diese in aller Regel im Attribut 199 (0xC7) anzeigen, wird man die Fehlerursache sowieso beheben, da gibt es also auch keine Fehler. Bleiben die internen Datenpfade der Platte, da haben nur Enterpriseplatten eine Schutz, andere allenfalls eine Prüfung (Ende-zu-Ende Fehler), aber auch da sieht man nur selten Platten mit Fehlern, dann die FW der HDD oder Fehler im Host Controller. Die sind selten, können aber vorkommen und nur davor schützen letztlich die Prüfsummen mit Fehlerkorrekturen bei den Filesystemen wie ZFS.
Wenn ihr maximale Performance und Sicherheit haben möchtet, macht ein Software Raid und lasst ca. 2-4 GB vom RAM als Schreibcache fungieren.
Dann sollte jedoch schon ECC Ram verwendet werden.
Wenn man überhaupt eine gegenüber Consumer HW gesteigerte Sicherheit vor Datenkorruption haben will, muss man ECC-RAM nehmen und wenn man die Daten nicht verlieren will, auch mindestens ein ordentliches Backup.
Daher ist ECC eher so ein nice to have.
Das sag nie einem echte Profi, der lässt keine HW ohne ECC-RAM in sein Rechenzentrum und nicht weil es nice to have wäre, sondern eben einfach Pflicht ist, wenn man einen sicheren Betrieb gewährleisten muss, oder wieso meist Du bieten, die Serverhersteller wie HP, Dell, etc. dies sogar bei ihren billigsten Kisten für unter 200€ an?
Aber sind wir mal ehrlich, auch CPU's und andere Hardware kann falsch rechnen.
Klar, 100%ige Sicherheit gibt es nicht, die Mainframes kommen dem noch am Nächsten und sind daher bei Banken und Versicherungen nicht wegzudenken. Die kosten aber auch richtig viel Geld und die Wahrscheinlichkeit von anderen Fehlern ist im Vergleich zu RAM Fehlern eben nicht so hoch, daher lohnt es sich eben dort zuerst anzusetzen, weshalb das auch das erste Feature ist, welches die kleinen Xeon E3 von den i5/i7 Desktop Systemen unterscheidet. Warum wohl`?
Im PC gibt es auch sonst so viele Fehlerquelle.
Momentan gibt es gar ein wenig einen ECC hype.
Klar gibt es viele Fehlerquellen und nur die häufigsten werden gestopft, wie eben Übertragungen über SATA und neuerdings bei DDR4 RAM auch die Übertragung zwischen dem Riegel und dem RAM Controller mit CRC gesichert, was es bei DDR3 RAM noch nicht gab. Da kam es bei den hohen Frequenzen die nun für DDR4 spezifiziert wurden (DDR3 ist ja nur bis 1866 spezifiziert, der Rest ist OC) offenbar so oft zu Fehlern, dass man da Handlungsbedarf sah, aber es ersetzt eben auch kein ECC RAM, da in den Zellen gekippte Bits damit nicht erkannt werden, sondern nur bei der Übertragung entstandene Fehler. Das zeigt wie hart an der Kante selbst die Übertragung schon ist.
Es gibt immer Umwege, klar ist der ECC Schutz nice to have.
NEIN, diese Umwege gibt es eben nicht und damit ist es kein nice-to-have, sondern für ein echtes mehr an Sicherheit Pflicht.
Dass ein günstigeres FertigNAS üblicherweise kein ECC hat liegt ausschliesslich daran, dass das teurer ist und die Kunden eher auf Preis und Features als auf Sicherheitsmerkmale schauen.
So viel teurer wäre es ja bei einigen NAS deren SoC ECC RAM unterstützt gar nicht. Die günstigen Microserver bieten es auch und bessere HW für weniger Geld, aber die NAS Hersteller geben dieser Feature nur für die ganz teuren Modelle frei und nicht für die für Consumer erschwinglichen Produkte.
Man muss allerdings auch sagen, dass statistische RAM-Fehler (also ohne dass der RAM tatsächlich defekt wäre) relativ selten sind.
Du meinst die Hard-Errors und so selten sind die nicht.
Treten RAM Fehler häufiger auf, dann merkt man das schnell weil der Rechner dann dauernd abstürzt.
Was schlimm genug wäre, aber das ist auch ein Märchen, gerade PCs haben so viel RAM, davon wird von kritischem Code und Daten von Windows so wenig belegt, dass ein Fehler längst nicht zu abstürzen führen muss, ich habe das vor Jahren selbst mal bei einem Rechner erlebt, der war schon alte und an dem habe ich öfter logs eines Systems gezogen und gepackt. Ab und zu waren die Archive korrupt und so habe ich immer zwei mit identischen Daten angelegt und gespeichert und dann binär bitweise vergleichen. Es war immer das gleiche Bit auf die gleiche Art falsch, ich glaube Bit 6 war zuweilen 1 wenn es 0 hätte sein sollen und Memtest86+ hat das dann auch bestätigt. Der Rechner lief wochenlang pausenlos durch ohne je einen Bluescreen gehabt zu haben! Wer meint sein RAM wäre fehlerfrei nur weil der Rechner nie abstützt, der liegt daneben, denn das ist kein hinreichender Beweis für die Fehlerfreiheit des RAMs.
Treten RAM-Fehler allerdings auf, gibt es keine "Umwege" außer ECC Speicherschutz/ Reparatur der Fehler.
Eben, es wird A geschrieben aber B gelesen, da kann keiner mehr wissen, dass es hätte A sein müssen. Außer eben RAM Tests die genau wissen was sie schrieben und das auch wieder auslesen und somit wissen, was da kommen muss. ZFS schützt z.B. auch seine Metadaten im RAM nicht mir Prüfsummen, was auch sehr aufwendig bis unmöglich ist. Man kann ja keinen Daten die man aus dem RAM liest trauen, die könne immer anderes sein als die, die man dort geschrieben hat, es ist auch ein Filesystem welches für Server geschrieben wurde und die haben eben ECC RAM, da es eben eine Aufgabe für die HW ist die Sicherheit des RAMs zu garantieren.
Im Worst Case werden die Metadaten verändert, so dass eine Platte/ Partition/ Pool nicht mehr lesbar ist. Das dürfte aber extrem selten sein. Eher schlägt der Blitz ein und bruzelt den Rechner.
So selten ist es nicht und die Metadaten jedes Filesystems sind in Gefahr, wenn da ein RAM Fehler zuschlägt. Wenn einem das nicht gefällt, weil man Schwellenangst hat oder eine bestimmte App möchte die nur ein NAS Hersteller anbietet, dann muss man eben Kompromisse machen und auf mehr Sicherheit verzichten. Das Leben ist kein Wunschkonzert und es gibt nicht alles auf einmal und man muss sich entscheiden: Features (Apps), Support und Plug-and-Play von Fertig-NAS auf der einen Seite oder die Sicherheit von ECC-RAM und günstige Preise von Microservern oder Selbstbaulösungen auf der Anderen.
Man sollte sich da nichts vormachen, ohne ECC RAM hat man nur Sicherheit auf Consumer HW Niveau und das reicht um meist bei den meisten User zu funktionieren. Ab und zu hat mal jemand Pech. Wer mehr Sicherheit wünscht, der sollte beim ECC RAM anfangen und da die NAS Hersteller dies nur teuren NAS (im 4-stelligen Bereich) gönnen, ist dann meist ein Micoserver oder Selbstbau die günstigere Lösung.