Naja ich will Rückschlüsse drauf ziehen, ob ich bei meinem "kleinen 16GB Ram Heimserver" ECC brauche, von der statistische Relvanz für diesen bin ich nicht so weit weg, wie du es erscheinen sein lässt. Ich weiß auch ehrlich gesagt nicht, was das geflame von einem Super Moderator hier zu suchen hat (ala "Ich denke, du solltest wiederkommen und Aussagen zu dem Thema treffen, wenn du bei 10^10000000000000000000000000000 Zugriffen bist." usw.).
@Namenlos
Doch, du bist sehr weit weg von statistischer Relevanz.
Ich greife nochmal ein Autobeispiel auf:
In .de werden am Tag millionen von Kilometern mit angelegtem Sicherheitsgurt gefahren.
Wirklich relevant ist er nur im Unfallfall. Sprich also, mal aus der Luft gegriffen, auf einem Kilometer ist er nötig, weil statistisch gesehen auf genau "diesem" Kilometer ein Unfall passiert und der Sicherheitsgurt dann zur Anwendung kommt.
Jetzt könnten ja alle anderen Autofahrer, die die restlichen Kilometer fahren, auf die Idee kommen, morgen brauche ich keinen Anlegen, weil ist ja heute nichts passiert.
Wer sagt denn diesen Autofahrern, dass nicht genau einer von denen, morgen mit seinem Unfallkilometer dran ist und einen Unfall baut, wo der Sicherheitsgurt dran ist.
Denn die Statistik sagt, dass morgen wieder einen mit dem Unfallkilometer dran ist.
Wie willst du also mit der Beobachtung von 384GB RAM über 56Tage statistisch relevante Aussagen treffen, wenn auf der Welt 10000000000000000000000000000TB RAM 24/7 laufen und RAM-Fehler in keister Weise dauerhaft statistisch erfasst werden.
Auf dich angewendet:
Auch wenn du morgen mit dem Auto nur zum Bäcker fährst, kannst du "dran" sein.
Es steht dir frei, dabei einen Sicherheitsgurt zu benutzen oder nicht. Aber glaube nicht, nur weil du zum Bäcker fährst (der mehr "100m" weg ist) du plötzlich kugelsicher bist, weil du sonst immer 10km zur Arbeit fährst und nix passiert.
Der Sicherheitsgurt ist eine Versicherung. Versicherungen braucht man nur, wenn etwas passiert und sonst nicht.
Und genauso verhält es sich mit dem ECC. Brauchen tut ihn keiner, Rechner gehen auch so. Sie sollen aber verhindern, dass bestimmte Speicher"defekte" auftreten.
Und diese Speicher"defekte" passieren, genauso wie Unfälle passieren, und man hofft immer, dass man nicht dran ist.
Du kannst bei dir auf Arbeit feststellen, dass alle eure Rechner über 365Tage kein Speicherproblem hatten. Und dennoch bauste dir morgen nen neuen Rechner hin und der stürzt direkt 10min später mit einem RAM-Fehler ab. Warum?
Weil die Server bei dir auf Arbeit quasi die "passiertnichtZeit" aufgebraucht haben und dein Rechner dann dran war und in die passiertwasZeit gekommen ist.
Das, leiber namenlos, nennt man Stochastik. (du kannst 100x die 1 Würfeln und ich Würfel beim ersten Mal direkt die 6)
Um dich mal schlau zu machen:
en.wikipedia.org
Das ist eine aussagekräftige Statistik von Leuten, was Statisik ist:
About a third of machines and over 8% of DIMMs in our fleet saw at least one correctable error per year. Our per-DIMM rates of correctable errors translate to an average of 25,000–75,000 FIT (failures in time per billion hours of operation) per Mbit and a median FIT range of 778 –25,000 per Mbit (median for DIMMs with errors), while previous studies report 200-5,000 FIT per Mbit.
Es steht dir frei, ECC zu nutzen oder nicht, aber das, was du da versuchst ist nicht mal im Ansatz eine fachliche Grundlage für eine Entscheidung. Es mag eine Entscheidungsgrundlage für dich sein, hat aber nichts mit der Realität und schon garnicht mit dem Businessumfeld zu tun.
Um dir die Entscheidung zu vereinfachen, kannst du auch ne Münze werfen, hat in etwas die selbe statische Relevanz wie deine Beobachtung.
Ich sehe kein geflame, sondern nur den Hinweis, wie man statistische Auswertungen von Beobachtungen macht und darauf aufbauend Ausfallwahrscheinlichkeiten berechnet.
Und mein Super Moderator-Status hat beim Fachthema garnichts zu sagen.