Es wird skuril. Oder zumindest für mich eher unverständlich.
Ich hatte nun das Backup von gestern (von Server1 (Supermicro X10SL7) nach Server2 (Dell T20) per NC und ZFS send/receive) Datei für Datei mittels Binärvergleich vergleichen lassen. Hat natürlich einige Stunden gedauert. Vergleich via SMB-Shares. Beide Maschinen sind ESXI-AIO mit FreeBSD 11 als Nas.
ZFS sagt auf beiden Maschinen "ok, keine Probleme".
Gegen Ende des Vergleichens schmeisst Freecommander auf einmal lauter Unterschiede in den Dateien. Haufenweise in einzelnen Files. Auch bei solchen in einem 2. Durchlauf, die beim 1. Durchlauf schon als identisch gelistet wurden. Erst Unsicherheit, doch langsam leichter Anflug von Unsicherheit und nahender Verzweiflung.
Weitere ZFS send/receives von Server1 nach Server2 werden mit Hinweis auf Checksum-Fehler in den Streams sofort abgebrochen.
Angst um die Datenbestände steigt: "was ist der richtige Stand"...."OMG"....
Nun, als senden und receiven wir Snaps innerhalb der gleichen Maschine (Server1). ????? geht?????? Interessant.
Server2 (Dell) komplett heruntergefahren und neu durchgestartet.
Und nun: keine Unterschiede in den Files wenn ich sie wie vorher binär vergleiche. Alles scheint ok.
Auf der einen Seite bin ich froh: alles wohl konsistent. Aber wie kann sowas auf einmal kommen? Ram-Defekt im Server2? Der hat ECC und bei so starken Problemen würde die Kiste wohl stehenbleiben/abstürzen. Netzwerk-Problem? Evtl. in Zusammenhang mit dem ESXI? IMO könnens nur diese zwei sein, denn der Pool ist ja offenbar clean und ZFS würde nach meinem Kenntnisstand ja auch keine korrupten Files ausliefern.
Irgendwie trau ich nun der Kiste2 bzw. deren Installation nicht mehr wirklich und würde wirklich gern rausfinden, was da war.
Aber zumindest: ZFS hatte immer recht ("No known data errors") und wohl offenbar richtige Daten.
Während der User Phantome jagte.