Ich bin mir nicht sicher ob mein derzeitiges Problem etwas mit Hardware, etwas mit Software, etwas mit Dumheit oder alles drei ist, daher fange ich mal hier an:
Ich habe einen proxmox server, als Basis dient ein Supermicro H11SSL-i. Daran hängen 2 SSDs (Intel DC S3520) und diverser anderer Kram, der erst einmal egal sein sollte. DA eine meiner VMs nach etwas mehr performance schreit (jellyfin), wollte ich ihr eine "übriggebliebene" 980 pro spendieren. Also server runtergefahren, den stick in den freien m.2 Slot gesteckt, hochgefahren, via GUI die Disk gewiped, GPT initalisiert, ZFS-Storage angelegt und los gings. Aber, ach weh - die SSD mag mich nicht. Oder das Board nicht. Oder mein proxmox nicht. Oder oder oder. Sobald ich damit beginne VMs darauf zu kopieren, anzulegen oder sonstwas geht der pool in "Suspended":
Code:
root@pve:~# zpool status VM_Storage_NVME
pool: VM_Storage_NVME
state: SUSPENDED
status: One or more devices are faulted in response to IO failures.
action: Make sure the affected devices are connected, then run 'zpool clear'.
see: https://openzfs.github.io/openzfs-docs/msg/ZFS-8000-HC
config:
NAME STATE READ WRITE CKSUM
VM_Storage_NVME ONLINE 0 0 0
nvme-Samsung_SSD_980_PRO_500GB_S5GYNG0NC44312K ONLINE 4 0 0
errors: List of errors unavailable: pool I/O is currently suspended
errors: 1 data errors, use '-v' for a list
-v bringt mir leider nichts an infos:
Code:
root@pve:~# zpool status VM_Storage_NVME -v
pool: VM_Storage_NVME
state: SUSPENDED
status: One or more devices are faulted in response to IO failures.
action: Make sure the affected devices are connected, then run 'zpool clear'.
see: https://openzfs.github.io/openzfs-docs/msg/ZFS-8000-HC
config:
NAME STATE READ WRITE CKSUM
VM_Storage_NVME ONLINE 0 0 0
nvme-Samsung_SSD_980_PRO_500GB_S5GYNG0NC44312K ONLINE 4 0 0
errors: List of errors unavailable: pool I/O is currently suspended
Also mal angefangen das auszutesten was das NEtz so hergibt, angefangen bei einem clear:
Code:
root@pve:~# zpool clear VM_Storage_NVME
Auf das Ergebnis warte ich immer noch, also Konsole neu gestartet (ctrl+c oder sonstiges brachte kein Ergebnis) und mal "härtere" Gangart eingeschaltet:
Code:
root@pve:~# zpool clear -nFX VM_Storage_NVME
Selbst das läuft unendlich ohne Ergebnis (außer der toten Konsole).
Sodele, und hier stehe ich jetzt erstmal. Klar, ausbauen, neu einbauen, formatieren, neue GPUid etc pp hab ich alles durch. Was mache ich als nächstes?
Die SSD ging bis zum Ausbau ohne PRobleme, zeigt keine Smart errors und war "unauffällig". Ich hab jetzt mal eine IcyBox NVME-USB Adapter bestellt, um das Mainboard als Fehlerquelle ausschließen oder identifizieren zu können. Irgendwelche anderen klugen Ratschläge was ich bis dahin mal testen könnte?