ESX Server 5.5 PSOD Lint1/NMI Motherboard nonmaskable Interrupt

MarV8501

Neuling
Thread Starter
Mitglied seit
06.05.2011
Beiträge
484
Ort
Recklinghausen
Hallo zusammen,

hat vielleicht irgendjemand von euch ne Idee wo ich eine Lösung suchen kann bei diesem PSOD:
ESX FEHLERBILD 1
ESX FEHLERBILD 2
ESX FEHLERBILD 3
ESX FEHLERBILD 4
ESX FEHLERBILD 5
ESX FEHLERBILD 6
ESX FEHLERBILD 7

Ich habe bereits ausgetauscht:
Motherboard, Raid CTL

Überprüft:
CPUs(PRIME95 - 24Std am Stück ohne Fehler), RAM(Memtest - 5Tests, 27Pass, 0Errors)

Habe VFlash ausgeschaltet bringt nix. Habe die Installation vom internen USB Stick auf eine SSD verschoben die am Raid Ctl hängt. Alle Firmwareupdates sind aktuell.

Genutzt wird das neuste ESX5.5 von Fujitsu. Verwaltet durch einen VCenter auf Win2012. Alle Netzwerkkarten laufen soweit möglich als VMNET3.

Hardware ist ein Fujitsu RX300 S5, 2Xeon E5540, 112GB RAM (Samsung DDR3 ECC), FC Controller Emulex LPe12000 8Gb, Netzwerk Intel Server Nic Dual, RaidCtl LSI Megaraid 256MB 5/6 mit BBU, 3xHDD WD Black 2,5 750GB, 1SSD 2,5 Crucial M4 64GB, FibreChannel Storage: Fujitsu SX88 4x1GB, 4x500GB, 4x2TB Serverplatten

Was mir aufgefallen ist im VMWare.log bevor der PSOD kommt scheint der RaidCtl Fehler zu produzieren aber wie schon erwähnt ist das schon ein neuer also denke ich das der Fehler vom Raid nur eine Folge eines vorher auftretenden Fehlers ist.

Reproduzierbar ist der Fehler nur bedingt. Mal läuft es 15Tage am Stück und der Fehler kommt, mal hab ich ihn sofort nach 1 oder 2Std, dann läuft er wieder 24Tage durch. Ich weiß nicht mehr weiter.
Habe die Maschinen jetzt zum Test erstmal alle auf die SX geschoben um Last auf dem RaidCTL wegzunehmen. Es laufen insgesamt wenn alle eingeschaltet sind 25VM´s. Von Debian - Win2012 alles dabei.
VdS mit 32Ports und 8Uplinks, PFSense Router für getrenntes Netz mit VPN

Nen Kollege hat die gleiche Maschine (bis auf HDD´s und FC) laufen und ungefähr das selbe an VM´s rennen ohne Fehler.
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Hallo MarV8501,

Ich vermute, dass es am SX88 direkt, oder an der Verbindung zum RC liegt. Hast du schon die FC Kabel getauscht?

mfg
 
Nabend,

das komische ist das der Fehler nur auftaucht wenn Last auf dem RaidCtl ist die SX hat momentan zwar eine Verbindung zum Host aber da läuft nix. Und ja die Kabel dort sind auch schon getauscht. Auch die FC Controller. Der zweite Host der als Backup dient hat auch Verbindung mit der SX und dort hab ich keinen Fehler.

Habe heute den ganzen Nachmittag damit verbracht das System zu testen. Sobald man 8,9VM´s auf dem Raid starten oder ausschalten lässt kommt ein megasas - reset.

Ist der Controller danach wieder bereit kommt direkt der NMI und der Host ist PINK.

Hab schon die VIB ausgetauscht, gleicher Fehler. Jetzt bin ich gerade dabei die HDD´s durchzutesten. Tausche gerade eine Platte aus dem Raid gegen die HotSpare und teste morgen weiter.

Bin für jede weitere Idee dankbar!
 
Zuletzt bearbeitet:
Du hast das ESX Image von Fujitsu genommen.

Schon mal das originale von VMware probiert?
 
Hatte ich glaub ich damals schon als erstes mal laufen. Aber ich kann auch das nochmal probieren. Danke.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh