ESX / ESXi - Hilfethread

Ja, hatte 2010-2019 eine X79 Consumer Möhre mit 64GB. Unglaublich wieviel Nerven und Geld mich ein defekter RAM Riegel gekostet hat, welchen ich nicht auf dem Schirm hatte. Ausserdem musste ich dann doch immer eine GPU stecken haben, um die PSOD zu sehen.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ja, hatte 2010-2019 eine X79 Consumer Möhre mit 64GB. Unglaublich wieviel Nerven und Geld mich ein defekter RAM Riegel gekostet hat, welchen ich nicht auf dem Schirm hatte.
Bevor ich da anfange zu instalieren lasse ich bei allen Systemen einmal Memtest86+ und eine stresstest 24H laufen.
 
Vergisses.
Damit findest du Fehler, die durch irgendwelche kosmischen Neutrinos verursacht werden, nicht mal im Ansatz.
Anbei mal ein Auszug aus meinen IPMI-Logs vom ESXi:
1646812494147.png

Keine Ahnung, wo die her kommen, memtest sagt, der RAM ist sauber.
Ist auch nur sporadisch...
ESXi fluppt aber einwandfrei 24/7.
 
1.0c ist die letzte Version, seit Kauf des Boards.
Supermicro ist zudem nicht gerade bekannt dafür, alle drei Wochen BIOS-Updates rauszukicken.

Google hab ich durch.
Sogar mit Druckluft alles freigeblasen.
Solange es nur sporadisch auftritt, juckt es mich nicht, der ESXi läuft ja stabil.
Man muss immer bedenken, es sind zwölf Bits, in einem Jahr 24/7-Betrieb, bei 80 GB ECC RAM.

Ich vermute, es liegt an der CPU, aber die ist halt aufgelötet (embedded EPYC)...
Alle drei, vier Monate verabschiedet sich der ESXi mal mit nem PSOD (allerdings ohne ECC-Fehler vorher), aber wirklich erhellende Aussagen dazu gibts auch nicht.
Man munkelt irgendwas mit dem Speichercontroller des EPYC...
 
Gibt es in ESXi 7u2 eigentlich die Möglichkeit bei GPU-Passthrough entweder
  • die GPU (Passthrough) als primäre GPU dem Gast zu übergeben und die vmware SVGA als sekundäre GPU

    oder

  • die vmware SVGA komplett zu deaktivieren, dass sie der Gast nicht sieht
    Die Option svga.present = false hat bei mir nicht funktioniert und den Host wohl sogar einmal zum Absturz gebracht.
 
@Weltherrscher mir würde das irgendwie keine Ruhe lassen. ;) Mein ESXI hat bei grad ca. 250 Tagen Uptime keine ECC-Fehler…
 
@Weltherrscher mir würde das irgendwie keine Ruhe lassen. ;) Mein ESXI hat bei grad ca. 250 Tagen Uptime keine ECC-Fehler…
Kann ich bestätigen. Ich betreibe hier seit weit über 10 Jahren Server - und sobald da ECC Errors reportet werden, dann tauscht man die entsprechenden Riegel bzw. prüft wenigstens ob es Known Issues gibt, die bspw. auf false positive reports zurück zu führen sind und mit nem Update der Firmware behoben werden. Denn normal ist das nicht... Solange sie zwar correctable sind, "merkt" man das nicht durch direkte Auswirkungen, aber dennoch rennt man direkt in den Fallstrick, der exakt dafür da ist, eben diese Ausnahmen abzufangen. Im Screen oben von @Weltherrscher sieht man allerdings auch uncorrectable ECC Errors. Dort sind Bits definitiv gekippt. Ob das direkt merkbar ist, ist eine andere Frage. Aber die Gefahr besteht, dass durch sowas das File System korrupt wird. Das OS abschmiert, VMs abnippeln usw. usf. Seriöser weise sollte man das so schlicht nicht betreiben ;)
 
Im produktiven Umfeld stimme ich euch voll und ganz zu.
Ich betreibe den ESXi ja privat.
Und um ehrlich zu sein, bin ich gerade echt zu faul, den ESXi runterzufahren und den RAM umzustöpseln, um zu sehen, ob sich dann die Bänke in den Meldungen ändern.
Was die beiden uncorrectable Errors gemacht haben, keine Ahnung.
Sie sind zeitlich jedenfalls nicht mit den PSODs in Verbindung zu bringen...
 
Hier auch seit Anfangs 2019 keinen einzigen ECC Fehler im log. Bei 128GB. Dafür habe ich alle paar Monate einen 5V Fehler drin, es wird aber eh demnächst das NT getauscht.
 
Solange es nur sporadisch auftritt, juckt es mich nicht, der ESXi läuft ja stabil.
Alle drei, vier Monate verabschiedet sich der ESXi mal mit nem PSOD (allerdings ohne ECC-Fehler vorher), aber wirklich erhellende Aussagen dazu gibts auch nicht.
Hm das würde ich jetzt nicht als „stabil“ bezeichnen, ausser die Vm‘s sind nicht sehr wichtig ( DHCP, Router, DNS, Datenbanken etc.)
aber mir würde dies keine Ruhe lassen….🤯
Was meint Supermicro dazu? ich meine das Board unterstützt ja ESXI hast du dort einmal ein Ticket aufgemacht ? Ich sage es mal so wir sprechen hier ja nicht von Meinem Gigabyte desktop Board, nein das ist „professionelle“ Server Hardware!

@AliManali
Was hast du den für eines verbaut?, und wie alt ist es USV davor?

Mein Status:
System wird getestet, jedoch fehlen noch Lüfter die, die kann ich morgen abholen 😁.
 
ASUS Z10PA-U8 Series. Mit E5 v4 Xeon und RDIMM. Verbaut sind noch Quad NIC, HBA und Telefon Interface.

USV hängt im Moment keine dran, die hat gebrannt. Zum Glück war ich zu hause. Letzthin wär ich mal froh gewesen, da haben die kurzfristig den Strom abgestellt. Und ich war am Server grad gröber am arbeiten.

Was nimmst Du denn für SSD's? Da habe ich mit Consumerhardware auch schlechte Erfahrungen gemacht. VM Store liegt nun auf einer SM883 auf ZFS.

Und, hast Du eine GPU verbaut? Startet der Server auch ohne?
 
Und, hast Du eine GPU verbaut? Startet der Server auch ohne?
Ja eine Uralte Nvidia die leider einen x16 Slot braucht im x8 funktioniert sie nicht 🙃 ob der server ohne boootet weis ich nicht aber ich denke schon wenn dann esxi drauf ist, das board ging jedenfalls in den Status AE ( kein boot Laufwerke)
USV hängt im Moment keine dran, die hat gebrannt. Zum Glück war ich zu hause. Letzthin wär ich mal froh gewesen, da haben die kurzfristig den Strom abgestellt. Und ich war am Server grad gröber am arbeiten.
OMG war es eine alte USV ? das sollte ja nicht einfach so passieren!

Was nimmst Du denn für SSD's? Da habe ich mit Consumerhardware auch schlechte Erfahrungen gemacht. VM Store liegt nun auf einer SM883 auf ZFS.
Ja im Aktuellen ESXI der auch bestehen bleibt sind nur SSD‘s verbaut, bis jetzt ist nicht‚ ausgefallen. Dies war auch der fall beim Hyper-V Server.

Beim neuen habe ich zwei Crucial p5 2TB auf dem Baord
 
Hallo Zusaamen

Die Hardware will nicht so richtig:
Der Onboard nie läuft nicht OTB auch die Treiber Installation scheitert:
Community Networking Driver for ESXi
Die Datei habe ich in Intel.zip umbenannt. und unter: /vmfs/volumes/Datastore1/ abgelegt.

Führe ich nun den Befehl aus:


Code:
Log:
2022-03-13T19:03:05Z esxupdate: 2101000: vmware.runcommand: INFO: runcommand called with: args = '['/sbin/esxcfg-advcfg', '-q', '-g', '/UserVars/EsximageNetTimeout']', outfile = 'None', returnoutput = 'True', timeout = '0.0'.
2022-03-13T19:03:05Z esxupdate: 2101000: vmware.runcommand: INFO: runcommand called with: args = '['/sbin/esxcfg-advcfg', '-q', '-g', '/UserVars/EsximageNetRetries']', outfile = 'None', returnoutput = 'True', timeout = '0.0'.
2022-03-13T19:03:05Z esxupdate: 2101000: vmware.runcommand: INFO: runcommand called with: args = '['/sbin/esxcfg-advcfg', '-q', '-g', '/UserVars/EsximageNetRateLimit']', outfile = 'None', returnoutput = 'True', timeout = '0.0'.
2022-03-13T19:03:05Z esxupdate: 2101000: root: INFO: Command = vib.install
2022-03-13T19:03:05Z esxupdate: 2101000: root: INFO: Options = {'depot': None, 'viburl': ['Intel.zip'], 'nameid': None, 'profile': None, 'baseimageversion': None, 'addon': None, 'softwarespec': None, 'level': None, 'updateonly': False, 'noliveinstall': False, 'nomaintmode': False, 'force': False, 'dryrun': False, 'oktoremove': False, 'proxy': None, 'nosigcheck': False, 'pending': None, 'rebooting': False, 'downgrade': None, 'nohwwarning': False}
2022-03-13T19:03:05Z esxupdate: 2101000: HostImage: INFO: Installers initiated are {'live': <vmware.esximage.Installer.LiveImageInstaller.LiveImageInstaller object at 0x4a13706190>, 'boot': <vmware.esximage.Installer.BootBankInstaller.BootBankInstaller object at 0x4a1390b1c0>, 'locker': <vmware.esximage.Installer.LockerInstaller.LockerInstaller object at 0x4a13706400>}
2022-03-13T19:03:05Z esxupdate: 2101000: imageprofile: INFO: Adding VIB VMware_locker_tools-light_11.3.5.18557794-19193900 to ImageProfile ESXi-7.0U3c-19193900-standard
2022-03-13T19:03:05Z esxupdate: 2101000: imageprofile: DEBUG: Adding Component VMware-VM-Tools_11.3.5.18557794-19193900 to ImageProfile ESXi-7.0U3c-19193900-standard
2022-03-13T19:03:05Z esxupdate: 2101000: imageprofile: DEBUG: Removing reserved Component VMware-VM-Tools_11.3.5.18557794-19193900 in ImageProfile ESXi-7.0U3c-19193900-standard
2022-03-13T19:03:05Z esxupdate: 2101000: downloader: INFO: Opening Intel.zip for download
2022-03-13T19:03:08Z esxupdate: 2101000: downloader: WARNING: Download failed: unknown url type: 'Intel.zip', 9 retry left...
2022-03-13T19:03:11Z esxupdate: 2101000: downloader: WARNING: Download failed: unknown url type: 'Intel.zip', 8 retry left...
2022-03-13T19:03:14Z esxupdate: 2101000: downloader: WARNING: Download failed: unknown url type: 'Intel.zip', 7 retry left...
2022-03-13T19:03:17Z esxupdate: 2101000: downloader: WARNING: Download failed: unknown url type: 'Intel.zip', 6 retry left...
2022-03-13T19:03:20Z esxupdate: 2101000: downloader: WARNING: Download failed: unknown url type: 'Intel.zip', 5 retry left...
2022-03-13T19:03:23Z esxupdate: 2101000: downloader: WARNING: Download failed: unknown url type: 'Intel.zip', 4 retry left...
2022-03-13T19:03:26Z esxupdate: 2101000: downloader: WARNING: Download failed: unknown url type: 'Intel.zip', 3 retry left...
2022-03-13T19:03:29Z esxupdate: 2101000: downloader: WARNING: Download failed: unknown url type: 'Intel.zip', 2 retry left..
CLI output:
root@localhost:/vmfs/volumes/622e2fd3-dcef9d59-6c1a-6cb3114f198e]  esxcli software vib install -v Intel.zip
 [VibDownloadError]
 ('Intel.zip', '', "unknown url type: 'Intel.zip'")
        url = Intel.zip
 Please refer to the log file for more details.
[root@localhost:/vmfs/volumes/622e2fd3-dcef9d59-6c1a-6cb3114f198e]

Jemand eine Idee warum dies nicht klappt ?
 
Ja, um den Pfad aus Schritt d zu ermittlen bietet sich WinSCP an. Wie auch für vieles anderes.

Du schreibst auch, ich führe "das" aus, aber darunter ist nur der Output? Wie genau lautet die Anweisung?

ESXi konntest Du ohne kompatible NIC installieren anscheinend? Oder wird die Realtec untersützt vom Sibni?
 
Zuletzt bearbeitet:
Die Fehlermeldung sagt aus das er die datei nicht findet, im datastore ist diese zu finden?
Ja die Datei existiert:
2022-03-14_20-42-07.png
Hi, versuche es mal wie hier im Schritt D beschrieben: https://www.netiq.com/de-de/documen...rge_11-3_field_rebuild/data/install-vibs.html evt klappt das dann, die Intel.zip ist auch nach dem Prinzip von Vmware gepackt und auch kompatibel?
Nja es ist eine Datei aus dem VMware Forum. Funktioniert leider nicht..
2022-03-14_20-43-59.png
Das Rot markierte ist eigentlich masgebend weiter oben habe ich aus Verzweiflung alles mögliche versucht da ich mit dem Befehl:
Code:
ls –al /vmfs/volumes
etwas anderes erhalte als auf dem Bild, da dieser command nicht richtig funktioniert das al findet er nicht...
Code:
/vmfs/volumes:
2269ee65-d4497da3-f197-3435a1d000c2         622e2fd2-a6cae15d-d142-6cb3114f198e         BOOTBANK1                                   OSDATA-622e2fd2-a6cae15d-d142-6cb3114f198e
2a1ec156-e34cd4f0-188e-997fd0d54b30         622e2fd3-dcef9d59-6c1a-6cb3114f198e         BOOTBANK2                                   datastore1
[root@localhost:~] ls –al /vmfs/volumes
ls: –al: No such file or directory
/vmfs/volumes:
2269ee65-d4497da3-f197-3435a1d000c2         622e2fd2-a6cae15d-d142-6cb3114f198e         BOOTBANK1                                   OSDATA-622e2fd2-a6cae15d-d142-6cb3114f198e
2a1ec156-e34cd4f0-188e-997fd0d54b30         622e2fd3-dcef9d59-6c1a-6cb3114f198e         BOOTBANK2                                   datastore1
[root@localhost:~]

Umgründe brauche ich die Onboard NIC nichtunbedingt es wundert mich einfach das intel doch nicht so unproblematisch ist... oder ich einfach zu doof :fresse2:

Besten Dank für jegliche Hillfe
 
Ja die Datei existiert:
Anhang anzeigen 739331

Nja es ist eine Datei aus dem VMware Forum. Funktioniert leider nicht..
Anhang anzeigen 739350
Das Rot markierte ist eigentlich masgebend weiter oben habe ich aus Verzweiflung alles mögliche versucht da ich mit dem Befehl:
Code:
ls –al /vmfs/volumes
etwas anderes erhalte als auf dem Bild, da dieser command nicht richtig funktioniert das al findet er nicht...
Code:
/vmfs/volumes:
2269ee65-d4497da3-f197-3435a1d000c2         622e2fd2-a6cae15d-d142-6cb3114f198e         BOOTBANK1                                   OSDATA-622e2fd2-a6cae15d-d142-6cb3114f198e
2a1ec156-e34cd4f0-188e-997fd0d54b30         622e2fd3-dcef9d59-6c1a-6cb3114f198e         BOOTBANK2                                   datastore1
[root@localhost:~] ls –al /vmfs/volumes
ls: –al: No such file or directory
/vmfs/volumes:
2269ee65-d4497da3-f197-3435a1d000c2         622e2fd2-a6cae15d-d142-6cb3114f198e         BOOTBANK1                                   OSDATA-622e2fd2-a6cae15d-d142-6cb3114f198e
2a1ec156-e34cd4f0-188e-997fd0d54b30         622e2fd3-dcef9d59-6c1a-6cb3114f198e         BOOTBANK2                                   datastore1
[root@localhost:~]

Umgründe brauche ich die Onboard NIC nichtunbedingt es wundert mich einfach das intel doch nicht so unproblematisch ist... oder ich einfach zu doof :fresse2:

Besten Dank für jegliche Hillfe
Servus, ich kann mich morgen gerne mal per Teamviewer oder Anydesk aufschalten. Du darfst den Treiber nicht entpacken. Das muss als zip im Datastore vorliegen.
 
Servus, ich kann mich morgen gerne mal per Teamviewer oder Anydesk aufschalten. Du darfst den Treiber nicht entpacken. Das muss als zip im Datastore vorliegen.
Besten Dank für dein Angebot, aber ich habe es hinbekommen da ich einen Highpoint SSD6204 gekauft habe musste ich auch eine via Datei instalieren

Das war auch das problem:

esxcli software vib install -v /vmfs/volumes/622e2fd3-dcef9d59-6c1a-6cb3114f198e/VIB/intel.vib -f und nicht wie ich immer gemacht habe Update wie auch noch das -V und -d maßgebend sind.
nun sind alle Karten Einsetzt bereit:
lan.png
ssd.png
 
Ich würde gerne meine Snapshots (Truenas ZFS) über die Windows Shadow-Copy verwalten.
Das Dataset auf dem ZFS-Pool ist per NFS an den ESXi-Host und per SMB an Windows geteilt.
Die VM die ich zurücksetzten möchte ist heruntergefahren.
Leider bekommen ich dennoch beim Klicken auf "Wiederherstellen" die folgende Fehlermeldung! :(
Snapshot wiederherstellen.JPG

Kann mir vielleicht jemand sagen, wie ich Schreibrechte auf den NFS-Datastore per SMB über Windows bekomme?
 
NTFS-Berechtigung auf den Share gesetzt?
 
Hmm, da versuchst Du offensichtlich auf dem nvram zurückzugehen. Ist das ein Shnapshot? Da müsstest Du wohl auf eine vmdk zurück gehen, wenn ich das richtig verstanden habe. Wenn die VM aus ist.
 
Hmm, da versuchst Du offensichtlich auf dem nvram zurückzugehen. Ist das ein Shnapshot?
Ja ist ein Snapshot in Truenas erstellt. - Also ein rekursiver Snapshot über den Ordner in dem untergeordnet die verschiedenen VMs des ESXi-Hosts liegen.
Ich habe die VMs per Skript um 02:30 Uhr heruntergefahren, dann wurde um 03:00 Uhr in Truenas der Snapshot angelegt.
Jetzt ist die entsprechende VM ebenfalls aus.
Ich dachte ich könnte hier einfach auf Ordnerebene den Zustand von 03:00 Uhr wiederherstellen.
Wenn ich dich jetzt richtig verstehe, dann muss ich nur manche Dateien zurücksetzten und der nvram ist nicht relevant?
Wobei ich trotzdem nicht verstehe, wieso ich hier nicht einfach die Daten überschreiben kann! :(
 
Ich muss dazu sagen, dass ich noch nie eine VM über SMB auf einen Snapshot zurück gesetzt habe.
Du nutzt dann die ESXi interne Snapshot-Funktion?

Nein die VM ist wirklich aus. Selbst ein "unregister" der VM gibt die Schreibrechte leider nicht frei. :( Ist wirklich sehr komisch!
Vor allem, wieso die nvram Datei im Verzeichnis ist, obwohl die VM aus ist ..... Kann hier ggf. jemand Aufklärung schaffen? :)
 
Du nutzt dann die ESXi interne Snapshot-Funktion?
Nein, ich mache ab und an ein ZFS Snap auf napp-it.

Die nvram Datei sind die vBIOS Einstellungen, die sind immer vorhanden. Ich habe das mit vswp verwechselt, welche aber auch bei ausgeschaltetem Zustand erhalten bleibt.

Da muss ich passen, ja.
 
Die nvram Datei sind die vBIOS Einstellungen, die sind immer vorhanden. Ich habe das mit vswp verwechselt, welche aber auch bei ausgeschaltetem Zustand erhalten bleibt.
OK, danke für die Info.

Jetzt ist mir noch eine Möglichkeit eigefallen, aber ich bin mir nicht sicher, ob das sein kann.
Ich kann z.B. auf den Snapshot von heute Nacht (20.03.22 um 03:00 Uhr) zurücksetzten, aber auf alle anderen zuvor leider nicht.
Die SMB Freigabe habe ich erst am 19.03.22 Nachmittags erstellt. - Also erst nach den Snapshots auf die ich nicht zurücksetzten kann.
Ist es möglich, dass ich nicht zurücksetzten kann, weil zu diesem Zeitpunkt der Windows-Rechner noch gar nicht die SMB-Freigaben hatte (obwohl ich jetzt die Schatten-Kopien sehe)?
Und falls ja, weiß jemand, ob man das noch nachträglich korrigieren kann?
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh