ESX / ESXi - Hilfethread

Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ich habe aktuell ein merkwürdiges Problem, was mir jetzt nur daheim aufgefallen ist - auf produktiven Systemen tritt es nicht auf.
Folgendes Setup habe ich daheim: esxi auf einer SSD, dort ist auch die VM drauf.
In der VM läuft Windows 10 mit einer Festplattenauslastung von 100%. read/write ist lächerlich, liegt bei paar mb/s.
Ich weiß, man sollte der Auslastung in der VM nicht trauen, aber trotzdem finde ich es merkwürdig. Vmwaretools sind ebenfalls installiert. Vielleicht hat jemand einfach eine gute Idee.
 
Defrag, Readyboot sowie Superfetch ausgeschaltet? Win10 macht das ja normal bei SSD automatisch, aber bei einer VM nicht, da es nicht erkennt, dass es eine SSD ist.
 
Zuletzt bearbeitet:
Ich weis das hat nichts primär mit den ESXi zu tun aber hier gibts ves viele die sich auskennen.
Ich habe den HP 410 Controller drinnen mit ka wie viel Cache Speicher.
Jetzt habe ich mir aus China den passenden 1GB Cache gekauft für paar €.
Die BBU ist auch dran. Ich hoffe die ist richtig herrum drinnen.

Was passiert wenn das Cache Modul defekt ist oder die BBU nicht erkannt wird?
Gibt es einen Fehler oder zerschieße ich mir dann die RAIDs?
 
Wenn du keine BBU hast ist der Cache nicht aktiv außer du hast die Warnung ignoriert und die Verwendung des Caches erzwungen.
Wenn der Speicher defekt ist kanns du dir theoretisch das RAID umbringen, jedoch handelt es sich da um ECC Speicher und der Controller erkennt das normalerweise auch wenn es da ein Problem gibt.
 
Da Problem nennt sich Write Hole Problem
"Write hole" phenomenon in RAID5, RAID6, RAID1, and other arrays.

Bei einem herkömmlichen Raid (Mirror Update oder Raid 5/6 Stripes, egal ob Hardware oder Software Raid) werden die Platten nacheinander upgedated. Verscharft wird das Problem dadurch dass beim Schreiben erst die Daten geschrieben werden und dann die Matadaten aktualisiert werden.

Ein Crash bei Schreiben kann da zu einem defekten Raid (Mirrors nicht identisch oder defektes Raid Stripe) oder zu einem defektem Dateieisystem führen.

Ein Hardware-Raid mit Cache und BBU ist die herkömmliche Methode um das Problem zu verringern. Die neuen Copy On Write Dateisysteme (ZFS und Abkömmlinge wie btrfs oder ReFS) vermeiden das Problem mit Software Raid und sicheren atomaten Schreibvorgängen (Ein Write/ Raid Update ist erst dann wirksam wenn es vollständig durchgeführt wurde)
 
jedoch handelt es sich da um ECC Speicher und der Controller erkennt das normalerweise auch wenn es da ein Problem gibt.
Die frage ist was passiert dann?
Kommt dann eine Error Message oder zerschiesst er was?
Eine BBU brauche ich eigentlich nicht wirklich weil ich eine USV habe.
 
Bei einem korrigierbaren Speicherfehler am Controller-Ram würde ich erwarten, dass der Controller die Daten korrigiert wegschreibt aber ein Fehlerlog über seine Verwaltungssoftware und ans OS-Systemlog ausgibt. Monitoringsoftware sollte das dann erkennen können.
Bei einem unkorrigierbaren Fehler sollte der Controller sich weigern, den I/O-Request auszuführen und das OS bzw. die Anwendungssoftware/Datenbank/whatever dementsprechend Alarm schlagen.

Beim Lesen kann der Controller die korrupten Datenblöcke ja verwerfen und nochmal von den Platten/SSDs anfordern. Aber auch hier sollte IMO eine Meldung ans Log der Controllerverwaltungssoftware erfolgen.
 
Zuletzt bearbeitet:
Also kann ich nicht das RAID zerschiessen wenn ich (bei den ausgeschaltenen) Server nur die Cache Karte tausche?
 
Ich würd bei solchen Aktionen immer eher kopieren als verschieben und dann die alte Doublette erst löschen, wenn wirklich alles sauber läuft und eine gewisse Testzeit überstanden hat.
Habe ich gerade gemacht und den teil gesagt das es sich um eine Kopie handelt und nach den Booten geht das Netzwerk nicht ganz. Ich habe im FF den Proxy eingetragen und es geht dann. Die IP ist noch die alte.
Was ist los irgend wo wird die Netzwerk Config eine andere sein?!
 
Moin,

bei uns war letzte Nach wegen Gewitter Stromausfall und mein ESXi macht jetzt probleme. Die Raid-Volumes (6x3TB RAID5 DATEN) + (2x1TB RAID 1 OS) werden vom Raid-Controller noch als Optimal geführt, der ESXi startet auch, aber als er dann die VMs hochfahren möchte, frisst er sich fest und es kommt im VMware vSphere Client die Fehlermeldung:

Aufruf von "PropertyCollector.RetrieveContents" für Objekt "ha-property-collector" auf ESXi "xxxx" ist fehlgeschlagen

Auf dem Bildschirm vom ESXi ist folgende Errormeldung zu sehen:
ESXi Error.JPG

Habt ihr eine Idee was das Kerlchen hat? Kann er die Volumes nicht mehr sehen?

Viele Grüße
Dominik

EDIT:

Ich habe gerade gesehen das ein Roll Back möglich ist. Kann ich damit evtl. etwas bewirken?
ESXi Rollback.JPG
 
Zuletzt bearbeitet:
Werden die VMs automatisch gestartet? Falls nein, kann man per vSphere Client die Datastores erreichen? Dass die Datastores nicht mehr erreicht werden können und sich der ESXi deswegen aufhängt, wäre ungewöhnlich, denn wenn die Datastores nicht erreicht werden können und der ESXi versucht, VMs zu starten, sollte eigentlich nur eine Fehlermeldung kommen, dass die VMs nicht gestartet werden können, kein PSOD.

Was sagt eine Internetsuche nach "Usage error in dlmalloc"?
 
Werden die VMs automatisch gestartet? Falls nein, kann man per vSphere Client die Datastores erreichen? Dass die Datastores nicht mehr erreicht werden können und sich der ESXi deswegen aufhängt, wäre ungewöhnlich, denn wenn die Datastores nicht erreicht werden können und der ESXi versucht, VMs zu starten, sollte eigentlich nur eine Fehlermeldung kommen, dass die VMs nicht gestartet werden können, kein PSOD.

Was sagt eine Internetsuche nach "Usage error in dlmalloc"?

Er versucht sie zumindest automatisch zu starten, das habe ich jetzt ausgeschaltet. Ich kann die Datastores weder über den Client noch per SSH mit "esxcli storage filesystem list" erreichen, läuft beides in einen Timeout :-(.

VMware rät ein Update durchzuführen, aber wie konnte das Teil ein Jahr mit dem Bug zuverlässig laufen?

VMware ESXi 6.0 Update 1 host fails with a purple diagnostic screen and reports the error: PANIC bora/vmkernel/main/dlmalloc.c:4923 - Usage error in dlmalloc (2135956) | VMware KB
 
Mach bitte mal nach dieser Anleitung ein Backup der Config:
Backup und Restore der vSphere Hostkonfiguration – Thomas-Krenn-Wiki

Dann installiere ESXi neu und prüfe, ob der Datastore vorhanden ist und funktioniert (Vm registrieren).
Falls nicht liegt es am Datastore. Dann würde ich die VMs versuchen zu sichern.
Falls es funktioniert dann kannst du davon ausgehen, dass es den ESXi beim Stromausfall zerhauen hat.

Die Config kannst du danach zurückspielen oder eben nicht. Mit Pech kommt der Fehler dann aber wieder. Allzu viele Einstellungen sind im ESXi eigentlich gar nicht zu treffen.

Btw: Eine USV gibt es schon ab 40 Euro.
 
Mach bitte mal nach dieser Anleitung ein Backup der Config:
Backup und Restore der vSphere Hostkonfiguration – Thomas-Krenn-Wiki

Dann installiere ESXi neu und prüfe, ob der Datastore vorhanden ist und funktioniert (Vm registrieren).
Falls nicht liegt es am Datastore. Dann würde ich die VMs versuchen zu sichern.
Falls es funktioniert dann kannst du davon ausgehen, dass es den ESXi beim Stromausfall zerhauen hat.

Die Config kannst du danach zurückspielen oder eben nicht. Mit Pech kommt der Fehler dann aber wieder. Allzu viele Einstellungen sind im ESXi eigentlich gar nicht zu treffen.

Btw: Eine USV gibt es schon ab 40 Euro.

Danke für die Hilfe! Ich kann die Konfig auch garnicht mehr exportieren, da passiert nix mehr. Dann wollte ich wie von dir vorgeschlagen eine neue installation bzw. gleich ein Update auf 6.5 durchführen, aber es kommt dieser Fehler:

Installation Error.JPG

Ich habe Boot von USB und einbindung der ISO via iKVM probiert, beides der gleiche Fehler. Hast Du eine Idee?
Mit der USV hast du natürlich komplett recht.....
 
Mach mal kein Update sondern wähle richtig "Installieren". Am besten nochmal die ISO neu runterladen um ein defektes ISO auszuschließen.
 
Hi,

ich würde gern meinen neuen ESXi(free) Server mit ner USV ausstatten. die idee wäre, die USV an eine VM weiter zu geben, die dann den ESXi herunterfährt. Gibt es da möglichkeiten ohne SSH auf dem ESXi host zu aktivieren?

Gruß,

Marc
 
Es soll irgend eine möglichkeit geben das ein Host den ESXi herunter fährt es gibt hier genug leute die sich damit auskennen.
 
@Boy: Host=Gastgeber=nach üblicher Terminologie= Hypervisor=ESXi & Co.

Was Du wohl meinst, ist ein GAST=guest=VM.

Und das läuft dann m.W. eben über SSH, was der Fragesteller offenbar irgendwie nicht will.
 
Ich weis nur was ich hier gelesen habe das man irgend wie von einen Gast OS den ESXi herunterfahren kann bei einen Stromausfall.
Und das hier mehr leute sind die sich damit besser auskennen als ich.
 
Genau. Dann schreib das auch und nicht dass ein HOST den ESXi herunter fährt... sowas verwirrt nur und ein bisserl Präzision bei der Kommunikation hilft immer, Missverständnisse zu verringern bzw. zu vermeiden.
 
Ich habe mich in der schnelle geirrt aber auch geschrieben das sich andere bessere auskenne als mich.
 
Wie soll es vernünftig klappen, das eine VM auf einem ESXer zuerst alle VMs herunterfährt (damit auch sich selbst) und anschließend noch den ESXer runterfährt?
Ich könnte natürlich direkt den ESXer herunterfahren, aber dann bekommen die VMs doch nen PowerOff, oder habe ich da gerade einen Denkfehler?

Bei uns auf der Arbeit habe ich mal nen Script geschrieben, das läuft auf nem physischen Server (Windows). Da ist die USV per USB mit verbunden und auf dem Server läuft die USV-Software, die das Script triggert.
In dem Script fahre ich u.a. auch alle VMs und zum Schluss die ESXer herunter. Zuerst werden die VMs über die VMware Tools heruntergefahren. 5 Minuten später macht der ESXer nen harten PowerOff auf alle VMs (die, die dann noch laufen oder keine VM-Tools verwenden) und fährt sich danach herunter.
Da der Server mit dem Script separat ist, kann der sich anschließend problemlos herunterfahren. Das Script greift für den Shutdown der VMs allerdings auf nen vCenter zu, ob das auch direkt mit den ESXern klappt habe ich nie getestet.
Eventuell könnte so etwas auch mit einem RasPi gebastelt werden, aber das überschreitet meine Fähigkeiten.

Bei Interesse kann ich weitere Infos zu dem Script (den verwendeten Befehlen) und den benötigten Programmen (seitens VMware) raussuchen.


Edit sagt: das Script kommt übrigens ohne SSH-Zugriff auf die ESXer aus.
 
Zuletzt bearbeitet:
Ja das wäre toll.
 
Bin gerade unterwegs, aber kann man nicht in den VM Einstellungen festlegen, was beim Shutdown des Host passieren soll? Wenn ich mich richtig erinnere, kann der ESXi die VMs doch einfrieren und den RAM-Inhalt auf Disk speichern?
 
Wenn die VM mit der USV-Software an den Host den Befehl zum Herunterfahren des Host absetzt, reicht das.
Die VMs werden (so sie automatisch gestartet wurden) dann vollkommen automatisch in der umgekehrten Reihenfolge heruntergefahren.
Es ist NICHT notwendig, die VMs separat herunter zu fahren!
 
@millenniumpilot
Okay, da habe ich gar nicht drüber nachgedacht. Aber das klappt doch nur bei einem ESXer, richtig?
Bei uns auf der Arbeit (zwei ESXer + VCSA) geht das so lange gut, bis ich eine VM per vMotion auf einen anderen Host schiebe. Weil diese Konfig übernimmt der nicht auf den anderen Host.
Oder gibt es eine Möglichkeit diese Konfig auch automatisch auf den anderen Host zu übertragen?
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh