Nea, bei nen guten Kumpel läuft das Board jetzt schon über 1 jahr ohne Probleme.
Man muss ja nicht jedes Update mitnehmen, IPMI funzt ja auch ohne Updates.
Was magst du den groß im Bios einstellen ?
Also anfangs habe ich einige Versuche mit diversen Einstellungen im BIOS gemacht, weil die Kiste deutlich mehr Strom zieht verglichen mit dem Vorgänger-Server (Supermicro X11SSH-CTF mit Xeon 1240 v6). Vorher etwa 39-42W im Idle und HDDs im SpinDown, 60-80W mit leichter Grundlast. Jetzt mit ASRock Rack X470D4U und Ryzen 3600 liege ich bei sonst identischer Peripherie (gleicher SAS-Controller, gleiche HDDs, usw) bei 60-70W im Leerlauf und 90-120W bei leichter Grundlast mit den gleichen VMs. Viele Optionen im BIOS haben aber dafür gesorgt, dass die Kiste gar nicht mehr bootet - obwohl die Optionen eigentlich damit nichts zu tun haben sollte. Also immer wieder alles zurückgesetzt. "Schnellste" Methode war jeweils, das BIOS über das IPMI neu zu flashen und dabei alle Einstellungen zu verwefen. Wobei "schnell" hier sehr relativ ist... Und in den letzten >10 Jahren mit Supermicro-Servern habe ich noch nicht ein mal so einen Tanz aufführen müssen, egal wie viel ich am BIOS rumgefummelt habe
Dann war lange Zeit die Lüftersteuerung verkorkst. So kontrollierte FAN1 im BIOS den Lüfteranschluss 1/CPU, FAN2 vermutlich Lüfteranschluss 6, FAN3 Lüfteranschluss 2, FAN4 Lüfteranschluss 3, FAN5 Lüfteranschluss 4 und FAN6 Lüfteranschluss 5. Hat mich auch einiges an Zeit gekostet, das herauszufinden - schließlich muss man für jeden Test erst die Werte im BIOS abspeichern und neu starten, was bei der Hardware und dank SAS-Controller und Co. jedes Mal ein paar Minuten dauert. Glaube seit Bios 3.20 oder 3.30 ist das aber behoben.
Später habe ich eine externe GPU für Transcoding für Emby und einen Kodi-LXC-Container hinzugefügt. Die GPU steckt im untersten Slot. Anders passt es nicht. Dafür muss man natürlich die Aufteilung der PCIe-Lanes einstellen, außerdem welche GPU das Haupt-Ausgabegerät ist. Mit der BIOS-Version, die ich zu dem Zeitpunkt drauf hatte, ging das nicht vernünftig - mit BIOS 3.50 war das leider auch nicht möglich, vernünftig einzustellen - da landete dann der Hypervisor auch immer zwangsläufig auf der externen GPU, das BIOS immer nur je nach Lust und Laune auf der IPMI-Grafik oder der externen GPU oder die externe GPU wurde im System nachher gar nicht erkannt. Also habe ich verschiedene BIOS-Versionen getestet und glaube mit 3.20 oder 3.30 ging das ganze dann.
Mit BIOS 3.50 war dann meine ich auch die Lüftersteuerung ganz verschwunden, aber auch noch nicht im IPMI vorhanden? Da bin ich mir aber gerade nicht sicher. War noch ein Grund auf 3.20 oder 3.30 zurückzugehen.
BIOS 4.20 habe ich jetzt installiert, weil ich eigentlich überlegt hatte, auf einen Ryzen der 5xxx-er Serie zu wechseln. Aber jetzt muss erstmal das IPMI wieder heile, bevor ich weiter bastele. Und ehrlich gesagt habe ich inzwischen auch keine Lust mehr, weiter an der Kiste rumzudoktern. Wenn das IPMI repariert ist, wird die Kiste so weiter benutzt wie sie ist und die nächste Änderung wird sein, dass das Board ganz rausfliegt.
Ich meine, ich hatte in der Anfangszeit auch noch weitere Probleme mit dem BIOS, aber gerade fallen mir nur noch die oben genannten Dinge ein. Und alleine, dass ich jetzt schon wieder gestern den halben Tag versenkt habe bei dem Versuch, das IPMI wieder zum Laufen zu bekommen (Zurücksetzen, Netzwerkeinstellungen testen, Flashen via socflash, weitere Recherchen, Baustein ausbauen der natürlich unter der GPU sitzt, dessen Stromkabel schön verlegt war, ...), reichte wieder, um die Abneigung wieder hochkochen zu lassen. Das ist mir mit mehreren Dutzend Supermicro-Servern auch noch nie passiert. Ich habe ja auch nichts falsch gemacht. Ich habe die neueste IPMI-Version geflasht, um wieder an die Lüftersteuerung zu kommen, die nun aus dem BIOS ins IPMI gewandert ist. Dabei habe ich keinen Zwischenschritt ausgelassen, der die Migration schwierig machen könnte und das Update ist vermeintlich erfolgreich durchgelaufen. Trotzdem verkorkst. Sowas darf einfach nicht passieren. Ich stelle mir das gerade im größeren Umfeld vor. Soll der Admin vorher seine Glaskugel anbeten und hoffen, dass das Update gut geht, bevor er danach zig Server zerlegen muss, um bei einigen die Flash-Bausteine auszubauen und per Hand extern neu zu flashen? Das ist Wahnsinn. Und wenn ich das von Knogle lese, dann scheine ich nicht der einzige zu sein, wo das trotz regulärem Flash-Vorgang schief läuft.
Ich bin jedenfalls wieder durch mit Asrock. Das nächste Geld wird wieder in Supermicro investiert.
Tobby schick mir mal deine Adresse und ich schicke dir kostenlos einen neu beschrieben Flash zu 😁
EDIT: Sehe gerade, ist ein 256mbit chip, habe gerade nur 128mbit Winbonds da. Aber wenn du magst kannst du mir deinen Chip zusenden und ich beschreibe den neu.
Danke, das ist sehr nett
Weiß gerade gar nicht, ob die Kiste ohne den Flash überhaupt booten würde (vermutlich wartet sie nur sehr lange auf das IPMI?), aber es gibt dann keinerlei Lüftersteuerung mehr und dann ist mir die Kiste definitiv zu laut. Neuerdings steht sie nämlich mit in meinem Büro... Wobei: Im Wohnzimmer wäre es nicht weniger nervig gewesen
Ich werde also mal schauen, dass ich den Chip selbst bespielt bekomme. Dann kann ich die Kiste zeitnah danach wieder in Betrieb nehmen. Hab schon ein Angebot für einen CH341a aus dem Freundeskreis, aber derjenige hat erst im September Zeit für mich, ein anderer Freund würde mir helfen das mit einem Raspberry Pi zu lösen. Muss mal schauen, 'nen Pi hätte ich auch noch selbst da, aber nicht genügend Clips um die Beinchen des Flashs zu verbinden und Anlöten wollte ich die zum Flashen jetzt nicht...