Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
Also wenn man genau hinschaut, dann habe ich den Anschluss genommen, der die vorderen x8 bedient. Da sieh man leicht die Leiterbahnen hingehen.
Ich versuche jetzt mal bei meinem System die M2 SSD weg zu lassen und über einen M2-> 4i -> x4 Adapter von c-Payne, dass die GraKa erkannt wird. (Brauche keine x8 an der Tesla. x4 würde reichen).
Hab grad mal eine U2 SSD geholt und einen Adapter vom 8i-> 2x U2. Da erhoffe ich, dass die SSD an einen der beiden U2 erkannt wird. Damit kann ich auch leben, wenn dann die M2 SSD raus fliegt.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Bei mir läuft ab heute folgende Konfiguration:
RAM: 4x 32GB PC4-2666V ECC R-DIMM HMA84GR7JJR4N-VK SK Hynix mit 2166MT/s
SlimSAS 4i: 4x SATA mit einem Adapter auf SFF8087 Amazon
M2: M2 zu SlimSAS4i Adapter Amazon und den PCIe x4 Adapter von c-payne c-payne
SlimSAS8i: An Anschluss 1 eine U2 SSD mit Adapterkabel Amazon
Damit wäre ich jetzt eigentlich zufrieden. Ich versuche aber noch an eine 2te U2 SSd zu kommen, um 2 SSDs gleichzeitig am 8i zu versuchen. Beim ersten Test hat es nur an Anschluss 1 geklappt.
So, ich habe mein Mainboard mit den LAN Verbindungsproblem nun vom Händler ausgetauscht bekommen, das neue Mainboard hat dieses Problem nicht und schaur erstmal für aus. Nun mal unRAID einrichten....
Jetzt teste ich wieder das motherboard, das zufällige neustartprobleme hat, wenn ich iperf3 darauf verwende. Ich flashe es erneut mit dem offiziellen F09 BIOS und lasse Proxmox mit iperf3 ein paar tage lang ohne probleme laufen.
Dann installiere ich TrueNas Scale und sehe während der installation viele AER Fehler. Ich starte die installation neu und bearbeite vor der installation GRUB und füge pcie_aspm=off hinzu, dann hat die Installation keine fehler mehr ausgegeben.
Vor dem TrueNas boot bearbeite ich wieder GRUB und füge pcie_aspm=off hinzu und rufe nach dem booten den befehl auf:
Jetzt läuft iperf3 20 stunden lang und das board wurde nicht neu gestartet... Vorher mache ich dieselben schritte, außer dass ich GRUB vor der installation bearbeite... Ich bin nicht sicher, ob das wirklich hilft.
Ich habe mir nach durchlesen dieses Forums und langen überlegen auch dieses Board zugelegt und direkt 4x RDIMM RAM dazu bestellt (Kingston KSM26RS4/16MEI). Nun wollte ich das Board damit starten und werde via VGA mit folgender Meldung begrüßt bevor das Board neustartet:
Code:
Reading BMC FRU... (62)
Nun habe ich das BMC geupdatet, jedoch ohne Änderung. Dann wollte ich das BIOS auf das vom EC0 updaten aber im IPMI steht immer noch F9 als Version drin, obwohl mir versichert wurde dass das update erfolgreich war.. Irgendwie mag der das nicht. Ich hab auch die gemoddete Variante hier aus dem Forum probiert aber da das selbe Ergebnis. Natürlich auch mal anderen RAM probiert oder nur ein Riegel aber keine Veränderung. Hat da noch wer eine Idee?
Das habe ich jetzt gerade genau so getan^^ BIOS wird anscheinend nicht resettet und hab immer noch denselben Fehler. Hatte Strom getrennt und nach paar Minuten auf dem Reset Jumper auch die Batterie getrennt und neu verbunden. Aber das Web BIOS zeigt immer noch dieselben Settings an und dort kann ich auch keine Ändern bzw. nach dem speichern und neuladen hat er nicht das übernommen was eigentlich gespeichert werden sollte. In das richtige BIOS komm ich leider gar nicht erst rein weil dieses ganze BMC Zeugs wohl noch davor liegt
Also erst ein erfolgreicher POST aktualisiert die Werte im BMC. Das die nicht aktuell sind ist also normal.
Warum er den POST nicht schafft ... Gute Frage...
Board wurde ohne anstand ausgetauscht und läuft jetzt auch ohne Probleme mit 4x Kingston KSM26RS4/16 RDIMM Riegeln. Ist schon merkbar schneller als der Ryzen 3 3200G der vorher als mein Homeserver gedient hatte und IPMI bzw die KVM ist super praktisch
Also mein unRAID hat heute bissel rumgezickt und da habe ich ihn mal neu gestartet. Ich hatte wohl das Syslog schreiben auf den Stick deaktiviert und da unRAID im RAM läuft wurde das ja durch den neustart gekillt und daher habe ich leider mein Log komplett verloren und kann dort nicht nach Fehlern gucken.
Ich habe aber im IPMI diese INFOs zum RAM gefunden wozu ich nun zwei fragen hab.
1. Sind wirklich 512GB RAM supported?
und
2. hab ich da ein Problem gefunden mit dem korrigierten ECC RAM Fehler:
Zu 1: Laut EC0 Handbuch nur bis 128GB. Kann mir aber vorstellen dass das nur die Unterstützte Kapazität ist. Also was garantiert laufen sollte
Zu 2:
Genau das Problem hab ich tatsächlich auch memtest86 (nicht die 86+ Version, aber trotzdem free) hat mir auch Correctable ECC Errors angezeigt. In den Event Logs vom BMC werden die auch gelistet. Bei mir ist es ein sehr kleiner Speicherbereich, weshalb ich das erstmal ignorieren werde. Die Fehler sind ja noch korrigierbar und im Notfall deaktiviere ich den Speicherbereich erstmal vorübergehend, aber weist trotzdem im Normalfall auf defekten RAM hin
Zu 1. könnte gern mal jemand ausprobieren... interessiert mich auch brennend seit dem ich das das erste mal gesehen hab
ECC Fehler sind toll... aber das RAM Thema hatten wir ja hier auch schon mehrfach durch. SK Hynix isn graus auf dem Board.. Was auf den Kingston drauf ist keine Ahnung und Micron weiß ich auch nicht so recht ob der die mag. Mischbestückung würd ich generell vermeiden.
Samsung läuft scheinbar problemlos.
Das ganze wohl gemerkt bei 4 DIMMs. Bei 2 DIMMs hat man generell weniger Sorgen, typisch Zen IMC
Hast du zu den Samsungs einen Link? Würde gerne wieder auf 128GB gehen oder eben auch dann das doppelte
So welche? Das mit dem Quad Rank macht mir bissel Sorgen...
Scheint der gleiche Speicher zu sein nur als HP gelabelt.
**EDIT**
OK die Samsungs sind nun verbaut, 4 gleiche Module. Bisher keine Fehler. Die Kingston entsorge ich dann die zwei Micron 32GB 36ASF4G72PZ-2G1A Module werde ich dann verkaufen. Bei interesse bitte PM an mich.
Ich verstehe diese boards nicht...
Ich führe den test etwa 10-12 Stunden lang aus, bis er abgeschlossen ist... Und es sind keine fehler und keine ECC fehler aufgetreten... Dann lasse ich Proxmox und iperf3 etwa 12 Stunden lang ohne probleme laufen...
Dann flashe ich das erste board erneut mit dem standard BIOS (F9). Mit modded hat es nicht funktioniert und es sind ECC fehler aufgetreten. Und lasse es weitere 12 Stunden laufen, bis der test ohne fehler und keine ECC fehler abgeschlossen ist. Ich verwende noch 4 weitere speichersticks, damit das zweite board unberührt bleibt. Ich habe nicht versucht, ob es beim iperf3 test immer noch neu startet... Dann schalte ich das zweite board ein und starte erneut den memtest und erhalte in 4 Minuten mehr als 30 ECC fehler... Dann starte ich es neu und überprüfe, ob die RAM einstellungen korrekt sind, und das sind sie. Dann führe ich den Memtest erneut aus und es läuft drei stunden lang normal???
Ich hab ein haessliches 8core Atom Board von Supermicro (A1-SLM oder so),was sich aehnlich verhaelt.
Ist in dem Fall wohl ein CPU Fehler plus was thermisches - das einzige was ich _jemals_ eingrenzen konnte, war, dass passiert, wenn er von kalt auf warm geht (z.b. war ein automatischer Start via Synology DSM um 09:00 eingestellt, der etwa zwei mal pro Monat mit viel gepiepse endete. Memtest und Speicherriegel durchtauschen half so gut wie nicht, wobei das Problem mit 4 Sticks groesser war als mit 2 oder 1. Ich will sagen, gut dass Du die RAM Riegel getrennt haeltst bei den Tests, aber am besten Du siehst auch die Boards als getreennte Probleme solange Du nicht 100 davon hast. Und wenn Du es rein ueber Methodik hinbekommen kannst, dann mach die Tests bei stabiler Temperatur.
(Meine Hochachtung fuer's nicht anzuenden, hab mich bei meinen bisher auch benommen)
Beitrag automatisch zusammengeführt:
Hi,
ich wollte fragen, ob einer von Euch einen kompletten G431 Server benutzt, ggf. die Luefter getauscht hat und dergleichen.
Fuer eine Bastelei werde ich einen davon nehmen. A) als Testsystem, wenn ich mal viele SAN HBAs Firmware Updaten muss, B) um die ganzen Innereien mit ein paar Add-Ons in einen alten NetAPP zu bauen. In jedem Fall brauche ich die PCIe Backplane mit dem Switch drauf, und daran haengt die Stromplatine, und daran haengen dann auch irgendwie die Netzteile. Einzeln sind die Sachen so viel teurer, dass ich einen ganzen Server nehmen muss.
Ich weiss nur nicht, ob ich das System so brauchen koennen werde...
Mit 3x1600W Netzteilen und einiger Laufzeit ist er wohl nicht super leise - ausser die kommen direkt aus dem Unverkauft-Lager - weiss ich nicht?
Gleichzeitig hat es ja 4HE, d.h. man kann an sich leise/grosse/starke Luefter rein tun. Entsprechend waere auch die Belueftung der Netzteile schon etwas, das man verbessern kann, wenn man eh nie in in diese hohen Wattzahlen kommt. (bleibe unter 700W unter bei absoluter Volllast)
Macht es Sinn, das Case zu behalten und benutzbar zu machen?
Oder ist's von der Qualitaet her so, dass Ihr alle nur "ja ihgitt" gesagt habt und es zum Schrott getan habt?
Mal VDDP bissl hoch gesetzt?
Ansonsten könnt man natürlich wieder an den Widerständen und Timings drehen...
ECC Fehler kommen irgendwie immer aufm A0 im BMC, scheint der nicht trennen zu können.
Mal VDDP bissl hoch gesetzt?
Ansonsten könnt man natürlich wieder an den Widerständen und Timings drehen...
ECC Fehler kommen irgendwie immer aufm A0 im BMC, scheint der nicht trennen zu können.
Durchprobieren.. 25/50mV Schritte.
Standard sind 950mV, damit laufen die Samsungs auch bei mir. Ansonsten hab ich für die nix angefasst.
Die Hynix liefen mit 1050mV besser.