EPYC 7742, ASUS KRPA-U16, startet dauernd neu bei Auslastung

michaelz

Neuling
Thread Starter
Mitglied seit
28.03.2021
Beiträge
28
Hey Leute, ich bin der Neue.

Hab mir ein Rig zum Monero-Mining gemacht.

Also ich habe einen EPYC7742 auf einem ASUS KRPA-U16 Mainboard, 4x 16GB Hynix HMA82GR7CJR8N DDR4-3200 Registered.
Als Kühler habe ich einen großen Noctua NH-U12S, Wärmeleitpaste auch die von Noctua die dabei war.

Netzteil ist ein Xilence XP630R8 80+ Bronze mit 630W.
Über dem Board sind vier 120mm Zusatzlüfter die direkt draufpusten.

Das "Gehäuse" ist ein Open Air Rig, Also Grundplatte und ein paar Streben um alles draufzumontieren.

Laut lm-sensors alle Temperaturen auf dem Board 30-32 Grad und CPU 39 Grad bei Auslastung mit 64 Threads.

Die Onboardgrafik liefert kein Signal, jedenfalls an meinem alten Monitor. (EDIT: Upps...der Jumper steht auf disabled...sorry)
Ich hab eine einfache Palit Geforce 710 dran die direkt im Slot steckt, weil ich das Gerät lieber am grossen Fernseher habe, ist besser für alte Augen. Mit HDMI.

Die Festplatte ist eine M.2 WD Green 120GB.

Ein Fehler ist beim bestücken mit 8 DIMMs aufgefallen, die Steckplätze E1 und E2, laut BIOS ist das Channel 3, da erscheint beim booten gleich ein Training-Fehler. Das DIMM darin wird dann offenbar auch deaktiviert. In Ubuntu fehlen dann auch 16GB. Es bleibt bei diesem Channel wenn ich die DIMMs durchwechsele.

Läuft mit Ubuntu 18.04LTS

Also jedenfalls ist da folgendes Problem,
Wenn ich XMRig oder XMR-Stak auf 16 oder 32 Threads laufen lasse dann ist an sich alles okay. Lasse ich 64 Threads laufen dann ist nach 10-15 Minuten Schluss und der Karren startet einfach neu. Bei 128 Threads passiert das schon nach 10-30 Sekunden.

Der Cache der CPU sollte ja eigentlich reichen für 128 Threads, er hat ja zumindest 128 Threads.

Was ich in Linux noch aktiviere ist huge pages=1168 weil das auch Leistungszuwachs bringt. Aber das hat keinerlei Auswirkung auf das Problem, macht keinen Unterschied ob ichs aktiviere oder nicht.

Anfänglich vermutete ich ein Temperaturproblem, der CPU-Kühler wird zwar nicht mal handwarm, aber die DIMMs werden auf der vom Lüfter abgewandten Seite merklich warm. Daher hab ich nun noch die vier Zusatzlüfter drüber gemacht um das ganze Board zu kühlen.

Da es zeitweilig das Problem gab das die Festplatte nach den spontanen Neustarts nicht erkannt wurde habe ich nun eine normale SATA 1TB von Seagate dran, aber das hats nicht gebracht.

Die DIMMs habe ich durchgewechselt, bringt nix. Da scheint der Fehler nicht zu liegen. Es sei denn die sind generell ungeeignet, aber laut Liste von ASUS sollen die geeignet sein.

Momentan lass ich Memtest 86+ durchlaufen, 30 Prozent durch, noch keine Fehler.

Was ich noch ausprobieren werde ist das Netzteil von meinem anderen Rig, ein BeQuiet Dark Power pro mit 1100W. Aber das Xilence lief vorher auch einwandfrei in dem Rig, wüsste nicht wieso das jetzt nicht ausreichen sollte. Zumal das EPYC-System nicht mehr als 155 Watt verbraucht bei voller Auslastung mit 128 Threads.

Bin a weng ratlos wa. Wenn jemand eine Eingebung hat wär das echt super.
Beitrag automatisch zusammengeführt:

Was mir noch einfällt.

Ich kenne solche Probleme wenn die CPU-Spannung nicht erhöht wird. Mit einem Ryzen 7 3700 System hatte ich das auch. Für Normalbetrieb oder Gaming ist alles gut, aber für Dauer Volllast brauchte es einen Hauch mehr Spannung.

Bei dem KRPA-U16 sehe ich im Bios auch das die Spannung angezeigt wird, aber ich kann die Einstellung nicht verändern. Ich hab da die Performance Einstellungen mit Auto-Übertakten, Boost, usw. Läuft aber alles nicht sauber. Auch das kenn ich von den normalen Desktop Ryzen, kaum ein Board kann das wirklich automatisch.

Gibts einen Trick um die Spannung im BIOS zu erhöhen?
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ok also das mit dem Speicherkanal ist erledigt.

Da war tatsächlich ein dickes Staubkorn an einem Kontakt der CPU. War vorher nicht da. Hat vielleicht im Sockel erst an einem der Kontakte gehangen. Hatte es vorher alles mit Leuchtlupe usw. kontrolliert aber nicht gesehen.

Dennoch besteht das Problem weiterhin.

Nebenbei ist der Stromverbrauch drastisch gestiegen mit nun 8 DIMMs. Leider zu sehr, lohnt sich nicht. Da sind 4 DIMMs dann doch besser, auch wenn Leistung verlorengeht, ist trotzdem weitaus profitabler.

Stromsparen for President.
 
die 39grad cpu temp sind unrealistisch unter last...
was sagen die logfiles?
mal nem stresstest probiert? stress oder stress-ng
 
die 39grad cpu temp sind unrealistisch unter last...
was sagen die logfiles?
mal nem stresstest probiert? stress oder stress-ng

39 Grad bei 16 von 128 Threads und mit vier DIMMs, 145 Watt aus der Steckdose. Find ich nicht so ungewöhnlich, mein R7-3700 hat mit Dauer-Vollast mit 16 Threads mit XMrig auch nur etwas über 55 Grad. Mit 360er Wasserkühlung.

Hilf mir auf die Sprünge, welche logfiles genau meinst du?
Stresstest noch nicht probiert, nur memtest. Mach ich morgen oder übermorgen mal noch wenn ich Zeit hab.

Ich hab langsam das Netzteil in Verdacht. Das ist zwar problemlos im anderen Rig gelaufen, aber halt mit ner kleineren CPU. Der 8 Pin EATX-Stecker ist nur vom 24 Pin abgegriffen. Vielleicht kommt da nicht genug Leistung, oder unsauber. Modular ist das nicht. Daher will ich auch mal das grosse NT aus meinem anderen Rig mal probieren.
 
/var/log/
anderes nt ausprobieren wäre auch was, ja
 
Stress und Stress-ng konnte ich nicht installieren. Dabei hat er schon einen Neustart hingelegt.
Sehr merkwürdig, kann ja nicht am Netzteil liegen. Das ist ja keine Last. Eigentlich.

Ich installiere grad mal testweise Ubuntu 20LTS, möglicherweise liegt da auch was im argen bei Serverhardware und Linux-Version.

Wenns damit die selben Erscheinungen gibt wechsel ich das Netzteil noch. Muss ich dann morgen mal machen, heute wird das nix mehr.
 
dann geh die logfiles durch, allenfalls findest du dort einen anhaltspunkt
 
Ja also das hat mal so garnicht geklappt. Durch diverse Reboots war Ubuntu völlig zerschossen, nix ging mehr.
Netzteil hab ich auch getauscht, bringt rein garnix. Windows 10 hab ich auch ausprobiert... Das hat ja wirklich total versagt, damit ging echt garnix. Nichtmal die Installation ist in eins durchgelaufen. Mehrere Versuche, kannst knicken.

Ich habe es daher jetzt mal mit HiveOS ausprobiert vom USB-Stick und mit Steuerung über die Weboberfläche. Das ist ein Mining-Betriebssystem das man von USB-Stick laufen lässt.

Siehe da, es läuft ein besser. Mit 128 Threads lief es einige Minuten. Dann kam ein Reboot. Aber es war immerhin das erste mal das es mit voller Leistung läuft, sonst hats sich spätestens bei 64 Threads sofort rebootet. Bei 32 lief es auch kaum 20 Sekunden.

Ich vermute das war dann aber tatsächlich ein Temperaturproblem, der CPU-Kühler wurde schon gut und schnell warm und die DIMMs auch. Ich hab in HiveOS auf der Webseite aber auf die Schnelle nicht gefunden wo ich die Temperaturen und alles sehen kann. Hab das zuletzt vor ein paar Jahren benutzt, muss mich erst wieder reinfinden. Ich such auch eine Option die Anzahl der Threads zu reduzieren. Das würde mir ja auch ein wenig mehr Zeit verschaffen um mir die Werte im Betrieb anzuschauen. Mit weniger Threads lief es bei Ubuntu ja auch länger.

Wenn ich das Rig eine Viertelstunde auskühlen lasse dann läuft es mit HiveOS wieder einigermassen.

Daraus schliesse ich das es zum einen ein Problem mit Linux und Windows gibt bei meinem Rig oder bzw. der Konfiguration.
Und zum anderen während der Vollast dann ein kleines Temperaturproblem.

Also ich bin auf jeden Fall dran. Hab aber auch noch einiges zu tun bei dem schönen Wetter.

Hast du einen Tipp welcher Serverspeicher tauglich ist? Ich hab jetzt Hynix, die stehen auch in der AVL bei Asus für das Board. Die hab ich genommen weil die auch bei meinem anderen Rig am besten laufen, G-Skill Ripjaws RED 3600. Mit verschiedenen anderen mit Micron hatte ich viele Probleme eigentlich, die liefen nie sauber mit XMP und waren insgesamt sehr unwillig selbst bei sehr sanften Geschwindigkeiten.
Beitrag automatisch zusammengeführt:

dann geh die logfiles durch, allenfalls findest du dort einen anhaltspunkt
Nix zu finden. Platte ist zerschossen und ich bekomm keinen Zugriff drauf. Warscheinlich zuviele Reboots.
Der reboot geht warscheinlich zu schnell als das Linux da noch was ins Logfile schreiben kann. Der Kasten geht ja einfach so aus. Ohne Vorwarnungen.
 
Aktuelle Bios hast du drauf? Alternativ das mit dem Anpressdruck (CPU <> Socket) nochmal testen, grade SP3 ist da arg anfaellig für...Evtl hat auch das Board einen weg (da du NT und Speicher schon getauscht hast) Thermisches Problem schließe ich eher aus, die Kiste wuerde throttlen und dann irgendwann ausgehen...
 
Bios und Firmware mache ich noch, aber erst als letzten Versuch. Ich hab das zwar oft genug gemacht, aber wie das so ist bei meinem Glück...

Ram durchgetauscht in dem Sinne das ich die DIMMs in den Steckplätzen durchgewechselt habe. Aber ich habe keinen anderen Speicher zum ausprobieren.

Interessant ist ja das es gestern mit HiveOS vom USB-Stick mit 128 Threads ja mal lief für etwa ne Viertelstunde. Dann kam auch da ein reboot. Der Kühler und auch der Speicher wurde auch echt richtig warm. Vielleicht lag es daran. Einige andere meinten das sie da auch nur mit einer 720er Wasserkühlung klarkommen, also zweimal 360er in Reihe. Damit man genug Lüfter dran hat.

Wenngleich die Hashrate ernüchternd war, das hab ich vorher mit Ubuntu schob bei 32 Threads erreicht. Nur das es da mit 32 Threads nur kurz lief.
Allerdings hab ich im HiveOS nur eine ältere Version von XMrig aktiviert, gibt noch viele andere die ich probieren wollte.

Das scheiterte daran das HiveOS nicht mehr richtig starten wollte. Ständig reboots an ganz verschiedenen Punkten des Bootvorganges.
Kann jetzt natürlich sein das es auf dem Stick dann zerschossen wurde durch den Reboot.

Sorry wenn ich euch damit nerve, ich weiss das ihr mit diesen Sachen selten was zu tun habt. Aber irgendwo muss ich ja ansetzen bei der Fehlersuche. Hab mit Serverhardware null Erfahrung und auch das Bios ist echt mal....es erinnert mich an 1980. Sehr schwer verständlich alles.
 
Wie die CPU da drinsitzt hab ich mehrmals geprüft, ich hab da keinerlei Einflussmöglichkeit. Der wird einfach in die Halterung gelegt, Rahmen runter, fertig. Die Schrauben haben einen Ansatz, man kanns lediglich bis auf Anschlag drehen und das wars. Da sind auch keine Federn oder so.

BIOS hab ich nachgeschaut, ist schon das aktuelle. Firmware gibts nur für Windows. Treiberpaket kann ich nicht installieren weil er vorher schon rebootet.

HiveOS bekomme ich auch nicht mehr zum laufen, hab es nochmal neu auf USB-Stick gemacht, bringt nix. Ständig reboot an beliebiger Stelle beim Bootvorgang. Irgendwas ist da faul.

Leider hab ich auch kein anders Board, Speicher oder CPU um mal auszuprobieren was davon nun einen Schlag weg hat. Es sind halt alles auch gebrauchte Teile und ich hab das nur genommen weil ich die CPU günstig bekommen habe. Neupreis würd ich sicher nicht ausgeben.
 
Ja da war ich jetzt schneller.
Ich hab den Micron gestern Abend bestellt, https://www.office-partner.de/micron-mta9asf2g72pz-3g2b1-12635556?campaign=webgains/produkte/"Markenshops/MicronCrucial/MemoryEnterprise"&wgu=7121_196673_16171284667195_5bd06b7300&wgexpiry=1624904466&source=webgains&utm_campaign=webgains&utm_source=196673&utm_medium=263213

Aber kann den auch umtauschen falls der nicht läuft oder sonstwie was ist.

Schmeiss mal allen Speicher bis auf 1 Modul raus pack das in C2, setz Bios auf defaults (Restore Defaults) letzter Tab, start neu, boot https://www.memtest86.com/download.htm (free reicht) und schau ob das durchläuft.
Geht nicht mehr. Soweit läuft es gar nicht das ich das machen könnte. Bios Defaults habe ich schon gesetzt.
Warum nur 1 Modul und warum in C2?

Als es zumindest noch soweit gestartet ist hab ich mehrmals memtest aus den Bootoptionen von Ubuntu laufen lassen. Immer ohne Fehler.
 
Zuletzt bearbeitet:
C2 siehe Handbuch > single DIMM Config

Linux Memtest86 ist zu alt fuer Ryzen und Co um verlässlich Speicherfehler zu melden.

Scheint als waere mit der HW generell was defekt. Tippe aufs Brett oder Speicherinkompatibilitaet.
 
C2 siehe Handbuch > single DIMM Config

Linux Memtest86 ist zu alt fuer Ryzen und Co um verlässlich Speicherfehler zu melden.

Scheint als waere mit der HW generell was defekt. Tippe aufs Brett oder Speicherinkompatibilitaet.
Achso deswegen C2, ich dacht das hat ne andere Bewandnis. Lief mit einem DIMM aber auch nicht.
Ja das Memtest ist uralt. Zumindest hats bei meinem anderen Rig zuverlässig Fehler angezeigt bei RAM. Aber solang es kein Stück läuft kann ich da sowieso nix probieren. Das ist ja grad das Elend.

Speicher kann gut sein, hat bei meinem anderen Rig auch derbe Probleme gemacht bis ich dann welchen hatte der gut läuft. G.Skill Ripjaws V rot, 3600er mit Hynix.
Kann ich auf dem Serverboard auch unregistered non ECC benutzen oder ist das zwingend Voraussetzung? Sonst würd ich die Ripjaws mal probieren, will nur keinen Schaden anrichten.
 
Achso deswegen C2, ich dacht das hat ne andere Bewandnis. Lief mit einem DIMM aber auch nicht.
Ja das Memtest ist uralt. Zumindest hats bei meinem anderen Rig zuverlässig Fehler angezeigt bei RAM. Aber solang es kein Stück läuft kann ich da sowieso nix probieren. Das ist ja grad das Elend.

Speicher kann gut sein, hat bei meinem anderen Rig auch derbe Probleme gemacht bis ich dann welchen hatte der gut läuft. G.Skill Ripjaws V rot, 3600er mit Hynix.
Kann ich auf dem Serverboard auch unregistered non ECC benutzen oder ist das zwingend Voraussetzung? Sonst würd ich die Ripjaws mal probieren, will nur keinen Schaden anrichten.
Nope.
 
Ja an sich sehr schade ne.

So ich hab es nochmal mit HiveOS laufen lassen. Ich hatte dummerweise ja nochmal die BIOS defaults geladen und dann vergessen den Core Performance Boost wieder auszuschalten, der ist mit den Defaults aktiviert. Und mit dem Boost lief es sowieso nicht richtig.

Jedenfalls lief es damit dann mit XMrig auf 128 Threads wieder so 20 Minuten bis zum reboot. Die CPU-Temperatur lag im Bereich 49 Grad Celsius laut HiveOS. Ich hab dann auch von HiveOS das Memtest laufen lassen, auch auf 182 Threads, das Memtest ist eine etwas neuere Version 8.4, keine Fehler. Die Version von Ubuntu ist älter, das ist Version 5.nochwas.

Dann ist der Speicher von Micron angekommen, Vier Stück. HiveOS mit XMRig lief damit auch wieder so 20 Minuten bis zum reboot. Memtest auch keine Fehler.

Aber in den Infos von Memtest wird angezeigt "ECC activated: No"
Keine Ahnung was das nun heissen soll. Irgendwo aktivieren kann ich das beim Board glaub ich nicht, habe da jedenfalls nichts in der Richtung gesehen.

Und dann hab ich ne Frage, im Bios steht etwas von "DRAM Scrubber". Ich hab das mal gegoogelt, aber eine verständliche Erklärung hab ich da nicht gefunden.
Ausser einem Testsheet https://www.spec.org/cpu2017/results/res2020q1/cpu2017-20200106-20512.html
Da steht weiter unten bei Platform Notes was von DRAM Scrub time: Disabled.

Leert das vielleicht den Speicher wenn er vollläuft? Könnte das dafür verantwortlich sein das der Miner nicht über längere Zeit läuft?
XMRig läuft ja auf CPU und da ist exzessive Speichernutzung ja quasi Voraussetzung?
 
Nö, DRAM Scrub Time bzw. Scrubbing ist quasi ECC.
Ist der Speicher fehlerhaft oder werden Bits falsch ausgelesen dann führt das zum Absturz.
Abgesehen davon hast du mit vier DIMMs die minimal Konfiguration. Für Speicherintensive Anwendungen wird 1 DIMM pro Channel empfohlen.
Siehe Link über dir.
Und RandomX ist Speicherintensiv/Memory Bandwith gebunden.
 
Hmm, laut Memtest ist alles gut, was anderes kann ich ja auch nicht testen was den Speicher angeht.

Mit 8 DIMMs ist es genau dasselber wie mit 4. HiveOS mit XMRig läuft 10 bis 20 Minuten und dann rebootet es ohne Vorwarnung. Mit Ubuntu, egal ob von CD, USB-Stick oder ein installiertes, läuft kaum 5 Minuten bis es einfach rebootet, auch wenn ich da nichts mache. Windows 10 ging quasi garnicht.
 
und wieder: logfiles ausgewertet?
Log ist aktiviert.

Aber wie gehabt, es existieren keine logs. Weder von XMRig noch vom System.
Es ist ja kein Shutdown der vorbereitet wird. Sondern ein harter Reset. Und /var/log/ ist auch leer. Dort werden die logs vom System und vom Miner gespeichert. Also wurden die logs vielleicht nicht mehr gespeichert vor dem reboot.
 
es müssen zwingend logfiles vorhanden sein, da diese selbst beim booten geschrieben werden.
 
  • Danke
Reaktionen: aXu
na dann wäre eine fehlersuche nützlich, weshalb keine logfiles geschrieben werden.
dienst nicht vorhanden, kein speicherplatz, falsche berechtigungen etc.
wenn dann logfiles geschrieben werden kann die richtige fehlersuche gestartet werden.
 
Ich hab Ubuntu nochmal installiert und mit XMRig getestet. Es lief damit immer einige Minuten. Immer automatisch mit 128 Threads. (Es gab mal einen Bug wenn man die Zahl der Threads manuell eingibt).
Wenn ich XMRig mit sudo starte werden automatisch largepages und der MSR-Mod aktiviert, damit ist die Leistung dreimal so hoch.
Ohne sudo ist die Leistung entsprechend niedriger.

Das scheint aber keinen Unterschied zu machen ob es länger oder nur kurz läuft.

Das sind die logfiles von Ubuntu im Anhang.

Die Reboots waren um 8:45, um 8:55 und etwa 9:23 Uhr.
 

Anhänge

  • logdateien.zip
    490,8 KB · Aufrufe: 138
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632193] BERT: Error records from previous boot:
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632194] [Hardware Error]: event severity: fatal
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632195] [Hardware Error]: Error 0, type: fatal
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632196] [Hardware Error]: fru_text: ProcessorError
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632197] [Hardware Error]: section_type: IA32/X64 processor error
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632198] [Hardware Error]: Local APIC_ID: 0xc
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632198] [Hardware Error]: CPUID Info:
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632200] [Hardware Error]: 00000000: 00830f10 00000000 0c800800 00000000
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632201] [Hardware Error]: 00000010: 76d8320b 00000000 178bfbff 00000000
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632202] [Hardware Error]: 00000020: 00000000 00000000 00000000 00000000
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632203] [Hardware Error]: Error Information Structure 0:
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632204] [Hardware Error]: Error Structure Type: cache error
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632205] [Hardware Error]: Check Information: 0x0000000026c2009f
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632206] [Hardware Error]: Transaction Type: 2, Generic
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632207] [Hardware Error]: Operation: 0, generic error
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632207] [Hardware Error]: Level: 3
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632208] [Hardware Error]: Processor Context Corrupt: true
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632208] [Hardware Error]: Uncorrected: true
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632209] [Hardware Error]: Overflow: true
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632209] [Hardware Error]: Context Information Structure 0:
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632210] [Hardware Error]: Register Context Type: MSR Registers (Machine Check and other MSRs)
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632210] [Hardware Error]: Register Array Size: 0x0050
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632211] [Hardware Error]: MSR Address: 0xc00020d1
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632211] [Hardware Error]: Register Array:
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632212] [Hardware Error]: 00000000: fea020000004010b 0400000ec9f25090
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632213] [Hardware Error]: 00000010: d01c0ff500000000 000000050000007f
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632214] [Hardware Error]: 00000020: 000700b023750200 0000f61c1d47000e
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632215] [Hardware Error]: 00000030: 0000000000000000 0000000000000000
Apr 3 09:22:53 haha-KRPA-U16-Series kernel: [ 3.632216] [Hardware Error]: 00000040: 0010000000000000 0000000000000000
such mal nach epyc fatal cache error

könnte falsche settings im bios sein (update gemacht?) oder evt die cpu defekt. wrde wohl auch erklären weshalb du die so günstig bekommen hast...
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh