Ein(e) Ryzen 7 Pro 4750G/5750G Desktop/Workstation entsteht

Trambahner

Urgestein
Thread Starter
Mitglied seit
14.08.2014
Beiträge
3.179
Ort
Serverraum
Nachdem ich mich lange gequält (will ich (oder nicht), brauch ich (oder nicht)... , das übliche Basteltriebdenken) hab ich mich durchgerungen.
Letzter Trigger war das Angebot einer Firma, die den 4750G in einem Bundle mit einem Mainboard anbot, das ich eh ins Auge gefasst hatte.
Kühler und Speicher waren auch dabei.

Ziel
Ich werde am Ende einen anderen Kühler verwenden, weil das ganze in einen kleinen Desktop (etwa im Stil eines HP/Dell/Lenovo SFF-Desktops) soll.
Ersetzen soll das letztlich meinen Laptop (T470p mit i7), darum war mir neben Performance eben auch die Leistungsaufnahme sehr wichtig (daher wurde es kein X570+3700X oder 3900X).
D.h. auch: Fragen bzgl. Games/FPS kann ich nicht beantworten. Ich spiele bisher de facto nix was irgendwie Grafikpower erfordert. :coffee: Mehr als mal Zusi3 wird das Ding aus dem Genre potentiell nicht sehen.

Somit besteht das Initial-Setup aus:
- Ryzen 7 Pro 4750G
- Asus B550M Tuf Gaming Plus WiFi (ordentliche+effiziente/kühle VRM, zwei x4 M.2 Slots, Bifurcation im x16 Slot, kein Luxus-Preis). Das nur 4 Sata-Ports sind, ist unwesentlich für den Einsatz.
- 2*8GB 3200er Speicher (dabei waren 2 8GB Module G.Skill Aegis 3200 CL16 ; k.a.: ist der gut?)
(Anm: Zielzustand ist nach Möglichkeit ECC-Speicher )
- Noctua NH-D9L (oder gar der NH L9x65, da liegt noch einer im Schrank) Noctua NH-D15S (eingebaut vorletzte August-Woche 2021, ersetzt NH-D9L aus dem ursprünglichen Setup)
- NT Bequiet 300W Bronze TFX (im Gehäuse war noch ein anderes TFX dabei, das BQ ist aber leiser und nen tick effizienter).
Ein 400W E9 Straight Power Gold hab ich ursprünglich alternativ getestet, brachte aber annähernd keinen Unterschied (<1W, also quasi Messungenauigkeit) in der Leistungsaufnahme bei meinem Setup, egal ob Idle oder Volllast).
- mittlerweile NT Bequiet 400W Pure Power 11 (80 Gold) (ersetzt NT 300W Bronze TFX)


- SSD 840pro 256GB (hatte ich rumliegen, wird nicht das finale Storage sein langt aber dicke für diverse nicht-storage Themen).

Verbaut wurde das ganze final in ein Chieftec CI-01B-OP Netter Cube für kleines Geld (manche nennen es auch den günsigsten Benchtable).
Für den Luftstrom sind 2 120er PWM-Lüfter verbaut (vorne ansaugen, Pure Wings 2. hinten Luft raus brauner Noctua) Das Setup steht unterm Tisch und ist im Regelbetrieb unhörbar, bei Last hört man leiiiiise und unaufdringlich die Lüfter).

Heute war der Tag, an dem das Paket mit dem Ryzen 7 Pro 4750G kam an, und seit Feierabend wird das ganze mal quick-and-dirty zusammengebaut.
Vor dem Produktiveinsatz möchte ich auch das eine oder andere vorher austesten (ESXI, BSD, AIO ESXI/Xigmanas,...etc.). Über die Ergebnisse werde ich berichten.

Hier der Geekbench4: https://browser.geekbench.com/v4/cpu/15660114 (Speicher auf 3200-XMP, alles andere default). Score: 5643/31605
und hier mit Ram @ 2133.: Score: 5171/29069
Ram "3200" + BCLK@102 : Score: 5694/32322
2666ECC @ 3200CL16-17-17-17-38-64 : Score 5737/34303 (war so nicht stabil unter Last)

Update nach Lüfterupgrade von NH-D9L auf NH-D15S: (und 2*16GB ECC-Speicher 3200@18-18-18-18-38-62):
Geekbench 4: 5680 single, 34030 multi
Cinebench: R15: 200 single, 2085 multi (1997 mit dem NH-D9L) , R20: 512 Single, 4884 multi (etwa 4250 mit dem NH-D9L)


Boostverhalten: knapp 4450 MHz wurden OOB erreicht, die Spec "bis zu 4.4Ghz" wird also leicht überfüllt. Später mal werd ich sehn, ob was mit BCLK noch sinnvoll zu erhöhen geht.

finale Einstellung nach der Testerei: PBO ist nun final auf maximale Performance eingestellt mit +200 Mhz Takt. Boostet dann bei Single- oder Dualcorelast dann in der Tat bis auf 4650 Mhz.

Beim Geekbench gibt es keinen Leistungsunterschied zwischen Ryzen Balanced und High Performance Energieplan.
Die VRMs langweilen sich, die sind hand- bis lauwarm. :coffee:

Idle Leistungsaufnahme: Messung via Homematic IP Schaltdose. CPU-Multiplier auf "Auto"/Default.
Obiges Setup plus SSD 840pro 256GB, Keyboard, Maus und aktivem Wlan.
Windows 10x64, v2004; aktuelle Chipsatztreiber installiert, alles andere auf Default im Bios (ausser Speicher, der ist auf das passende XMP-Profil gesetzt). RGB-Gefunzel ist deaktiviert.
Bios ist auf Version 803 upgedatet. PBO auf Auto.
Werte unter Last kommen noch, wenn das System sorgfältiger montiert mal ist.

1,3W soft off
23,4W Idle desktop W10x64 , BQ 300W TFX Bronze (Ryzen balanced) , TFT on. (MS Basis Grafikkartentreiber)
23,7-24,1W " (Ryzen High performance) , TFT off (MS Basis Grafikkartentreiber)
21,1W " (Ryzen High performance, Ram@2133) , TFT off (MS Basis Grafikkartentreiber)
18,5W " (Ryzen High performance, Ram@2133) , TFT on (AMD Grafiktreiber)
19,8 W " (Ryzen High performance, Ram@3200) , TFT on (AMD Grafiktreiber) => sinnvolles Basisszenario mit der gelieferten Hardware
25,2W " (Ryzen High performance, Ram@3200 plus BCLK@102) , TFT on (AMD Grafiktreiber)
25,7W " Blaues setup mit 19,8W, plus Intel X540-T1 mit 1G-Link.
27,2W " Blaues setup mit 19,8W, plus SB X-FI Titanium.
36,0W Idle W10x64 32GB ECC-Ram@3200, X540-T1 mit 1G-Link, SB X-FI Titanium, 1*970Evo Plus 1TB, 2*MX100 512GB, PBO enabeld 200 Mhz 92C Max, Vcore default, BQ 300W Bronze TFX
30,0W Idle ESXI 6.7.0U3, Blaues setup mit 19,8W, plus Intel X540-T1 mit 1G-Link.
29,7W Idle FreeBSD 12.1 , Blaues setup mit 19,8W, plus Intel X540-T1 mit 1G-Link.
28,8W Idle Solaris 11.4 Konsole , Blaues setup mit 19,8W, plus Intel X540-T1 mit 1G-Link.
137W Prime5 v28.6, Leistungsaufnahme fürs gesamte System, 4.2ghz allcore mit small FFT (@3200er Ram, alles für die CPU auf Stock)
138-142W x265-Benchmark, basierend auf dem o.g. Cyan-setup.

Diese ganzen Messungen waren mit deaktiviertem EnergystarReady und deaktiviertem CeC.

Mit voll aktiviertem APM:
0,1-0,4W soft off
33,5-35W Idle W10x64 32GB ECC-Ram@3200, X540-T1 mit 1G-Link, SB X-FI Titanium, 2*970Evo Plus 1TB, 2*MX100 512GB, PBO enabeld 200 Mhz 95C Max, Vcore default, BQ 300W Bronze TFX
=> dauerhaftes Setup.

Ich denke, das kann sich durchaus sehen lassen angesichts der verbauten durstigeren Kombonenten (X540, X-FI)


Im offenen Gehäuse Idle ist dabei annähernd nichts zu hören.
Ich muss sagen, ich bin zufrieden. 20W Idle für einen aktuellen, leistungsfähigen 8Kerner Desktop out-of-the-box. So muss das. Und ist damit auch tauglich für Rollouts z.B. in Büros (ggf. halt auch als kleinere 4 oder 6 Kerner). 3000er Zen2 sind dafür idle zu stromhungrig, um in Masse z.B. in einer großen Firma aufgestellt zu werden.
D.h. die 4000er APUs sind ein wichtiger Schritt für Biz-Anwendungen und damit auch in die Masse. Wir "Schrauber" und Homelab'ler sind ja nur Nischenkunden.
=> Mit Renoir und angesichts der eigenen Probleme dürfte die Konkurrenz schwerste Kopfschmerzen bekommen. (Und ja, ich wünsche mir durchaus sinnvolle Konkurrenz (in beide Richtungen!) , weil wir haben ja den Zustand quasi ohne einige Zeit gesehen )


Treiber Windows:
An Treibern ist bisher nur der Chipsatztreiber und der AMD Grafiktreiber zu installieren. Der Rest (WiFi, Realtec Lan) wurde selbst gefunden. Sound muss ich noch prüfen (aber da soll potentiell eh ne X-FI rein).

Apropos Bios: Der CPU-Takt Multiplier ist in der Tat locked: es gibt nur die Einstellung "Auto" kann im Bios per manueller Eingabe gesetzt werden. Ebenso bei den CCX1+2 Gruppen. Speicher ist einstellbar, Baseclock auch. OCen kann ich mit meinem aktuellen Test-Setup nicht viel.
Beim Initial-Bios (Version 245) hab ich das nicht geprüft. Dort wird die CPU als Ryzen 7 4700G erkannt, ist aber problemfrei gestartet damit. Mit dem aktuellen Bios wird "Ryzen 7 Pro 4750G" sauber erkannt.
=> locked stellt für mich kein Problem dar, da die Leistung eh schon sehr hoch ist und die Luft nach oben eh relativ dünn ist; wg. +5% mach ich da kein Fass auf (evtl. geht da ja was brauchbar via Baseclock).

SVM-Mode ist standardmässig deaktiviert => also enablen nicht vergessen.
SR-IOV ist im Bios aktivierbar.

Im Bios 1202 kein PBO-Boost > max. 4450 Mhz.
Bios 1004 max. 4650 Mhz, => PBO-Overdrive +200 Mhz geht.

Server-Hw/LAN:
- Intel X540-T1 ; getestet im oberen 16x Slot und im unteren PCI3.0x4-Slot. Läuft mit Win10.
- Intel X540-T2 ; getestet im oberen 16x Slot und im unteren PCI3.0x4-Slot. Läuft mit Win10.
Der Onboard-Netzwerkchip ist meiner Meinung nach sehr suboptimal. Über den RTL8125-Chip gehen bei mir in der Regel etwa 100-102 MB/s mit andauernden Spikes runter auf 92-95 MB/s, über die X540 auf einem 1G-Link 112 MB/s. Jeweils auf Defaulteinstellungen. => Um einen 1G-link voll zu nutzen, empfiehlt sich IMO daher das Nachstecken einer NIC.

- IBM M1015/LSI-9211-8i (flashed auf IT-Firmware) : getestet im oberen 16x Slot und im unteren PCI3.0x4-Slot. Läuft mit Win10. (allerdings Test mit nur 1Laufwerk dran)
- Broadcom 9400-16i (flashed auf IT-Firmware) : getestet im oberen 16x Slot und im unteren PCI3.0x4-Slot. Läuft mit Win10. (allerdings Test mit nur 1Laufwerk dran)

"PCIE Raid Modus" durfte jeweils aktiv oder inaktiv sein; das machte keinen Unterschied

- Supermicro SLG3-2M2 funktionert nur der obere der beiden SSD-Plätze, untere wird nicht erkannt. Wenn beide SSD-Plätze besetzt sind, wird keine der beiden erkannt.

ECC-Ram:
- Windows10 und FreeBSD zeigen, direkt am Blech: "Multibit ECC" mit Total Width 72bit und Data Width 64 bit.
- Memtest86 V8.4 zeigt "ECC enabled: yes"
- Finale, produktiv genutzte Memory-Timings: 3200@16-18-18-18-36-62 , IF auf 1600 Mhz. ( 2 Module 16GB Samsung M391A2K43BB1-CTD (2666 ECC DDR4, CL19 ) )
- korrigierte ECC Fehler werden bei mir im Windows Eventviewer berichtet

Consumer-Hw:
- Intel 750 400GB, lauffähig und bootfähig mit beiden Slots
- Soundblaster X-FI Titanium, getestet nur im 1x Slot, läuft.
- Asus Hyper M.2 x16 im PCIEx16 funktioniert auf allen 4 SSD-Plätzen => Bifurcation funktioniert mit 3 SSDs, 4 funktionieren (derzeit?) nicht.
(Bios sagt, es gingen nur der obere und die unteren beiden Plätze (also vmtl. x8x4x4 gemeint), ich kann aber zwei SSDs an beliebigen Plätzen einsetzen.
2. Test war mit 4x M.2, davon wurden alle 4 im Bios nach nem Kaltstart erkannt, aber nicht in Windows; dort nur 3 von den 4. Beim Reboot hats dann nicht mehr gepostet. (x4x4x4x4 >scheint< also Probleme zu machen)


Betriebssysteme:
- Win10 2004 x64 läuft
- ESXI 6.7.0 U3 bootet, benötigt aber VIB-Package für die Realtek NIC oder eine unterstützte NIC (getestet mit Intel X540 in PCI3.0x4 slot).
- FreeBSD 12.1 (und damit z.B. Xigmanas) ist installierbar, ebenso erfolgreich getestet habe ich Versionen 13-stable und 14-current (Dez 2021).
- Solaris 11.4 ließ sich von USB-Stick an einem der USB 2,0-Ports installieren; am 3.0 Usb läufts nicht. erkennt OOB die Realtek NIC nicht; die X540 schon. Desktop/GUI ist installierbar und startet.
- Ubuntu 20.04 LTS war installierbar, aber offenbar fehlen Treiber für die iGPU (und ich meine für die RealTek NIC). Die AX200 wurde erkannt, die X540 natürlich auch.
- Ubuntu 21.10 war installierbar und ist voll lauffähig, keine Probleme mit GPU und NIC.


Upgrade von 4750G auf 5750G:
Mittlerweile ist der 4750G durch einen 5750G ersetzt. Der 4750G darf sich nun als sparsamer Homeserver auf einem B550M Tuf Gaming Plus (ohne Wifi) verdient machen.
Der 4750G hat sich als gute und sparsame Allround-CPU erwiesen, der neuere 5750G ist bei Singlethread jedoch deutlich performanter (~ +15 bis +20%) und da als Zen3 zwischen 5600X- und 5800X-Level. Multithreaded geht der Performancevorteil dann ab 3 Kernen in etwa umgekehrt proportional zurück bis auf 5-10% bei voller Auslastung.
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Yup, das ist natürlich auch eine meiner ersten Fragen gewesen. Und war auch der Grund, warum mir eine Pro-CPU eh mehr zusagte, trotz locked Multiplier.

ECC-Abfrage unter Windows 10 (am Blech, nicht in einer VM):

Mitgelieferter Gskill-Ram:
>wmic MEMORYCHIP get DataWidth,Totalwidth
DataWidth TotalWidth
64 64
64 64

>wmic memphysical get memoryerrorcorrection
MemoryErrorCorrection

3
=> kein ECC


mit 2*16GB Samsung M391A2K43BB1-CTD (2666 ECC DDR4, CL19):
>wmic MEMORYCHIP get DataWidth,Totalwidth
DataWidth TotalWidth
64 72
64 72

>wmic memphysical get memoryerrorcorrection
MemoryErrorCorrection
6

=> Multibit-ECC wird gemeldet.

Edit: hier weiter unten ECC-Check unter FreeBSD (direkt am Blech). Im Prinzip das gleiche Resultat.
 
Zuletzt bearbeitet:
Arlt war der Lieferant oder? Nettes Ding. Bin an esxi infos / Werten interessiert 😉
 
Yup, kommt dort her. Order war noch rechtzeitig, um an der Cashback-Aktion teilzunehmen und auch vor der schnellen Preiserhöhung.

ESXI kommt noch, keine Sorge. Hatte ich eh am Radarschirm. :-)
Kleins bissi Geduld bitte, weil ich berufstätig bin und immer nur die eine oder andere Stunde in der Freizeit nun probieren kann.
 
edit: hier stand Blödsinn

Ich dachte die Renoir sind OEM CPUs. Lief der auf Anhieb auf deinem MB/BIOS?
 
Yup, das lief auf Anhieb mit den Initialbios v245 des Boards. Bootete, meldete sich aber als "Ryzen 7 4700G"
Mit aktuellem Bios 803 hat er sich sauber als Ryzen 7 Pro 4750G gemeldet
Mal sehn, vielleicht flashe ich nochmal ein älteres Bios, ob er da unlocked für den Takt-Multiplier der CPU ist.

Ergänzt oben: HBAs M1015/9211-8i und 9400-16i.
 
Ich muss sagen, ich bin zufrieden. 20W Idle für einen aktuellen, leistungsfähigen 8Kerner Desktop out-of-the-box. So muss das.

Ehrlich gesagt sind 20 Watt im Leerlauf längst nicht mehr Stand der Technik. Bereits 2013 hatte die c't ihren 10-Watt-Bauvorschlag auf Haswell-Basis mit Standardkomponenten (also z.B. mit ATX-Netzteil statt PicoPSU). Selbst mit AMD, die beim Leerlaufverbrauch noch deutlich hinterherhinken, sind solche Werte für reine Office-Kisten mittlerweile möglich (siehe 7-Watt-PC mit Deskmini A300). Das einzig positive an deinen 20 Watt ist, daß die Hardware tatsächlich ein gewisses Mindestniveau erreicht hat, bei dem solch enorme relative Verbrauchsunterschiede (Verdreifachung!) nicht mehr ins Gewicht fallen - weder akustisch noch finanziell.
 
Das ist mir bewusst, das zu Haswell-Zeiten die Levels noch geringer waren. Darum habe ich eben auch keinen Zen2 mit X570 haben wollen, sondern auf die APU gewartet, um wenigstens wieder in vernünftige Größenordnung zu kommen.

Ich weiss auch, dass es Nuc, Deskmini & Co gibt. Nur, da hats nicht die geringsten Erweiterungsmöglichkeiten. Kein HBA, kein 10Gbit (ausser via TB oder USB), keine 128GB Ram, keine bessere Soundkarte, kein Pfad evtl. mal ne GPU doch nachzurüsten. ECC?
Die Levels haben sich seit 2013 verschoben für leistungsfähige Desktopkisten > 4 Kerne. Und zwar nach oben.

Eine Desktopworkstation kann man nunmal nicht mit Nuc&Deskmini vergleichen; das sind zwei paar Stiefel.
Und 7-10W haben auch Business-Desktops bisher nie geschafft; Elitedesk, Thinkcenter/-station P3xx sind da die richtigen Vergleichspartner. Nicht Nuc, Deskmini oder irgendwelchen Sonderkonstruktionen mit PicoPSU.

Ich verlang von meiner Kiste schon mehr, als Notepad, Solitär, Outlook und ein paar MB Excel Sheets. Das gleiche Ding soll auch Videoschnitt und Encoding können, VMs mit Datenbankservern, etc.
Für so eine Multipurpose-Kiste halte ich 20W für ok; ein guter Kompromiss zwischen wenig Last und hohem Performance-Potential.

Unterm Strich:
Mit dem Performancerennen zwischen AMD und Intel haben sich im Desktopbereich die Prioritäten deutlich weg von Idle Leistungsaufnahme der Systeme verschoben.
 
Nee, mit Haswell gab es bei Intel einen großen Fortschritt beim Leerlaufverbrauch und danach wurde es nicht wieder schlechter, sondern noch ein gutes Stück besser. All das, was du da an Ansprüchen stellst (Standardkomponenten, Erweiterungsmöglichkeiten, ECC, mehr als vier Kerne, 128 GB RAM), liegt für Intel-Plattformen längst im Regal. Nimm ein Fujitsu D3644-B, einen beliebigen Xeon-E, irgendein BeQuiet-Netzteil und du landest locker bei weniger als der Hälfte deiner 20 Watt.

Auch den Deskmini sollte man nicht unterschätzen und ihn in eine Reihe mit den NUCs stellen. Denn da passen ganz normale CPUs bis 65 Watt rein, auch Achtkerner (z.B. i7-9700). Insb. der kommende Nachfolger des A300 wird mit den neuen Ryzen-APUs richtig stark werden, da sieht deine Solitär-Polemik ganz alt aus.

Und wenn du an einen Business-Desktop denkst:
<4 Watt im Leerlauf ist mal ne Hausnummer, oder?
 
Zuletzt bearbeitet:
Nee, mit Haswell gab es bei Intel einen großen Fortschritt beim Leerlaufverbrauch und danach wurde es nicht wieder schlechter, sondern noch ein gutes Stück besser. All das, was du da an Ansprüchen stellst (Standardkomponenten, Erweiterungsmöglichkeiten, ECC, mehr als vier Kerne, 128 GB RAM), liegt für Intel-Plattformen längst im Regel. Nimm ein Fujitsu D3644-B, einen beliebigen Xeon-E, irgendein BeQuiet-Netzteil und du landest locker bei weniger als der Hälfte deiner 20 Watt.

10 Watt und weniger in deiner vorgeschlagenen Konfiguration? Das wage ich zu bezweifeln.
Alleine Netzteil Verlustleistung, RAM und Mainboard fressen schonmal die 10 Watt.
 
Yup, das ist natürlich auch eine meiner ersten Fragen gewesen. Und war auch der Grund, warum mir eine Pro-CPU eh mehr zusagte, trotz locked Multiplier.

ECC-Abfrage unter Windows 10 (am Blech, nicht in einer VM):

Mitgelieferter Gskill-Ram:
>wmic MEMORYCHIP get DataWidth,Totalwidth
DataWidth TotalWidth
64 64
64 64

>wmic memphysical get memoryerrorcorrection
MemoryErrorCorrection

3
=> kein ECC


mit 2*16GB Samsung M391A2K43BB1-CTD (2666 ECC DDR4, CL19):
>wmic MEMORYCHIP get DataWidth,Totalwidth
DataWidth TotalWidth
64 72
64 72

>wmic memphysical get memoryerrorcorrection
MemoryErrorCorrection
6

=> Multibit-ECC wird gemeldet.

Interessant aber soweit ich weiß (und von Asrock und AMD bestätigt) kann Ryzen zwar ECC (pro und non pro) aber eben kein Error Reporting.

Heisst du bekommst nichts von den laufenden oder bereits vergangenen "Verbesserungen" mit.


Asrock hatte mir mal ein TUT geschickt mit dem man wohl solche Fehler (oder Korrekturen) unter Linux abfragen kann.

Ps:

Der Deskmini kann selbst mit einer Pro CPU kein ECC. Der Bootet dann einfach nicht.

NUCs auch die teuren Hades (etc) Varianten booten zwar mit ECC RAM aber die Funktionalität bleibt deaktiviert (Keine BIOS Option)

Der neuste NUC (Ghost) kann das anscheinend...
 

Anhänge

  • memory error check SOP.PDF
    265 KB · Aufrufe: 620
Zuletzt bearbeitet:
Eine interessante und lehrreiche Diskussion zum Thema Ryzen + ECC Reporting gibt es in der Linux Mailing Liste: https://lore.kernel.org/linux-edac/79bca0d0-42eb-c232-6bbe-a958734e096d@gmail.com/T/

Ein kurzes TL;DR, so wie es ich verstanden habe:
- User hat die Speicherfehler mittels Overclocking provoziert
- Altes System mit Ryzen 7 2700X + ASUS Prime X470-PRO - ECC Error Reporting über edac-utils (Linux) funktioniert
- Sein neues System mit Ryzen 3900X + ASUS Prime X570-PRO korrigiert offensichtlich die Fehler, aber ohne Reporting an das OS
- Es wurde vermutet, dass Platform First Error Handling (PFEH) zum Einsatz kommt (https://www.amd.com/system/files/2017-06/AMD-EPYC-Brings-New-RAS-Capability.pdf), was beim User über die entsprechenden Register nachvollzogen werden konnte
- Kurz und knackig: PFEH enabled = Firmware kümmert sich ums ECC und entscheidet, wie vorgegangen und reported wird. OS kriegt nichts mit, wenn die Firmware so konfiguriert wurde.
- Ein späteres BIOS-Update hat PFEH deaktiviert und seitdem klappt mit Kernel 5.4, 3900X und ASUS Prime X570-Pro das ECC Error Reporting über edac-utils.

Meine persönliche Meinung zu dem Thema:
Wenn man ein Board kauft, wo nirgends ECC steht und eine non-PRO Ryzen CPU kauft, dann ist das Thema ECC Glückssache. Wenn man aber ein Board kauft, wo auf der Produkthomepage in Schriftgröße 100 ECC steht (wie bei manchen ASUS und ASRock Boards), dann erwarte ich funktionierendes ECC. Ob Fehler im BIOS oder im OS reported werden, ist Implementierungssache, aber irgendwo muss der User es mitkriegen (zumindest die Uncorrectable). Und tatsächlich scheint es Mainboards zu geben, die das Error Reporting korrekt an das OS melden (s. Mailing Liste).

Ich sehe es ganz entspannt, wir leben hier in Deutschland. Wenn bei Komponenten, die mit ECC werben diese Funktion nicht richtig funktioniert, vom User nicht überprüfbar ist, reklamiert man das und bei Schaden geht man zum Anwalt.
 
Zuletzt bearbeitet:
Oder man kauft im Vorfeld einfach eine Plattform, bei der Sowohl der CPU Hersteller, als auch der Mainboard/Systemhersteller die ECC Funktionalität validiert hat und auch offiziell so vertreibt.
 
Bei den Pro Cpus und Asrock oder denen sie das offen auf deren Produktbeschreibung auflisten sollte man erwarten können das drin ist was draufsteht.

Aber wir wissen ja seit VW (und allen anderen...)....
 
@Brokk du meinst sicherlich das X470D4U? Das ist schon seit dem Release ein einziger Bug-Haufen, bei dem Board ist das ECC Reporting schon fast ein nebensächliches Problem.

@sch4kal genau meine Rede. Ryzen PRO CPU und dazu dann noch bspw. das ASUS Pro WS X570-ACE und ECC RAM von der QVL Liste und gut ist. Das wird vom Hersteller so angegeben und beworben: "Die Unterstützung von Error-Correcting-Code (ECC) bietet eine hervorragende Grundlage für Ihr System. Mit ECC ist das Pro WS X570-ACE in der Lage, Einzelbit-Speicherfehler automatisch zu erkennen und zu reparieren, um so eine zuverlässige und flexible Leistung in unternehmenskritischen Umgebungen zu gewährleisten."

Dabei fällt mir ein, ich weiß garnicht, ob meine beiden Dell T20 ECC Errors Reporten können. In ca. 6 Jahren noch nie einen Bit-Flip gesehen oder Reportet bekommen. Muss ich mal testen, aber das ist an dieser Stelle Off-Topic...
 
@
@Brokk du meinst sicherlich das X470D4U? Das ist schon seit dem Release ein einziger Bug-Haufen, bei dem Board ist das ECC Reporting schon fast ein nebensächliches Problem

Genau das Board und sein Zwilling. Asrock hatt jetzt allerdings ECC mit Asterix in ganz klein aufgelistet.

Conditional ECC reporting.....
 
Hmm nur Einzelbit ? Windows meldet doch bei AM4 Multi-bit.
 
ESXI 6.7.0 U3 bootet einen USB-Stick (einer anderen Installtion, Neuinstall muss ich noch testen).
Findet erwartungsgemäß aber die Realtek NIC (ohne VIB package) nicht. Also rein mit der X540 aus den Spareparts.

Hier der Passthrough Config-Screen mit den Adressen, die auswählbar sind. (Obs dann funktioniert, ist natürlich wieder was anderes.)
passthrough.png



Edit 16Uhr45:
ECC-Check mit FreeBSD 12 , direkt am Blech.

#dmidecode -t memory

meldet
Error Correction Type: Multi-bit ECC Error Information Handle: 0x002A

und auf den Bank 1
Error Information Handle: 0x0033 Total Width: 72 bits Data Width: 64 bits
Bank 3:
Error Information Handle: 0x0038 Total Width: 72 bits Data Width: 64 bits


Edit 18Uhr30:
ECC-Check mit Memtest86 8.4 (free):
Status sagt ECC enabled.

Edit 20Uhr:
CPU-Takt Multiplier können im Bios wohl doch geändert werden. Es ist zwar kein Popdown-Menü da , aber man kanns einfach übertippen. 8-) Aktuell hab ich auf 45 (=4500 Mhz.)
Scheint zu funktionieren Allcore 45x und Rest auf "Auto" schmiert ab bei Geekbench.


Ich hab mal mit Memtest86 V8.4 angefangen.
2*16GB Samsung M391A2K43BB1-CTD (2666er ECC): 1,35V , @3200CL19 (und CPU auf 4500) laufen bei mir ohne Ram-Fehler durch.
Die Temp-Anzeige von Memtest scheint falsch. 123-133C ????? Nope, das kann nicht stimmen. Das dürften F sein; zumindest passt da die Idle temp ziemlich gut.

Jetzt wird noch ein Durchlauf 3200@16-17-17-17 mit den 2666 ECC-Riegeln durchgeführt.
Mit CL15-16-16-16 hat Windows nicht mehr gebootet. Aber mehr als 1,35V mag ich den Riegeln (nackte Chips, keine Heatspreader) nicht geben. Des kanppe Prozent macht auch nix mehr aus.

Edit: Musste auf 17-18-18-18 zurückstellen, da Post sonst öfters hängen blieb.
Edit 2020-08-31: final nun stabil auf 16-18-18-18-36-62 @ 1.37V
 
Zuletzt bearbeitet:
Danke dir für die Tests! Dass der ECC-RAM korrekt erkannt wird und funktioniert, daran besteht kein Zweifel. Würde mich aber schon interessieren, ob das auch an das OS reported wird und wie das System mit Multibit-Fehlern umgeht. Standard ist bei solchen Systemen ja Einzelbit-Fehler = Korrektur (und Logging), Multibit-Fehler = Halt und Logging. Das kann man über Injekt provozieren (je nach BIOS / Firmware jedoch nicht immer verfügbar) oder über absichtlich instabiles RAM-Overclocking.

Wäre es für dich möglich, folgende Tests durchzuführen, z.B. unter eine Ubuntu Live CD / USB Umgebung?
1. Was gibt das Kommando "sudo rdmsr 0xC0002003" aus?
2. Gibt es im BIOS unter AMD CBS einen Eintrag für ECC-Einstellungen? Falls ja, welche?
3. Könntest du deinen RAM schrittweise von 2666MHz (1.2V fix) hochtakten, bis du Fehler provozieren kannst und unter Ubuntu Live CD / USB schauen, ob du korrigierten Fehler gemeldet bekommst? Stress-Test kannst du mit mprime machen, korrigierte Fehler werden mit dem Kommando "sudo edac-util -rfull" angezeigt.
 
Musste die Speichertimings um 1 langsamer machen, da mir die Kiste beim Booten hängen blieb.

zu 1) hab mit Ubuntu 20.04 LTS getestet; RDSMR-Tool musste ich nachinstallieren (#apt install msr-tools), Kommando "sudo rdmsr 0xC0002003" gibt dann "rdmsr: open: No such file or directory" aus.
die iGPU scheint nicht sauber erkannt zu werden; ich kann OOB nur 1024*768 auswählen. D.h. wohl, die im Standardimage befindlichen Treiber können mit der iGPU nix anfangen.
Die AX200 Wlan-Karte wurde sofort erkannt.

Zu 2) Unter AMD CBS gibt es eine einzige Option: "Dram ECC" mit den Werten Auto/Disabled/Enabled.



Die Realtek NIC kann mit einem XS716T + FS-Transceiver (über 25m) nicht gut zusammenarbeiten. Upload max. 130 MB/s, Download @ Autonego ~ 8MB/s, wenn fixiert auf 2,5G dann etwa 75 MB/s, obwohl Linkspeed mit 2.5G im Status angegeben wird, An einem 1 oder 10Gbase-T Anschluss 114 MB/s konstant. Ähnlich war das mal mit der Aquantia.
D.h. ich vermute, dass da die Kombi XS716T/Transceiver nicht wirklich voll passt. => Ist nicht der Realtek anzulasten, damit kann ich aber 2,5G nicht testen,

An der X540 NIC: sofort voller Durchsatz.
 
Zuletzt bearbeitet:
Sehr interessanter Bericht. Bin auf weitere Erfahrungen gespannt.
Überlege mir ein ähnliches System als NAS/Homeserver/VM-Maschine zusammenzubauen - wobei ich mich da im Moment noch selbstkritisch hinterfrage ob es wirklich ein "ich brauche das" oder doch eher ein "ich will das" ist.
Würde aber wohl eher der 4650 bei mir werden, dürfte dicke reichen.
 
Wo is'n der Unterschied zwischen "brauch das" und "will das"? :d

Kenne nur vielleicht "will das, aber nicht wirklich".
 
Nuuun, mit den Worten meiner Frau: "Brauchst Du das oder willst Du nicht lieber stattdessen mit Deiner Dich liebenden Familie einen Kurzurlaub machen? Musst Du wissen."... watt ne fiese Charakter!
 
naja... aber auch nicht für ewig... :d
 
Ich dachte die Renoir sind OEM CPUs.
Ryzen (non-Pro) 4000G sind nur für OEMs. Daher gibt es sie auch nicht im Handel zu kaufen.
Ryzen Pro 4000G sind für OEMs und Systemintegratoren. Daher gibt es sie im Handel zu kaufen (wie auch andere Tray-CPUs), die Händler können sie gewöhnlich über ihre Distributoren beziehen.

Leider steht das vielfach falsch in der Fachpresse, daher gibt es oft Verwirrung in dieser Sache.
Lief der auf Anhieb auf deinem MB/BIOS?
Die Renoir-APUs laufen bei B550 in der Regel mit dem Release-BIOS.
Standard ist bei solchen Systemen ja Einzelbit-Fehler = Korrektur (und Logging), Multibit-Fehler = Halt und Logging.
Das ist zumindest bei Linux nur bis Kernel 2.4 so gewesen. Seit Kernel 2.6 wird differenzierter vorgegangen und standardmäßig nach non-correctable und non-recoverable unterschieden.

Ein nicht korrigierbarer Fehler im Userspace führt zu einem Bus Error und die betroffene Anwendung wird beendet.
Nur ein nicht korrigierbarer Fehler im Kernelspace führt zu einem Systemhalt.

Dieses Verhalten kann über Kernelparameter angepasst werden.
 
Prime5 v28.6 137W maximal fürs gesamte System, 4.2ghz allcore mit small FFT (@3200er Ram, alles für die CPU auf Stock) ; Test über ~2 Stunden.

Mittlerweile ist fast alles vom alten Rechner (Laptop mit 7820HQ) auf den 4750G umgezogen. :cool:
 
Wo ist eigentlich die Grafikleistung einzustufen? Auf Höhe Nvidia GeForce GTX 1060 ?
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh