[Sammelthread] Ryzen DDR5 RAM OC Thread

z3r0.c0m · 14.01.2024

RedF schrieb:
Habe mal beobachtet, dass der CPU Test vom TimeSpy schwer unter IF Fehlercorrektur leidet.
Müsste mal einer Verifizieren : )

Was bedeutet "leiden"? Ich hatte dort immer sehr konstante CPU Werte von 18.500 - 18.800.

Beitrag automatisch zusammengeführt: 14.01.2024

LuxSkywalker schrieb:
sollte dann PyPrime aber nicht derbe schwanken?

Beitrag automatisch zusammengeführt: 14.01.2024

VSoC

vSOC ist am limit von 1,3v. Gibt es noch andere Möglichkeiten bei den Widerständen oder so?

RedF · 14.01.2024

z3r0.c0m schrieb:
Was bedeutet "leiden"? Ich hatte dort immer sehr konstante CPU Werte von 18.500 - 18.800.

Beitrag automatisch zusammengeführt: 14.01.2024

vSOC ist am limit von 1,3v. Gibt es noch andere Möglichkeiten bei den Widerständen oder so?

Ich meine, bei mir sind die CPU Punkte mit aktiver Fehlerkorrektur schwer eingebrochen.

Müsste aber nochmal geprüft werden. Vielleicht war es nur Zufall.

z3r0.c0m · 14.01.2024

Wolf87 schrieb:
Komme mit gleichem cpu auf 9.256 im Durchschnitt ich denke dein IF geht in die Fehlercorrektur. versuch mal 2067. Sisoftsandra interthreadtest ist zum ausloten auch noch ein test um die core latency zu messen

Kann es auch sein, das PYPRime auch CPU-Takt-Abhängigkeit hat? Ich habe bei mir einen negativen Offset von 150 Mhz drin. Könnte das evtl. die Differenz erklären?

LuxSkywalker · 14.01.2024

Zumindest mein TestOS benötigt im Schnitt gut ~0.1 Sekunden weniger im Vergleich zu meinen 24/7 Daily OS

beides Win 10 Pro - aber das TestOS ist gut debloatet und zig Dienste deaktiviert

ich komme auf 9.278 im Schnitt - @Wolf87 ist dein System auch PBO CO optimiert?

Wolf87 · 14.01.2024

Ja habe es mit ropbench auf den effektiven Takt optimiert. Wenn ich z.b auf 2100 und mehr gehe hab ich auch 9.5 in pyprime. In microbench sehe ich auch fclk throttle im relevantem Bereich. Veii ist ja paar post voher schon drauf eingegangen. Deshalb fahr ich aktuell mit 2066 am besten. Auch wenn Veii meint dass bei non 3D cache cpu if takt viel bringt. Aber bei mir ist aktuell 2067 Ende der Fahnenstange

criticalx · 14.01.2024

RedF schrieb:
Also tWR = RCD+RTP+4 ? Weil tWR_A nicht ausgelesen werden kann?

auf meinem msi b650 tomahawk lässt sich tWR nur in Schritten von 6 verstellen.
-> 54 -> 60

RedF · 14.01.2024

criticalx schrieb:
auf meinem msi b650 tomahawk lässt sich tWR nur in Schritten von 6 verstellen.
-> 54 -> 60

Da wirst du aufrunden müssen.

Beitrag automatisch zusammengeführt: 14.01.2024

criticalx schrieb:
auf meinem msi b650 tomahawk lässt sich tWR nur in Schritten von 6 verstellen.
-> 54 -> 60

Ist bei mir auch so...

z3r0.c0m · 14.01.2024

@Wolf87

Ich habe jetzt mal weitere Tests gemacht, um das mit der Differenz mit unseren ähnlichen Systemen in PyPrime zu verstehen.
Du nutzt ja Windows 10 wie ich das verstanden habe. Bei mir ist es Windows 11. Bei den systemeigenen Backgroundprozessen und -diensten ist Windows 11 leider ein Rückschritt, da ein frisches Windows 11 ohne Zusatzprogramme schon deutlich über 130 Prozesse laufen hat. Hier möchte ich nur begrenzt etwas manuell beenden. Um diesen Unterschied dennoch etwas entschärfen zu können, habe ich einen Test im abgesicherten Modus (inkl. Netzwerktreiber) durchgeführt. Dabei laufen dann 62 Prozesse. Zudem habe ich für diesen Test meine CPU Einstellungen im Bios umgestellt, sodass ich keinen negativen Taktoffset mehr habe.

Dabei kam folgendes Ergebnis heraus:

Das bestätigt zumindest, dass PyPrime vom Maximaltakt (Single-thread??) beeinflusst wird. Dies ist aber für mich nicht so wichtig. Darauf komme ich gleich noch.
Die letzten etwa 50ms zu z.B. @LuxSkywalker sind dann einfach so 🤷‍♂️ Ich habe keine CO-Anpassung mit ROPBench o.ä. gemacht, vielleicht würde das nochmal etwas bringen

Aber den Aufwand möchte ich mir eigentlich sparen.

Grund für mein CPU-Setup und dem 150 MHz negativen Taktoffset liegt einerseits darin begründet, dass ich bei der CPU-Lotterie kein so gutes Los gezogen habe. Das mache ich daran fest, weil die CPU im Ursprungszustand eine Taktdifferenz von ca. 200 Mhz zwischen den CCDs aufweist. Um dies etwas zu glätten, habe ich ne Zeit lang diverse Tests gemacht. Als bestes Ergebnis für meinen Fall hat sich herausgestellt, auf ein möglichst hohes CO Offset zu kommen. Bei mir ist das -26 und -28. Diese Werte erreicht man in der Regel nicht, da für die höchsten Taktstufen einfach viel Spannung notwendig ist. Diese hohe Spannung wiederum führt aber dazu, dass die CPU gedrosselt wird. Dies führt dann schon zum zweiten, für mich noch wesentlich wichtigeren Grund: Ich benötige Multi-Core-Leistung fürs encoden und rendern, dafür verzichte ich gerne auf Single-thread-Leistung.
Hier im Cinebench 2024 gut zu sehen:
2311 CO -18 all core OHNE Taktoffset.
2333 CO -24 all core mit 100 MHz negativen Taktoffset
2349 CO -26/-28 pro CCD mit 150 MHz negativen Taktoffset

Meine Einstellungen sind prime erprobt. Als sehr guter Stabilitätstest hat sich Cinebench R23 erwiesen. Denn dieser reagiert sehr empfindlich, wenn er deutlich über eine Stunde läuft (ideal >2 Stunden).

Kannst du die Cinebench (R23 + 2024) mal bei dir checken als Vergleich, wie die CPU so liegt? Wäre mal gut zu wissen, denn du hast dein System auch sehr stark optimiert.
Vielleicht mache ich mich ja dann doch nochmal ans Optimieren der CPU

RAM hake ich für mich jetzt erstmal ab, da ich mit dem Ergebnis, welches ich mit der Hilfe dieses Forums erreicht habe, echt sehr zufrieden bin.

Gruß
Zero

LuxSkywalker · 15.01.2024

Bei meinen beiden CCDs ist auch ein Taktunterschied von 150MHz vorhanden

Ich glaube das AMD da bewusst einen guten CCD mit einem weniger guten CCD zusammen setzt.

Der maximale Turbo wird ja auch nur für einen einzigen Kern garantiert und das ja auch nur solange die restlichen Vorgaben wie Temperatur etc im vorgegebenen Rahmen sind

Btw. meine RAM (Sub)Timings sind bis aufs letzte optimiert

Was ich sagen kann: AIDA Latenz und PyPrime korreliert nach meinen Beobachtungen

Wenn die Latenz in AIDA schön niedrig ist siehst du das auf meinem System sofort auch in PyPrime

FightingFalcon · 15.01.2024

Moin!

Derzeit hab ich F5-6000J3038F16GX2-FX5 verbaut und an sich ganz zufrieden auf meinem Gene und dem 7800X3D.

Könnte den "preiswerten" Ram jetzt aber gut in nem anderen Mini-ITX Build verwenden.

Da es mich reizen würde 2x24GB zu Probieren hier nun meine Frage welchen RAM die Profis in diesem Thread hier nehmen würden.

Im Moment hab ich CMP48GX5M2B6000C30 bzw F5-6400J3239F24GX2-TZ5RK im Blick.

Was würdet ihr Empfehlen?

RedF · 15.01.2024

criticalx schrieb:
auf meinem msi b650 tomahawk lässt sich tWR nur in Schritten von 6 verstellen.
-> 54 -> 60

Habe auf 60 tWR aufgerundet, gibt hier recht gleichmäßige PYPrime werte.

Beitrag automatisch zusammengeführt: 15.01.2024

Habs in die Tabelle eingepflegt.

Wolf87 · 15.01.2024

@z3r0.c0m Anbei mal ein paar Werte von mir. System läuft auf win11.

@RedF habe das Sd, dd Thema in unserer Liste überarbeite. Man kann jetzt über einen Wert 0 oder 1 dann zwischen single sided und dual sided switchen. Habe auch die zentiming Seite darauf hin angepasst.
Gibts schon was neues zum Ropbench?

Ich bin mir unsicher ob du die TWR Formel korrekt umgesetzt hast. Veii sagt ja nur das twr wie tras einen Buffer braucht. twr= 12+x+8

".....Basically tWR should never be lower than tWTR_L
And tWR should never be lower than RTP + WTRA (X).
Soo tWR should never be lower than 12+X (+BC8 aka +8). Depends when tWR is needed.
In the most simplified way possible, ignoring most "but if" variables.
= don't go under value 24. Optimally never under value 20, because that's just silly and begs for trouble.
Because things are not only working in BC8 mode,
The correct correct rule is not under 48, but 24 is somewhat an option."

RedF · 15.01.2024

Wolf87 schrieb:
@z3r0.c0m Anbei mal ein paar Werte von mir. System läuft auf win11.

@RedF habe das Sd, dd Thema in unserer Liste überarbeite. Man kann jetzt über einen Wert 0 oder 1 dann zwischen single sided und dual sided switchen. Habe auch die zentiming Seite darauf hin angepasst.
Gibts schon was neues zum Ropbench?

Ich bin mir unsicher ob wir du die TWR Formel korrekt umgesetzt hast. Veii sagt ja nur das twr wie tras einen Buffer braucht. twr= 12+x+8 wir wissen blos nicht was x ist da WTRA nicht ausgelesen werden kann.

Des weiteren hat er folgendes gesagt

".....Basically tWR should never be lower than tWTR_L
And tWR should never be lower than RTP + WTRA (X).
Soo tWR should never be lower than 12+X (+BC8 aka +8). Depends when tWR is needed.
In the most simplified way possible, ignoring most "but if" variables.
= don't go under value 24. Optimally never under value 20, because that's just silly and begs for trouble.
Because things are not only working in BC8 mode,
The correct correct rule is not under 48, but 24 is somewhat an option."

Ja, bin mir auch nicht sicher -_-

z3r0.c0m · 15.01.2024

Wolf87 schrieb:
@z3r0.c0m Anbei mal ein paar Werte von mir. System läuft auf win11.

@RedF habe das Sd, dd Thema in unserer Liste überarbeite. Man kann jetzt über einen Wert 0 oder 1 dann zwischen single sided und dual sided switchen. Habe auch die zentiming Seite darauf hin angepasst.
Gibts schon was neues zum Ropbench?

Ich bin mir unsicher ob wir du die TWR Formel korrekt umgesetzt hast. Veii sagt ja nur das twr wie tras einen Buffer braucht. twr= 12+x+8 wir wissen blos nicht was x ist da WTRA nicht ausgelesen werden kann.

Des weiteren hat er folgendes gesagt

".....Basically tWR should never be lower than tWTR_L
And tWR should never be lower than RTP + WTRA (X).
Soo tWR should never be lower than 12+X (+BC8 aka +8). Depends when tWR is needed.
In the most simplified way possible, ignoring most "but if" variables.
= don't go under value 24. Optimally never under value 20, because that's just silly and begs for trouble.
Because things are not only working in BC8 mode,
The correct correct rule is not under 48, but 24 is somewhat an option."

Stark

Wie wäre denn der Ablauf mit ROPBench? Gibts da zufällig eine Anleitung?

RedF · 15.01.2024

Ropbench, dachte V1,70 hat er schon veröffentlicht, kann es aber nicht mehr finden.

Beitrag automatisch zusammengeführt: 15.01.2024

Ah, habs https://www.overclock.net/attachments/ropbench_v1-70-zip.2640971/

Wolf87 · 16.01.2024

Mit Ropbench kann man mit einem startbefehl statt der peak clock die effektive clock über Zeitraum x zb. 20 sekunden messen. (Siehe readme) Habe so lange co gesenkt. Bis dort kein mhz gewinn durch weiteres senken möglich war. Veii hat in einem früheren Post empfohlen sich den oberen chart anzuschauen. Wenn da im 1 ms Bereich größere Einbrüche geschehen dann ist auch Ende der Fahnenstange. Er meinte auch evtl lässt sich auch über die varianzen im intercore chart etwas ableiten. Muss es mir mal die Tage anschauen. Muss man testen. Empfehlungen sind echt schwer weil das amd system so gut korrigiert.

criticalx · 16.01.2024

Wolf87 schrieb:
Mit Ropbench kann man mit einem startbefehl statt der peak clock die effektive clock über Zeitraum x zb. 20 sekunden messen. (Siehe readme) Habe so lange co gesenkt. Bis dort kein mhz gewinn durch weiteres senken möglich war. Veii hat in einem früheren Post empfohlen sich den oberen chart anzuschauen. Wenn da im 1 ms Bereich größere Einbrüche geschehen dann ist auch Ende der Fahnenstange. Er meinte auch evtl lässt sich auch über die varianzen im intercore chart etwas ableiten. Muss es mir mal die Tage anschauen. Muss man testen. Empfehlungen sind echt schwer weil das amd system so gut korrigiert.

@z3r0.c0m

wenn du primär renderst, solltest du vielleicht den Renderer gleichzeitig anschmeißen und gucken, dass es unter avx last nicht zu clock stretching kommt, da Ropbench nur sehr leicht belastet.

Veii · 16.01.2024

Wolf87 schrieb:
Ich bin mir unsicher ob du die TWR Formel korrekt umgesetzt hast. Veii sagt ja nur das twr wie tras einen Buffer braucht. twr= 12+x+8

Es gibt 4 variablen
Ich konnte "am Sontag ?" den Post nicht fertigstellen.

Ich muss es mir genauer anschauen.
Eigentlich hat die alternativ-formel

Zu stimmen, bloß sind das für nicht AP refreshes.
Und es sind für writes nop write+BC8 nop read

Unsere WR werden nach dem write ausgerechnet bevor der Read startet
nicht nach dem Read
Jedoch ist der 2. angereihte write um 8 clock verschoben

Ich werde es mir genauer anschauen müssen.
Es gibt 4 korrekte Werte, je nach syncronization.

WR never under WTRL stimmt
RAS-RCD stimmt teils
Write past RTP + WTRA or WTRL + another BC8 clock , ~ ist ebenso korrekt
Sogar genauer.
Hier ist der Unterschied zwischen CAS+WTRL+BC8
// ^ WR von dem ehmaligen read startend, und nach beendeten Read abfangendd
Ebenso richtig wie CWL + BC8 + WTRA + RTP
Wobei für diese Methode FGR benötigt wird, damit timings sich nicht überlappen und der Read (start) in dem anderen Subchannel passiert
^ Etwas das wir mir soweit bekannt immer noch nicht unterstützen. Kein FGR, kein RFCpb.

Gib mir etwas Zeit und ich finde es herraus, was für uns am besten passt.
Soweit kannst du es zu CAS+WTRL+8 ersetzen, und wir schauen dann weiter wie (half WTRS) darauf wirkt.
Der erste Write ist instant. Der nächste write ist um +8 clock verzögert. Gleichzeitig aber geschieht ein Read auf einem anderen Ort.
Somit überlappen sie sich nicht

^ alternative, mostly write nop write

DDR4 but same rules apply

^ command explanations

Beitrag automatisch zusammengeführt: 16.01.2024

criticalx schrieb:
@z3r0.c0m

wenn du primär renderst, solltest du vielleicht den Renderer gleichzeitig anschmeißen und gucken, dass es unter avx last nicht zu clock stretching kommt, da Ropbench nur sehr leicht belastet.

Bei einer boost Ramp-up Time von 1ms , worin die besten tools eine API mit einer updatezeit von 30ms Nutzen, auf Pooling 500ms minimum
// Hydra nutzt RSMU mit einer update-zeit von ~10ms.
Kannst du bei 1/30 , bzw 1/500 samples wenig auslesen.

Clock Stretching existiert nicht.
Es gibt clock gating und voltage gating.
Beides geschieht weitaus schneller als jegliche Tools das auslesen können.

RopBench its kein SSE load.
Es verwendet AMDs eigene HardwareInstructions um die CPU auf der Boosting-state zu halten.

Bei schwerer Last gibt es Voltage Throttling, aber kein Strap-Stretching.
Bei schwerer Last welche alle Kerne ladet, wird hinunter bis zu dem schwächsten Kern getacktet. Danach setzen Thermal und Amperage Guardbands ein.
Da die Kerne nur eine Spannungsversorgung haben. Zwar bekommt jeder Kern durch das LDO eine leicht abgeänderte Spannung als der Input
Jedoch bleibt es ein Input.
Somit haben sie auch Frequency-Delta's in CCDs und zwischen CCDs bzw (legacy) CCX einzuhalten.
Sie können keinen individuellen Clock rennen wie bei Intels Seite.

z3r0.c0m · 16.01.2024

criticalx schrieb:
@z3r0.c0m

wenn du primär renderst, solltest du vielleicht den Renderer gleichzeitig anschmeißen und gucken, dass es unter avx last nicht zu clock stretching kommt, da Ropbench nur sehr leicht belastet.

Mein größtes Problem beim Ausloten der besten CPU Einstellung war nicht der Takt bei sehr hoher Belastung.
Meine Erfahrung diesbezüglich war, dass ich unter heavy load schon stabil war, aber bei mixed load, wenn der Takt höher ist als bei max. Belastung, dort war es zum Haare ausreißen. Daher war das Mittel der Wahl dann einfach den Takt zu begrenzen, denn beim Rendern erreicht dieser nie über 5,5 Ghz auf allen Kernen. Deswegen tut mir das auch nicht weh. Aber man hat halt im Hinterkopf, dass da noch ungenutztes Potenzial liegt, wenn auch nicht so viel.

Mal sehen, vielleicht mache ich mich doch mal dran und schau mir das mit ROPBench mal an.

Danke trotzdem für deinen Hinweis

Gr3yh0und · 16.01.2024

@Wolf87 In C51 ist auch ein tCL, welches manuell eingegeben werden kann. Kann man das nicht aus B4 übernehmen? Hab jetzt etwas gesucht bis ich mein abweichendes tCWL im Zentimings Screenshot nachvollziehen konnte. Dort verwendet @RedF nämlich das tCWL aus D51.

Wolf87 · 16.01.2024

Danke für den Hinweis. Habe die Edit sachen anderster gefärbt dann ist es im Dark Modus besser lesbar. Jetzt funktioniert auch der switch für single sided und dual sided sorry hatte vergessen die Spalte freizugeben. Anbei aus Ropbench intercore chart 7950x

Veii · 17.01.2024

130ns

I can't believe its that bad.
Over 60ns is bad.

Can you re'verify with SiSofft Sandra @Wolf87

z3r0.c0m · 17.01.2024

Wolf87 schrieb:
Danke für den Hinweis. Habe die Edit sachen anderster gefärbt dann ist es im Dark Modus besser lesbar. Jetzt funktioniert auch der switch für single sided und dual sided sorry hatte vergessen die Spalte freizugeben. Anbei aus Ropbench intercore chart 7950x

Sieht bei mir nicht viel anders aus

Wolf87 · 17.01.2024

Ja da scheint irgendwas mit dem Programm zu sein. Bei Si soft Sandra ist die Range 7,8-61,4ns. @Veii zur Info aktuell lässt sich bei Asus twr nur in 6 Schritten beginnend ab 48 zu konfigurieren. Was ich so von anderen gelesen habe sieht es bei den anderen Boards ähnlich aus.

RedF · 17.01.2024

Wolf87 schrieb:
Ja da scheint irgendwas mit dem Programm zu sein. Bei Si soft Sandra ist die Range 7,8-61,4ns. @Veii zur Info aktuell lässt sich bei Asus twr nur in 6 Schritten beginnend ab 48 zu konfigurieren. Was ich so von anderen gelesen habe sieht es bei den anderen Boards ähnlich aus.

ASRock auch nur in 6er schritten.

z3r0.c0m · 17.01.2024

Wolf87 schrieb:
Ja da scheint irgendwas mit dem Programm zu sein. Bei Si soft Sandra ist die Range 7,8-61,4ns. @Veii zur Info aktuell lässt sich bei Asus twr nur in 6 Schritten beginnend ab 48 zu konfigurieren. Was ich so von anderen gelesen habe sieht es bei den anderen Boards ähnlich aus.

Was genau kann ich davon ableiten? Gibt es Referenzwerte, von denen man ein "gut" oder "nicht gut" ableiten kann? Ich habe jetzt auch nochmal diesen Check gemacht, nachdem ich gestern etwas mit ROPBench experimentiert habe. Die Werte sind etwas besser als vorher, aber ohne Maßstab bzw. Referenzwerte ist mir keine Einschätzung möglich.

TKJBerlin · 18.01.2024

Darki24 schrieb:
Lass ich mal Kommentarlos so stehen

Anhang anzeigen 952083

Wow 😮

Kann es sein, das das STRIX B650E-E besser läuft als das Hero?
Mir kommt es so vor, als ob das Gene so wie das Strix X670E-E und auch Asrock Taichi (sowohl B650e als auch X670e) die einzigen Boards sind die da so richtig mithalten können oder?

Sind das auch die im Moment Stressfreiesten Boards?

LG in die Runde

Darki24 · 18.01.2024

Nö, RAM ist nie das Problem, das Board auch nicht, sondern der IMC.
Du kannst dir das teuerste Board kaufen und der imc schafft nur 6200, dann haste ordentlich Geld versenkt.

Stressfrei sind die Boards alle, zumindest seit agesa 1.1.0.0.

Einzig die ganzen Failsafe Werte die beim RAM OC hinterlegt sind (und die fehlenden Optionen) müssten noch angegangen werden.

TKJBerlin · 18.01.2024

Danke für deine Antwort😊

Mir ist schon klar, das es Unterschiede bei den IMC gibt.

Aber manche Boards (zumindest kenne ich das von Intel so) sind da schon wesentlich problematischer als andere wenn es an RAM OC geht 😅

Du würdest also sagen, das auch ein Hero ähnlich abliefert wie dein Strix?❤🤗

RedF · 18.01.2024

Also butanding hat es mit dem gene geschafft die 8000 stabil zu bekommen, mit dem Taichi nicht.

Beitrag automatisch zusammengeführt: 18.01.2024

Aber alle Boards mit PCIe 5 müssen ziemlich hochwertig sein, also viele layer/gute Schirmung.

[Sammelthread] Ryzen DDR5 RAM OC Thread

Profi

Enthusiast

Profi

Urgestein

Experte

Experte

Enthusiast

Profi

Urgestein

Enthusiast

Enthusiast

Experte

Anhänge

Enthusiast

Profi

Enthusiast

Experte

Experte

Enthusiast

Profi

Brummbär

Experte

Anhänge

Enthusiast

Profi

Experte

Anhänge

Enthusiast

Profi

Neuling

Enthusiast

Neuling

Enthusiast

Ähnliche Themen