[Sammelthread] Ryzen RAM OC + mögliche Limitierungen

Sorry, dann wars ein Missverständnis meinerseits. :)

EDIT:
Wo sollte man für GDM disabled eig. ansetzen, um es stabil zu bekommen bzw. was brauchts dann eher - mehr Vdimm oder auch mehr SoC ect.?
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wo sollte man für GDM disabled eig. ansetzen
Mit 16GB einfacher als mit 32GB. Als erstes GDM Off 2T. Am wichtigsten sind dann die Nebenspannungen RTTs und CADs. Wenn die nicht absolut sauber aufeinander abgestimmt sind, dann läufts nicht stabil. Das kann in Sisyphusafbeit ausarten.
Von 3800C16 auf 3800C15 1T brauchte ich 0,02v mehr Vdimm.
 
Ich schrieb ja, er solle GDM nicht ausschalten und die geraden CL-Werte in Kauf nehmen. So meinte ich das. ;)

Deswegen sollst ins Ereignisprotokoll schauen. Und bringe uns die Werte von Zentimings, bevor wir alles erraten muessen. ;) Zentimings ist ein Programm.
Ja IF lag auf 2000, kann auch daran liegen. Bin wie gesagt noch nicht so bewandert, aber Zentiming, Tayphoon usw ist schon bekannt. Ist für mich wohl noch einfach ungewohnt das es nicht so out of the box funktioniert bzw ist es für mich auch einfacher wie bei dem E-Die, bei 3200 mit nem Grundgerüst sich "hochzuarbeiten". Aber es macht mir aktuell Spaß ein bisschen rumzubasteln und wie gesagt für 59 € musste ich den Ram mitnehmen :d Wird schon, und auch 3800 mit guten Timings wäre ja was.

Ist nur die Frage ob ich dann einfach auf 4x8 3600 oder 2x8 3800 gehe. So wie ich das rauslese würde ja 3800 = IF mit guten Timings wahrscheinlich besser sein als nicht 1:1 oder?
 
würde ja 3800 = IF mit guten Timings wahrscheinlich besser sein als nicht 1:1 oder?
ja, unbdingt 1:1. Alles andere macht keine Sinn. IF2000 schafft kaum ein Ryzen 5000. Booten vielleicht ja. Aber ich wette drauf, dass es bei dir eben auch nicht stabil ist. Das lässt sich aber schnell mit einem AIDA Stresstest herausfinden. Stress cache only war da meine ich die passende Einstellung für. Das 1h laufen lassen.
Oder du guckst vorher schon mal in die WIndows Ereignisanzeige und suchst nach WHEA Fehlern.
 
ja, unbdingt 1:1. Alles andere macht keine Sinn. IF2000 schafft kaum ein Ryzen 5000. Booten vielleicht ja. Aber ich wette drauf, dass es bei dir eben auch nicht stabil ist. Das lässt sich aber schnell mit einem AIDA Stresstest herausfinden. Stress cache only war da meine ich die passende Einstellung für. Das 1h laufen lassen.
Oder du guckst vorher schon mal in die WIndows Ereignisanzeige und suchst nach WHEA Fehlern.
Meist reicht auch der Cache Benchmark, da ploppen die 100er WHEA Pakete nur so rein :LOL:
 
Mit 16GB einfacher als mit 32GB. Als erstes GDM Off 2T. Am wichtigsten sind dann die Nebenspannungen RTTs und CADs. Wenn die nicht absolut sauber aufeinander abgestimmt sind, dann läufts nicht stabil. Das kann in Sisyphusafbeit ausarten.
Von 3800C16 auf 3800C15 1T brauchte ich 0,02v mehr Vdimm.
Mir gings um GDM off 1T. :fresse: GDM off 2T wäre zu GDM on "1T" ja ein Rückschritt.
Oder lohnt sich das ggf. trotzdem, wenn man dafür mit der CL auf 15 kommt? :hmm:
 
Meiner Erfahrung nach lohnt sich nativ 2T mit GDM off immer minimal ggü. GDM on mit Fake-1T - also auch bei gleicher CL. Die Unterschiede zugunsten nativ 2T GDM off sind aber marginal.
 
Zuletzt bearbeitet:
Da bin ich ganz bei mynx. Mit GDM laufen auch unsaubere Settings. Das ist halt der Vorteil von GDM On. Die 1T sind aber in Wirklichkeit eher 1.5T.
Ein stabiles GDM Off 2T hat zumindest in der Theorie eine bessere Latenz. Wir bewegen uns hier allerdings im Homöopathischen Bereich.

Mir gings um GDM off 1T
ja, nur ist es vom Vorgehen her mMn besser, erst einmal ein 2T auszuloten um eine Basis zu haben. Direkt mit 1T durchstarten wird sonst schnell frustrierend.

Am Ende sinds halt nur Nuancen. Mit 3800 C16 und vernüftigen Subtimings mit GDM ON hat man 98% rausgeholt.
 
Mir geht es natürlich nur um jeweils stabile Settings, alles andere ist ja Unsinn und nicht vergleichbar. Meine 3800/1900 C16 GDM on "1T" liefen 16h+ durch HCI.
Ich frage mich dann schon, wie GDM off 2T schneller als GDM on "1,5T" sein soll. :hmm:

Habs mal kurz nachgebencht.

GDM ON "1T" - Durchsatz etwas besser
cachemem.png




GDM OFF "2T" - Latenz etwas besser (der beste Lauf hatte sogar 58.5ns)
cachemem_gdmoff.png



Allerdings will meine Kombi GDM off auch mit 2T bei dem Takt einfach nicht (HCI wirft relativ flott Fehler). Also bleibts, wie es ist. :)
 
Zuletzt bearbeitet:
Bin jetzt doch wieder am rumspielen und ziehe es noch etwas strammer bzw. versuchs. :)
Eine Sache verstehe ich aber nicht. Scheinbar kann man mit M8E bei der tRCDWR viel weiter runter, als ich dachte, während es ja bei der tRCDRD die bekannte harte Wand gibt.
Wieso schaffen die ICs schreibend viel niedrigere Latenzen beim Wechsel von RAS to CAS? Und wieso nutzen die meisten Screenshots hier die Möglichkeit der dort niedrigeren Timings nicht?

Auch die alten Ramhasen wie @emissary42 und @Reous nicht. Gibt es hierfür einen Grund?
 
Hallo,

ich versuche mich aktuell das erste Mal an RAM OC und hab die untenstehenden Timings erreicht.

tCL und tRCDRD habe ich leider nicht weiter runterbekommen. Da ist wohl bei 16 bzw. 18 das Ende erreicht. Bei den ganzen sekundären und tertiären Timings bin ich mir komplett unsicher. Habt ihr ne Idee was ich da noch optimieren kann?

@MehlstaubtheCat: Danke für den Hinweis auf den Thread :)

5126A86A-7164-4627-A5EC-AF15999E04D4.png
 
Eine Sache verstehe ich aber nicht. Scheinbar kann man mit M8E bei der tRCDWR viel weiter runter, als ich dachte, während es ja bei der tRCDRD die bekannte harte Wand gibt.
Wieso schaffen die ICs schreibend viel niedrigere Latenzen beim Wechsel von RAS to CAS? Und wieso nutzen die meisten Screenshots hier die Möglichkeit der dort niedrigeren Timings nicht?
1. Weil es optisch dann nicht mehr schön aussieht :d
2. Weil es keinen Vorteil bringt. Wenn du deine Subs einigermaßen geschärft hast, dann bringt ein niedriger tRCDWR Wert in Games keinen Vorteil (CPU Limit). Je nach Spiel bringt es 1-2FPS mehr oder eben auch weniger als der normale Wert.

Ich habe in den letzten Wochen immer mal wieder etwas getestet was für Auswirkungen niedrige Timings haben bzw wie es sich auswirkt wenn man seine Timings "overtuned". Ergebnis ist eigentlich so wie ich es schon immer hier gesagt habe: Zu stark optimierte Timings haben einen negativen Effekt. Selbst der bisher auch von mir empfohlene Wert 4-6-16 (tRRDS/L + tFAW) ist nicht optimal. Dazu aber mehr wenn ich meine Tests abgeschlossen habe.

@Prax77
Das von mir oben geschriebene trifft im Prinzip auch auf dein Setting zu. Da gibt es nichts mehr zu optimieren bzw ist meiner Meinung nach sogar schon "overtuned".
 
Sorry hier nochmal richtig. Handy hat mich verarscht.

@Reous: Was meinst du genau mit overtuned? Sollte ich ggf. etwas entschärfen? Aktuell läuft es so stabil.

Im Benchmark komme ich damit aktuell auf Folgendes:

05939521-2151-4666-93F2-5AB7AD7A2D0F.png
 
Zuletzt bearbeitet:
Ich persönlich würde folgende Timings bei dir entschärfen:

tRCDWR und tRP auf 16
tWTRS auf 5
tWRTL auf 10

Den Rest kannst du für den Moment so lassen.
 
Selbst der bisher auch von mir empfohlene Wert 4-6-16 (tRRDS/L + tFAW) ist nicht optimal. Dazu aber mehr wenn ich meine Tests abgeschlossen habe.
da bin ich schon gespannt :)

vielleicht ist gerade das ein Vorteil von GDM OFF, hier wird "overtunen" wesentlich schwieriger als mit GDM ON?!
 
1. Weil es optisch dann nicht mehr schön aussieht :d
2. Weil es keinen Vorteil bringt. Wenn du deine Subs einigermaßen geschärft hast, dann bringt ein niedriger tRCDWR Wert in Games keinen Vorteil (CPU Limit). Je nach Spiel bringt es 1-2FPS mehr oder eben auch weniger als der normale Wert.

Ich habe in den letzten Wochen immer mal wieder etwas getestet was für Auswirkungen niedrige Timings haben bzw wie es sich auswirkt wenn man seine Timings "overtuned". Ergebnis ist eigentlich so wie ich es schon immer hier gesagt habe: Zu stark optimierte Timings haben einen negativen Effekt. Selbst der bisher auch von mir empfohlene Wert 4-6-16 (tRRDS/L + tFAW) ist nicht optimal. Dazu aber mehr wenn ich meine Tests abgeschlossen habe.

@Prax77
Das von mir oben geschriebene trifft im Prinzip auch auf dein Setting zu. Da gibt es nichts mehr zu optimieren bzw ist meiner Meinung nach sogar schon "overtuned".
Das es quasi keine messbare Leistung mehr bringt, dachte ich mir schon. Leistung zu verlieren wären aber blöd. :-[
Trifft das bei overtuned nur zu, wenn nicht mehr 100% stable oder auch so? Sieht man es nur in echten Anwendungen oder auch bei AIDA?
Aida legte schreibend etwas zu, durch "overtunen". :fresse:

Wenn du mir einen Benchmark nennst, wo man das gut testen kann, vergleich ich mal die jetzigen Werte mit den nicht ganz so scharfen Settings. :)
EDIT:
1,375Vdimm btw und tFAW 16 schaffte ich mit den edie auf Zen1 nie stabil, weshalb ich es auf dem Zen3 erst gar nicht versuchte. Hast du mit M8E oder S8B deine Tests gemacht? Nicht das es am Ende dann auftritt, wenn das Ergebnis eben nicht 100% stable ist und der IMC/IF im Hintergrund vereinzelt Fehler "abfängt".

cachemem_final.png


edie_final.jpg
 
Zuletzt bearbeitet:
Wenn du mir einen Benchmark nennst, wo man das gut testen kann
ich bin nicht Reous, aber anworte mal ;)
neben AIDA hab ich noch GeekBench3 (die 3er Version hat mehr Daten für RAM als die aktulle), den RAM Benchmark vom Ryzen Calculator und den Benchmark von Shadow of the toomb raider (ist in der kostenlosen Demo dabei) genutzt.
Es gibt sicherlich noch mehr.
 
Werde mit GB3 und dem Ram Calcu mal testen. Hier ist kein Steam drauf (WinToGo), weshalb Tomb Raider erst mal rausfällt. Ich lasse HCI aber noch etwas laufen, kommt also erst später. :)
tFAW 16 mit Zen3 teste ich dann auch noch kurz, sofern der Rechner es will und HCI nicht sofort Fehler wirft.
 
Ich habe echt vergessen wie viel Aufwand die Bencherei ist, wenn man anständige Ergebnisse will. :fresse: Respekt an Reous für die viele Arbeit, die er sich da macht. :)

Dennoch habe ich nun die tRCDWR isoliert getestet, 3 Läufe Geekbench, 3 Läufe Membench im DRAM Calculator.

Einziger Unterschied zwischen den Läufen ist tRCDWR 8 oder 16. Der Wert ist 100% stable und lief etwas über 16 Stunden durch HCI.
1636735153771.png



Ergebnisse wie folgt:


tRCDWR 8
Geekbench 3 Läufe gemittelt

Gesamtperformance:
Single: 6838,67
Multi: 63875

Speicherperformance:
Single: 8900,33
Multi: 9038


DRAM Calculator 3 Läufe gemittelt (Gesamtzeit)
105,05 Sekunden

########################################

tCDWR 16
Geekbench 3 Läufe gemittelt

Gesamtperformance:
Single: 6845,33
Multi: 63837

Speicherperformance:
Single: 8836,33
Multi: 9028,66

DRAM Calculator 3 Läufe gemittelt (Gesamtzeit)
106,08 Sekunden


Fazit für mich: tRDCWR niedriger = besser. Dass das nur Nuacen sind, ist/war klar, aber es ist eindeutig flotter.
Die Gesamtperformancewertung bei Geekbench kann man sich btw in die Haare schmieren, da ich die Cores nicht lockte und das Boostverhalten des Ryzen zu inkonsistent ist, um das zu vergleichen. Die Speicherperformance ließ sich aber 1a vergleichen.

Einzelergebnisse sind vorhanden. Falls gewünscht kann ich die Screenis hier hochladen + Geekbench links.
 
Zuletzt bearbeitet:
Bin von 2x16GB Micron E-Die auf 2x32GB Micron B-Die umgestiegen.

Mit dem E-Die Kit war mit dem Ryzen 5950X 3666 MHz ohne WHEA möglich, mit dem B-Die Kit sind jetzt plötzlich 3800 MHz ohne WHEA möglich. Und das E-Die Kit hatte 3733 MHz ohne WHEA mit dem 3950X geschafft. Dachte also es liegt am Speichercontroller von meinem 5950X. Aber nein, er kann mehr.

Nach ordentlichem Anziehen der Timings hatte ich extreme Probleme dabei, 100% stabile Settings zu finden, da ich u.a. bei 8909% Karhu den ersten Fehler bekommen hatte, die Isolierung hat also extrem viel Zeit gekostet.
Crucial 2x32GB-BLK2K32G32C 56.7 NS + ZenTimings + Karhu 8909 1 Errror.png
Letztendlich konnte ich nun tWR oder tRDWR als Übeltäter identifizieren, eine Erhöhung beider von 10 auf 11 hat es nun 100% stabil gemacht, bis 23788% Karhu getestet.
Crucial 2x32GB-BLK2K32G32C 56.7 NS + ZenTimings Stable - Karhu 23788 + Thaiphoon + CPU-Z zensi...png

tRTP + tWR/tRDWR werde ich noch versuchen etwas mehr anzuziehen.
Mit 3800 MHz CL15 und 56.7 ns Latenz mit 2x32GB Modulen bin ich auf jeden Fall schon mal sehr zufrieden.
 
Sehr geiles Ergebnis! (y)
Gehen M16B mit den Timings ja ne ganze Ecke weiter runter, als M8E. Dachte bisher sie wären ungefähr gleich, aber scheint ja nicht so. Vor allem t***SCL beides auf 2 find ich bei dem Takt sehr krass. [Gerade gesehen, ist für M16B ja echt normal. ^^]
Ich glaube, dass das bei mir nicht mal angehen würde mit M8E.
 
Zuletzt bearbeitet:
Wenn du mir einen Benchmark nennst, wo man das gut testen kann, vergleich ich mal die jetzigen Werte mit den nicht ganz so scharfen Settings.
Im Prinzip mit den Games, welche du auch verwendest. Dann entweder den vorhandenen In-Game Benchmark oder eben über zb. CapFrameX auswerten (CPU Limit natürlich). Glaube kaum, dass du RAM OC nur machst um ein gutes Geekbench oder Calc Ergebnis zu haben :d
 
Im Prinzip mit den Games, welche du auch verwendest. Dann entweder den vorhandenen In-Game Benchmark oder eben über zb. CapFrameX auswerten (CPU Limit natürlich). Glaube kaum, dass du RAM OC nur machst um ein gutes Geekbench oder Calc Ergebnis zu haben :d
Ich machs einfach aus Spaß - zählt das auch? :fresse:
CPU-OC bei Ryzen ist ja quasi tot, leider, daher widme ich mich halt dem Speicher. Klar, ich könnte mit CurveOptimizer den Ryzen noch "optimieren", aber OC an sich ist das ja nicht mehr und der Nutzen steht für mich in absolut keinem Verhältnis zum Aufwand. "Game-stable" mit "kurz antesten pro Core" ist einfach nicht meins. Das muss auch 12h laufen oder 24h ... oder eine Woche, vollkommen egal. Es muss einfach immer laufen, egal welche Last, egal ob es im Raum nun +5°C hat oder nicht und das pro Kern mit CO? Da brauchste ja locker nen Monat Testzeit für, für am Ende was? Minimal mehr Takt... Den gesparten Strom der Zukunft hat man während des Testens dann schon für 5Jahre+ im Voraus verbraten. :fresse:

Allein den Zen1 auf wirklich 100% stabile 3466 C14 zu bringen hatte, ich hatte ein KD302 dran, ungefähr 10€ Stromkosten verursacht. :fresse2: [ Da sind die 2 Prime runs für 3,8GHz allcore mit drin gewesen. ]

Mehrleistung beim Speicher nehme ich dankend mit, aber eher aus Spaß/Hobby heraus, als das ich die Mehrleistung nun bräuchte. Bessere min FPS sind natürlich immer gut. Nur langsamer sollte es halt nicht werden. :)
Wobei ich den sweet-spot mag, weshalb ich die 4000/2000 auch verworfen habe. Knüppel drauf für die letzten Prozent war noch nie mein Ding.
 
Zuletzt bearbeitet:
So, die Optimierung meines 16Gbit Micron B-Die Kits ist nun abgeschlossen. Schlussendlich habe ich noch 0.1ns rauskitzen können, somit nun 56.6ns Latenz.
Crucial 2x32GB-BLK2K32G32C 56.6 NS + ZenTimings  + Karhu 10949 Stable.png

Ein paar Anmerkungen:
  • In mehreren "Quellen" habe ich gelesen, dass tRAS mindestens tCL + tRCDRD sein muss und darunter dann der Speichercontroller den Wert entscheidet, also sinnlos. Es hat sich herausgestellt, dass diese Annahme auf einer Fehlinterpretationen eines Diagramms in dem JEDEC 79-4B Standard basiert. Das tatsächliche Limit für tRAS ist tRTP + tRCDRD. Das kann ich auch so bestätigen, da nach drei maligen Testen die Latenz minimal 56.7ns mit tRAS 33 (tCL 15 + tRCDRD 18) und 56.6ns mit tRAS 26 (tRTP 8 + tRCDRD 18) ist.
  • Für die Karhu Fehler im Bereich 5000-9000% konnte ich nun alleinig tWR ausfindig machen, was ich von 10 auf 11 erhöhen musste. Bei sehr später Karhu Instabilität mit Micron B-Die also am besten mal tWR unter die Lupe nehmen.
  • tRTP kann ich auf 6 senken, aber alles unter 8 sorgt für schlechtere Latenz
  • tWRWRDD kann ich auf 2 senken, aber alles unter 3 sorgt für schlechtere Latenz
  • tRRDS und tRRDL kann ich auf 5 senken, aber alles unter 7 sorgt für Karhu Instabilität je nach Wert ab 500%-3000%
 
@GamingWiidesire
Wenn du tRRDS nicht weiter senken kannst, dann solltest du wenigstens tFAW noch anpassen. Dieser sollte nicht kleiner sein als 4x tRRDS
 
Habs versucht, habe aber mit tFAW 28 ~1ns höhere Latenz. Ich werde es jetzt einfach bei 16 belassen, funktioniert perfekt. Gerade nochmal die alten Timings von meinem Micron E-Die Kit angesehen, dort hatte ich tRRDS 6 und tFAW 20.

Ich hab mir eine Primärquelle von AMD angesehen, bei der die 4x tRRDS als minimum für tFAW angegeben wird (https://web.archive.org/web/2020042.../2017/05/25/community-update-4-lets-talk-dram), allerdings habe ich noch keine Erklärung gefunden, was genau passiert, wenn man es darunter setzt.
The first parameter is the row-to-row activation delay (tRRD) that specifies the minimum waiting time between two subsequent ACTIVATE commands within a DRAM device. The second is called the four activate window (tFAW) that defines the length of a rolling window during which a maximum of four ACTIVATEs can be in progress.

Für mich klingt es so aus diesem Paper so, dass es keine Pflicht ist, tFAW auf mindestens 4x tRRDS zu setzen, sondern das lediglich die energiesparsamste Variante ist.
Because a refresh operation requires activating rows to restore charge in DRAM cells [...]
Wenn also tRRD auf "7" ist und das die Zeit zwischen zwei ACTIVATE commands bestimmt und dieser ACTIVATE command selbst auch nochmal etwas Zeit benötigt, dann können in einem tFAW 16 WINDOW nur zwei ACTIVATE commands statt der maximal möglichen vier ausgeführt werden. D.h. aber nicht, dass es zu einem Performanceverlust kommt und auch nicht dass es zu keinem Performancegewinn kommen kann.

Falls jemand mehr weiß, gerne teilen.
 
I have a tRC 59 - tRP 16 = 43 tRAS ? really
Normally i was thinking that 2xCL is tRAS 16x2=32
 
i also went by that rule (15-15-15-15-30-45)
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh