Nein du scheinst einfach nicht zu verstehen, dass bei KBL bei Datengrößen > 8 MB der L3 Cache überläuft und die Daten in den Ram geschoben werden.
Das ist bei Ryzen EXAKT GENAUSO!
Ryzen hat das doppelte an L3-Cache und trotzdem sinken die Transferraten und die Latenzen schlagen aus, sobald zwischen den CCX kommuniziert werden muss, auch mit Datengrößen < 16 MB, welche nicht in den Ram ausgelagert werden müssen. Was jetzt KBL oder auch Broadwell aber deutlich von Ryzen unterscheidet ist, dass bei denen die Datenrate nicht so drastisch einbricht wie bei Ryzen. Bei Ryzen sinkt sie sogar unter die Datenrate vom Ram!
Erstens, nein, mit vergleichbarem RAM sind dessen Latenz und Transferraten bei Ryzen grundsätzlich nicht schlechter als bei Kaby. Das wurde ja nun mittlerweile auch von diversen Tests gezeigt. Und zweitens, weise doch erstmal nach, dass es so viel Kerntransfer zwischen den CCX gibt, dass das Infinity Fabric zum Flaschenhals wird. Solange du das nicht kannst, bleibt es nur leeres Gerede. Fakt ist, es wurden mittlerweile von mehreren Seiten auch Spiele mit unterschiedlichen CCX Konfigurationen getestet. Bis auf ein bis zwei kleinere Ausreisser, übrigens in beide Richtungen, gab es da keine Unterschiede. Ergo, das CCX Design hat auch auf Spiele keine relevanten negativen Auswirkungen. Dementsprechend haben das Latenz und Bandbreite auch nicht.
Wieso profitiert denn Ryzen so stark von schnellerem Ram?
Jeder Prozessor profitiert von schnellerem RAM, wenn die Datenmengen so gross werden, dass sie nicht konstant im L3 gehalten werden können. Da ist Ryzen keine Ausnahme und hat auch nichts speziell mit dem CCX zu tun. Das einzig spezielle am Ryzen ist, dass er keinen unified shared L3 besitzt, sondern zwei den CCX dedizierten L3. Das macht ihn aber nicht per se langsamer. Bis 8 MB gibt's da keinen nennenswerten Unterschied. Und oberhalb ist der Unterschied in der Praxis gering. Für AMD auf jeden Fall die richtige Entscheidung, diesen minimalen Nachteil in Kauf zu nehmen, dafür aber mehrere Designs zu vereinfachen und schneller auf den Markt bringen zu können, bei geringeren Kosten und damit für uns zu attraktiveren Preisen.
Ne, ich habe mich einfach nur ein bisschen über den schwachsinnigen Vergleich lustig gemacht
Daran war aber nichts schwachsinnig.
Und btw. die Aussage die du getroffen hast, war das eine Art Selbstreflexion
Falls das eine Frage werden sollte, nein.
Ich meinte damit, dass die Software allgemein deutlich kleiner war und nicht so viele Daten über Threads austauschen musste wie heutzutage, wo Software riesiger und komplexer ist. Heutzutage arbeitet Software mit größeren Datengrößen als damals.
Der letzte Satz ist richtig. Nur ist das nebensächlich für Kernkommunikation. Synchronisierungsobjekte, die Kernkommunikation erfordern, egal ob OS-spezifisch oder selbstgeschriebene, haben sich kaum verändert.
Wie selber verstehst du keine Ironie?
Keine Sorge, ich habe die Ironie schon verstanden. Das ändert an meiner Antwort trotzdem nichts.
Ja es gibt noch Optimierungsmöglichkeiten bei der Software, ich habe nicht gesagt das es überhaupt keine gibt
Genauso klang es aber. Aber dann sind wir uns ja zumindest einig. Ein Programmierer kann sehr wohl dem Compiler dabei helfen, noch besser zu optimieren. Und das wird auch immer so bleiben. Alleine schon deswegen, da ein statischer Compiler keine Laufzeitdynamik kennt.
Aber du gehst davon aus ...
Ich gehe davon aus, dass die Möglichkeit besteht, dass es nicht stimmt was da steht. Ob jetzt absichtlich was falsches gesagt wurde oder es einfach nur Unwissenheit ist, war gar nicht mein Thema. Such dir also jemand anderen, dem du Worte in den Mund legen kannst, die nie gesagt wurden. Alle weiteren Unsachlichkeiten kannst du dir genauso sparen.
Ich möchte mal darauf hinweisen dass das ein Intel Thread und kein AMD Thread Wunschkonzert Thread ist.
Deshalb habe ich meine Antworten sogar in Spoiler-Tags gesetzt. Wenn du das nicht für notwendig hältst und den Thread weiter mit falschen Behauptungen und Unsachlichkeiten offen zuspammen möchtest, dann mache nicht mich dafür verantwortlich.
Na dann messe doch selbst wie hoch der Performanceabfall ist wenn über die Infinity Fabric kommuniziert werden muss.
Das kostet da teilweise 20% (Battlefield1) und da ist noch nicht mal der doppelte Cache mit rausgerechnet.
Nein, das kostet im Schnitt keine Performance. Die meisten Spiele verhalten sich gleich, egal ob zB mit 2+2 oder 4+0 Konfiguration. Es gibt Beispiele, da werden mit einer 2+2 Konfiguration sogar mehr FPS gemessen, zB in Dota 2. Was sagt uns das? Richtig, solche Ausreisser haben nichts mit der höheren Latenz und/oder der niedrigeren Bandbreite zwischen den CCX im Vergleich zum L3 zu tun. Die Ursachen dafür müssen woanders zu suchen sein. Wer diese logische Schlussfolgerung nicht einsehen will, der ist schlichtweg nicht objektiv bei diesem Thema. Typischer Fall von festgefahrener Meinungsbildung aufgrund von Halbwissen und dem Kursieren von oberflächlichen Behauptungen im Netz.
Ich rede vom 6900k vs 1800x, falls es dir nicht auffällt.
Und so ein Verhalten ist völlig normal da weiter entfernte L3 Segmente die Daten etwas langsamer liefern.
Dass darf aber niemals so stark nach oben gehen wie be Ryzen vom Sprung auf 4mb zu 8mb, da liegt nocht einiges im Argen.
Beim Ryzen geht von 4 auf 8 MB nichts stark nach oben. Nach oben geht es erst ab der Grösse des direkt angebundenen L3 Caches. Wie bei Intel auch. Egal ob Kaby, BDW-E oder was auch immer. Im Fall von Ryzen beträgt diese Schwelle 8 MB. Da liegt also nichts im Argen. Das wünschst du dir nur.
Aber nicht bei bereits deutlich weniger als der Hälfte an L3 Cache.
Ist bei Ryzen ja auch nicht anders.
Die Infinity Fabric limitiert hier massiv und das kostet AMD Konkurrenzfähigkeit und Leistung..
Falsch. Infinity Fabric limitiert hier nichts und ist für die kommende Zeit ein grosser Pluspunkt von AMD. Vega und Raven Ridge werden die nächsten Vertreter. IF ermöglicht komplett kohärente Systeme. Aber davon scheinst du nichts zu verstehen und willst es auch nicht. Diskussion daher zwecklos.
Und sogar innerhalb eines CCX stimmt die Cache Latenz nicht.
Sie ist, bezogen auf den L3, niedriger als bei Intel. Wie viel stimmiger soll es denn sonst noch werden?
Ja das stimmt, ich habe mich überall vertan.
Hab das mal für dich korrigiert. So stimmt es.
Ich weiß natürlich dass es ein Victim Cache ist
Ja, jetzt.
Wie war das nochmal mit dem windenden Aal bei seinen letzten Zuckungen? Schon lustig, was du dir hier alles zusammenphantasierst. Was einem nicht passt, wird einfach ignoriert. Ich zeige dir zB klare Belege dafür, dass Ryzen bis 8 MB keinen signifikanten L3 Latenzanstieg zeigt, du behauptest trotzdem weiterhin stur das Gegenteil. Hier nochmal in Zahlen:
Code:
...
512 K 17 1
1 M 29 12 + 23 (L3)
2 M 35 6
4 M 37 2
8 M 39 + 5 ns 2 + 5 ns
16 M 40 + 48 ns 1 + 43 ns + 90 ns (RAM)
...
Wer nicht auf beiden Augen blind ist, sieht den deutlichen Latenzanstieg erst oberhalb der 8 MB.
Und das legt nur einen Schluss nahe. Du willst gar nicht sachlich und objektiv diskutieren und Gegenargumente akzeptieren oder zumindest darauf eingehen. Du willst nur Ryzen irgendwas negatives andichten, teils mit erfundenen und schlichtweg falschen Behauptungen. Über Motive kann sich jeder seine eigene Meinung bilden. Die dürften aber nicht schwer zu erraten sein. Jede weitere Diskussion mit dir führt daher zu nichts. Kannst dir also weitere Antworten sparen. Du kommst auf Ignore.