L2 Cache des A64 wirklich so langsam?

m_tree

Semiprofi
Thread Starter
Mitglied seit
04.02.2005
Beiträge
3.037
Ort
Herzogenaurach
Hatte von früher noch so in Erinnerung, dass ich bei meinem alten P4 bei memtest viel höhere L2 Cache Bandbreiten hatte. Jetzt wollte ichs nochmal wissen und hab memtest86+ @v1.55 auf dem P4 (Northwood-B @2,8GHz) und memtest86+ 1.6 auf dem A64 (siehe Sig) gestartet. Level1 Cache war fast identisch (23GB/s), aber beim L2 Cache gibts ne enorme Differenz: P4 irgendwas mit 19,600MB/s und A64 was mit 5,700MB/s!

Ist das einfach nur ein Auslesefehler von memtest oder ist der Cache wirklich so langsam? Zieht das nicht irgendwelche Nachteile mit sich?

Ne Antwort wär cool :)
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Hi!
Ich denke mal, das hat was mit der Architektur der beiden Chips zu tun. Die ist eben grundverschieden und kann so nicht verglichen werden... Sorgen würde ich mir da jetzt nicht unbedingt machen. Der Unterschied ist allerdings gewaltig, finde ich. Allerdings weiß ich zu wenig über die Architektur der einzelnen Chips, aber ich denke daran liegts.
cu
 
Ja, ist schon klar, dass es zwei völlig andere Chips sind. Es könnte ja aber auch sein, dass memtest einfach Fehler ausliest. Der verhältnismäßige Faktor der beiden Bandbreiten ist ~3,44 - also echt gewaltig.

Das eigenartige ist eben, dass der A64 dem P4 trotzdem in nichts nach steht - bei gleichem (realen) Takt sogar massiv im Gegenteil. :d

Btw: Ein niedriger getakteter A64 bringt dann ja auch noch weniger .. hab nene Screen von nem Winnie @2,5Ghz gesehen und es stand irgendwas mit 4600 da. :hmm:
 
Dein Opteron hat 1MB L2-Cache, damit soll Memtest nicht ganz klarkommen.
 
Auch bei 512kB Caches sind die Bandbreiten so niedrig. Habe ja gesagt, was ich auf dem Screen mit dem Winnie gesehen habe.

Oder hast du zufällig nen K8 mit 512kB L2 Cache, der wesentlich höhere Bandbreiten bringt?
 
mir ist nicht klar wie memtest auch solche komischen "benchmark" ergebnisse kommt... damals hatte mein xp-m mehr speichergeschwindigkeit als theoretisch möglich war..
 
Ich glaube sowieso nicht, dass das Benchmarks sind, sondern nur theoretische Werte. So schnell wie memtest startet .. kann mir nicht vorstellen, dass es in den paar Zehntel Sekunden L1, L2 Cache und Speicher "benchmarken" kann. :hmm:
 
Ich glaub das liegt an den verschiedenen L1/L2-Cache Architekturen:

Der P4 hat nen inklusiven cache => hohe Performance des L2-Cache, aber nutzbarer Cache geringer ,komplizierter im Aufbau und Cachegröße lässt sich nicht ohne weiteres ändern

A64 mit exklusiven Cache => Cache kann ohne großen Aufwand vergrößert werden und nutzbare Cachegröße ist höher, aber eben geringere Performance des L2-Caches
 
Hat der K8 wirklich nen externen L2 Cache? Wusste ich garnicht. Ne Quellenangabe wäre ganz nett .. ;)
 
m_tree schrieb:
Hat der K8 wirklich nen externen L2 Cache? Wusste ich garnicht. Ne Quellenangabe wäre ganz nett .. ;)
Öhm.... Er schrieb "exklusiv", nicht "extern". Es geht da mehr um logische Organisation als um physische Anordnung. ;)
 
Nicht vergessen dass der L2 jeweils mit dem CPU Takt betrieben wird, der ist beim P4 ja höher.

Bei mir sagt Memtest 86+ 23GB/s
 
X909 schrieb:
Nicht vergessen dass der L2 jeweils mit dem CPU Takt betrieben wird, der ist beim P4 ja höher.

Bei mir sagt Memtest 86+ 23GB/s
Hmm, etwas genauer lesen könnte hilfreich sein. Der getestete P4 lief in etwa mit dem gleichen Takt wie der A64, und zwar 2,8GHz - habe ich auch so im ersten Post geschrieben. Dass der Level1 Cache bei beiden um die 23GB/s schnell ist hab ich auch schon geschrieben. Es geht hier aber um den L2 Cache.

Und selbst wenn man nen 3000+ mit nem 3GHz P4 vergleichen würde, wäre der Faktor nicht 3,4x, sondern was bei 1,6 aufwärts.

@Powersurge
Achso .. ja,w ar heute früh wohl dann etwas zu müde. Verstehe jetzt was du meinst. ;)
 
Zuletzt bearbeitet:
m_tree schrieb:
Hmm, etwas genauer lesen könnte hilfreich sein. Der getestete P4 lief in etwa mit dem gleichen Takt wie der A64, und zwar 2,8GHz - habe ich auch so im ersten Post geschrieben. Dass der Level1 Cache bei beiden um die 23GB/s schnell ist hab ich auch schon geschrieben. Es geht hier aber um den L2 Cache.

Und selbst wenn man nen 3000+ mit nem 3GHz P4 vergleichen würde, wäre der Faktor nicht 3,4x, sondern was bei 1,6 aufwärts.

@Powersurge
Achso .. ja,w ar heute früh wohl dann etwas zu müde. Verstehe jetzt was du meinst. ;)

Ich rede vom L2.....
 
OK, nehmen wir an dein P4 wäre beim L2 Benchmark wirklich schneller, wäre aber völlig unrelevant, weil ---> zeig mir einen Test wo dein Opteron irgendeinen P4 nicht um Längen schlägt?


:bigok:
 
Super schrieb:
OK, nehmen wir an dein P4 wäre beim L2 Benchmark wirklich schneller, wäre aber völlig unrelevant, weil ---> zeig mir einen Test wo dein Opteron irgendeinen P4 nicht um Längen schlägt?
Eben genau davon redete ich auch .. aber der Bericht von cpuid.com ist schon gut .. da sieht man auch die realen Bandbreiten. Die memtest ANgaben sind schon irgendwie fürn Ar*** .. :hmm:
 
Super schrieb:
OK, nehmen wir an dein P4 wäre beim L2 Benchmark wirklich schneller, wäre aber völlig unrelevant, weil ---> zeig mir einen Test wo dein Opteron irgendeinen P4 nicht um Längen schlägt?


:bigok:

Gehts hier um die Anwendungsperformance? Es geht um den Durchsatz des L2 Cachs und um nichts anderes.

P.S. Seti@home
 
X909 schrieb:
Gehts hier um die Anwendungsperformance? Es geht um den Durchsatz des L2 Cachs und um nichts anderes.

P.S. Seti@home

Ich hab auch m_tree direkt angesprochen, und auch nur ihn!
 
Achso :)

Ich werd jetzt mal nen Sandra Cache/Mem Benchmark machen. Mal sehen was der sagt.

Sandra 2005 bringt schon ganz andere Werte ;)

L1 35 - 37 GB/s
L2 26 - 28 GB/s

Hier scheint die Latenz eine entscheidende Rolle zu spielen. Kann das mal jemand mit einem A64 testen?
 
Zuletzt bearbeitet von einem Moderator:
@ X909

Bitte die Editfunktion verwenden und Doppelposts vermeiden, danke.
 
Ja, hab eben meinen gebencht. Also maximal hab ich knapp 21GB/s mit nem 2kB Block. Bei 1MB bringt er noch 11GB/s.

Sandra ist da schon besser in der Hinsicht. Gefällt mir :)

Und trotzdem hat ein ganz stinknormaler P4 schon höhere Bandbreiten als mein FX-57 (theoretisch :bigok: ). Aber ein P-M hat auch net viel höhere Bandbreiten als ein A64. Ich glaub einfach, dass der P4 in der Hinsicht unnötig leistungsfähig ist. :rolleyes:
 
Nicht unnötig, sondern nötig. Der P4 ist im Falle einer falschen oder nicht erfolgten Sprungvorhersage darauf angewiesen, die Pipeline wieder schnellstmöglich zu füllen. Daher sind die schnellen Caches erforderlich.

Was sagt der Test bei dir für den RAM (die letzen 2-4 Werte)?
 
X909 schrieb:
Nicht unnötig, sondern nötig. Der P4 ist im Falle einer falschen oder nicht erfolgten Sprungvorhersage darauf angewiesen, die Pipeline wieder schnellstmöglich zu füllen. Daher sind die schnellen Caches erforderlich.
Und warum soll das nur beim P4 so sein? Weil er so ne lange Pipeline hat?

Na ja kann schon sein .. dadurch, dass P-M und K8 nicht so ne lange Pipeline haben, brauchen sie dann auch net so nen schnellen L2 Cache. :hmm:

X909 schrieb:
Was sagt der Test bei dir für den RAM (die letzen 2-4 Werte)?
Hab mal nen Screenshot gemacht:

18973sandra_bench.jpg
 
Das Cachedesign von Netburst ist auf Geschwindigkeit ausgelegt. Beim P-M bzw. A64 vielleicht mehr auf Effektivität. Das sieht man am kleinen L1 des P4 bzw. exklusiv vs. inklusiv.

Hier mal meine Grafik:

memorysubs.jpg


Das interessante dabei ist, dass der L1/L2 der Extreme Edition trotz des geringeren Taktes schneller ist als bei meiner CPU. Da sieht man dass der L1/L2 beim Prescott vergrößert wurden - damit musste ja auch die Latenz erhöht werden.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh