Bei Tests mit meinem Gigabyte K8NXP SLi Mainboard (nForce4 SLi Chipsatz) sind folgende Resultate entstanden.
Bekanntermaßen besitzt der A64 den Memory-Controller auf der CPU und dieser arbeitet hochgradig effizient. Im DualChannel Betrieb mit gut 6-8 GB/s Speicherbandbreite habe ich ein Verhalten in SiSoft Sandra festgestellt, welches klar zeigt, daß in diesen gigantischen Bandbreiten-Regionen der Speicher kein Flaschenhals mehr ist, sondern dessen Nutzung alleinig von der Leistung der CPU abhängt.
Wovon rede ich? Hier drei Screenshots:
200 MHz 2.0-2-2-5 1T mit /11 Teiler
200 MHz 2.0-2-2-5 1T mit /10 Teiler
200 MHz 2.0-2-2-5 1T mit /9 Teiler
Trotz 100% identischer Systemeinstellung von Timings (2.0-2-2-5 1T), LDT-Multi (x5), CPU (2200 MHz) und Referenztakt (200 MHz) unterscheidet sich die Effizienz erheblich! Erreicht man mit 11er Multi noch 93% Speichereffizienz, so sind es bei 10er Multi 88% und bei 9er Multi nur noch 83%. Dieses Verhalten besteht auch bei höheren Speichertakten.
Die Ursache hierfür ist, daß die CPU bei 1800 MHz (9x200) einfach viel zu langsam ist, um die gebotene Speicherbandbreite im DualChannel effizient auszunutzen. Selbst bei 2200 MHz ist man noch 7% vom Optimum entfernt. Ich schätze, erst mit 12.0 oder gar 13.0 Multi erreicht man hier vermutlich eine Traum-Effizienz von 97-98% (100% ist bekanntermaßen nur theoretischer Maximalfall).
Im Single-Channel Modus (ca. 3000 MB/s) tritt dieses Verhalten nur in viel schwächerem Maße auf (schwankt nur zwischen 90-94% bei Multi /9 /10 /11). Hier ist die CPU in allen Fällen schnell genug, um den Speicher effizient auszulasten. Im DualChannel ändert sich die Lage wie erwähnt erheblich.
Bei der Verwendung eines Speicherteilers größer als dem CPU-Multiplikator sieht die Sache natürlich wieder anders aus: hier wird der Speicher ja "eingebremst", so daß man auch bei kleineren Multiplikatoren eine hohe Speichereffizienz erreichen kann. (Also z.B. 10x240 MHz mit DDR333 Teiler gibt bekanntlich einen /12 Teiler für den Speicher, so daß bei 2400 MHz dann 200 MHz am Speicher anliegen. Mit 2400 MHz ist die CPU aber so schnell, daß sie die 200 MHz Speichertakt sicherlich mit ~95% Effizienz nutzen kann.)
Fazit: DualChannel ist also in der Lage, deutlich mehr Daten zu liefern, als die CPU bei niedrigen Taktfrequenzen überhaupt verarbeiten kann. Taktet man Speicher und Referenztakt identisch, entscheidet der CPU-Multiplikator über Bandbreite und Speichereffizienz. Das heißt, mit kleinen CPU's à la 3000+ und nur 9.0 Multiplikator wird man wohl im 1:1 Betrieb (d.h. CPU-Multiplikator=RAM-Teiler) nie Effizienzen von 85% oder mehr erreichen.
Insbesondere bei den vielen OC-Screenshots von SiSoft Sandra sollte also in Zukunft immer der CPU-Multiplikator mitbeachtet werden, um Bandbreiten von 8000 MB/s und mehr sinnvoll einordnen zu können. Ein 1:1 Vergleich kann nur bei gleichem CPU-Multiplikator und gleichem DDRxxx Speicherteiler erfolgen.