w0mbat
Enthusiast
Thread Starter
- Mitglied seit
- 12.02.2006
- Beiträge
- 7.108
- Prozessor
- AMD Ryzen 7 5800X3D
- Mainboard
- MSI MAG B550M Mortar Max WIFI
- Kühler
- NZXT Kraken X63
- Speicher
- G.SKILL F4-3600C17D-32GTZR
- Grafikprozessor
- XFX Speedster QICK 319 Radeon RX 6800 BLACK
- Display
- LG 34UC79G-B
- SSD
- 2TB WD_BLACK SN850X | 2TB Samsung 970 EVO Plus
- Soundkarte
- Realtek ALC1220
- Gehäuse
- Lian Li O11 Dynamic Mini
- Netzteil
- Corsair SF750 Platinum
- Keyboard
- CM QuickFire Rapid-i
- Mouse
- Logitech G Pro X Superlight 2
- Betriebssystem
- Windows 11 Pro x64
- Webbrowser
- Firefox
- Sonstiges
- Sennheiser PC37X
Offizieller AMD Barcelona (K10) *Sammel- & Infothread*
Heute, am 10. September 2007, hat AMD die 3. Generation ihrer AMD Opteron Serverprozessoren, mit dem Codenamen Barcelona, vorgestellt. Der Barcelona basiert auf einer neuen und verbesserten K8-Architektur, dem K10. Der K10 (auch AMD 10h-Family genannt) ist ein x86 Prozessor welcher auch x86-64 (64 Bit) unterstützt. Zudem ist der Barcelona (K10) der erste native Quad-core, d.h. alle vier Kerne der CPU sind auf einem einzigen Die.
Für die neue AMD Opteron-Generation hat AMD auch ein neues Logo präsentiert:
Der AMD Opteron ist eine Server- & Workstation CPU, setzt auf den Sockel F+ (1207), unterstützt je nach Variante bis zu zwei (AMD Opteron 23xx) oder mehr CPUs (AMD Opteron 83xx) auf einem Mainboard und nutzt reg. DDR2-667. Folgende Varianten sind ab heute verfügbar:
AMD Opteron 2000-Serie
AMD Opteron 2350 - 2,0GHz - 75W - $389
AMD Opteron 2347 HE - 1,9GHz - 55W - $377
AMD Opteron 2347 - 1,9GHz - 75W - $316
AMD Opteron 2346 HE - 1,8GHz - 55W - $255
AMD Opteron 2344 HE - 1,7GHz - 55W - $209
AMD Opteron 8000-Serie
AMD Opteron 8350 - 2,0GHz - 75W - $1019
AMD Opteron 8347 HE - 1,9GHz - 55W - $873
AMD Opteron 8347 - 1,9GHz - 75W - $786
AMD Opteron 8346 HE - 1,8GHz - 55W - $698
Die AMD Opteron CPUs aus der 8000-Serie sind deutlich teurer, da sie auch auf >2-Sockel Systemen eingesetzt werden können. Später in diesem Jahr sollen weitere, höher getaktete, Opterons auf den Markt kommen.
Architekturveränderungen am Barcelona (K10) gegenüber dem K8
Die Änderung, die einem wohl als erste auffällt, sind die vier Kerne, die der K10 besitzt (bezieht sich natürlich nicht auf die K10 Dual-cores). Dazu hat AMD aber nicht einfach zwei Dual-cores zusammen gepackt, sondern ein natives Quad-core Design entworfen, damit die Kerne untereinander ohne Behinderungen und auf direktem Wegen kommunizieren können. So skalieren die Kerne besser und man kann Flaschenhälse umgehen - im Gegenzug muss man aber eine teurere und komplizierte Fertigung/Entwicklung in Kauf nehmen. Der K10 ist aber nicht einfach nur ein K8 Quad-core (was bei dem früheren Codenamen K8L möglich erscheint), sondern es wurden an vielen Stellen Verbesserungen vorgenommen, die Wichtigsten werde ich hier aufführen:
Neue Cache-Struktur
Der K8 besitzt 128Kb L1-Cache (64Kb Data + 64Kb Inst.) und je nach Kern 512Kb oder 1024Kb L2-Cache. Ein K8 Dual-core hat logischer Weise doppelt so viel Cache. Der K10 hat beim Cache einige Veränderungen erfahren. Der L1-Cache ist mit 128Kb gleich groß geblieben, jetzt aber mit 256Bit angebunden (K8: 128Bit), was den Datenaustausch zwischen L1-Cache und Kern beschleunigt. Der L2-Cache beträgt beim K10 bei allen Versionen 512Kb pro Kern, es wurden also Versionen mit 1024Kb L2-Cache abgeschafft. Neu eingeführt wurde beim K10 ein L3-Cache, welcher bei allen Versionen 2048Kb groß ist. Das besondere an diesem L3-Cache ist, daß alle Kerne auf ihn zugreifen können, er also nicht wie L1- & L2-Cache exklusiv ist. Das soll den Austausch zwischen den Kernen steigern und somit die Multithreadingperformance erhöhen. Aber auch bei Anwendungen die "nur" einen Kern nutzen ist der L3-Cache nützlich, da er in diesem Fall nur von einem Kern genutzt wird, womit diesem ein größere Cache zur Verfügung steht.
Anmerkung zum L3-Cache von grover
Was noch erwähnt werden sollte, ist das der L3 Cache vom K10 ein Spill Cache ist und keine direkte Rolle im Speicherzugriff spielt. Der L3 enthält nicht zwingend alles was je aus dem RAM gelesen wurde, sondern nur die Sachen die aus einem L2 rausfallen. Theoretisch kann der K10 seine Speicherzugriffe dadurch optimieren, in dem parallel auf den RAM und den L3 Cache zugegriffen wird und d.h. nicht zwingend auf den RAM gewartet werden muss, wenn das Datenwort schon im L3 liegt. Andererseits bedeutet dies, das RAM-Lesezugriffe immer direkt in den L2 geladen werden (und damit nicht in den L3 geladen werden.)
Es ist also keine gewöhnliche Cache-Hierarchie.
Speicherkontroller (MC)
Der K10 besitzt, wie der K8, einen in der CPU integrierten Speicherkontroller, der die Zugriffe auf den Arbeitsspeicher (RAM) regelt. Der Barcelona unterstützt aktuell reg. DDR2 RAM mit einer maximalen Geschwindigkeit von 667MHz, der Phenom soll bis zu 1066MHz schnellen DDR2 nutzen können. Im K10 soll dessen Effizienz gesteigert worden sein.
SSE-128
Der K10 unterstützt nun 128Bit SSE, d.h. die FPU-/SSE-Einheiten sind nun 128Bit breit (K8: 64Bit). Der K10 braucht also weniger Zeit, um SSE-Instruktionen auszuführen (was z.B. in Spielen mehr Performance bringt). So wird die SSE-Performance des K10, im Vergleich zum K8, theoretisch verdoppelt, wenn man die doppelte Anzahl der Kerne einbezieht hat ein K10 Quad-core sogar die 4x SSE-Performance (bei gleichem Takt) wie ein K8 Dual-core.
Performance pro Watt
AMD legt bei der K10-Architektur nicht nur Wert auf die Performance pro MHz, sondern auch auf die Performance pro Watt. D.h. der K10 soll bei möglichst niedrigem Energieverbrauch möglichst viel Leistung bringen. Dazu wurde z.B. das Herstellungsverfahren verbessert. Ein 1,9GHz Barcelona mit einem 55W ACP hat also einen Verbrauch von unter 14W pro Kern. Mit besseren Steppings wird der Verbrauch weiter fallen.
Zudem wurde noch viel im Detail verbessert, bei dem meine Kenntnisse aber nicht ausreichen um dies darzustellen.
Der K10 wird im 65nm SOI Verfahren hergestellt und hat als Quad-core über 460 Millionen Transistoren.
Leistung des Barcelonas (K10) gegenüber dem K8 und dem Core2
Der Barcelona hat, wie jede CPU, seine Stärken und seine Schwächen. Nach den aktuell bekannten Benchmarks ist der Barcelona im Mittel 15-20% schneller pro MHz als der K8 und befindet sich etwa auf dem Performanceniveau der Intel Core2-Architektur (Conroe/Kentsfield). D.h. bei gleichem Takt ist ein Barcelona im Mittel gleich schnell wie ein Intel Xeon Quad-core. Nun gibt es Bsp. bei denen selbst ein 1,86GHz Xeon einen 2GHz Barcelona deutlich schlägt, wie auch Bsp. bei denen ein 2GHz Barcelona einen 3GHz Xeon abhängt. Um eine genaue und detaillierte Perfromanceanalyse zu bekommen, müssen wir aber noch auf ausführlichere Tests warten.
Einige Benchmarkbsp.
Wie man sieht kann sich der Barcelona (K10) in einigen Benches vor den höher getakteten Xeon E5345, einmal sogar vor den X5365 setzen. In anderen benches sind beide Intel Quad-cores vor dem Barcelona, was bei dessen niedrigem Takt aber auch nicht verwunderlich ist. Solange AMD also keine höher getakteten CPUs auf Basis des K10 auf den Markt bringt wird Intel durch den höheren Takt die Performancekrone behalten können. Zwar kann sich der 2GHz K10 in einigen Fällen sogar vor einen 3GHz Xeon Quad-core setzten, das sind aber nur Spezialfälle, die es bei Intel ebenso gibt.
Verglichen wurden hier:
zwei Xeon 5160 Dual-cores 3,0GHz (insg. 4 Kerne)
zwei Xeon E5345 Quad-cores 2,33GHz (insg. 8 Kerne)
zwei Xeon X5365 Quad-cores 3,0GHz (insg. 8 Kerne)
zwei Opteron 2220 Dual-cores 2,8GHz (insg. 4 Kerne)
zwei Opteron 8350 Quad-cores 2,0GHz (insg. 8 Kerne, Barcelona)
Wird der Phenom schneller als der Barcelona?
Der Phenom basiert auf genau der gleichen Architektur wie der Barcelona, große Verbesserungen kann man also nicht erwarten. Aber etwas an Performance wird der Phenom gewinnen könne, da er auch mit schnellerem RAM betrieben werden kann. Hier kann man mit ca. 5% mehr Performance rechnen, wenn man statt reg. DDR2-667, wie beim Barcelona schnellen DDR2-800 nutzt (mit DDR2-1066 wird die Steigerung entsprechend größer).
Fazit
Die K10-Architektur, respektive der Barcelona, ist keine Wunder-CPU, bietet aber eine zeitgemäße Performance bei einem guten Performance pro MHz und Watt Verhältnis. In Serveranwendungen ist der K10 etwas schneller als der Core2 bei gleichem Takt, in Desktopanwendungen sind beide etwa auf dem gleichen Niveau. Wenn AMD jetzt noch die Taktraten in den Griff bekommt und den Phenom mit DDR2-1066 RAM schnell und flächendeckend einführen kann ist AMD wieder im Spiel und wir können uns auf einen schönen Preiskampf freuen. Ich frage mich schon die ganze Zeit über was sich AMD- und Intel-Anhänger jetzt streiten werden, wenn beide CPU-Architekturen in etwa gleich schnell sind. Aber irgendwas wird sich bestimmt finden
Ich bitte euch mich auf Rechtschreibefehler und/oder inhaltliche Fehler hinzu weisen. Aber bitte per PM. Zudem würde ich mich natürlich über Kommentare und konstruktive Kritik freuen.
Und jetzt viel Spaß beim Diskutieren (nein, Spaß werde ich immer mit ß schreiben )
MfG w0mbat
Anhang:
Zuletzt bearbeitet: