AMD Bulldozer - Sammelthread
Der schnellste Single/Multi-Thread-Prozessor ?
AMD wird 2011 eine ganz neue Prozessorarchitektur erstmals seit K7 Zeiten auf den Markt werfen. Diese hört auf den Namen "Bulldozer" und wird wohl der größte Schritt seit vielen vielen Jahren werden.
Bulldozer wird der eigentliche Phenom werden, denn die beiden Vorgänger waren nicht das, was sie für AMD sein sollten, auch wenn sich Version II des Phenom trotzdem gut machte.
Bulldozer soll AMD wieder an die Spitze bringen mit einer deutlich veränderten neuen Architektur.
Was ist Bulldozer und wie ist er aufgebaut?
Bulldozer ist ein Prozessor, der mit 8 Kernen im Desktop-Markt bestückt werden wird, im Serverbereich mit 16 Kernen.
Intern kommen mehrere Module zum Einsatz, die je 2 reale Prozessorkerne besitzen. Diese 2 Prozessorkerne haben jeweils 4 Pipelines, die Hälfte davon für ALUs. AMD kann die Anzahl der Kerne einfacher gestalten. Braucht es 8 Kerne, so werden 4 solcher Module zusammengekoppelt und der Prozessor meldet sich dann als Achtkernprozessor.
Jeder einzelne Modul hat intern 2 Kerne, ähnlich wie Intels SMT, nur mit dem Unterschied, dass jeder Bulldozer Kern jeden Thread mit eigens reservierter Hardware verarbeiten darf und so die Verarbeitung schneller ausführen kann. SMT von Intel kann nur mit gemeinsamer Hardware Threads verarbeiten. Bei AMD heißt die Technik CMT und soll beim 2 Integer Core pro Modul 80 % Leistung erziehlen und dabei nur 12% Fläche kosten, AMD wird diesen 2. integer im Modul als Core vermarkten. Im vergleich Intels SMT kostet 5% zusätzliche Fläche, erziehlt aber nur 5-25%, dieser wird bei Intel als zusätzlicher Thread im Taksmanager angezeigt, bei AMD ist der 2. zusätzliche Thread ein Core im Taskmanager, Windows sieht 8 Kerne & 8 Threads, Multi Thread Anwendungen arbeiten mit diesen 8 Cores.
Jeder der 2 Kerne eines Moduls, hat einen eigenen L1 Cache sowie einen eigenen Scheduler. Der L2 Cache ist aber getrennt, sprich beide Kerne teilen sich hier einen gemeinsamen L2 Cache. Beim AMD K8 hatte noch jeder Kern einen eigenen L2 Cache.
Jeder der einzelnen Module hat eine eigene 128-Bit-FPU für Gleitkommazahlenberechnungen. Ebenfalls mit dabei ist natürlich der L3 Cache. Hier nutzen alle Module zusammen (egal wie viele) einen gemeinsamen L3 Cache, der recht hoch ausfallen dürfte.
Durch diesen neuen internen Aufbau ist ein Bulldozer, einem Phenom II mit seinen "nur" drei Integer-Pipelines und einer FP-Pipeline pro Kern überlegen.
Bei einem 8 Kern Prozessor mit 4 Modulen pro 2 integer würden also 8x L1 Cache vorkommen (jeder integer hat ein eigenen L1 Cache, 4x L2 Cache (pro Modul ein L2 Cache), 1x L3 Cache für alle Modulen und 4x FPUs Unit (pro Modul eine FPU).
Bulldozer wird von AMD speziell für Multithreading entwickelt. Durch den Aufbau mit 2 Kernen pro Modul will AMD sehr hohe Multithreadleistung erzielen.
Mehrere Threads sollen effektiver auf mehrere Kerne verteilt werden und so schneller bearbeitet werden. Es wird interessant zu sehen sein, wie AMD das umsetzt und wie schnell die Kerne sind.
AVX
Eine FPU pro Modul, die sich beide Kerne teilen müssen ist 256Bit breit, beherrscht Intels AVX Instruktionssatz und kann sich bei kürzeren Befehlen in 2x128Bit splitten (und damit dann 2 128-Bittige Befehle gleichzeitig ausführen). Diese FPU ist als FMAC (Fused Multiply Accumulate) ausgelegt und kann daher eine Multiplikation und eine Addition in einem Rutsch ausführen. Des weiteren wird spekuliert dass sie um die Effizienz zu erhöhen, auch direkt als 1 Multiplizierer & 1 Addierer arbeiten kann.
Fertigung
Bulldozer wird im 32nm Prozess bei Globalfoundries produziert, das erste TapeOut von Bulldozer soll gegen ende 2009 stattgefunden haben.
Der Prozessor wird voraussichtlich ein DDR3-1866 oder 2133 Speichercontroller besitzen.
Desktop
Für den Desktop Markt kommt Zambezi, für die Desktop CPUs braucht man ein Socket AM3+ (Dual Channel) Mainboard
Server
Für den Server Markt kommt Interlagos/Valencia, für diese Server CPUs braucht man ein Socket C32 (Dual Channel) oder G34 (Quad Channel) Mainboard.
Update 09.11.2011
Desktop Roadmap
Server Roadmap
Zambezi Desktop Roadmap
Am Anfang machen 2 Modelle den Anfang
Der schnellste Single/Multi-Thread-Prozessor ?
AMD wird 2011 eine ganz neue Prozessorarchitektur erstmals seit K7 Zeiten auf den Markt werfen. Diese hört auf den Namen "Bulldozer" und wird wohl der größte Schritt seit vielen vielen Jahren werden.
Bulldozer wird der eigentliche Phenom werden, denn die beiden Vorgänger waren nicht das, was sie für AMD sein sollten, auch wenn sich Version II des Phenom trotzdem gut machte.
Bulldozer soll AMD wieder an die Spitze bringen mit einer deutlich veränderten neuen Architektur.
Was ist Bulldozer und wie ist er aufgebaut?
Bulldozer ist ein Prozessor, der mit 8 Kernen im Desktop-Markt bestückt werden wird, im Serverbereich mit 16 Kernen.
Intern kommen mehrere Module zum Einsatz, die je 2 reale Prozessorkerne besitzen. Diese 2 Prozessorkerne haben jeweils 4 Pipelines, die Hälfte davon für ALUs. AMD kann die Anzahl der Kerne einfacher gestalten. Braucht es 8 Kerne, so werden 4 solcher Module zusammengekoppelt und der Prozessor meldet sich dann als Achtkernprozessor.
Jeder einzelne Modul hat intern 2 Kerne, ähnlich wie Intels SMT, nur mit dem Unterschied, dass jeder Bulldozer Kern jeden Thread mit eigens reservierter Hardware verarbeiten darf und so die Verarbeitung schneller ausführen kann. SMT von Intel kann nur mit gemeinsamer Hardware Threads verarbeiten. Bei AMD heißt die Technik CMT und soll beim 2 Integer Core pro Modul 80 % Leistung erziehlen und dabei nur 12% Fläche kosten, AMD wird diesen 2. integer im Modul als Core vermarkten. Im vergleich Intels SMT kostet 5% zusätzliche Fläche, erziehlt aber nur 5-25%, dieser wird bei Intel als zusätzlicher Thread im Taksmanager angezeigt, bei AMD ist der 2. zusätzliche Thread ein Core im Taskmanager, Windows sieht 8 Kerne & 8 Threads, Multi Thread Anwendungen arbeiten mit diesen 8 Cores.
Jeder der 2 Kerne eines Moduls, hat einen eigenen L1 Cache sowie einen eigenen Scheduler. Der L2 Cache ist aber getrennt, sprich beide Kerne teilen sich hier einen gemeinsamen L2 Cache. Beim AMD K8 hatte noch jeder Kern einen eigenen L2 Cache.
Jeder der einzelnen Module hat eine eigene 128-Bit-FPU für Gleitkommazahlenberechnungen. Ebenfalls mit dabei ist natürlich der L3 Cache. Hier nutzen alle Module zusammen (egal wie viele) einen gemeinsamen L3 Cache, der recht hoch ausfallen dürfte.
Durch diesen neuen internen Aufbau ist ein Bulldozer, einem Phenom II mit seinen "nur" drei Integer-Pipelines und einer FP-Pipeline pro Kern überlegen.
Bei einem 8 Kern Prozessor mit 4 Modulen pro 2 integer würden also 8x L1 Cache vorkommen (jeder integer hat ein eigenen L1 Cache, 4x L2 Cache (pro Modul ein L2 Cache), 1x L3 Cache für alle Modulen und 4x FPUs Unit (pro Modul eine FPU).
Bulldozer wird von AMD speziell für Multithreading entwickelt. Durch den Aufbau mit 2 Kernen pro Modul will AMD sehr hohe Multithreadleistung erzielen.
Mehrere Threads sollen effektiver auf mehrere Kerne verteilt werden und so schneller bearbeitet werden. Es wird interessant zu sehen sein, wie AMD das umsetzt und wie schnell die Kerne sind.
AVX
Eine FPU pro Modul, die sich beide Kerne teilen müssen ist 256Bit breit, beherrscht Intels AVX Instruktionssatz und kann sich bei kürzeren Befehlen in 2x128Bit splitten (und damit dann 2 128-Bittige Befehle gleichzeitig ausführen). Diese FPU ist als FMAC (Fused Multiply Accumulate) ausgelegt und kann daher eine Multiplikation und eine Addition in einem Rutsch ausführen. Des weiteren wird spekuliert dass sie um die Effizienz zu erhöhen, auch direkt als 1 Multiplizierer & 1 Addierer arbeiten kann.
Fertigung
Bulldozer wird im 32nm Prozess bei Globalfoundries produziert, das erste TapeOut von Bulldozer soll gegen ende 2009 stattgefunden haben.
Der Prozessor wird voraussichtlich ein DDR3-1866 oder 2133 Speichercontroller besitzen.
Desktop
Für den Desktop Markt kommt Zambezi, für die Desktop CPUs braucht man ein Socket AM3+ (Dual Channel) Mainboard
Server
Für den Server Markt kommt Interlagos/Valencia, für diese Server CPUs braucht man ein Socket C32 (Dual Channel) oder G34 (Quad Channel) Mainboard.
Update 09.11.2011
Desktop Roadmap
Server Roadmap
Zambezi Desktop Roadmap
Am Anfang machen 2 Modelle den Anfang
Zuletzt bearbeitet: