Werbung
Bei der Präsentation neuer Hardware und vor allem neuer Chips durch Hersteller wie AMD, NVIDIA oder Intel ist in den vergangenen Jahren vor allem eines auffällig: Nicht immer reden die Hersteller gerne über jedes Detail der Entwicklung und ungern wird Journalisten oder der Konkurrenz die Möglichkeit geboten, sich diese Details selbst zu erarbeiten. So wurden die beliebten Die-Shots von CPUs und GPUs in jüngster Vergangenheit lieber gegen ein Blockdiagramm ersetzt, denn dort kann der Hersteller Details, die er nicht preisgeben möchte, einfach weglassen.
Auf der Hot Chip 28 in Cupertino hat NVIDIA nun aber einen Die-Shot der GP100-GPU, der größten Ausbaustufe der Pascal-Architektur mit NVLink und Unterstützung von HBM der zweiten Generation, veröffentlicht. Dieser kommt bisher nur auf dem GPU-Beschleuniger Tesla P100 zum Einsatz. Ein solcher Die-Shot erhält seine Faszination durch die Darstellung der Details und erstmals ermöglicht NVIDIA den Blick auf eine GPU mit NVLink und HBM2-Interface. Auf ein paar Details wollen wir dabei näher eingehen.
Auf dem Die-Shot sind sehr schön die 60 Streaming Multiprozessoren zu sehen, die sich immer in einem Zweierpaket (dunkel grün eingefärbt) gegenübergestellt auf dem Chip wiederfinden. Jeder dieser Streaming Multiprozessoren besteht wiederum aus jeweils 64 Shadereinheiten, deren Details auf dem Die-Shot aber nicht wirklich zu erkennen sind. In einem Streifen in der Mitte befinden sich die Thread Scheduler und weitere Uncore-Funktionen einer GPU.
Der obere und untere Bereich des Die-Shots legt das HBM2-Interface offen. Im Vergleich zur restlichen GPU ist dieses recht klein und belegt nur eine begrenzte Fläche des Chips. Da es sich aber um ein 4.096 Bit breites Speicherinterface handelt, ist die Größe umso erstaunlicher und zeigt einmal mehr die Vorteile des Speichers, die sich nur nicht auf die Speicherbandbreite begrenzen lassen. Im linken Bereich sind weitere Uncore-Funktionen zu sehen, diese lassen sich aber kaum direkt identifizieren. Hier dürfte sich beispielsweise das NVLink-Interface befinden.
Die technischen Herausforderungen bei der Fertigung einer solchen GPU sind enorm. NVIDIA lässt bei TSMC in 16 nm fertigen. Der Chip hat eine Größe von 610 mm². NVIDIA gibt eine Anzahl von 15,3 Milliarden Transistoren für die GPU an, während das gesamte Package 150 Milliarden Transistoren beinhalten soll. NVIDIA zählt hier allerdings auch Komponenten wie den Speicher und die Interconnects mit. Den HBM2 bringt NVIDIA auf dem Interposer unter und bindet darüber auch die vier Speicherchips an. Die Interposertechnologie stammt aus dem Hause TSMC und damit ist NVIDIA nicht auf einen weiteren Dienstleister für die Interposertechnologie angewiesen. Auf einem Foto der GPU sind die engen Abstände zwischen GPU und den vier HBM2-Speicherchips zu erkennen – hier ist kein Millimeter mehr Platz. Auch der Interposer, der sich unterhalb der GPU und Speicherchips befindet, dürfte nicht viel größer sein, um das Gesamtpackage des Chips nicht noch weiter zu vergrößern.
Die GP100-GPU wird eine solche für den professionellen Bereich bleiben. Mit der GP102-GPU hat NVIDIA aber inzwischen eine Ausbaustufe vorgestellt, die in Form der Titan X die schnellste GPU für Spieler darstellt und als Quadro P6000 im Workstation-Markt sogar mit noch mehr Shadern daherkommt. Vorstellbar ist also eine GeForce GTX 1080 Ti mit eben 3.840 Shadereinheiten anstatt der derzeit maximalen 3.584 wie auf der Titan X oder der Tesla P100.