NEWS

Ampere und 7 nm

Was uns zur GTC19 erwarten könnte

Portrait des Authors


Was uns zur GTC19 erwarten könnte
17

Werbung

Am kommenden Montag, gegen 23:00 Uhr, wird NVIDIAs CEO die GPU Technology Conference 2019 mit einer Keynote eröffnen. Im Frühjahr 2017 präsentierte NVIDIA auf der Konferenz die Volta-Architektur. Ein Jahr zuvor wurden die ersten Details zur Pascal-Architektur verraten. Es spricht also einiges dafür, dass NVIDIA die GTC19 nutzen wird, den Volta-Nachfolger vorzustellen.

Bereits vor der Vorstellung der Turing-Architektur im vergangenen Sommer machte der Name Ampere die Runde. Nun wissen wir, dass es eben Turing für die GeForce- und Quadro-Karten geworden ist – Turing aber eben nicht für den HPC-Bereich ausgelegt ist. Dafür fehlt es Turing an den notwendigen FP64-Einheiten. Als würdiger Volta-Nachfolger im HPC-Segment rückt damit Ampere in den Fokus.

Bereits im November 2017 prognostizierten wir eine zweigleisige Strategie bei den GPU-Architekturen. Am Ende ist genau dies eingetreten: Die Volta-Architektur deckt das Datacenter-Segment ab und auf die Pascal-Architektur folge bei den GeForce- und Quadro-Karten eben die erwähnte Turing-Architektur. Dabei vollzieht NVIDIA in den finalen Produkten zwar eine mehr oder weniger strikte Trennung. Um die notwendige Basis zu legen, kann es aber durchaus vorkommen, dass bestimmte Technologien aus dem HPC-Segment in die Endkunden-Produkte wandern. Im Falle der Tensor Cores ist NVIDIA so vorgegangen. Erstmals in der Volta-Architektur angewendet und dort für das Inferencing im Einsatz, verwendet NVIDIA diese in den GeForce-RTX-Karten für das Deep Learning Super Sampling und das Entrauschen der per Ray Tracing berechneten Frameinhalte.

Die Fragen die sich nun stellen sind etwa, ob NVIDIA in Ampere auch RT Cores für die hardwarebeschleunigte Berechnung der Bounding Volume Hierarchy (BVH) für das Ray Tracing verwenden wird. Damit verknüpft ist sicherlich die Frage, ob NVIDIA die RT Cores im HPC-Bereich sinnvoll wird einsetzen können. Wir halten dies für eher unwahrscheinlich, da uns kein konkreter Anwendungsfall bekannt ist. Aber hier sind die Hersteller ja für allerlei Überraschungen und Tricks bekannt.

Als gesetzt gelten dürfte, dass wir die Tensor Cores auch in Ampere sehen werden. NVIDIA hat bereits angekündigt, dass man die Tensor Cores weiter ausbauen wird.

Datenschutzhinweis für Youtube



An dieser Stelle möchten wir Ihnen ein Youtube-Video zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Youtube setzt durch das Einbinden und Abspielen Cookies auf ihrem Rechner, mit welchen Sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf den Play-Button. Das Video wird anschließend geladen und danach abgespielt.

Ihr Hardwareluxx-Team

Youtube Videos ab jetzt direkt anzeigen

Datenschutzhinweis für Twitter

An dieser Stelle möchten wir Ihnen einen Twitter Feed zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Twitter setzt durch das Einbinden des Applets Cookies auf ihrem Rechner, mit welchen sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf diesen Feed. Der Inhalt wird anschließend geladen und Ihnen angezeigt.

Ihr Hardwareluxx-Team

Tweets ab jetzt direkt anzeigen

Bisher werden sie für Matrix-Multiplikation von INT16- und INT8-Datentypen verwendet. Perspektivisch will NVIDIA aber auch Anwendungsfelder für INT4, INT2 und sogar INT1 finden. Bisher gibt es dafür noch keine Anwendungsfelder, NVIDIA forscht jedoch daran.

Neben den Tensor Cores wird Ampere als HPC-Architektur aber auch wieder vermehrt auf FP64-Einheiten setzen. Über deren Ausbau und auch das Verhältnis zu den Shadereinheiten entscheidet natürlich auch, in welcher Fertigungstechnologie NVIDIA die Ampere-Chips produzieren lässt. Die offensichtliche Entscheidung wäre natürlich eine Fertigung in 7 nm. NVIDIA ließ alles vor Volta in 16 nm bei TSMC vom Band laufen, mit den Volta-Chips wechselte man auf 12 nm, vollzog also einen nominellen Shrink und nutzte die Volta-Chips als Pipecleaner für die Turing-Chips, die allesamt in 12 nm gefertigt werden.

Nachdem AMD mit den Radeon-Instinct-MI50- und MI60-Karten auf die Vega-20-GPU aus der 7-nm-Fertigung gewechselt ist und auch die Radeon VII auf eine 7-nm-GPU setzt, dürfte dieser Schritt auch für NVIDIA mehr als wahrscheinlich sein. Vorerst dürfte dies aber nur für die HPC-GPUs in Frage kommen. NVIDIA kann die höheren Kosten im Datacenter-Segment einfacher rechtfertigen. Bis wir einen Shrink der Turing-GPUs auf 7 nm sehen, wird vermutlich noch einige Zeit vergehen, zumal NVIDIA in der oberen Mittelklasse und im High-End-Bereich derzeit kaum Konkurrenz hat.

Für technikinteressierte Menschen könnte die Keynote der GPU Technology Conference am kommenden Montag also durchaus interessant werden. Wir haben einfach einmal ein paar Ideen in den Raum geworfen, wie sich die Situation am Montag darstellen wird.