NEWS

NVIDIA präsentiert die GeForce GTX 1080 auf Basis der Pascal-Architektur (Update)

Portrait des Authors


NVIDIA präsentiert die GeForce GTX 1080 auf Basis der Pascal-Architektur (Update)
856

Werbung

Soeben hat NVIDIA auf einem Editors Day in Austin, Texas, die Consumer-Version der Pascal-GPU vorgestellt. Jen-Hsun Huang stellte sich dazu persönlich auf die Bühne und begann die Vorstellung mit einem kleinen Rückblick auf die Entwicklung der Hardware bzw. GPUs. In einem zweiten Teil wurde auf das Aufkommen einer neuen Kunstart eingegangen, bei der Grafik-Engines und Spiele genutzt werden, um künstlerische Darstellungen zu erstellen.

Dazu hat NVIDIA eine virtuelle Kamera namens Ansel in Software geschaffen. Bei dieser handelt es sich um ein SDK im Treiber, welches von den Spielen eingebunden werden kann. Danach kann sich der Nutzer frei in der 3D-Umgebung bewegen. Hinzu kommen Funktionen wie Filter, eine Scaling der Auflösung um den Faktor 30 sowie die Möglichkeit, eine virtuelle 360°-Umgebung der aktuellen Szene zu erstellen. Demonstriert hat NVIDIA Ansel am Beispiel von The Witness. Dabei sei an dieser Stelle angemerkt, dass es solche Free-Cam-Lösungen schon etwas länger gibt. Zunächst aber macht Ansel von NVIDIA den Eindruck bei nahezu allen Spielen zu funktionieren. Allerdings müssen die Entwickler der Spiele das SDK ansprechen und damit doch eine gewisse Unterstützung anbieten.

NVIDIA AnselNVIDIA Ansel

NVIDIA Ansel

[h3]VRWorks Audio[/h3]

Für alle Entwickler von VR-Spielen hat NVIDIA auch eine Neuigkeit auf dem Editors Day verkündet. Bisher konzentriert sich viel auf die Optik bei den aktuellen VR-Anwendungen. Doch für ein möglichst immersives Erlebnis spielt die Tonwiedergabe eine ebenso wichtige Rolle. VRWorks Audio basiert dabei auf der IRAY-Technologie – anstatt virtueller Lichtstrahlen werden aber Audiowellen simuliert und damit möglichst realistisch berechnet und letztendlich auch ausgegeben. NVIDIA nennt diese Technologie Path Tracing Audio.

VRWORKS Audio

VRWORKS Audio

Eine aktuelle GPU von NVIDIA soll in der Lage sein tausende von "Audio-Pfaden" berechnen zu können. Dazu werden die Compute-Eigenschaften der GPU verwendet. NVIDIA bezeichnet VRWORKS Audio als die erste Echtzeit Berechnung von 3D-Audio. Die PlayStation VR verwendet allerdings eine Zusatzhardware in Form eines kleines Gehäuses, dass bei Sonys Lösung ebenfalls maßgeblich für die Berechnung des Audio verantwortlich sein soll.

Datenschutzhinweis für Youtube



An dieser Stelle möchten wir Ihnen ein Youtube-Video zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Youtube setzt durch das Einbinden und Abspielen Cookies auf ihrem Rechner, mit welchen Sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf den Play-Button. Das Video wird anschließend geladen und danach abgespielt.

Ihr Hardwareluxx-Team

Youtube Videos ab jetzt direkt anzeigen

[h3]GeForce GTX 1080[/h3]

Nun aber kam NVIDIA zum eigentlich Hauptgrund der Veranstaltung und dies war die Vorstellung der GeForce GTX 1080. Die dazugehörige GPU basiert natürlich auf der Pascal-Architektur. Mehrere tausend Entwickler haben an Pascal über mehr als zwei Jahre gearbeitet. Die komplette Entwicklung soll dabei zwischen 2 und 3 Milliarden US-Dollar gekostet haben. Neben der Architektur sind die Fertigung in 16 nm FinFET-Verfahren, der Einsatz von GDDR5X-Speicher (den NVIDIA G5X nennt), die Fertigung von PCB und Kühler und eine bisher noch unbekannte Rendering-Technologie.

Optimierte Spannungsversorgung der GeForce GTX 1080

Optimierte Spannungsversorgung der GeForce GTX 1080

Ein Detail der neuen Technologien für die GeForce GTX 1080 ist die Spannungsversorgung der GPU. Durch die immer größere Anzahl an Transistoren bei kleinerer Fertigung sowie einem höheren Takt muss die Spannungsversorgung schneller und genauer werden. So erreicht die GeForce GTX 1080 eine stabile Spannungsversorgung in einem Bereich von 120 mV (Peak to Peak). Bei der GeForce 980 soll dieser Wert noch bei 209 mV gelegen haben. Dies hat auch einen Einfluss auf die Effizienz der Karte. Diese soll noch einmal verbessert worden sein.

NVIDIA nennt auch einige Leistungswerte. So soll eine GeForce GTX 1080 schneller als ein SLI-System aus zwei GeForce GTX 980 sein. Ebenso soll die Leistung über der GeForce GTX Titan X sein – laut Präsentation um einen Wert zwischen 15 und 20 Prozent. Die Leistungsaufnahme der GeForce GTX 1080 liegt dabei bei 180 W und damit etwas über der GeForce GTX 980 als direkten Vorgänger, die noch bei 165 W liegt.

Leistungsdaten der GeForce GTX 1080Leistungsdaten der GeForce GTX 1080

Leistungsdaten der GeForce GTX 1080

Tim Sweeny von Epic betrat die Bühne und zeigte eine Demo seines aktuellen Projektes Paragon. Die dabei eingesetzte Grafikkarte erreichte einen Takt von 2.114 MHz für die GPU. Damit verdoppelt NVIDIA den Boost-Takt im Vergleich zum Vorgänger nahezu. Der GDDR5X-Speicher arbeitet währenddessen mit 1.377 MHz und die GPU hatte luftgekühlt eine Temperatur von 67 °C. Die Techdemo verschlang 2.665 MB der zu diesem Zeitpunkt noch unbekannten Speicherkapazität. Die Demo lief dabei mit 60 FPS. Die Angaben zu den Taktraten beruhen allerdings auf einer Übertaktung der hier eingesetzten Karte.

Bis zu 16 Viewports für Multi-Monitor-Systeme

Multi-Monitor-Setups sind sicher noch immer nicht sonderlich weit verbreitet und dennoch geht NVIDIA ein Problem an, wenn mehr als ein Monitor verwendet wird. Denn bei der Berechnung der 3D-Szene in ein 2D-Bild auf dem Monitor wird nicht mit einbezogen, dass das Bild eigentlich für jeden Monitor einzeln berechnet werden müsste, um einen realistischen Blickwinkel zu erreichen. NVIDIA verwendet dazu eine Technologie, die auch schon in der Maxwell-Architektur verwendet wurde. Dort hat NVIDIA die Viewports verwendet, um das Multi Resolution Shading anzuwenden. Während Maxwell mit 9 Viewports umgehen kann, sind bei Pascal bis zu 16 Viewports möglich.

Simultaneous Multi ProjectionSimultaneous Multi Projection

Simultaneous Multi Projection

Interessant ist dies aber nicht nur für Multi-Monitor-Setups, sondern vor allem bei VR-Anwendungen. Dort können diese 16 Viewports verwendet werden, um die zwei Bilder für die 3D-Darstellung in einem einzigen Durchlauf zu Berechnen. In VR-Anwendungen erreicht die GeForce GTX 1080 die doppelte Leistung gegenüber der GeForce GTX Titan X bei dreifacher Effizienz. Simultaneous Multi Projection ist dabei für ein Performance-Plus von 50 bis 60 Prozent verantwortlich. Die Rechenleistung der GeForce GTX 1080 gibt NVIDIA mit 9 TFLOPS an.

Simultaneous Multi ProjectionSimultaneous Multi Projection

Simultaneous Multi Projection

[h3]Die Pascal-Architektur[/h3]

Im Verlaufe dieses Artikels verwenden wir für die GPU auf der GeForce GTX 1080 den Namen GP104. NVIDIA hat noch keine technische Bezeichnung für den Chip benannt. Damit ein Vergleich zur GP100 der Tesla P100 möglich ist, verbleibe wir zunächst bei GP104 für die GeForce GTX 1080. Weiterhin ein zentraler Bestandteil der Architektur sind die Streaming Multiprocessors (SM). Der Aufbau sieht Graphics Processing Clusters (GPCs), Streaming Multiprocessors (SMs) und Speichercontroller vor, die in einem bestimmten System organisiert sind. GP104 besteht vermutlich aus vier GPCs, diese haben jeweils 10 SMs und diese wiederum besitzen jeweils 64 Shadereinheiten. Damit kommt damit auf insgesamt 2.560 Shadereinheiten (4x10x64). Neben den 64 Shadereinheiten befinden sich in jedem SM auch noch vier Textureinheiten, so dass wir hier insgesamt auf 160 Textureinheiten kommen.

Die technischen Daten der GP104-GPU im Überblick
GPU GP100 GP104 Fiji XT GM200 GM204
Fertigung 16 nm 16 nm 28 nm 28 nm 28 nm
Transistoren 15,3 Milliarden 7,2 Milliarden 8,9 Milliarden 8 Milliarden 5,2 Milliarden
Speichertakt 737 MHz 1.250 MHz 500 MHz 1.750 MHz 1.750 MHz
Speichertyp HBM2 GDDR5X HBM GDDR5 GDDR5
Speichergröße 16 GB 8 GB 4 GB 6 GB 4 GB
Speicherinterface 4.096 Bit 256 Bit 4.096 Bit 384 Bit 256 Bit
DirectX-Version 12 12 12 12 12
Shadereinheiten 3.840 2.560 4.096 2.816 2.048
Textureinheiten 224 160 256 176 128
ROPs - 64 64 96 64
Typische Boardpower 300 W 180 W 275 W 250 W 165 W
SLI/CrossFire - SLI CrossFire SLI SLI

Nicht unerwähnt ließ NVIDIA eine weitere Steigerung bei der Effizienz. Diese ist auf der einen Seite auf die Fertigung in 16 nm FinFET zurückzuführen. Änderungen in der Architektur der SMs sollen aber zu weiteren Verbesserungen beigetragen haben. Insgesamt nennt NVIDIA für die GeForce GTX 1080 eine maximale Leistungsaufnahme von 180 W.

Erstaunlich sind sicherlich die Taktraten der GP104-GPU auf der GeForce GTX 1080. NVIDIA gibt einen Basis-Takt von 1.607 MHz an. Per GPU-Boost sollen unter Last aber mindestens 1.733 MHz anliegen. Hinzukommen sollen ein gewaltiges Overclocking-Potential. Während der Demos ist ein Boost-Takt von über 2.100 MHz erreicht worden.

In der Folge schauen wir uns den Aufbau einer Streaming Multiprocessors noch einmal etwas genauer an. Bereits angesprochen haben wir die 64 Shadereinheiten pro SM – ob diese auch bei der GP104-GPU vorhanden sind, ist derzeit unbekannt. Bei den Shadereinheiten handelt es sich um FP32-Recheneinheiten. Maxwell und Kepler hatten 128 bzw. 192 FP32-Rechenheiten pro SM und legten den Fokus daher klar auf die Single-Precision-Performance. Jeder SM in der GP104-GPU ist in zwei Processing Blocks aufgeteilt. Jeder davon hat 32 Shadereinheiten, einen Instruction Buffer, einen Warp Scheduler und zwei Dispatch Units. Während die SMs in Pascal also die Hälfte an Shadereinheiten im Vergleich zu Maxwell tragen, sind die Größe der Register, Warps und Thread Blocks identisch geblieben.

Blockdiagramm der GP100-GPU und der SMsBlockdiagramm der GP100-GPU und der SMs

Blockdiagramm der GP100-GPU und der SMs

NVIDIA hat auch den Datenpfad bzw. dessen Organisation optimiert. Letztendlich konnte NVIDIA die Die-Fläche reduzieren und auch die Leistungsaufnahme in diesem Bereich ist deutlich geringer. Dies ist einer der Bereiche, der zur Effizienzsteigerung geführt hat. Die neue Scheduler-Architektur sorgt für eine bessere Auslastung der Pipelines und jeder Warp Schedular kann zwei Warp Instructions pro Takt zuteilen.

Die technischen Daten der GeForce GTX 1080 im Überblick
Modell NVIDIA GeForce GTX 1080 AMD Radeon R9 Fury X NVIDIA GeForce GTX 980 Ti
Straßenpreis 599 US-Dollar ab 615 Euro ab 620 Euro
Homepage www.nvidia.de www.amd.de www.nvidia.de
Technische Daten
GPU GP104 Fiji XT GM200
Fertigung 16 nm 28 nm 28 nm
Transistoren 7,2 Milliarden 8,9 Milliarden 8 Milliarden
GPU-Takt (Base Clock) 1.607 MHz - 1.000 MHz
GPU-Takt (Boost Clock) 1.733 MHz 1.050 MHz 1.075 MHz
Speichertakt 1.250 MHz 500 MHz 1.750 MHz
Speichertyp GDDR5X HBM GDDR5
Speichergröße 8 GB 4 GB 6 GB
Speicherinterface 256 Bit 4.096 Bit 384 Bit
Speicherbandbreite 320 GB/s 512,0 GB/Sek. 336,6 GB/s
DirectX-Version 12 12 12
Shadereinheiten 2.560 4.096 2.816
Textureinheiten 160 256 176
ROPs 64 64 96
Typische Boardpower 180 W 275 W 250 W
SLI/CrossFire SLI CrossFire SLI

Für die deutlich bessere Double-Precision-Performance hat NVIDIA die Verhältnisse für die Funktion von FP64 und FP32-Recheneinheiten geändert. Während dieses bei der Kepler-Architektur noch bei 1/3 lag und in der vorherigen Maxwell-Architektur 1/32 betrug, sieht NVIDIA für die Pascal-Architektur ein Verhältnis von 1/2 vor. Für das Gaming und die GeForce GTX 1080 spielt diese allerdings keine große Rolle – dennoch wollen wir es an dieser Stelle nicht unerwähnt lassen.

Für Deep-Learning-Netzwerke sind Half-Precision-Berechnungen bzw. FP16-Berechnungen besonders wichtig und daher sieht hier NVIDIA auch ein Verhältnis von 1/2 zu den FP32-Berechnungen vor. NVIDIA hat das Handling dieser FP16-Berechnungen geändert, um von den dedizierten FP32-Kernen profitieren zu können. Dazu werden FP16-Berechnungen zusammengelegt, damit sie auf FP32-Kernen ausgeführt werden können. Damit die FP16-Berechnungen zusammengelegt werden können, müssen sie allerdings die gleichen Operationen ausführen. Zum Beispiel können nur zwei Additionen oder zwei Multiplikationen zusammengeführt werden. FP16-Operationen sind für Spielen bzw. dort der Verarbeitung von Texturen wichtig oder aber bei der Analyse von Foto- und Videodaten.

Im Zuge der neue Pascal-Architektur stellt NVIDIA auch neue Standards für die Display-Ausgänge zur Verfügung. So verfügt die GeForce GTX 1080 über HDMI 2.0b und DisplayPort 1.4. Die GeForce GTX 1080 soll ab dem 27. Mai verfügbar sein. Ob es nur eine Referenzversion geben wird oder NVIDIA mit den Boardpartner auch an anderen Versionen arbeitet, ist derzeit nicht bekannt. Der Preis für die GeForce GTX 1080 liegt bei 599 US-Dollar, Eine Founders Edition im speziellen Design liegt bei 699 US-Dollar.

[h3]Neuer Speicherstandard GDDR5X[/h3]

Ende des vergangenen Jahres präsentierte Micron die finalen Spezifikationen zu GDDR5X. Demnach sieht Micron GDDR5X als Lückenfüller zwischen GDDR5 und HBM oder ersten und zweiten Generation bzw. legt den Speicher auf bestimmte Einsatzgebiete aus. Um die Leistung des Speichers zu erhöhen, wird beispielsweise der Prefetch von 32 auf 64 Bit verdoppelt. Dadurch verdoppelt sich auch die Anzahl der Datenwörter pro Zugriff von 8 auf 16. Die Datenraten pro Speicherchip liegen aktuell bei 8 GBit/s bei den erwähnten GDDR5-Varianten mit 2.000 MHz. Micron arbeitet in der aktuellen Ausführung von GDDR5X mit 10 bis 12 GBit/s, plant aber mit bis zu 16 GBit/s. Laut Micron sorgen die geringen Unterschiede zwischen GDDR5 und GDDR5X dafür, dass nur wenige Änderungen beim Design der Speichercontroller vorgenommen werden müssen, was AMD und NVIDIA sicherlich entgegenkommt.

Besitzt eine GPU aktuell ein Speicherinterface mit 256 Bit, so steigert der Einsatz von GDDR5X bei 12 GBit/s die Speicherbandbreite von 256 auf 384 GB/s (bei einem angenommenen Chiptakt von 2.000 MHz). Bei 16 GBit/s wäre sogar eine Verdopplung auf 512 GB/s möglich und damit läge man schon auf Niveau der aktuellen HBM-Generation. An dieser Stelle muss aber auch erwähnt werden, dass ein GDDR5X mit 16 GBit/s derzeit noch nicht realisierbar ist.

GeForce GTX 1070

NVIDIA GeForce GTX 1070

NVIDIA GeForce GTX 1070

Ebenfalls vorgestellt hat NVIDIA die GeForce GTX 1070. Diese besitzt eine Rechenleistung von 6,5 TFLOPS und verwendet ebenfalls 8 GB an GDDR5-Speicher. Sie soll ab dem 10. Juni verfügbar sein und kostet 379 US-Dollar in der normalen Version sowie 449 US-Dollar in der Founders Edition.

1. Update:

Auf dem Event stellt NVIDIA die GeForce GTX 1080 auch aus, so dass wir ein paar Bilder machen konnten:

{jphoto image=96266}

Darauf sind unter anderem auch die Display-Anschlüsse zu sehen. Zudem verfügt auch die GeForce GTX 1080 wieder über zwei SLI-Anschlüsse. Die zusätzliche Stromversorgung erfolgt über einen 8-Pin-Anschluss. Damit kann die zusammen mit dem PCI-Express-Steckplatz theoretisch 225 W aufnehmen.

Bei der Betrachtung der ausgestellten Demo-Systeme ist uns noch eines aufgefallen. Eines der Systeme besteht aus einem SLI-Gespann aus zwei GeForce GTX 1080. Üblicherweise würde zum Betrieb eines solchen Systems ein einfacher SLI-Connector ausreichen. NVIDIA verbaut aber weiterhin zwei – womöglich um ein 3-Way- oder gar 4-Way-SLI möglich zu machen. Das SLI-System aus zwei GeForce GTX 1080 verwendet aber eine SLI-Bridge, die beide SLI-Anschlüsse belegt.

SLI-Gespann aus zwei GeForce GTX 1080

SLI-Gespann aus zwei GeForce GTX 1080

Leider konnte uns auf der Veranstaltung selbst niemand Auskunft darüber geben, was es damit auf sich hat. Denkbar ist aber, dass NVIDIA hier das Bandbreiten-Limit umgeht, welches bei besonders hohen Auflösungen und Multi-Monitor-Setups auftritt. Die Verbindung der SLI-Anschlüsse wird üblicherweise mit 400 MHz, also dem gleichen Takt wie die Ansteuerung der Display-Ausgänge betrieben. Im vergangenen Jahr aber haben Hersteller wie ASUS, EVGA und MSI spezielle SLI-Bridges vorgestellt, die nicht mehr mit einem Pixelclock von 400 MHz arbeiten, sondern diesen auf 540 MHz erhöhen. Die damit einhergehende Erhöhung der Bandbreite kommt vor allem solchen Systemen zu gute, die einen Monitor mit mehr als 120 Hz oder eine 4K-Aufösung betreiben. Es ist daher denkbar, dass NVIDIA dieses Problem über eine doppelte Verbindung umgeht.

Sind beide SLI-Anschlüsse in einem 2-Way-SLI bereits belegt, bedeutet dies aber auch, dass dann kein 3-Way- oder 4-Way-SLI mehr möglich ist. Ob dies weiterhin durch eine einfache SLI-Bridge realisiert werden kann, ist derzeit unklar. Wie bei vielen anderen Punkten werden wir dies im weiteren Verlauf des Events mit NVIDIA versuchen zu klären.

2. Update:

Inzwischen ist das Rätsel um die doppelte SLI-Brücke geklärt. In der Tat erhöht NVIDIA darüber die Bandbreiter dieser Verbindung, um bei höheren Auflösungen und Bildwiederholungsraten noch ausreichend schnell darüber kommunizieren zu können. NVIDIA selbst nennt dies SLI HB, wobei das HB für High Bandwith steht. Die dazugehörgen SLI-Brücken werden von NVIDIA angeboten werden – abhängig vom eingesetzten Mainboard mit unterschiedlicher Länge.

SLI HB schließt damit auch kein 3-Way- oder 4-Way-SLI aus, denn weiterhin kann die klassische, einfache Verbindung verwendet werden. Wir haben ein kleines Video erstellt, auf dem die Karte in voller Pracht zu sehen ist.

Datenschutzhinweis für Youtube



An dieser Stelle möchten wir Ihnen ein Youtube-Video zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Youtube setzt durch das Einbinden und Abspielen Cookies auf ihrem Rechner, mit welchen Sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf den Play-Button. Das Video wird anschließend geladen und danach abgespielt.

Ihr Hardwareluxx-Team

Youtube Videos ab jetzt direkt anzeigen

Während der Präsentation zeigte NVIDIA auch einige interessante Demos. Auch diese haben wir auf Video gebannt. Dazu gehören die FreeCam Ansel, der VR-Showroom für VRWORKS Audio, Epic Games Paragon in einer Art Vorschau sowie die Simultaneous Multi Projection.

Datenschutzhinweis für Youtube



An dieser Stelle möchten wir Ihnen ein Youtube-Video zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Youtube setzt durch das Einbinden und Abspielen Cookies auf ihrem Rechner, mit welchen Sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf den Play-Button. Das Video wird anschließend geladen und danach abgespielt.

Ihr Hardwareluxx-Team

Youtube Videos ab jetzt direkt anzeigen

Datenschutzhinweis für Youtube



An dieser Stelle möchten wir Ihnen ein Youtube-Video zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Youtube setzt durch das Einbinden und Abspielen Cookies auf ihrem Rechner, mit welchen Sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf den Play-Button. Das Video wird anschließend geladen und danach abgespielt.

Ihr Hardwareluxx-Team

Youtube Videos ab jetzt direkt anzeigen

Persönliche Meinung

NVIDIA hat auf dem Editors Day 2016 ein wahres Feuerwerk abgebrannt. Die Pascal-Architektur weiß in vielen Belangen als GP100 bzw. Tesla P100 bereits zu überzeugen, zielt dort aber auf einen ganz anderen Markt ab. Mit der GeForce GTX 1080 und den dazugehörigen technischen Details kennen wir jetzt die Marschrichtung für den Gaming-Markt, allerdings fehlen uns zu einer finalen Einschätzung noch die notwendigen Hintergrundinformationen. Auf den ersten Blick wirkt das, was NVIDIA heute vorgestellt hat durchaus solide. Leistungssprünge von +50 Prozent sind heutzutage kaum noch zu erwarten. Ein Leistungsplus bei gleichzeitiger Reduzierung der Leistungsaufnahme (und so sieht der Vergleich zur GeForce GTX 980 Ti aktuelle aus) ist aber durchaus beachtenswert. Wir sind gespannt was die Karte zu leisten im Stande ist, wenn sie durch unseren Benchmark-Parcours muss. Erst dann können wir uns ein finales Bild machen. Bis dahin aber hat NVIDIA seine Karten zunächst einmal auf den Tisch gelegt. (Andreas Schilling)

Quellen und weitere Links KOMMENTARE (856) VGWort