Werbung
Heute hat Jen-Hsun Huang die GTC 2012 eröffnet. Der Fokus der hauseigenen Messe liegt natürlich auf dem GPU-Computing und der CUDA-Schnittstelle. Besonders stolz ist man auf die Tatsache, dass bereits in zahlreichen Supercomputern GPUs zum Einsatz kommen. GPUs nehmen also auch im professionellen Umfeld eine immer wichtigere Rolle ein. Neben der Tatsache, dass die Hardware sich für solche Anwendungen eignet, spielt aber auch die Unterstützung auf Seiten der Software eine wichtige Rolle. Die Verbreitung von CUDA wird durch die freie Verfügbarkeit und die Nutzung auf verschiedenen Plattformen begünstigt (Windows, OS X, Linux).
{jphoto image=24205}
Für den Gaming-Markt hat man "Kepler" in Form der GeForce GTX 680 (Hardwareluxx-Artikel) bereits Mitte März vorgestellt. Die neue GPU-Generation sollte aber auch Bestandteil der GTC-Keynote sein. In aller Ausführlichkeit präsentiert wurde auch die kürzlich vorgestellte GeForce GTX 690 (Hardwareluxx-Artikel). Vorgeführt wurden einige Tech-Demos, darunter auch zu Ray-Tracing. Auf diesen Bereich konzentriert sich NVIDIA bereits seit einiger Zeit, doch erst heutzutage sind GPUs in der Lage solche Szenen Echtzeit zu berechnen. Dabei kommen nicht nur "feste" Materialien zum Einsatz, sondern inzwischen auch Flüssigkeiten. Vor gut 1 1/2 Jahren waren dazu noch mehrere GPUs in einem System oder einer Cloud nötig. Auch diesen Bereich will NVIDIA weiter ausbauen.
Nun aber zum eigentlichen Zusammenhang zwischen der neuen GPU-Architektur und der GTC 2012. Die neuen Features im Zusammenhang mit "Kepler" und HPC (High Performance Computung) sind SMX (neue GPU-Architektur, siehe Artikel zur GeForce GTX 680), Hyper-Q und Dynamic Parallelism. Hyper-Q und Dynamic Parallism sind allerdings Punkte die beim derzeitigen GK104 keinerlei Rolle spielen. Bei den SMX-Clustern sorgen zahlreiche Optimierungen für eine bessere Energieeffizienz. Hyper-Q nimmt sich dem Problem an, dass CPUs nicht immer in der Lage sind die GPUs mit ausreichend Rohdaten zu füttern. "Fermi" beispielsweise hatte nur eine Work-Queue, Kepler kann nun mit 32 Work-Queues besser ausgelastet werden. Dediziert werden 32 CPU-Kerne unterstützt, ohne das Optimierungen in der Software vorgenommen werden müssen. Dynamic Parallelism verteilt die anfallenden Daten und Berechnungen selbständiger. Die Qeue-List wird nicht mehr von der CPU bestimmt, sondern von der GPU selbst.
Auch zu diesem Thema hat NVIDIA eine Techdemo, die den Vergleich zwischen "Fermi" und "Kepler" zeigt.
Gezeigt wurde eine Simulation von Sternen, bei der das Verhalten von einer Milliarde Objekte berechnet wurde. Diese Simulation wurde auf "Fermi" ausgeführt. "Kepler" erlaubt die Simulation von 10 Milliarden Objekten - im Beispiel die Kollision unserer Milchstraße mit dem Andromedar-Nebel in 3,8 Milliarden Jahren.
Natürlich wurden auf Basis von "Kepler" auch neue Produkte vorgestellt: Tesla K10 und Tesla K20. Während es sich bei erstgenanntem vermutlich um den GK104 handelt, den wir schon von der GeForce GTX 670, 680 und 690 kennen, dürfte Tesla K20 auf dem GK110 basieren. Tesla K20 soll erst im 4. Quartal 2012 erscheinen.
Tesla K10:
- 2x GK104
- 745 MHz
- 4,58 TFLOPs
- 2x 4 GB GDDR5-Speicher (ECC)
- 2x 160 GB/Sek. Speicherbandbreite
- 3x höhere Single-Precision-Performance gegenüber Tesla M2090 (Fermi)
- GK110
- 7,1 Milliarden Transistoren
- 13 oder 14 SMX-Cluster
- 384 Bit Speicherinterface
- 3x höhere Double-Precision-Performance gegenüber Fermi
In die Zukunft blickend präsentierte NVIDIA noch weitere Neuheiten. Bereits bekannt, aber weiter ausgeführt werden soll das Cloud-Computing - jetzt mit GPUs auf Basis von "Kepler". Wirklich neu sind die virtuellen GPUs, die es möglich machen das mehrere Nutzer gleichzeitig auf einer GPU arbeiten. Der Anwendungsbereich dafür ist in vielen Produktgruppen denkbar. Von den klassischen PCs, über Tablets, bis hin zu Smartphones. Das Prinzip dürfte von virtuellen Instanzen auf klassischen Servern bekannt sein.
Schließlich stellte man auch noch das Geforce Grid vor. GeForce Grid soll die komplette und aufwendige Gaming-Erfahrung eines Desktop-Systems auf mobile Geräte bringen. OnLive stellte dazu bereits vor Monaten eine Lösung zur Verfügung. Solche Streaming-Lösungen haben oftmals mit Problemen wie dem Lag der Eingaben zu kämpfen. NVIDIA will sich diesem Problem mit GeForce Grid angenommen haben.
In den kommenden Tagen wird NVIDIA in unzähligen Sessions den anwesenden Programmierern und Journalisten weitere Details zum GPU-Computing versuchen näher zu bringen.
Update:
Laut Aussage einer NVIDIA-Mitarbeiter wird GK110 im Maximalausbau 2880 CUDA-Prozessoren haben. Diese setzen sich aus 15 SMX-Cluster a 192 CUDA-Prozessoren zusammen. Insgesamt soll GK110 auf 7,1 Milliarden Transistoren kommen. Die GPU auf der Tesla K20 soll allerdings nicht der Vollausbau sein, sondern über 13 oder 14 SMX-Cluster verfügen.
Der Speicher soll über ein 384 Bit breites Speicherinterface angebunden sein. Über den Speicherausbau wollte NVIDIA aber keinerlei Angaben machen. Erst 2013 will NVIDIA dann auch GeForce-Grafikkarten auf Basis von GK110 auf den Markt bringen.
Quelle: Heise.de