NEWS

Finale Spezifikationen des GK110 enthüllt

Portrait des Authors


Finale Spezifikationen des GK110 enthüllt
19

Werbung

Mitte Mai präsentierte NVIDIA erstmals einige Daten zum GK110, also dem vermeintlichen Vollausbau der aktuellen "Kepler"-Architektur. Zum damaligen Zeitpunkt war aber noch nicht klar, über wie viele Shader-Prozessoren GK110 verfügen wird, wie breit das Speicherinterface sein würde und wie schnell der Speicher getaktet ist. Wohlgemerkt sprechen wir hier von GK110 für den Einsatz auf den Tesla K20 Karten, also nicht von einem Endkundenprodukt. NVIDIA hat sich bisher noch nicht dazu geäußert, ob wir eine GK110-GPU auch auf einer GeForce-Grafikkarte sehen werden. Es ist aber sehr wahrscheinlich, dass genau das Anfang 2013 geschehen wird.

[figure image=images/stories/newsbilder/aschilling/2012/gtc2012-tesla-k20-rs.jpg link=http://www.hardwareluxx.de/images/stories/newsbilder/aschilling/2012/gtc2012/gtc2012-tesla-k20.jpeg alt= Tesla K20 auf Basis von GK110] Tesla K20 auf Basis von GK110[/figure]

Heise hat nun weitere Details von einem Lieferanten von GPU-Rackservern namens CADnetworks erfahren. Demnach soll die GK110-GPU in der Ausbaustufe für die Tesla K20 Karten über 13 SMX-Cluster mit jeweils 192 CUDA-Kernen verfügen. Dies resultiert in 2496 CUDA-Kernen insgesamt. Auf der GTC 2012 war noch von 2880 CUDA-Kernen die Rede. Die reduzierte Anzahl sollen mit 705 MHz arbeiten, einen GPU-Boost gibt es hier nicht. Dies bedeutet eine theoretische Rechenleistung von 3,52 TFlops bei Single-Precision- und 1,17 TFlops bei Double-Precision-Berechnungen. Der Speicher besitzt eine Transferrate von 200 GB/Sek. Geht man von einem 384 Bit breiten Speicherinterface aus, würde der GDDR5-Speicher mit 1014 MHz arbeiten. Bei 256 Bit wären es 1562 MHz. Insgesamt sollen 5 GB GDDR5-Speicher auf der Tesla K20 zum Einsatz kommen. Die maximale Leistungsaufnahme soll bei 225 Watt liegen. Anfang November sollen die ersten Karten ausgeliefert werden. Der Preis liegt bei 2950 Euro.

GF110 GK104 GK110 auf Tesla K20
Fertigung 40 nm 28 nm 28 nm
Transistoren 3 Milliarden 3,54 Milliarden 7,1 Milliarden
Die-Größe 530 mm² 294 mm² etwa 600 mm²
TDP 225 Watt 225 Watt 225 Watt
GPU-Takt 772 MHz 1006 MHz 705 MHz
Speichertakt 1000 MHz 1502 MHz 1014 oder 1562 MHz
Speichertyp GDDR5 GDDR5 GDDR5
Speichergröße 1536 MB 2048 MB 5120
Speicherinterface 384 Bit 256 Bit 256 oder 384 Bit
Speicherbandbreite 192 GB/Sek. 192,2 GB/Sek. 200 GB/Sek.
Shadereinheiten 512 (1D) 1536 (1D) 2496 (1D)
Textur Units 64 128 240
L1-Cache 64 KB 64 KB 64 KB
L2-Cache 768 KB 512 KB 1,5 MB
ECC Speicher und Caches nur Speicher Speicher und Caches
FP64 1/2 FP32 1/24 FP32 1/3 FP32

Die Ausrichtung auf den professionellen Bereich wird vor allem durch folgende Punkte deutlich: GK110 beherrscht ein ECC-Fehlererkennungsverfahren, hat eine höhere Double-Precision-Performance, höhere Speicherbandbreite und mehr CUDA-Kerne. Hinzu kommen Features wie Hyper-Q und Dynamic Parallelism. Hyper-Q nimmt sich dem Problem an, dass CPUs nicht immer in der Lage sind die GPUs mit ausreichend Rohdaten zu füttern. "Fermi" beispielsweise hatte nur eine Work-Queue, Kepler kann nun mit 32 Work-Queues besser ausgelastet werden. Dediziert werden 32 CPU-Kerne unterstützt, ohne das Optimierungen in der Software vorgenommen werden müssen. Dynamic Parallelism verteilt die anfallenden Daten und Berechnungen selbständiger. Die Qeue-List wird nicht mehr von der CPU bestimmt, sondern von der GPU selbst.

[figure image=http://www.hardwareluxx.de/images/stories/newsbilder/aschilling/2012/gtc2012/gtc2012-gk110-die-rs.jpg link=http://www.hardwareluxx.de/images/stories/newsbilder/aschilling/2012/gtc2012/gtc2012-gk110-die.jpeg alt= GK110 Die] GK110 Die[/figure]

Auf alle diese Punkte gingen wir bereits im Mai in einer ausführlichen News mit genauen Erklärungen ein.

Quellen und weitere Links KOMMENTARE (19)