Werbung
Auf der diesjährigen CES erwähnte NVIDIA in der Pressekonferenz ein Projekt "Denver". Dahinter soll sich eine von NVIDIA mitentwickelte ARM-Architektur verbergen, die in zukünftiger Hardware in Form von Smartphones, über mobile PCs, bis hin zu Embedded-Hardware und Server eingesetzt werden soll. Nun bestätigte Michael Rayfield, General Manager für den Mobile-Geschäftssektor bei NVIDIA, gegenüber Hexus, dass die auf der GTC 2010 in einer Roadmap präsentierte "Maxwell"-GPU mit ARM-Rechenkernen auf Basis von "Denver" ergänzt sein soll.
Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht
Als Übergang zu "Maxwell" wird Ende des Jahres "Kepler" erwartet. Entsprechende GPUs sollen in 28 nm bei TSMC gefertigt werden. Um die GPUs bzw. deren Rechenkerne effektiver nutzen zu können, soll "Kepler" bereits Preemption- und Virtual-Memory-Funktionen besitzen. Bereits heute kommen Scheduler zum Einsatz, um die Rechenaufgaben auf die Kerne der GPU aufzuteilen. Der Scheduler in "Kepler" soll in der Lage sein, einzelne Rechenkerne auch direkter anzusprechen, um sie beispielsweise in eine Ruhezustand zu versetzen
Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht
Einen Flaschenhals beim GPU-Computing stellt heute noch der Datentransfer zwischen Speicher, CPU und GPU dar. AMD versucht diesen mit den DMA-Engines zu umgehen. DMA steht für Direct Memory Access und beschreibt eine Zugriffsart, bei der nicht über die CPU auf den Arbeitsspeicher zugegriffen wird, sondern direkt über das Bussystem. AMD verwendet bidirektionale DMA-Engines, die eine vollständige Saturierung des PCI-Express-Interfaces erreichen. Doch dies wird zukünftig wohl nicht mehr ausreichen. ARM-Prozessoren direkt auf der GPU könnten die Daten noch schneller an die einzelnen Rechenkerne heranführen.
Noch ein paar Zahlen zur Rechenleistung, welche noch von der GTC 2010 stammen und vielleicht erklären warum NVIDIA die GPU mit ARM-Prozessoren koppeln möchte:
Fermi erreicht aktuell fast 2 GFLOPS Dual-Precission-Performance pro Watt. 2011 soll Kepler folgen. Kepler soll zwischen 4 und 6 GFLOPS Dual-Precission-Performance pro Watt erreichen. Im zweiten Quartal 2011 will NVIDIA erste Prototypen ausliefern. Für die zeitliche Lücken zwischen jetzt und Kepler erwähnt Jen-Hsun noch einen "mid life kicker", über den man aber sonst nichts weiter verraten wollte. Für 2013 ist Maxwell geplant, der zwischen 14 und 16 GFLOPS Dual-Precission-Performance pro Watt erreichen soll. Zwischen jetzt und Maxwell liegen noch einige technologische Schritte wie etwa ein Virtueller Speicher. Kepler soll rund 10x schneller sein als Fermi. Für Maxwell gibt NVIDIA eine Steigerung der Performance um den Faktor 40 gegenüber Tesla an.
Weiterführende Links: