TEST

NVIDIA GeForce GTX 280 - GT200Architektur2

Von Andreas Schilling
Montag, 16.06.2008 um 16:25 Uhr

Seite 3: GT200 Architektur (2)

SIMT Architecture:

Die Kommunikation zwischen den Texture Processing Clustern erfolgt mittels MIMD (Multiple Instruction - Multiple Data). Zwischen den Streaming-Multiprozessoren wird SIMT (Single Instruction - Multiple Thread) angewendet. SIMT bietet gegenüber MIMD den Vorteil, dass es schneller arbeitet und auch einfacher zu programmieren ist. SIMT sorgt ebenso dafür, dass alle Streaming-Prozessoren ausgelastet sind, was bei einer solchen Anzahl an Prozessoren sehr wichtig wird.

Larger Register File:

Gegenüber der "GeForce 8 & 9"-Generation wurde die Größe des Registers in den Streaming-Multiprozessoren verdoppelt. In der Vergangenheit kam es häufiger zu der Situation, dass lange Shader-Operationen ausgelagert werden mussten. Das neue, doppelt so große Register kann nun auch mit langen Shader-Operationen umgehen und erreicht so eine höhere Effektivität. Da auch in Zukunft mit immer komplexer werdenden Shader-Operationen gerechnet werden muss, sicher ein richtiger Schritt, der auch keinerlei Nachteile aufweist, da die Register nur einen sehr kleinen Teil der Streaming-Multiprozessoren ausmachen.

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht

Special Function Units:

Sogenannte Special Function Units übernehmen in den Streaming Multiprozessoren MAD- und Floating-Point MUL-Operationen, also einfache Multiplikation sowie Addition. Der GT200 ist nun in der Lage pro Takt jeweils eine MAD- und eine MUL-Operation in den Special Function Units zu berechnen. Insgesamt erreicht eine GeForce GTX 280 so eine maximale Rechenleistung von einem Teraflop innerhalb des Scalable Processor Array.

Double Precision:

Für herkömmliche Berechnungen reicht eine 32 Bit Single-Precision aus. Da NVIDIA aber besonderen Wert auf GPGPU und GPU-Computing legt, können hier Situationen auftreten, bei denen eine Präzision von 32 Bit nicht mehr ausreicht. Hierzu hat NVIDIA nun Double Precision, also 64 Bit Floating-Point, eingeführt. Jeder Streaming-Multiprozessor besitzt eine Double-Precision-Einheit, was insgesamt zu 30 Double-Precision-64-Bit-Prozessoren führt. Die Rechenleistung soll damit auf Niveau eines Achtkern-Xeon-Systems liegen.

ROP:

Das ROP-System der GeForce-8-Serie unterstützt Multisampled, Supersampled, Transparency Adaptive und Coverage-Sampling-Antialiasing. Ebenfalls unterstützt wurde der Frame Buffer (FB) samt Floating-Point (FP16 und FP32), was dann auch Multisampled Antialiasing im Zusammenspiel mit HDR möglich macht. So wurden dann 24 Pixel pro Takt berechnet. Mit der GeForce GTX 280 sind nun 32 Pixel pro Takt möglich. Auch die Anzahl der Raster-Operation-Prozessoren (ROPs) steigt von sechs auf acht.

Durch Klick auf das Bild gelangt man zu einer vergrößerten Ansicht
105 NVIDIA GT200 GPUs können aus einer 300 mm 65nm Wafer bei TSMC gefertigt werden. Intel schafft zum Vergleich 2500 45 nm Atom Prozessoren aus einer 300 mm Wafer.

512-Bit-Speicherinterface und 1-GB-Grafikspeicher:

Ein weiteres auffälliges Merkmal der GeForce GTX 280 ist der 1 GB große Grafikspeicher und das 512 Bit breite Speicherinterface. Aktuelle und zukünftige Spiele basieren auf immer hochauflösenderen Texturen. Cubemaps und Shadowmaps für Soft Shadows benötigen ebenfalls eine Menge Speicher. Besonders im Zusammenspiel mit Antialiasing kommen selbst aktuelle Grafikkarten wie zum Beispiel die GeForce 9800 GTX an ihre Grenzen. Die GeForce GTX 280 hat hier gegenüber der Vorgängergeneration einen doppelt so großen Frame-Buffer, wohingegen die GeForce GTX 260 mit 896 MB auskommen muss und auch wird, denn auch hier dürfte der Speicher mehr als ausreichend sein.

Die Steigerung von einem 384 Bit breiten, auf ein 512 Bit breites Speicherinterface wird durch acht 64 Bit Wide Frame Buffer Interface Units möglich gemacht. Auch das Texture zu Frame Buffer (TEX:FB) Verhältnis wurde auf aktuelle und zukünftige Bedürfnisse hin optimiert. Der Takt des Speichers bleibt mit 1100 MHz bei der GeForce GTX 280 gegenüber dem Vorgänger aber auf gleichem Niveau.

Stromsparmechanismen:

Ein großer Nachteil des G80/G92 war der fehlende Stromsparmechanismus. Doch der immer größer werdende Stromhunger scheint NVIDIA geholfen zu haben, nun doch eine entsprechende Technologie zu implementieren. In drei verschiedenen Modi können Karten der GeForce-200-Serie betrieben werden. Im Full-Performance-Mode arbeitet die Karte mit voller Leistung und zieht dann theoretisch bis zu 236 Watt an Leistung, um diese dann nahezu vollständig in Wärme umzuwandeln. Im Blu-ray-DVD-Playback-Mode soll der GT200 dann nur noch 35 Watt verbrauchen. Wem auch das noch zu viel ist, der kann die Karte im Idle/2D-Modus betreiben, wo dann nur noch 25 Watt aus dem Netzteil gesaugt werden.

Erreicht wird diese Reduzierung durch eine Absenkung des Taktes und der Spannungen. Hinzu kommt noch eine Technologie, wie sie unter anderem bei Notebook-Prozessoren eingesetzt wird. Das Clock Gating erlaubt es einzelne Bereiche der GPU abzuschalten, sodass sie gar keinen Strom mehr benötigen. Dazu wird die Auslastung der GPU überwacht und innerhalb von Sekundenbruchteilen zwischen den verschiedenen Modi umgeschaltet.

Kommt ein Mainboard mit nForce-780a-Chipsatz zum Einsatz, so bieten die GeForce GTX 280 und 260 auch Hybrid-SLI an. Mit Hybrid SLI bzw. HybridPower will NVIDIA nun die SLI-Technologie nicht nur was die Performance betrifft verbessern, sondern auch einen weiteren wichtigen Faktor einbringen, den Stromverbrauch. Auf einem Mainboard mit NVIDIA-Chipsatz der Hybrid-SLI unterstützt, lassen sich so entsprechende NVIDIA-Grafikkarten komplett abschalten wenn sie nicht gebraucht werden, und die Onboard-Grafik übernimmt die Arbeit.

Seite 2: GT200 Architektur (1) Seite 4: GPU-Computing

Quellen und weitere Links

KOMMENTARE ()

{{{_source.title}}} {{#_source.showPrice}} {{{_source.displayPrice}}} {{/_source.showPrice}}

NVIDIA GeForce GTX 280 - GT200Architektur2