Werbung
In der Radeon-HD-7000-Serie zum Einsatz kommt die Tessellation-Engine in der 9. Generation. In dieser wurde die Wiederverwendung der Vertex-Daten erhöht, das Buffering optimiert und die Größe des Paramter-Cache verdoppelt.
Dies soll dazu führen, dass die Tessellation-Engine der 9. Generation bis zu viermal schneller arbeitet als die 8. Generation in der Radeon-HD-6900-Serie. Besonders zum Tragen soll dies in hohen Tessellation-Stufen ab Level 15 kommen. Bemerkbar macht sich dies natürlich nur in Anwendungen und Spielen, die Gebrauch von Tessellation machen.
NVIDIA hat es über die vergangenen Jahre geschafft, seine GPUs auch für das Computing anderer Aufgaben interessant zu machen. Dies hat zum einen mit dem guten Support zu tun, den NVIDIA in dieser Hinsicht leistet und ist zum zweiten auch durch die Fermi-Architektur begründet, die für diesen Einsatzzweck ausgelegt wurde.
AMD hat dies erkannt und will mit „Southern Islands“ gegensteuern. Doch neben den bereits erwähnten grundsätzlichen Optimierungen in der GCN-Architektur hat AMD auch noch weitere Komponenten der GPU auf das Computing ausgelegt. So sind in jeder „Tahiti“-GPU zwei ACEs (Asynchonous Compute Engine) zu finden. Diese arbeiten unabhängig voneinander und auch vom GCP (Graphics Command Processor). Die Aufgabe der Dual-ACEs ist es, die anstehenden Rechenaufgaben möglichst effizient zu verteilen. Eine Dual-DMA-Engine (Direct Memory Access) erlaubt den direkten Speicherzugriff ohne den Umweg über die CPU. Die Dual-DMA-Engine kommuniziert direkt mit dem L2-Cache und den zwei ACEs. Somit ist es möglich, die zur Berechnung nötigen Daten deutlich schneller an die Compute-Engines zu liefern. AMD spricht davon selbst den PCI-Express-Bus mit 16 GB/Sek. bidirektional zu saturieren.
AMD gibt eine Rechenleistung von 4,5 TeraFLOPS für die Fließkommaperformance in Single-Precision an. Bei doppelter Genauigkeit kommt die „Tahiti“-GPU auf eine Rechenleistung von 947 GFLOPS. Zum Vergleich: Eine GF110-GPU kommt auf eine Rechenleistung von 1,58 TeraFLOPS bei einfacher Genauigkeit. Eine Cayman-XT-GPU kommt bei einfacher Genauigkeit auf 2,7 TeraFLOPS und 675 GFOPS bei doppelter Genauigkeit. Doch all diese theoretischen Werte spielen kaum ein Rolle, wenn das übrige Ökosystem nicht darauf abgestimmt ist. AMD bietet daher auch den ECC-Support für DRAM und SRAM. Als erste GPU werden die „Southern-Islands“-Chips auch OpenCL 1.2, DirectCompute 11.1 und C++ AMP unterstützen. Man kann also davon ausgehen, dass in Kürze auch professionelle FirePro-Grafikkarten auf den Markt kommen, die dann explizit auf das Computing ausgelegt sind.