TEST

Ivy Bridge im Test

Intel Core i7-3770K und alle i5-Modelle - Die Änderungen zu Sandy Bridge

Portrait des Authors


Werbung

Auf der Architektur-Seite hat sich im Vergleich zu Sandy Bridge nichts getan, die Neuerungen der letzten Serie besitzt auch Ivy Bridge:

Ring-Bus-Cache:

Ältere integrierte Grafikkerne hatten oftmals nicht nur aufgrund der spärlichen Speicheranbindung eine schlechte Performance. Als weiterer negativer Punkt bremsten sie auch das Gesamtsystem aus, wenn gleichzeitig Bandbreite für die CPU und die Grafik benötigt wurde. Bereits aus diesem Grund waren integrierte Grafikkerne nur bei einem Low-End-System eine Alternative. Intel hat mit Sandy Bridge aber bereits eine integrierte Grafik geschaffen, die man durchaus nutzen konnte – und mit Ivy Bridge bohrt man diese noch einmal auf.

Die Performance der Grafiklösung erhöht man am besten mit einem schnellen Speicherzugriff: Nichts liegt näher, als bei einem Grafikkern auf dem Die auch den L3-Cache mit zu nutzen. Um dann allerdings den oben genannten Effekt auszugleichen, dass eventuell die CPU-Zugriffe auf den Cache ausgebremst werden, musste Intel die zur Verfügung stehende L3-Cache-Bandbreite massiv erhöhen. Durch den Ring Bus ist dies gelungen.

ringbus

Der Ringbus wurde erstmals mit Sandy Bridge eingeführt, um genügend
Leistung für die integrierte Grafik mitzubringen. Bei Ivy Bridge ist er in
unveränderter Art ebenso vorhanden.

Wie in der obenstehenden Grafik sichtbar ist, besitzt jeder Kern, die Grafik-Engine und der System-Agent einen Kommunikationspunkt mit dem L3-Cache. Im Endeffekt gibt es sogar vier Verbindungen: Einen 32 Byte Data-Ring, einen Request-Ring, einen Acknowledge-Ring und einen Snoop-Ring. Der Zugriff geschieht dabei immer über den kürzesten Pfad, also nicht in einer bestimmten Richtung. Durch diese für den CPU-Bereich neue Anordnung hat Intel nicht nur die Bandbreite gesteigert, auch ist die Latenzzeit für den Cache deutlich niedriger. Und: Der L3-Cache läuft mit der CPU-Taktfrequenz. Natürlich wirkt sich dies positiv auf die Grafikperformance aus – aber auch Enthusiasten, die eine dedizierte Grafikkarte einsetzen, haben von der neuen Architektur einen Vorteil, da der L3-Cache deutlich schneller geworden ist.

Zwischen Sandy Bridge und Ivy Bridge hat sich hier nichts getan, was auch die Messungen der Cache-Bandbreite belegen:

ivycachebandwidthssandybridge-bandwidths 

Cache-Latency-Vergleich:
Links Ivy Bridge, Rechts Sandy Bridge

ivycachelatencyssandybridge-latencys 

Cache-Bandbreiten-Vergleich:
Links Ivy Bridge, Rechts Sandy Bridge

Auch wenn die Grafiken aufgrund einzelner Ausschläge etwas andere Skalierungen besitzen - denn die Messungen wurden schließlich auf einem aktiven System gemacht -, so sind keine Unterschiede zwischen Ivy Bridge und Sandy Bridge vorhanden. Sowohl die Latenz des Caches wie auch die Bandbreite hat sich nicht geändert, sodass die Vermutung nahe liegt, dass Intel hier keine Veränderungen durchgeführt hat.

 

Turbo Boost 2.0:

Die Logik hinter Intels Turbo Boost ist einfach zu erklären: Werden bei einem Prozessor nicht alle Bereiche genutzt, reicht die Kühlung und die Auslegung der Stromzufuhr dafür, die genutzten Einheiten etwas schneller zu takten. Diese dürfen dann mehr Strom aufnehmen und etwas heißer werden, ohne die Funktion des Prozessors zu beeinträchtigen. Der Lohn der Arbeit: Berechnungen können schneller abgeschlossen werden.

turbobetrieb

Schematische Darstellung vom Turbo-Betrieb.

Wichtig wurde dieses Prinzip erst mit Mehrkern-Prozessoren, da viele Anwendungen weiterhin nur auf einem einzelnen Kern laufen oder nicht gleichzeitig alle Kerne voll auslasten. Dann ist es möglich, die Effizienz des Prozessors mit Turbo Boost zu erhöhen - der Prozessor wird dann ein oder mehrere Speed-Bins (Multiplikatorschritte) schneller betrieben.

Mit Sandy Bridge hat Intel sich zu dem üblichen Turbo-Betrieb eine Art Boost 2.0 ausgedacht, eine Art thermisches Budget wird zugrunde gelegt. Die Idee dahinter kennt jeder von dem CPU-Kühler im eigenen PC: Nach dem Anschalten des PCs ist das Metall noch kalt, erst nach minutenlangen Berechnungen erwärmt es sich auf eine gleichmäßige Temperatur. Diese Trägheit bei der Kühlung macht sich Intel bei den sogenannten „Dynamic Range Turbo Frequency Limits“ zunutze.

Intel erlaubt es bei Turbo Boost 2.0, nicht nur den einen Speed Bin schneller zu arbeiten, der in der Spezifikation hinterlegt ist, sondern je nach Energiebudget und CPU-Temperatur auch eine noch höhere Taktung. Diese geht somit über die eigentliche TDP des Prozessors hinaus – aber nur so lange, wie die Power Control Unit aufgrund der Umgebungsvariablen dies zulässt. Ist das thermische Budget aufgebraucht, also der Kühler wärmer geworden, schaltet Intel zurück in den normalen Turbo-Betrieb.

Die Speed-Bins haben sich mit Ivy Bridge etwas verändert: Mit voller Last taktet sich beispielsweise ein Core i7-3770K auf 3,7 GHz, also zwei Speed Bins höher. Bei zwei Kernen unter Last sind es 3,9 GHz, mit einem Kern ebenso 3,9 GHz. Je nach Prozessormodell unterscheiden sich diese Turbo-Speed-Bins aber teils deutlich.

turbo2

Auch beim Ivy Bridge verwendet Intel das Modell des thermischen Budgets,
und taktet den Prozessor somit auch kurzzeitig über die TDP, wenn die
Kühlung dies erlaubt.

Weiterhin kommen die größeren Modelle natürlich mit Hyperthreading, AVX mit 256 bit, AES-NI und den Architektur-Verbesserungen im Vergleich zu Lynnfield. Wie man aber an dieser Seite sehen kann, sind die Kerne und die Architektur nicht verändert worden - bis auf minimale Änderungen an einzelnen Registern, die Intel verbessert hat, wenn sich hier Probleme ergeben haben. 

Im Detail hat sich dann doch einiges geändert: Zum einen ist ein Hardwaregenerator für Zufallszahlen hinzugekommen, der es ermöglicht, einige Algorithmen sicherer zu machen. Weiterhin hat Intel einen Supervisor Mode Execution Protection hinzugefügt, die das NX-Bit ergänzt. Einige Befehle hat Intel ebenso überarbeitet (z.B. Float16). Messbar sind aber Performanceunterschiede hier nicht - wenn die Funktionen überhaupt schon in Software genutzt werden.

Die Veränderungen aufseiten der Grafikeinheit sind hingegen groß, weshalb Intel von einem Tick+ spricht. Auf der nächsten Seite haben wir diese Veränderungen detailliert aufgelistet.