Werbung
Der 12 MB Shared L3-Cache
Der Cache ist von der Struktur her unverändert und wird auch wie beim Bloomfield getaktet:
Beim Core i7-9xx wird der Cache mit der Uncore-Taktrate betrieben, diese ist immer mindestens der doppelte Takt des Speichertaktes. Wird der Core i7-980X also mit 1066 MHz betrieben, läuft der Uncore-Takt mit 2133 MHz und somit auch der L3-Cache mit 2133 MHz. Verwendet man hingegen 1333 MHz schnellen Speicher, läuft der L3-Cache mit 2666 MHz, bei 1600 MHz schnellem Speicher sind es 3200 MHz.
Beim Lynnfield-Prozessor Core i7-8xx und dem i7-750 ist dies anders. Beim Core i7-870 und Core i7-860 beträgt der UnCore-Takt 2400 MHz, wobei Intel hier zwischen den Lynnfield-Prozessoren differenzieren kann. Wie der UnCore-Takt ist auch der L3-Cache mit 2400 MHz getaktet, unabhängig vom Speichertakt. Der Takt des L3-Caches hängt nur noch von der Base Clock Rate ab, die - wenn das System nicht übertaktet ist - bei 133 MHz als Basistakt zugrunde liegt.
Beim Core i5-750 beträgt der UnCore-Takt nur 2133 MHz, somit besitzt dieser auch nur einen mit 2133 MHz getakteten L3-Cache. Neben dem Fehlen von Hyperthreading ist dies also ein weiteres Kennzeichen der Core i5-Serie.
Der Core i7-980X zeigt bei Verwendung von 1333 MHz den typischen L3-Cache-Takt von 2,66 GHz:
UnCore-Takt beim Core i7-980X
Die Performance des Caches haben wir mittels Rightmark Memory Analyzer gemessen:
Die Cache-Performance des Core i7-980X ist identisch zu den bisherigen Bloomfield-Prozessoren.
Allgemeines zum Speicherinterface:
Ein integrierter Speichercontroller kann aus Performancesicht sehr nützlich sein: AMD hielt mit der Integration des Memory-Controllers in den Athlon 64 den damaligen Pentium-4-Gegenspieler lange in Schach. Intel hingegen wehrte sich anfangs gegen eine derartige Lösung, da man mit der Integration in die CPU die Flexibilität etwas aus der Hand gibt: Mit einem neuen Chipsatz ließe sich schnell auf einen neuen Speichertyp umschwenken, ist der Speichercontroller erst einmal in der CPU integriert, muss ein neues Stepping her - und meistens wohl auch ein anderer Sockel oder Ähnliches. Die Performancevorteile ließen Intel aber dann doch umdenken - mit der Nehalem-Architektur kam auch ein integrierter Speichercontroller.
Bei Intels Prozessor-Lineup der Core-i3/5/7-Serie gibt es drei Ausführungen des Speichercontrollers:
Der Memory-Controller des Core i7-9xx:
Intel spendiert dem Gulftown und anderen Modellen der Core i7-9xx-Serie ein Triple-Channel-DDR3-Interface, welches man zunächst für den Betrieb mit DDR3-1066 freigibt. Eigentlich ist hier sehr viel mehr möglich, wir haben den Speichercontroller schon mit bis zu 2280 MHz betrieben. Auch sind schnellere Speichermodule am Markt verfügbar, Intel selber spezifiziert mit der XMP-Technik Module mit 1600 MHz. Doch selbst mit DDR3-1066 steht dem Prozessor eine Bandbreite von 25,5 MB/s zur Verfügung - und das bei extrem guten Latenzzeiten.
Der Core i7-980X bringt jedoch auch Möglichkeiten mit, den Speicher schneller laufen zu lassen. Im BIOS vieler Boards finden sich beim Einsatz eines Core i7-965 beispielsweise Optionen bis zu DDR3-2133 hin. Auch bei kleineren Modellen lässt sich der Speicher hochdrehen. Beachtet werden muss zudem, dass die Uncore-Taktrate vom DDR3-Takt abhängt - sie ist mindestens zweimal so hoch. Bei DDR3-2133 würden der Memory-Controller, der L3-Cache und die sonstigen Uncore-Bereiche demnach auf 4266 MHz laufen - oftmals wohl zu viel.
Der Memory-Controller des Core i7-8xx und i5-750:
Dem Lynnfield spendiert Intel nur ein Dual-Channel-Speicherinterface. Dafür setzt Intel den Takt hinauf, statt 1066 MHz dürfen nun 1333-MHz-Module zum Einsatz kommen. Auch XMP ist hier wieder mit am Start, so dürfen Speichermodule mit XMP im Core i7-870 und -860 auch mit 1600 MHz betrieben werden. Der kleinere Core i5-750 besitzt kein XMP und somit auch nicht die Möglichkeit, mit 1600 MHz Speicher offiziell zu laufen. Im BIOS der Mainboards fehlt diese Option auch als Speichermultiplikator.
Auf diversen Boardverpackungen sind auch Taktungen von 2133 MHz und mehr angegeben - diese erreicht man nur durch hinaufsetzen der Base Clock Rate (BCLK), da bei allen Prozessoren nur ein 12x-Multiplikator für den Speicher als Maximum einzustellen ist.Der UnCore-Takt stieg beim Core i7-9xx immer mit an - beim Core i7-8xx ist dies nicht mehr der Fall. Der UnCore-Bereich wird hier immer mit 2400 MHz getaktet, unabhängig vom Speichertakt. So testeten wir dies mit den Einstellungen 800, 1066, 1333 und 1600 MHz, CPU-Z zeigte uns jedoch immer denselben Northbridge-Takt von 2400 MHz an. Daraus folgt, das der Northbridge-Takt hier zwar nicht mehr limitiert bei der Übertaktung des Speichers über den Multiplikator, aber auch die Performance des Uncore-Bereiches etwas niedriger ist, als die Performance des Uncore-Bereichs des Core i7-9xx. Setzt man die Base Clock Rate hoch, steigert sich natürlich auch der Northbridge-Takt, da dieser von der BCLK abhängt.
Architektur: QPI - der neue Bus
Intels Front-Side-Bus ist in die Jahre gekommen, deshalb schwenkte Intel beim Bloomfield auf einen neuen Bus um. Dies geschieht nicht ohne Grund: Im Desktop-Bereich mag der FSB mit seinen aufgebohrten 1600 MHz und 12,8 GB/s Übertragungsrate noch ausgereicht haben, bei Dual-Prozessor-Maschinen und Servern teilen sich aber mehrere Prozessoren die Bandbreite des FSBs bei Zugriffen auf den Speicher und den Cache des fremden Prozessors. Hier war das Phenom- und Athlon-64-Design mit AMDs Hypertransport-Bus in der Vergangenheit überlegen, aufgrund der NUMA-Architektur konnte AMD gerade im Serverbereich Marktanteile gewinnen.
Intel entlastet durch zwei maßgebliche Änderungen das Nadelöhr Richtung Northbridge: Der Speichercontroller wandert in die CPU, weiterhin bohrt man den I/O-Bus auf. Statt des bis zu 12,8 GB/s schnellen FSBs (bei 1600 MHz) kommt eine Point-to-Point-Verbindung mit 12,8 GB/s zum Einsatz, bei der die Daten aber bidirektional gesendet und empfangen werden können. Insgesamt stehen also 25,6 GB/s pro Link zur Verfügung. Zukünftig möchte Intel auch den QPI-Link durch Takterhöhung noch beschleunigen. Per Overclocking ist das schon heute möglich.
Gerade bei Mehrsockel-Systemen bietet Intel aber mehrere QPI-Links pro Prozessor. Durch diese QPI-Links können auch Prozessoren miteinander kommunizieren. Mit dieser Architektur ist es auch möglich, auf den Arbeitsspeicher des anderen Prozessors in hoher Geschwindigkeit zuzugreifen. Diese sogenannte Non-Uniform-Memory-Access-Architektur (NUMA) ähnelt der AMD-Implementierung im Serverbereich. Intel gibt dabei an, dass für einen Prozessor der Speicherzugriff auf den eigenen Speicher zwar durch die hohe Bandbreite und niedrige Latenzzeit zu empfehlen ist, der so genannte „Remote-Speicher“, also der Speicher eines anderen Prozessors, sei jedoch von der Performance her mit einer ähnlichen Latenzzeit zu erreichen wie bei einem Harpertown-System mit einem FSB von 1600 MHz.
Beim Lynnfield findet man den QPI-Takt allerdings nur für interne Zwecke, da er keinen QPI-Controller besitzt, um ihn mit mehreren Prozessoren zu koppeln. Der QPI-Controller bindet vermutlich nur intern den DMI- und PCIe-Controller an.