Werbung
Wie immer rollt bei neuen Prozessoren auch die Marketing-Maschinerie der Hersteller an - nicht nur auf Intels Seite mit der "Multiply"-Werbekampagne, sondern auch auf Seiten des Konkurrenten AMD. Dieser schießt auf das Multi-Chip-Packaging von Intel und stellt die eigene Architektur als die fortschrittlichere dar, da man hier nicht den FSB verwenden würde.
AMD plant für 2007 einen monolithischen Quad-Core-Prozessor - also ein Modell aus einem einzigen Stück Silizium mit vier Kernen. Dieser unter dem Codenamen "Barcelona" (Serverbereich, im Desktop-Bereich wohl Altair/Altair-FX) entwickelte Kern wird neben schnelleren Fließkommaberechnungen und einer größeren Anzahl Instruktionen pro Takt (ähnlich wie Intels Wide Dynamic Execution) jeden Kern einzeln heruntertakten können, um Strom zu sparen. Auch wird der Kern einen L3-Cache erhalten, den sich alle Prozessoren teilen - ähnlich wie dem Smart-Cache von Intel. AMD möchte gerne die 65-nm-Technik nutzen und verspricht eine TDP von unter 100 Watt. Allerdings muss man sich noch eine Zeit lang gedulden, denn das Produkt wird erst für das dritte Quartal 2007 erwartet.
Vorteil des monolithischen Designs sind hingegen die Bandbreiten, die dem Prozessor zur Verfügung stehen, um Daten von einem Kern zum anderen auszutauschen. Bei Intel läuft ein Datenaustausch von den Kernen 1 und 2 zum zweiten Kernpaar 3 und 4 über den FSB. Deshalb betont AMD gerne, dass der FSB bereits zum Nadelöhr wird: Sämtliche I/O-Zugriffe, die Übertragung zum Speicher und zu den Kernen läuft bei Intel über den 8,5 GB/s schnellen Bus. Bei AMD existiert durch den eigenen Memory-Controller ein dedizierter Zugriff auf den Speicher, die Kerne können sich über HT-Links mit 6,4 GB/s miteinander verständigen und die I/O-Anbindung wird wiederum separat durch einen HT-Link realisiert - Bandbreite hat man in diesem Modell also deutlich mehr.
Allerdings stellen sich für den Endkunden nicht diese theoretischen Fragen, sondern ganz praktische:
a) Ist der Core2 Extreme QX6700 durch den FSB im Nachteil?
Nachdem wir auf dem Intel Developer Forum von Intel selber bereits mittels VTune gezeigt bekamen, dass der FSB nur eine Auslastung von 10 bis 20% in einigen Anwendungen besaß, wollten wir diesen Umstand selber messen. Aufgrund der vorgezogenen Vorstellung des Core2 Extreme QX6700 auf den heutigen 2. November ist uns eine aussagekräftige Bestimmung mit VTune leider nicht mehr zeitlich möglich gewesen. Den eigenen Beweis müssen wir also zu einem späteren Zeitpunkt angehen. VTune ist in diesem Fall eine hilfreiche Applikation: Man kann auf Systemebene überwachen, wo Bottlenecks bei Programmen auftauchen. Auch die Nutzung der FSB-Bandbreite kann man sich hier anzeigen lassen.
Ein einfacher Test wäre allerdings auch ohne VTune möglich: Betreibt man den FSB des Prozessors einmal mit 1066 MHz und einem Multiplikator von x10 (2,66 GHz) mit einem Speicherteiler von DDR2-800 und anschließend mit 1333 MHz und einem Multiplikator von x8 (2,66 GHz) mit einem Speicherteiler von DDR2-800, so müssten einige Anwendungen, die FSB-limitiert sind, deutlich schneller laufen.
Bei diesem Test darf man allerdings nicht vernachlässigen, dass aktuelle Mainboards eventuell einen FSB von 1333 MHz nicht mit denselben Chipsatz-Timings realisieren. So testeten wir mit dem Intel D975XBX2 und stellten fest, dass das Board signifikant langsamer wurde, wenn ein FSB von 1333 MHz gewählt wurde. Dieses liegt daran, dass versucht wird, den höheren FSB ebenso stabil betreiben zu können - für eine Vergleichbarkeit ist dieses Board dann aber nicht mehr geeignet, weil die Vorteile durch den höheren FSB bei bandbreitenlimitierten Anwendungen durch die Entschärfung der Chipsatzregister verfälscht werden würden.
Die zweite Abweichung entsteht durch den Arbeitsspeicher: Hier wird bei FSB1333 ein Speichertakt von 833 MHz gefahren. Die sind zwar nur 4,1% mehr als spezifiziert, wenn man allerdings Abweichungen im Prozentbereich überprüfen möchte, ist dies eindeutig zu viel.
Also: Bei einem derartigen Test, misst man Mist. Wir haben trotzdem etwas herumprobiert und kamen auf keine oder nur geringe Abweichungen der Benchmarks. Natürlich skaliert Sisoft Sandra als Speichertest extrem in derartigen Tests, in der Real World Performance zeigten sich allerdings nur geringe Auswirkungen - und wenn sich diese zeigten, dann aufgrund des höheren Speichertaktes.
b) Ist das Produkt durch den FSB günstiger / schneller verfügbar?
Auf dem Intel Developer Forum rutschte uns eine Folie mit Herstellungskosten von Intel in die Hand - wahrscheinlich ein Versehen, dass diese Daten in einer Präsentation zu finden waren, oder Intel streute diese Informationen bewusst, um die finanziellen Vorteile durch das Multi-Chip-Package herauszustellen. Fakt ist, in dem Papier von Intel sind die MCP-Quad-Cores günstiger, als ein monolithisches Design. Hierbei berücksichtigt Intel nur die Herstellungskosten - also keine Kosten für die Forschung an einem separaten Kern.
Denn auch dies verursacht Kosten und kostet vor allen Dingen Zeit: Möchte man einen Vierkernprozessor auf einer Siliziumfläche produzieren, so muss ein komplett neuer Die entwickelt werden. Neben den Forschungskosten am Die und das Risiko, dass dieser Prozessor nicht so funktioniert, wie man ihn geplant hat, geht Zeit für die Validierung und Produktion ins Land. Setzt man hingegen zwei bereits bestehende und sicher funktionierende Prozessoren auf einem Multi-Chip-Package nebeneinander, muss man nur validieren, dass diese Kerne zusammen funktionieren, die thermischen Fragen geklärt sind und die Mainboards eine entsprechende Stromversorgung gewährleisten können.
Dies war für Intel kein Problem - demnach kann man bereits jetzt einen Quad-Core-Prozessor aufweisen. Ein entsprechendes monolithisches Design ist von Intel allerdings auch geplant: Der Yorkfield genannte 45-nm-Prozessor wird über voraussichtlich 6 MB Shared L2-Cache verfügen und vier Kerne in einem einzigen Silizium vereinen. Vielleicht bringt Intel dann schon einen 8-Kern-Prozessor mittels MCP?
Für den Anwender haben die oben dargestellten Dinge also eigentlich keine Relevanz: Der Preis muss stimmen, wobei wahrscheinlich ist, dass dies durch ein MCP-Design durchaus einfacher zu realisieren ist. Weiterhin muss die Performance stimmen und hierbei haben andere Faktoren deutlich mehr Einfluss als der FSB.