Integrierte Grafik von AMDs Fusion-CPUs auf Niveau einer Radeon HD 5500?

Ein Llano Quad Core mit IGP wird von der CPU Leistung wie der Deneb X4 mit 3,2 Ghz punkten können.

AMD wird es trotzdem nicht leicht haben gegen Intel

Der i7 975 ist bei Cinebench 29-30% schneller als der X4 965, hier sieht man das die IPC vom Nehalem P6-X ganz klar AMD K10-X überlegen ist.

AMD kann nur mit Bulldozer Intel überholen, dazu sind erstmal hohe IPC steigerungen von 50% gegenüber K10 nötig, (Sandy Bridge wird IPC Steigerungen zeigen, der Abstand von Intel zu AMD wird dann noch größer) das muss AMD schaffen, wenn es gelingt sind die hohe Taktraten durch max. Turbo nochmal einen harten Schub um Intel im schatten zu lassen.


qqehshy4.jpg
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Der i7 975 ist bei Cinebench 29-30% schneller als der X4 965, hier sieht man das die IPC vom Nehalem P6-X ganz klar AMD K10-X überlegen ist.
Das ist doch überhaupt nicht vergleichbar. Das eine ist eine CPU mit 8 logischen Prozessoren, die andere eine mit 4 logischen Prozessoren. Also eine grundsätzlich andere Leistungsklasse. Du solltest dich lieber fragen, warum die CPU mit 8 logischen Prozessoren nicht doppelt so schnell ist.
Vergleichbar mit dem Nehalem Quad mit SMT ist der X6. Zwar immer noch 2 logische Prozessoren weniger, dafür 2x mehr Ausführungseinheiten. Und anhand von Cinebench sieht man ja schon, dass die IPC, bezogen auf den gesamten Prozessor, sich nicht gross unterschiedet. AMD muss mit Bulldozer also gar nicht aufholen, um mit Sandy Bridge mithalten zu können. Sie müssen lediglich so viel zulegen wie Sandy Bridge gegenüber Nehalem. Was nicht heissen soll, dass es nicht mehr wird.

Btw, man sollte auch wissen, wie man Zahlen richtig liest. Deine Grafik zeigt, dass der X4 965 ~30% langsamer ist und nicht dass der i7-975 ~30% schneller ist. ;)
 
Zuletzt bearbeitet:
Naja, die sind aber generell nicht so leistungshungrig, bis auf den Saturn-Emu krieg ich auf nem X2 3800+ alles halbwegs zum laufen, da kommt dann auch ein Kern einer aktuellen CPU nicht ins Schwitzen. Wir reden von Emulatoren bis max PS1, N64 etc.

Ach so, na dann gehts ja. ;) Bei PS2 Emulatoren sind die Anforderungen an die CPU im Regelfall nämlich recht heftig, dazu werden nicht mehr als 1-2 Kerne ausgelastet - wenn man da einen 20-30% IPC-stärkeren (verglichen zu K10.5) Core i3/i5 hat, kann das die Spielbarkeit schon deutlich verbessern. Die GPU ist dabei wiederum nicht ganz so bedeutend, auch wenn Llano nur auf ~30-60% der Speicherbandbreite eines aktuellen Propus + Redwood kommt, sollte das für solcherlei Anforderungen noch locker ausreichen.
 
Die Anforderungen reichen locker für Emulatoren. K10.5 hat ja lediglich 10-15% weniger IPC im Vergleich zu Nehalem pro logischen Prozessor und Llano wird hier sicherlich nochmal einige Prozent drauflegen. Hinzu kommt der Takt. Auch die GPU in Llano wird nicht weniger Bandbreite haben als aktuell zB eine HD 5570.
 
K10.5 hat ja lediglich 10-15% weniger IPC im Vergleich zu Nehalem

auch wenn dus noch 1000mal schreibst wird es dadurch nicht richtiger - es sind etwa 25% - zeigt zB der 1-CPU Test bei Cinebench, mein Ausführlicher Post wurde leider gelöscht - er war ein bisschen zuweit oT

mfg
 
Zuletzt bearbeitet:
Vielleicht redet er ja von einem bestimmten Spezialfall - da mögen es mal nur 10-15% sein. Gleichermaßen gibt es auch Fälle, wo die Differenz bei 40% liegt. Das wir im Schnitt bei grob 25% liegen bestreitet kein neutraler Beobachter. :wink: Ähnlich interessant sind seine Bandbreitenvergleiche: Llano ist keine GPU. Llano besteht aus einer GPU und einer CPU, also müssen wir die summierten Bandbreiten vergleichen.
 
Ihr könnt 20-30% auch noch eine Million Mal kolportieren, es wird dadurch nicht richtig. Es sind durchschnittlich 10-15%. Punkt. Alles andere, wie Cinebench, sind Einzelfälle und damit nicht aussagekräftig. Zumal gerade Cinebench sehr stark Intel optimiert ist. Da könnte ich genauso gut Sachen wie TrueCrypt heranziehen und behaupten, K10.5 hätte 20% mehr IPC. :rolleyes:

Und jetzt bitte zurück zum Thema. Es geht um Fusion. Und gerade bei Llano muss man die Bandbreite natürlich nicht zusammenrechnen. Für die GPU ist nur die Bandbreite von Bedeutung, die die GPU bekommt. Gleiches gilt für die CPU. Bandbreiten einfach zu addieren, sagt überhaupt nichts.
 
Zuletzt bearbeitet:
Für die GPU ist nur die Bandbreite von Bedeutung, die die GPU bekommt. Gleiches gilt für die CPU. Bandbreiten einfach zu addieren, sagt überhaupt nichts.

So würde ich das auch sehen. :wink:

Vor allem wenn man Vergleiche zu anderen Prozessoren ziehen will macht eine Addition der einzelnen Faktoren nur sehr wenig Sinn.
 
Da könnte ich genauso gut Sachen wie TrueCrypt heranziehen und behaupten, K10.5 hätte 20% mehr IPC.

Und da wir weder von Einzelfällen in der einen, noch in der anderen Richtung reden, gibt es diverse Durchschnittsratings einer Vielzahl von Reviews im Netz. Diese erneut gemittelt, ergeben die vielzitierten ~25%. :)

Für die GPU ist nur die Bandbreite von Bedeutung, die die GPU bekommt. Gleiches gilt für die CPU.

Ah ja. Dann verdoppelt sich also auf wundersame Weise die Bandbreite, so dass CPU und GPU zeitgleich die vollständige Bandbreite nutzen können?

Machen wir doch mal ein praxisrelevantes Beispiel:

790GX Boards mit Sideport (16Bit, DDR3-1333) liegen ~10% vor Modellen ohne diese zusätzliche Bandbreite. Und das bei einer mickrigen 40 Shader GPU... Die offensichtlich nicht ausreichend vom Dual-Channel DDR3-1333 Speicherinterface einer aktuellen AM3-CPU versorgt werden kann. Jetzt machen wir aus den 40 Shadern 400 (Faktor 10) und geben unserer CPU-GPU Kombination 40% (Faktor 1,4) mehr Bandbreite...
 
auch wenn dus noch 1000mal schreibst wird es dadurch nicht richtiger - es sind etwa 25% - zeigt zB der 1-CPU Test bei Cinebench, mein Ausführlicher Post wurde leider gelöscht - er war ein bisschen zuweit oT

mfg

Das sind keine 25%. Im besten Falle sind es 15%, ich würde sogar eher sagen 10% pro Kern. 25% können es nur werden, wenn man SMT pro Kern mit enrechnet. Die I/O-Bereiche unterscheiden sich etwas und spielen je nach Aufgabe in die Leistungbilanz mit rein. Sandy profitiert auch nicht wirklich durch eine bessere IPC sondern durch ein besseres Gesamtpaket. Das wird beim Llano ähnlich sein, weil auch der Llano einen komplett neuen I/O-Bereich bekommt. Ich würde eher sagen, da werden die Karten neu gemischt. Was BD angeht, so ist es bei dem wirklich so, dass er massiv mehr IPC abbekommt. Bleibt nur die Frage, in wie weit er das auch in Realleistung umsetzen kann.
 
Zuletzt bearbeitet:
Das sind keine 25%. Im besten Falle sind es 15%, ich würde sogar eher sagen 10% pro Kern. 25% können es nur werden, wenn man SMT pro Kern mit enrechnet.

Blöderweise ist ein X6 bei gleichem Takt im Schnitt nur knapp so schnell wie ein Quadcore i7 mit gleichem Takt, im Regelfall wird der 1090T knapp unter dem i7 870 eingeordnet. Bringt SMT jetzt ~35%, wenn du von 10% IPC-Unterschied ausgehst? Oder beträgt der IPC-Unterschied ~30%, wenn du ~15% für SMT annimmst?

Realistisch betrachtet splittet es sich folgendermaßen auf:
~25% IPC -> i5 750 >=X4 965
~20% SMT -> i7 870 >=1090T
 
25% können es nur werden, wenn man SMT pro Kern mit enrechnet.

der Vorsprung von 25% ist ohne SMT - Cinebench beim 1-CPU Test bescheinigt dem Nehalem einen vorsprung von 24% bei Taktgleicheheit - und da der 1-CPU Test nur in einem Thread läuft ist auch SMT inaktiv - mit SMT sind es eher 28-30% Vorsprung

mfg
 
Ich würde eher sagen, da werden die Karten neu gemischt. Was BD angeht, so ist es bei dem wirklich so, dass er massiv mehr IPC abbekommt. Bleibt nur die Frage, in wie weit er das auch in Realleistung umsetzen kann.
:bigok:
Selbst wenn es 30% mehr sein sollten, werden sie sich umso mehr über den Bulldozer ärgern.
Stichwort: Modul :fresse2:

MfG
 
"Reviews im Netz" sind genauso Einzelfälle. Viele testen gerade mal 4-5 Anwendungen, und dann noch das typische Cinebench & Co. Setup. Was soll das bzw ein gemittelter Wert aussagen? Genau, gar nichts. Wirklich aussagekräftige Vergleiche bei gleichem Takt gibt es so gut wie nicht. Vor allem auch wegen Turbo bei Intel, was selten deaktiviert wird oder, wenn es deaktiviert wird, Vergleichswerte fehlen.

ComputerBase ist sicherlich noch eines der besseren Printmedien, die auch ausführlicher als andere testen. Wobei selbst deren Anwendungsauswahl noch recht begrenzt ist damit leicht verzerren kann. Und wie man zB hier sehen kann, liegen zwischen X4 925 und i5-750 gerade mal 18%. Wobei der i5-750 mindestens mit 2,8 GHz taktet, öfter sogar auch höher und mit bis zu 3,2 GHz. Also inklusive Taktvorteil liegt der i5-750 18% vorne bei Anwendungen. Da sollte es nicht allzu schwer zu verstehen sein, dass 15% unter Windows bei gleichem Takt plausibel sind und 20-30% fernab der Realität. Was auch zum X6 passt, der ja auf dem Level des Nehalem Quad liegt bei gleichem Takt in entsprechenden Anwendungen unter Windows. Bei etwa 15% mehr IPC unter Windows und etwa 20% durch SMT kommst du eben auf knapp 40% mehr Performance, die der X6 gegenüber dem X4 bei gleichem Takt in etwa schneller ist.

Wobei ich mich generell schwer tue, einen i5-750 als Vergleich heranzuziehen. Es ist halt ein kastriertes Design, das so gar nicht für einen reinen Quad-Core vorgesehen war, sondern ein Design mit SMT ist. Wenn man so will, wird auch Bulldozer zusätzlich zulegen, wenn man nur einen Thread auf einem Modul laufen lässt anstatt zwei. Wobei ich da sogar noch mehr Gewinne erwarte. Aber das ist ein anderes Thema.

Und nochmal, Bandbreiten addiert man nicht so ohne Weiteres. Erst recht nicht, wenn es unterschiedliche Busse sind. Eine HD 5570 hat 28,8 GB/s. Die Bandbreite der CPU nützt der Karte Null Komma Nix. Entscheidend ist, wie viel Bandbreite tatsächlich auch genutzt wird. Eine CPU braucht gerade bei grafiklastigen Anwendungen vergleichsweise wenig Bandbreite. Sagen wir einfach mal 5 GB/s. Nehmen wir auf der anderen Seite an, dass in einem fordernden Szenario die HD 5570 relativ nahe an ihre theoretische Bandbreite kommt, zB 25 GB/s. Greifen nun beide auf den gleichen Bus zu, wie es bei Llano zumindest teilweise der Fall sein wird, muss der Bus 30 GB/s hergeben. Genau das ist der Fall mit DDR3-1866. Eine Limitierung liegt in dem Fall also nicht vor. Und wir wissen nicht, was zusätzlich an Bandbreite bereitgestellt wird und was zur Optimierung der Bandbreitennutzung implementiert wurde. Solche Aussagen wie 40-70% weniger Bandbreite sind also nichts anderes als Panikmache und haben mit der Realität nicht viel zu tun.


Durschschnittlich von was genau?
Durchschnitt sämtlicher Anwendungen und sämtlicher Plattformen.


@Athlon-64
Höre doch mal bitte mit diesem Unsinn auf. Dass Cinebench als einzelne Anwendung (dazu noch stark Intel optimiert) keinerlei Aussagekraft besitzt, solltest doch auch du langsam mal mitbekommen haben. Wieso nimmst du nicht gleich Super Pi? :rolleyes:
 
Zuletzt bearbeitet:
AMD hat immer noch ein großes Problem, die Intel CPU Architektur kommt nicht an ihre grenzen.
hoffen wird das ein 4 Modul Bulldozer schneller als ein Sandy Bridge 6 Core ist, allgemein sieht es nicht gut aus für AMD.
 
Dem würde ich so nicht ganz zustimmen, wenn man mal die Entwicklung ansieht, stellt man fest, das die IntelIngeneure, die alte P6 Architektur immer mehr erweitert haben, was man an der Transistorzahl von einem Nehalem Core sehen kann, die Frage ist, wann das alles so aufgedunsen ist, dass man mal ein komplett neues Design fertigen sollte, da die alte von ihrer Größe einfach nicht mehr tragbar ist...
Vielleicht is Bulldozer auch irgendwo genau das....wir werden es sehn...
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh