Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: this_feature_currently_requires_accessing_site_using_safari
Ich denke eine Ineffizienzsteigerung innerhalb einer CPU Architektur werden wir nicht erleben... Das halte ich für ausgeschlossen. Es kann nur besser werden.
Welcher Prozessor skaliert denn 1:1 Mit dem Takt?Dann wird es aber nicht unbedingt ineffizienter, sondern durch mehr Takt gibts auch mehr Leistung, optimaler Weise skaliert das nahe 1:1 mit dem Takt.
Hab bisher noch nichts darüber gelesen in den Kommentaren.Der neue Sockel wird zum alten FM1-Sockel nicht kompatibel sein, da die Aussparungen um einen Pin versetzt wurden und somit die neuen APUs nicht in den FM2-Sockel passen würden. Außerdem wird eine der vier Aussparungen um einen Pin vergrößert und so werden die "Trinity"-APUs nicht mehr auf 905, sondern nur noch auf 904 Pins setzen.
Das bestreitet ja wohl auch niemand, Kritik darf aber wohl angebracht sein, wenn man die Mehrleistung hauptsächlich durch Ausnutzung der mehr TDP erreicht.
Es scheint so, als ob AMD durch mehr TDP Spielraum vor allem die niedrigere IPC im Vergleich zu Sandy Bridge bzw Ivy Bridge etwas mit höherem Turbo wettmachen will.
Es muss nicht unbedingt etwas schlechtes bedeuten, wenn man die max. TDP von 100 auf 125Watt anhebt.
Weil ein Design mit jedem zusätzlichen Kern komplexer wird und maximal für eine bestimmte Anzahl an Kernen dimensioniert ist. AFAIK liegt sowohl bei Shanghai als auch Orochi die maximale Erweiterbarkeit der Kerne bei 8. Wenn man also einfach nur geshrinkte K10 Kerne nehmen würde und davon 8 Stück aufs Die platziert hätte, wäre jetzt bereits Feierabend. So hat man bisher lediglich 50% der Erweiterbarkeit ausgereizt. Oder man hätte von vornherein mit mehr Kernen planen müssen, zB bis zu 16 pro Die. Nur wie gesagt, das hätte das Design dann nochmal ein Stück komplexer gemacht. Es kommt nicht von ungefähr, dass die eigentliche Herausforderung von Many-Core Prozessoren die Vernetzung der Kerne ist.Warum auf Kerne runterbrechen?
Ja, nur sollte man eben auch die eigentliche Technik dahinter verstehen und differenzieren können. Ansonsten hätte man genauso behaupten können, Intel würde stagnieren und keinen Fortschritt erzielen, weil Clarkdale nicht schneller als Yorkfield war. Ist der gleiche Sachverhalt, 45 nm 4C/4T vs 32 nm 2C/4T.Du warst doch auch mit einer der Beführworter, CPUs nicht anhand der reinen Coreanzahl sondern besser anhand der logischen Prozessoren zu vergleichen. Und dann stehts nach wie vor vier zu vier.
Mehr IPC muss man auch über mehr Energie erkaufen. Transistoren gibt's schliesslich nicht gratis. Der Vorteil von Takt ist allerdings, dass dieser vorhersagbar ist, also bei allen möglichen Workloads greift. Verbesserungen der IPC sind das nicht. Je nach Workload können die mal mehr und mal weniger bringen. Und ich denke schon, dass der CMT Ansatz besser ist. Schliesslich kann man damit Logik teilen.Nur ist in meinen Augen fraglich ob der CMT Ansatz vom kommenden Trinity mit zwei Cores pro Modul eben den bis dato herkömmlichen Ansatz von vier vollwertigen Llano Kernen paroli bieten kann. In Sachen BD vs. Thuban zieht erster deutlich den kürzeren (bei gleicher Anzahl logischer Prozessoren)
Es muss also entweder das Design deutlich mehr IPC bieten bzw. im allgemeinen mehr Berechnungen pro Core und Thread raushauen oder aber man geht den Weg über den Takt (Turbo)
Was man aber wohl wieder über mehr Verbrauch erkaufen muss...
Da war dein Vorsatz aber ein falscher. Man liegt ja nicht unter den Erwartungen, weil die Architektur es nicht hergibt. Sondern weil man momentan noch nicht das Potenzial entfalten kann (fehlender Software Support, fehlender OS Support, Kinderkrankheiten im Design, etc). Die Architektur selbst hat jedenfalls das Potenzial, K10 pro Thread deutlich hinter sich zu lassen, durch mehr Takt und mehr IPC.Der Takt klang von Anfang an realstisch. Die bis 80% Skalierung von CMT ebenso. Unwarscheinlich wurde irgendwas daran an den Preisspekulationen, wo die 300$ Marke von Anfang an irgendwie mitmischte. Da ich mir aber so ne mörder CPU nicht vorstellen konnte zu dem Preis ging ich von Anfang an von schlechterer pro Thread Leistung aus. Und genau das ist eingetreten.
Da war dein Vorsatz aber ein falscher. Man liegt ja nicht unter den Erwartungen, weil die Architektur es nicht hergibt. Sondern weil man momentan noch nicht das Potenzial entfalten kann (fehlender Software Support, fehlender OS Support, Kinderkrankheiten im Design, etc). Die Architektur selbst hat jedenfalls das Potenzial, K10 pro Thread deutlich hinter sich zu lassen, durch mehr Takt und mehr IPC.
Sprach ich ja ebenso an, das man K10 als acht Core langfristig gesehen wohl weniger Erfolg erziehlen würde.Weil ein Design mit jedem zusätzlichen Kern komplexer wird und maximal für eine bestimmte Anzahl an Kernen dimensioniert ist. AFAIK liegt sowohl bei Shanghai als auch Orochi die maximale Erweiterbarkeit der Kerne bei 8. Wenn man also einfach nur geshrinkte K10 Kerne nehmen würde und davon 8 Stück aufs Die platziert hätte, wäre jetzt bereits Feierabend. So hat man bisher lediglich 50% der Erweiterbarkeit ausgereizt. Oder man hätte von vornherein mit mehr Kernen planen müssen, zB bis zu 16 pro Die. Nur wie gesagt, das hätte das Design dann nochmal ein Stück komplexer gemacht. Es kommt nicht von ungefähr, dass die eigentliche Herausforderung von Many-Core Prozessoren die Vernetzung der Kerne ist.
Ja, nur sollte man eben auch die eigentliche Technik dahinter verstehen und differenzieren können. Ansonsten hätte man genauso behaupten können, Intel würde stagnieren und keinen Fortschritt erzielen, weil Clarkdale nicht schneller als Yorkfield war. Ist der gleiche Sachverhalt, 45 nm 4C/4T vs 32 nm 2C/4T.
Da gehe ich mit, nur im konkreten Fall halte ich es für fraglich, ob das Konzept aufgeht. Der 2M/4T Trinity als Topmodell gegen nen kommenden 4C/4T Llano wird es durch die bekannten BD Ergebnise recht schwer haben, da eben die Leistung bei gleicher Threadanzahl zwischen Phenom II und BD doch gut zurück gegangen ist und man das nur schwer mit dem Takt ausgleichen kann, da nicht genügendMehr IPC muss man auch über mehr Energie erkaufen. Transistoren gibt's schliesslich nicht gratis. Der Vorteil von Takt ist allerdings, dass dieser vorhersagbar ist, also bei allen möglichen Workloads greift. Verbesserungen der IPC sind das nicht. Je nach Workload können die mal mehr und mal weniger bringen. Und ich denke schon, dass der CMT Ansatz besser ist. Schliesslich kann man damit Logik teilen.
Wieso falsch? Ich habe mir im Vorfeld ne Meinung gebildet, und es ist quasi so eingetreten, trotz aller Unkenrufe im Vorfeld der Befürworter der neuen CPU.Da war dein Vorsatz aber ein falscher. Man liegt ja nicht unter den Erwartungen, weil die Architektur es nicht hergibt. Sondern weil man momentan noch nicht das Potenzial entfalten kann (fehlender Software Support, fehlender OS Support, Kinderkrankheiten im Design, etc). Die Architektur selbst hat jedenfalls das Potenzial, K10 pro Thread deutlich hinter sich zu lassen, durch mehr Takt und mehr IPC.
Darum ging's doch gar nicht. Es ging darum, dass jemand FX4 mit Phenom II X4 verglichen hat. Und das ist eben der gleiche Sachverhalt wie bei Intel 4C/4T Yorkfiled vs 2C/4T Clarkdale. Der einzige Unterschied ist, dass AMD nicht die Ressourcen hat, für den FX4 ein separates Design zu machen, und daher kastrierte Orochis nimmt. Ein separates 2CU Design, mit 4 MiB Cache (2x 2 MiB L2, kein L3) und ohne Server Schnick-Schnack, könnte auch deutlich kleiner ausfallen (<120 mm²?, siehe Regor) als Deneb und wäre dann ebenfalls nicht mal halb so gross.Sehe ich nicht so... Es macht ja wenig Sinn hier ne kleine CPU gegen ne große der alten Generation antreten zu lassen. Vergleicht man nen Quad der alten gegen nen Dualcore + SMT der neuen, sind das CPUs aus unterschiedlichen Leistungsbereichen. Stagnieren würde es doch erst dann, wenn man hätte anstatt heute 4C/8T eben nur 2C/4T geliefert... ist aber nicht. Also gibts im direkten Vergleich der Leistungsbereiche auch mehr Leistung.
Sehe ich nicht so, sofern die 30/30% stimmen. FX4 kann ja jetzt schon mit Propus/Llano mithalten und bei entsprechendem Softwaresupport diese auch abhängen (AVX, FMA, AES, etc). Auch wenn die Skalierung von CMT nicht ganz an CMP rankommt. Dafür kann man eben mehr Takt fahren. Und das wird mit Trinity sicherlich nicht schlechter, da der Piledriver basierte CPU-Teil performanter werden sollte als beim FX4.Da gehe ich mit, nur im konkreten Fall halte ich es für fraglich, ob das Konzept aufgeht. Der 2M/4T Trinity als Topmodell gegen nen kommenden 4C/4T Llano wird es durch die bekannten BD Ergebnise recht schwer haben, da eben die Leistung bei gleicher Threadanzahl zwischen Phenom II und BD doch gut zurück gegangen ist und man das nur schwer mit dem Takt ausgleichen kann, da nicht genügend
So wie ich dich verstanden habe, hast du das aber nur wegen der Preise gemacht. Und darauf kann man nichts geben. Das sind ja keine stichhaltigen Indizien für technische Ursachen. Und nur die sollte man beurteilen. Nach deiner Methode lassen sich nur Glückstreffer erzielen, aber keine echten Prognosen. Die tatsächlichen Preise sind auch noch nicht so lange bekannt. Davor wurde einfach nur wild spekuliert mit unterschiedlichsten Grössen.Wieso falsch? Ich habe mir im Vorfeld ne Meinung gebildet, und es ist quasi so eingetreten, trotz aller Unkenrufe im Vorfeld der Befürworter der neuen CPU.
Tatsächlich? Dann zeige uns mal bitte Vergleiche zwischen Opteron 6128 und 6220. Letzterer hat immerhin 50% mehr Takt. Wenn du aber eh mit 2 GHz leben kannst, wieso dann nicht eher Opteron 6234, 6238 oder 6272? Die bieten mehr Leistungsreserven als der 6220, kosten aber genauso viel bzw weniger.Als Endkunde spielt es für mich auch keine Rolle woran es hapert, wenn es hapert muss ich mich anderweitig umsehen. Ich wollte eigentlich auf nen 6220 Opteron setzen, als 4M/8T 3GHz + Turbo versprach ich mir mehr als vom 6128 Opteron 2GHz 8C/8T. Im Grunde nimmt sich das aber so gar nix
Darum ging's doch gar nicht. Es ging darum, dass jemand FX4 mit Phenom II X4 verglichen hat. Und das ist eben der gleiche Sachverhalt wie bei Intel 4C/4T Yorkfiled vs 2C/4T Clarkdale.
Wollen wir es hoffenSehe ich nicht so, sofern die 30/30% stimmen. FX4 kann ja jetzt schon mit Propus/Llano mithalten und bei entsprechendem Softwaresupport diese auch abhängen (AVX, FMA, AES, etc). Auch wenn die Skalierung von CMT nicht ganz an CMP rankommt. Dafür kann man eben mehr Takt fahren. Und das wird mit Trinity sicherlich nicht schlechter, da der Piledriver basierte CPU-Teil performanter werden sollte als beim FX4.
Och, ich bin mit der Methode bis dato immer gut gefahrenSo wie ich dich verstanden habe, hast du das aber nur wegen der Preise gemacht. Und darauf kann man nichts geben. Das sind ja keine stichhaltigen Indizien für technische Ursachen. Und nur die sollte man beurteilen. Nach deiner Methode lassen sich nur Glückstreffer erzielen, aber keine echten Prognosen. Die tatsächlichen Preise sind auch noch nicht so lange bekannt. Davor wurde einfach nur wild spekuliert mit unterschiedlichsten Grössen.
Tatsächlich? Dann zeige uns mal bitte Vergleiche zwischen Opteron 6128 und 6220. Letzterer hat immerhin 50% mehr Takt. Wenn du aber eh mit 2 GHz leben kannst, wieso dann nicht eher Opteron 6234, 6238 oder 6272? Die bieten mehr Leistungsreserven als der 6220, kosten aber genauso viel bzw weniger.
Wo liest du was von Llano? In der Originalaussage ging es um Trinity. Und dessen "CPU Part" ist eben die Weiterentwicklung eines FX4. Unterschied ist, dass aus 2 Bulldozer CUs 2 Piledriver CUs werden und der L3 wegfällt. Und der Fortschritt ist eben, dass man für das, was man bisher mit 4 Kernen geschafft hat, jetzt nur noch 2 Kerne braucht. Das gilt für grössere Designs natürlich genauso. "Mau" ist daran nichts.Wieso FX4xxx?
Die Aussage, das AMD im CPU Part beim Llano stagniert, weil man nichtmal die Leistung von Phenom II erreicht war doch nicht auf FX4xxx bezogen.
Nein, der Vergleich hinkt nicht. Es gibt ja genauso FX Modelle jenseits des 2CU/4T FX4. Der FX4 ist genauso wenig der Nachfolger der bisherigen Top-Modelle (X4, X6). Das sind FX6 und FX8. FX4 ist vielmehr der Nachfolger vom X2. Ähnlich wie Clarkdale die C2Ds abgelöst hat.Der Vergleich zu Intel hinkt immernoch, weil es eben noch Modelle jenseits von 2C/4T gibt. Und somit der 2C/4T Clarkdale nicht als Nochfolgemodell zum 4C/4T Yorkfield gestellt wird.
Behauptet hätte ich das an deiner Stelle wohl jetzt auch. Glauben muss ich dir das trotzdem nicht. Wie gesagt, es bleiben maximal Glückstreffer, mit einer Note subjektiver Wahrnehmung.Och, ich bin mit der Methode bis dato immer gut gefahren
Da wäre ich aber vorsichtig. Typische Desktop Benchmarks sagen meist nicht viel über Serverperformance. Wobei es natürlich davon abhängt, was du damit vorhast.Echte Vergleiche habe ich leider nicht, würde ich mir aber wünschen. Ich leite eher von vorhandenen Benches ab.
Haha, schöne Milchmädchenrechnung. Naja, es sind eher 40% mehr Takt bei 25% weniger Kernen. Die Rechnung geht aber schon deswegen nicht auf, weil der X6 ja auch Turbo hat.Abgeleitet dürften 8 Magny-Cours Cores bei 2GHz ca. ähnlich schnell sein, wie der X6 1075T. Weil 1/3 weniger Takt, dafür 1/3 mehr Cores.
Von CPU World. Sind zwar nur Listenpreise und kA ob die auf offiziellen Infos basieren. CPU World ist aber meist gut informiert.Woher hast du die Preise?
Ich beziehe mich auf diesen Post:Wo liest du was von Llano? In der Originalaussage ging es um Trinity. Und dessen "CPU Part" ist eben die Weiterentwicklung eines FX4. Unterschied ist, dass aus 2 Bulldozer CUs 2 Piledriver CUs werden und der L3 wegfällt. Und der Fortschritt ist eben, dass man für das, was man bisher mit 4 Kernen geschafft hat, jetzt nur noch 2 Kerne braucht. Das gilt für grössere Designs natürlich genauso. "Mau" ist daran nichts.
Auch wenn das Marketing dagegen spricht?Nein, der Vergleich hinkt nicht. Es gibt ja genauso FX Modelle jenseits des 2CU/4T FX4. Der FX4 ist genauso wenig der Nachfolger der bisherigen Top-Modelle (X4, X6). Das sind FX6 und FX8. FX4 ist vielmehr der Nachfolger vom X2. Ähnlich wie Clarkdale die C2Ds abgelöst hat.
Du kannst dir ja die alten Posts im Thread raussuchen... Ob Glück oder nicht, vllt hab ich auch einfach nur ein gutes Händchen beim Spekulieren bis datoBehauptet hätte ich das an deiner Stelle wohl jetzt auch. Glauben muss ich dir das trotzdem nicht. Wie gesagt, es bleiben maximal Glückstreffer, mit einer Note subjektiver Wahrnehmung.
Durchaus richtig, bei mir gehts aber nicht um HPC Anwendungen oder ähnliches. Ich liebäugel mit dem Opteron aufgrund des Quadchannel RAM Interfaces, dem guten ESX Supports der Opteronboards und schlussendlich dem Preis aus der CPU/RAM/Board Kombo bei mehr wie 16GB oder 24GB RAM.Da wäre ich aber vorsichtig. Typische Desktop Benchmarks sagen meist nicht viel über Serverperformance. Wobei es natürlich davon abhängt, was du damit vorhast.
Da die Benches vom X6 kommen, ist bei mir der X6 auch die Rechnungsbasis. Und bei 3GHz ist nunmal 2GHz 1/3 weniger. Und bei 6 Cores des X6 sinds 1/3 mehr Cores beim 6128Haha, schöne Milchmädchenrechnung. Naja, es sind eher 40% mehr Takt bei 25% weniger Kernen. Die Rechnung geht aber schon deswegen nicht auf, weil der X6 ja auch Turbo hat.
Irgendwelche Listenpreise bringen mich nicht weiter, wenns die Teile nirgendwo zu kaufen gibtVon CPU World. Sind zwar nur Listenpreise und kA ob die auf offiziellen Infos basieren. CPU World ist aber meist gut informiert.
Ich auch. Und wie gesagt, von Llano steht dort nichts, sondern von Trinity, den ich eben gegen einen X4 verglichen habe.Ich beziehe mich auf diesen Post:
http://www.hardwareluxx.de/community/17845224-post26.html
Das Marketing spricht davon, dass der FX4 der Nachfolger eines X4 ist? Wäre mir neu. Hast du dafür eine Quelle? Und selbst wenn, das Marketing spricht bei Zambezi auch von 8 "Kernen". Wie viel solche Aussagen wert sind, dürfte ja mittlerweile bekannt sein. Man sollte immer die Technik dahinter betrachten und auf Marketingaussagen nicht allzu viel geben. Und technisch gesehen ist ein FX4 eben mehr als Nachfolger eines X2 zu sehen. Wie gesagt, wenn es ein separates und kompaktes Design mit 2 CUs gäbe, ohne L3 und den ganzen Server Kram, dann wäre vermutlich eine ähnliche Grössenordnung wie bei Regor drin. 2 CUs inklusive L2 brauchen ja lediglich gut 60 mm².Auch wenn das Marketing dagegen spricht?
Wieso gutes Händchen? Es bleiben Glückstreffer und subjektive Wahrnehmung. Ich kann deine Einschätzung zB auch nicht komplett teilen. Aber das ist ein anderes Thema.Du kannst dir ja die alten Posts im Thread raussuchen... Ob Glück oder nicht, vllt hab ich auch einfach nur ein gutes Händchen beim Spekulieren bis dato
Der X6 hat aber Turbo, der Opteron 6100 nicht. Das muss man eben beachten, wenn man die Performance beider vergleichen will. Erst die Opteron 6200 besitzen ebenfalls Turbo. Und du kannst nicht einfach die Basis ändern beim vergleichen der Specs, hier mal mehr angeben und da mal weniger. So funktioniert das nicht. Warum werden denn solch einfache mathematischen Sachverhalte immer wieder falsch gemacht? So schwer ist das doch nicht. ZB 30% mehr auf der einen Seite sind nicht 30% weniger auf der anderen Seite, sondern nur ~23%. Oder um das mal konkret auf die Prozessoren zu beziehen, Opteron 6128 und X6 1075T bei Basistakt:Da die Benches vom X6 kommen, ist bei mir der X6 auch die Rechnungsbasis. Und bei 3GHz ist nunmal 2GHz 1/3 weniger. Und bei 6 Cores des X6 sinds 1/3 mehr Cores beim 6128