AMDs 'Excavator' mit Intels AVX2

iToms

Redakteur
Thread Starter
Mitglied seit
25.11.2011
Beiträge
2.016
<p><img style="margin: 10px; float: left;" alt="AMD Logo 2013" src="/images/stories/logos-2013/AMD_Logo_2013.jpg" height="100" width="100" />Im GCC-Quellcode sind erstmals Optimierungen mit dem Namen „BDver4“ aufgetaucht. Dies deutet darauf hin, dass <a target="_blank" href="http://www.amd.de">AMD</a> an seinem Entwicklungs-Plan für die großen Architekturen festhält und zumindest bis Excavator weiterentwickelt. "BDver1" bezeichnet "Bulldozer", welcher erstmals 2011 eingeführt wurde und "BDver2" ist "Piledriver". Auf dieser Architektur mit leichten Verbesserungen basieren die aktuellen FX-CPUs und "Richland"-APUs. "BDver3" ist "Steamroller", welcher Ende des Jahres von AMD mit den "Kaveri"-APUs vorgestellt wird.</p>
<img alt="AMD-Roadmap fuer Opteron"...<br /><br /><a href="/index.php/news/hardware/prozessoren/28242-amds-excavagator-mit-intels-avx2.html" style="font-weight:bold;">... weiterlesen</a></p>
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Excavator in 22nm könnte eine sehr gute Cpu werden..Bis dorthin gibts auch die Softwareoptimierungen
 
Naja AMD verspricht halt nicht mehr so viel. Wenn Sie für sich im Plan liegen, aber nichts darüber verlauten, um keine falschen Versprechen zu machen, nur zu. Damit haben Sie ja reichlich wenig gutes erlebt. Also lieber ruhig entwickeln, statt sich vorher weit aus dem Fenster zu lehnen.

Gehe zur Zeit fast schon davon aus, dass Steamroller für AM3+ kommt im weiterem Verlauf. Mal sehen, was die bald erscheinenden APUs bringen. Bin eigentlich aber mehr auf den 28nm Prozess gespannt und seine Vorzüge beim Verbrauch.
 
Zuletzt bearbeitet:
wenn wohl eher in 20nm (TSMC z.B. arbeitet ja an 20nm)

aber bis dahin hat Intel wahrscheinlich schon weitläufig 14nm raus gebracht!
Aber naja man kann immer hoffen das wieder etwas Konkurenz und damit mal größere Entwicklungen entstehen!
 
Bin eigentlich aber mehr auf den 28nm Prozess gespannt und seine Vorzüge beim Verbrauch.

Ist auch die größte Variable, wobei 28nm im Vergleich zu 32nm gar nicht so viel Stromspar-Potenzial hat meine wegen Halfnode-Shrink. Kann mich aber auch irren. Was einem allerdings Bauschmerzen bereiten sollte, ist das der prozess von Globalfoudries kommt und in wie weit AMD wieder den Takt hoch ziehen muss um eventuelle "fehlende" IPC am Markt zu Kaschieren.
 
Naja mal sehen, Pildriver sollte ja die P/W steigern. Was er ja auch erfüllt hat. Höheren Takt bei gleichem Verbrauch. Nun soll an der Performance geschraubt werden. Wenn es so kommt, was ich alles gelesen habe, an Neuerungen etc., sollte es sich bei ca. +20% bis +35% mehr Performance bei gleichem Verbrauch einpendeln (CPU Part). Wenn der Prozess es bringt. (Glaskugel wieder wegpacken :d )

Na mal sehen, ob GF Ihren ersten Prozess gebacken bekommt. Der 32nm SOI war ja schon unter AMD Führung fast fertig ^^
 
20% Plus halte ich noch für realistisch, aber 35% nicht, das dürften dann so Benches in Befehlssätzen sein, die außer dem Erfinder keiner einsetzt. :d Steht und fällt halt alles mit dem Fertigungs-Prozess und ich persönlich fände ein absinken der Leistungsaufnahme wesentlich wichtiger als 20% drauf zu klatschen.
 
20% Plus halte ich noch für realistisch, aber 35% nicht, das dürften dann so Benches in Befehlssätzen sein, die außer dem Erfinder keiner einsetzt. :d Steht und fällt halt alles mit dem Fertigungs-Prozess und ich persönlich fände ein absinken der Leistungsaufnahme wesentlich wichtiger als 20% drauf zu klatschen.

Oder man trifft sich da in der Mitte ;) Weniger Stromverbrauch, aber trotzdem höhere Leistung.
 
weniger stromverbrauch können die durch weniger takt immer erzielen.
 
Joa 20 bis 35% vermute ich schon, mal sehen was hinten raus kommt. Im Gegensatz zu Pildriver hat Steamroller ziehmlich einschneidende Änderungen, was die Performance angeht. Vorallem habe ich gelesen, das die Pro Kern Leistung in den Vordergrund gerutscht sein soll o_O
 
20% Plus halte ich noch für realistisch, aber 35% nicht, das dürften dann so Benches in Befehlssätzen sein, die außer dem Erfinder keiner einsetzt. :d Steht und fällt halt alles mit dem Fertigungs-Prozess und ich persönlich fände ein absinken der Leistungsaufnahme wesentlich wichtiger als 20% drauf zu klatschen.

Das ist AMD ich halte selbst die 20% für übertrieben.
Ich tippe auf 10% +-3%

Gesendet von meinem GT-I9505 mit der Hardwareluxx App
 
Da wäre aber viel Spielraum, die Intel Cpus schaffen ja auch 3,6Ghz mit 1,0V.

Bei 8 Threads wären 3,6Ghz ok, vl. werdens noch 16 Threads.

Intel hat aber im Moment auch den Meilenweit besseren Fertigungs-Prozess und ein Acht-Moduler bleibt ein feuchter Nerdtraum...

Das ist AMD ich halte selbst die 20% für übertrieben.
Ich tippe auf 10% +-3%

Gesendet von meinem GT-I9505 mit der Hardwareluxx App

Naja ich tipp da auf 5-10% mehr IPC und den Rest per Takt, wobei das dann am Ende auch wieder nur 15% sein können. ;) Ich geh nämlich davon aus, dass der Shrink leider komplett in die Leistung geblasen wird.
 
jrs77 schrieb:
Zu wenig und zu spät.

Inwiefern kannst du jetzt schon Excavator einschätzen?

intel hat mMn keine Konkurrenz mehr mit AMD, auch nicht von den APUs, denn für Leute die keine extra GPU brauchen reicht auch die HD4xxx IGP zum Filmchen gucken.

Und mit der AMD kannst du nicht Filmchen gucken? Ich versteh die Begründung nicht, ergibt auch keinen Sinn.

" In Puncto APU´s hat AMD keine Konkurrez mit Intel, da der AMD Prozessorteil auch für Office mehr als auseichend ist und die IGP zum Filmchen gucken ausreicht."

:hmm:
 
Zuletzt bearbeitet:
Naja, warum auch nicht ? Außerdem wird's dann auch wohl kleinere Modelle geben wo du die "akktuelle" Amd Leistung dann vielleicht mit weniger Verbrauch bekommst ;)

mfg

Nur braucht AMD eigentlich deutlich weniger Verbrauch, das Problem schlägt ja bis auf den mobilen Markt durch. Da hat AMD CPU-seitig ab einem spätestens ab einem i5 nicht mehr viel entgegnen zu setzen. Entweder versucht man weiter aufzuholen oder versucht sich an runderen CPUs.

Kann ich nicht verstehen, es sind ja nur reale 4 Kerne und 4 virtuelle.

So 16 Threads kommen von vier realen Kernen und vier virtuellen? In meiner Rechnung brauche ich dafür acht Module bei AMD. Selbst wenn irgendwann ein Modul vier Threads ausführen könnte bleibt für Steamroller in 28nm immer noch das Problem, das Verbrauchsarm unter einen Headspreader zu Quetschen, so ein Ding würde bei einem Takt über 2 Ghz locker mehr als ein FX 8xxx verbrauchen, von 3,6 Ghz ganz zu schweigen. Dazu kommt noch die Frage wer sowas im Consumer-Markt kaufen soll? Halt ein feuchter Nerd-Traum...
 
So 16 Threads kommen von vier realen Kernen und vier virtuellen? In meiner Rechnung brauche ich dafür acht Module bei AMD. Selbst wenn irgendwann ein Modul vier Threads ausführen könnte bleibt für Steamroller in 28nm immer noch das Problem, das Verbrauchsarm unter einen Headspreader zu Quetschen, so ein Ding würde bei einem Takt über 2 Ghz locker mehr als ein FX 8xxx verbrauchen, von 3,6 Ghz ganz zu schweigen. Dazu kommt noch die Frage wer sowas im Consumer-Markt kaufen soll? Halt ein feuchter Nerd-Traum...

Ich meinte das die jetzigen 4 moduler ausreichend wären, ich würde nicht behaupten das AMD Cpus schlecht sind, die Zukunft wird aber besser das es mehr support geben wird.
 
So 16 Threads kommen von vier realen Kernen und vier virtuellen? In meiner Rechnung brauche ich dafür acht Module bei AMD. Selbst wenn irgendwann ein Modul vier Threads ausführen könnte bleibt für Steamroller in 28nm immer noch das Problem, das Verbrauchsarm unter einen Headspreader zu Quetschen, so ein Ding würde bei einem Takt über 2 Ghz locker mehr als ein FX 8xxx verbrauchen, von 3,6 Ghz ganz zu schweigen. Dazu kommt noch die Frage wer sowas im Consumer-Markt kaufen soll? Halt ein feuchter Nerd-Traum...

Nicht unbedingt 16 ;)
Aber ich könnte mir vorstellen, das man ne Art vier Thread pro Modul Modell entwickelt bzw. plant. Sprich du nur noch zwei Module brauchst für 8 Threads... Vorteil -> die MT Performance sollte trotzdem vorhanden sein. Vorteil 2 -> man könnte mehr Aufwand und Ressourcen in die SingleThread Performance blasen. Eben abseits des Taktes, der nach oben hin so scheinbar eher schlecht skaliert (siehe FX9 mit 5GHz und unwesentlich mehr Leistung trotz 25% mehr Takt im vollen Turbo)

Würde zumindest auch zu der Spekulation bzw. dem Gerücht passen, das man auf Bald nur noch Modelle für den FM irgendwas Sockel bringen will und AM3(+) langsam ausläuft...
Aus meiner Sicht benötigt AMD auch langsam mal ne PCIe 3.0 fähige Kombo... :wink: halt mal wieder auf neuestem Stand der Schnittstellentechnik -> ob man sowas noch für Bulldozer/Vishera nachzieht!? Denke ich nicht...
Das stelle ich mir eher vor, das man da den FM irgendwas für nutzen werden wird.
 
Bin mal gespannt was dabei rauskommt, bei Amd bin ich mitlerweile sehr vorsichtig, an richtig große Leistungssprünge mag ich nicht mehr so recht glauben, wäre schon einmal froh wenn die TDP endlich mal bei 100 W oder darunter ist.
Mehr Leistung wäre auch fein aber an 20% mag ich garnicht glauben.
 
Nicht unbedingt 16 ;)
Aber ich könnte mir vorstellen, das man ne Art vier Thread pro Modul Modell entwickelt bzw. plant. Sprich du nur noch zwei Module brauchst für 8 Threads... Vorteil -> die MT Performance sollte trotzdem vorhanden sein. Vorteil 2 -> man könnte mehr Aufwand und Ressourcen in die SingleThread Performance blasen. Eben abseits des Taktes, der nach oben hin so scheinbar eher schlecht skaliert (siehe FX9 mit 5GHz und unwesentlich mehr Leistung trotz 25% mehr Takt im vollen Turbo)

Würde zumindest auch zu der Spekulation bzw. dem Gerücht passen, das man auf Bald nur noch Modelle für den FM irgendwas Sockel bringen will und AM3(+) langsam ausläuft...
Aus meiner Sicht benötigt AMD auch langsam mal ne PCIe 3.0 fähige Kombo... :wink: halt mal wieder auf neuestem Stand der Schnittstellentechnik -> ob man sowas noch für Bulldozer/Vishera nachzieht!? Denke ich nicht...
Das stelle ich mir eher vor, das man da den FM irgendwas für nutzen werden wird.

Die 16 Threads kamen ja nicht von mir und auf die bezog ich mich, das dürfte selbst in deinem Ansatz dann Strom fressen. ;) Was den Wechsel auf FMx angeht, gehe ich das fest von aus, guck dir mal die aktuellen AM3+ Boards aus diesem Jahr an und was es für FM2 und Fm2+ gibt. Auch wenn AMD es nicht ausspricht, so scheint AM3+ doch in seinen letzen Zügen zu liegen.
 
Gibts überhaupt neue Chipsätze? Ich glaube das ist doch noch alles mehr oder weniger aus Phenom II Zeiten, was wir da aktuell haben... Wenn AMD hier nichts neues bringt, scheint da wirklich nicht mehr viel zu kommen.
 
Bei AM3+ ist im Endeffekt alles beim alten seit 7xx. Die "neueren" Chipsätze findet man meiner Meinung nach auf FM2 und FM2+. Ich meine mich zu erinnern, das Opteron mal meinte, die könnten die Board-Herstelelr theoretisch auch auf AM3+ Boards verbauen, da sie das nicht tun sehen sie da wohl weniger Markt drinne als im "APU-Sockel"
 
Bei AM3/+ war die SB850 das letzte große update, alle 9er bauen darauf auf.

Bei Excavator kann man zu 99% mit dem selben Fertigungsprozess rechnen wie beim Kaveri. AMD wird sicherlich zwei Generationen diesen Prozess verwenden und Excavator später im Jahr 2015 oder in 2016 auf einem neuen Prozess schrumpfen auf 14XM (=20nm FinFET) oder 14 FDSOI (=20nm FDSOI), mit starker Tendenz zu FDSOI, weil auch IBM diesen Prozess offenbar nutzen wird für seine CPUs, die ja auch z.T. bei GloFo hergestellt werden. TSMC scheidet hier gänzlich aus, weil AMD Verträge mit GloFo für CPU-Herstellung bis 2024 hat. Bezüglich der Fertgungsprozesse hab ich ja immer noch den starken Verdacht dass es sich immer um denselben Prozess handelt, da so eine Entwicklung 6-8 Jahre dauert und die Kooperationen schon früher festgelegt wurde, also gilt mMn folgendes:

28nm SHP GloFo = IBM 22nm SOI = AMD 22nm SOI, kommen ja auch annähernd gleichzeitig Produkte auf den Markt von IBM und AMD, das ist sicher kein Zufall.
14 FDSOI GloFo/STM = IBM 16nm ETSOI = Marketingnamen für 20nm FDSOI.

Mit 20nm Bulk planar braucht man übrigens weder bei CPUs noch GPUs zu rechnen, da gibts viel zu wenig Effizienzgewinn (ca. 15% mehr Takt/Watt im gereiften Zustand) und die durchschnittlichen Produktionskosten sind ca. 1/3 höher als bei 28nm. FinFETs und FDSOI kosten nur wenig mehr und steigern die Effizienz erheblich.

IBMs 16nm SOI alias offenbar GloFos 20nm SHP Prozesse sind alle gecancelt worden. War offenbar unrentabel, schon der 22nm-Prozess mit PDSOI von IBM sind wohl sehr groß ausgefallen, offenbar nennt GloFo deshalb den Prozess auch 28nm SHP. Es gibt da bei PDSOI bei der Strukturbreite eine Effizienzgrenze bei der das Ganze unrentabler wird als Bulk. Man ist auf die kleinste rentable Größe geschrumpft, weiter gehts dann mit FDSOI und später mit FDSOI und FinFET-Mischprozessen.

Ich glaube übrigens nicht mehr an einen weiteren 32nm Orochi Rev.D AM3+-Ableger. Die werden die Rev.D in Mengen ab jetzt produzieren und auf Halde legen um genug Reserve für die G34-Server zu haben und die C0 auf AM3+ abverkaufen. Ab nächstes Jahr wird man alles auf 28nm SHP umstellen, um genug Kapazität für IBMs Power8 zu haben, der ja offenbar auch bei GloFo mitgefertigt werden soll. Zudem gibt es evtl. noch einen vergrößerten Kaveri.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh