ARMv8 mit bis zu 128 Kernen und 3 GHz

Don · 29.10.2011

<p><img src="images/stories/logos/arm_logo.jpg" width="100" height="100" alt="arm_logo" style="float: left; margin: 10px;" /><a href="http://www.arm.com/">ARM</a> hat vor wenigen Tagen erste Details zur neuen ARMv-Architektur veröffentlicht, die erstmals auch 64-Bit-Befehlssätze verarbeiten kann. Als einer der ersten Kunden hat <a href="http://www.apm.com/">AppliedMicro</a> nun einen SoC auf Basis dieser neuen Architektur vorgestellt. SoC steht dieses mal aber nicht für "System on a Chip", sondern für "Server on a Chip". Der X-Gene getaufte Chip verfügt über zwei bis 128 CPU-Kerne, die auch bei der maximalen Anzahl mit bis zu 3 GHz arbeiten. AppliedMicro gibt eine Leistungsaufnahme von maximal zwei Watt pro Kern an, so dass ein voll ausgebauter Prozessor auf einen Verbrauch von etwa...<p><a href="/index.php?option=com_content&view=article&id=20364&catid=34&Itemid=99" style="font-weight:bold;">... weiterlesen</a></p>

Cookie1990 · 29.10.2011

So, das bitte in nem NAS mit AES Chip

Achja: ERSTER!!!

amdpc · 29.10.2011

Es muss nicht immer Intel sein =)

boxleitnerb · 29.10.2011

130W idle für den Xeon? Äh...?

websmile · 29.10.2011

boxleitnerb schrieb:
130W idle für den Xeon? Äh...?

Intel® Xeon® Processor X5680 (12M Cache, 3.33 GHz, 6.40 GT/s Intel® QPI)

Wo steht da was von idle

? der Arm zwischen 64 idle und 256 last, was wohl die TDP ist, der xeon hat da 130 watt tdp

boxleitnerb · 29.10.2011

Dann ist dieser Absatz arg unglücklich formuliert:

Den Stromverbrauch von maximal zwei Watt pro Kern haben wir bereits angesprochen. Doch entscheidend ist auch der Verbrauch im Idle-Betrieb. Dieser liegt bei 0,5 Watt, so dass ein X-Gene mit 128 Kernen zwischen 64 und 256 Watt verbraucht. Auch hier ein Vergleich zu konventionellen Servern: Ein Intel Xeon 5680 kommt auf 130 Watt.

scully1234 · 29.10.2011

Hört sich zwar beeindruckend an 128Kerne mit 3GHZ Basistakt bei 256Watt nur lässt man sich nicht über deren Rechenleistung in Anwendungsszenarien aus.

128Kerne lassen sich nunmal schlechter auslasten wie 6 oder 8 mit HT bei Intel

Wenn er eine praxisbezogene Rechenleistung auf Höhe der Xeons hat wäre es natürlich auch wegen der 64bit Befehlssätze vielleicht ein attraktiver Gegenpol

jdl · 29.10.2011

websmile schrieb:
Wo steht da was von idle ? der Arm zwischen 64 idle und 256 last, was wohl die TDP ist, der xeon hat da 130 watt tdp

Intel gibt grundsätzlich die TDP an, aber andere Hersteller oft den maximalen Wert.

mr.dude · 29.10.2011

Don schrieb:
Doch entscheidend ist auch der Verbrauch im Idle-Betrieb. Dieser liegt bei 0,5 Watt, so dass ein X-Gene mit 128 Kernen zwischen 64 und 256 Watt verbraucht.

Sind diese 64 W unter Idle eine offizielle Angabe? Was ist mit Power-Gating? Beherrscht das der Prozessor nicht? Damit sollten doch Kerne komplett abgeschaltet werden können, so dass die Leistungsaufnahme unter Idle deutlich geringer ist.

Don schrieb:
Dabei soll ein X-Gene-Prozessor aber bis zu dreimal schneller als ein auf Sandy Bridge basierender E3-Xeon-Prozessor sein.

Klingt jetzt nicht gerade prickelnd bei 128 Kernen, zumal diese auch recht hoch getaktet sind. Da ist wohl die Frage, ob GPU Architekturen in Zukunft nicht doch besser geeignet sind für solche Many-Core Prozessoren. Selbst wenn man Einschränkungen in der GP-Funktionalität hinnehmen müsste.

Timbaloo · 29.10.2011

mr.dude schrieb:
Da ist wohl die Frage, ob GPU Architekturen in Zukunft nicht doch besser geeignet sind für solche Many-Core Prozessoren. Selbst wenn man Einschränkungen in der GP-Funktionalität hinnehmen müsste.

Du meinst die Richtung die nvidia mit ihren "Project Denver" einschlägt?

DerGoldeneMesia · 30.10.2011

scully1234 schrieb:
Hört sich zwar beeindruckend an 128Kerne mit 3GHZ Basistakt bei 256Watt nur lässt man sich nicht über deren Rechenleistung in Anwendungsszenarien aus.

128Kerne lassen sich nunmal schlechter auslasten wie 6 oder 8 mit HT bei Intel

Wenn er eine praxisbezogene Rechenleistung auf Höhe der Xeons hat wäre es natürlich auch wegen der 64bit Befehlssätze vielleicht ein attraktiver Gegenpol

Man wird früher oder später auf kerne setzen müssen!

jdl · 30.10.2011

mr.dude schrieb:
Da ist wohl die Frage, ob GPU Architekturen in Zukunft nicht doch besser geeignet sind für solche Many-Core Prozessoren. Selbst wenn man Einschränkungen in der GP-Funktionalität hinnehmen müsste.

Wenn man sich IBMs BlueGene/Prototypen anschaut, dieser führt momentan die Green500 an, dann würde ich eher sagen nein. Beim Prozessor handelt es sich um einen "normalen" 16+1 Core PowerA2.

temnozor · 30.10.2011

scully1234 schrieb:
Hört sich zwar beeindruckend an 128Kerne mit 3GHZ Basistakt bei 256Watt nur lässt man sich nicht über deren Rechenleistung in Anwendungsszenarien aus.

128Kerne lassen sich nunmal schlechter auslasten wie 6 oder 8 mit HT bei Intel

Wenn er eine praxisbezogene Rechenleistung auf Höhe der Xeons hat wäre es natürlich auch wegen der 64bit Befehlssätze vielleicht ein attraktiver Gegenpol

Das Ding ist auch nicht für den Desktop PC, denn da lassen sich sowieso meistens nicht mehr als 3 kerne auslasten wodurch das ding der mega epicfail wäre....sondern für serverfarmen die dann rechenkapazität für 100te anwendungen vermieten bzw. direkt VMs drauf laufen lassen.
Auf dem Desktop wird man wenn überhaupt mal so 4kerner ARMs als thin client sehen (mit win8 evtl.)

mr.dude · 30.10.2011

Timbaloo schrieb:
Du meinst die Richtung die nvidia mit ihren "Project Denver" einschlägt?

Nein, ich meine eher die Richtung, in die zB AMD mit Fusion einschlägt. Das geht noch einen Schritt weiter als Denver. Auch sollte man Intels Tera Scale im Auge behalten. Ist zwar auf den ersten Blick ein ähnlicher Ansatz wie dieser ARM hier. Auf den zweiten Blick allerdings wesentlich fokussierter auf SIMD/MIMD (512/1024-bit) und daher mehr vergleichbar mit GPU Shadern. AMDs GCN Architektur wird zB ebenfalls auf 512-bit (16-wide FP32) Vektoreinheiten aufbauen. ARM bietet meines Wissens bisher nur eine 128-bit SIMD Pipeline.

jdl schrieb:
Wenn man sich IBMs BlueGene/Prototypen anschaut, dieser führt momentan die Green500 an, dann würde ich eher sagen nein.

Dann sollte dir aber auch aufgefallen sein, dass sich bereits direkt dahinter GPU basierte Supercomputer einordnen. Und wir stehen hier gerade mal am Anfang dieser Entwicklung. Das Potenzial von GPUs bei Supercomputern ist noch nicht mal ansatzweise ausgeschöpft. Ganz abgesehen davon, dass es nicht nur um Energieeffizienz geht, sondern auch um maximale Rechenleistung und Anschaffungskosten. Und da ist Blue Gene nicht gerade die Messlatte.

Opteron · 31.10.2011

temnozor schrieb:
Das Ding ist auch nicht für den Desktop PC, denn da lassen sich sowieso meistens nicht mehr als 3 kerne auslasten wodurch das ding der mega epicfail wäre....sondern für serverfarmen die dann rechenkapazität für 100te anwendungen vermieten bzw. direkt VMs drauf laufen lassen.
Auf dem Desktop wird man wenn überhaupt mal so 4kerner ARMs als thin client sehen (mit win8 evtl.)

1 Die hat nur 2 Kerne, die 128 Kerne gibts nur in SMP Aufbau mit dann eben 96 Sockel.
128Kerne auf einem DIE wären etwas viel, selbst für ARM :fresse:

pajaa · 01.11.2011

Es liest sich aber so, als wären maximal 128 Kerne pro SoC möglich.

jdl · 01.11.2011

mr.dude schrieb:
Dann sollte dir aber auch aufgefallen sein, dass sich bereits direkt dahinter GPU basierte Supercomputer einordnen. Und wir stehen hier gerade mal am Anfang dieser Entwicklung. Das Potenzial von GPUs bei Supercomputern ist noch nicht mal ansatzweise ausgeschöpft.

Dir sind die Probleme bei GPGPUs bekannt?
Das größte Problem ist die aufwendige Programmierung und der sehr begrenzte Arbeitsspeicher. Die GPGPUs sind nur sehr langsam mit dem System verbunden, das limitiert zusätzlich die Probleme für die man GPGPUs einsetzen kann. Selbst ein PCIe PEG Slot ist langsam, wenn man das mit dem Hauptspeicherdurchsatz eines aktuellen Mainboards vergleicht.

GPGPU Computing klingt ganz toll, aber in der Realität kann man sehr viele Probleme auf GPGPUs gar nicht rechnen, weil der Arbeitsspeicher nicht ausreichend ist. Das sind aber gerade die Bereiche der Naturwissenschaften, bei denen es den größten Bedarf an Computerrechenleistung gibt (Quantenchemie, Festkörperphysik, ...). Man muß sich also entweder auf alte Rechenverfahren begrenzen, die deutlich schlechtere Ergebnisse liefern, oder man muß die Problemgröße drastisch reduzieren. Was bei vielen Probleme in der Chemie den Rechner komplett unbrauchbar macht.

mr.dude schrieb:
Ganz abgesehen davon, dass es nicht nur um Energieeffizienz geht, sondern auch um maximale Rechenleistung und Anschaffungskosten. Und da ist Blue Gene nicht gerade die Messlatte.

Bei großen Clustern wird die Luft sehr schnell sehr dünn, so daß man bei einem der großen Anbieter landet, der Preis ist somit meist vergleichbar hoch. Einfach mal so zusammenschrauben funktioniert nicht. Desweiteren sind die Klimakosten und der Stromverbrauch ein nicht unerhebliches Problem. Der Betrieb verschlingt bei einem Top100 Cluster Hunderttausende im oberen Bereich auch schnell mal Millionen von Euro pro Jahr.

Was die absolute Rechenleistung betrifft, schon einmal angeschaut wieviel BlueGene/Q Kerne IBM in ein Rack stopft? Laut Heise sind's 16.384 Kerne, und das Warmwasser gekühlt. Das spart massiv an Klimakosten.

mr.dude · 01.11.2011

jdl schrieb:
Das größte Problem ist die aufwendige Programmierung und der sehr begrenzte Arbeitsspeicher. Die GPGPUs sind nur sehr langsam mit dem System verbunden, das limitiert zusätzlich die Probleme für die man GPGPUs einsetzen kann. Selbst ein PCIe PEG Slot ist langsam, wenn man das mit dem Hauptspeicherdurchsatz eines aktuellen Mainboards vergleicht.

Ich sag nur -> Fusion. Lies dich mal ins Thema ein. Die Entwicklung wird nicht auf dem Stand von heute stehen bleiben.

Neue GPU Architekturen werden mehr Funktionalität bieten, wodurch sie flexibler im Einsatz werden. Natürlich wird dann auch die Komplexität der Shader-Architektur steigen, was Auswirkungen auf die Effizienz hat. Die Kunst wird dann sein, den Sweet Spot aus Flexibilität und Effizienz zu finden. Weder CPUs noch GPUs haben diesen heutzutage schon erreicht.

Durch das direkte Integrieren der GPU Shader in die CPU, genau das ist ja das Ziel von Fusion, steht den GPU Shadern natürlich auch die gleiche Infrastruktur zur Verfügung, inklusive Interconnects, Speicher, etc. Bereits Llano besitzt ein entsprechendes Interface, Onion/Garlic, was natürlich erst der Anfang ist. Dein Argument mit dem Arbeitsspeicher ist für mich daher nicht nachvollziehbar.

jdl schrieb:
Bei großen Clustern wird die Luft sehr schnell sehr dünn, so daß man bei einem der großen Anbieter landet, der Preis ist somit meist vergleichbar hoch. Einfach mal so zusammenschrauben funktioniert nicht. Desweiteren sind die Klimakosten und der Stromverbrauch ein nicht unerhebliches Problem. Der Betrieb verschlingt bei einem Top100 Cluster Hunderttausende im oberen Bereich auch schnell mal Millionen von Euro pro Jahr.

Sicherlich. Das ist trotzdem kein Argument, wenn Rechenleistung gefragt ist. Damit können diese beiden Blue Gene Rechner nun mal nicht punkten. Und die Rechner dahinter sind bezüglich Energieeffizienz auch nicht soweit entfernt, bieten teils aber deutlich mehr Rechenleistung.

Suche

ARMv8 mit bis zu 128 Kernen und 3 GHz

Don

[printed]-Redakteur, Tweety

Cookie1990

Enthusiast

amdpc

Enthusiast

boxleitnerb

Enthusiast

websmile

Urgestein

boxleitnerb

Enthusiast

scully1234

Banned

jdl

Enthusiast

mr.dude

Urgestein

Timbaloo

Enthusiast

DerGoldeneMesia

Enthusiast

jdl

Enthusiast

temnozor

Enthusiast

mr.dude

Urgestein

Opteron

Semiprofi

pajaa

Super Moderator

jdl

Enthusiast

mr.dude

Urgestein

Ähnliche Themen