NEWS

Neue SoC-Kerne

Cortex-A78 für High-End und Cortex-X1 für etwas mehr

Portrait des Authors


Cortex-A78 für High-End und Cortex-X1 für etwas mehr
1

Werbung

ARM hat zwei neue CPU-IPs für mobile SoCs vorgestellt. Dies geschah im Rahmen des Client Tech Day. Die beiden neuen CPU-Kerne, bzw. die neuen Mikroarchitekturen hören auf den Namen Cortex-A78 und Cortex-X1, die Codenamen der Architekturen lauten Hercules und Hera.

Der Cortex-A78 bietet gleich mehrere kleinere Verbesserungen gegenüber dem Cortex-A77 – es handelt sich jedoch nicht um ein grundsätzlich neues Design. Beispielsweise kann der L1-Data-Cache von 64 auf 32 kB halbiert werden, wenn der Kunde dies aufgrund der Effizienz und Fläche möchte. Dazu wurde die Sprungvorhersage im Frontend verbessert, um die Missrate niedriger zu gestalten. Bei einem kleineren L1-Cache ist dies wichtig, um mit dem halbierten Cache zurecht zu kommen, aber auch die Geschwindigkeit, bzw. Effizienz im grundsätzlichen Sinne zu steigern. Beim L2-Cache gibt es hinsichtlich der Kapazität keinerlei Änderungen, allerdings ist die Interface-Bandbreite verdoppelt worden und die Entries wurden von 1280 auf 1024 reduziert.

Eine höhere Effizienz und weniger Fläche sind die Optimierungen, die ARM für den Cortex-A78 vorgenommen hat. Es gibt allerdings große Abhängigkeiten zur Fertigung. Ausgelegt ist das Design auf 5 nm, was sich an einer um 20 % besseren Leistung im Vergleich zu Fertigung in 7 nm zeigen soll. Bei gleicher Leistung soll der in 5 nm gefertigte Kern nur die Hälfte der Leistungsaufnahme aufweisen.

Im Vergleich zum Cortex-A77 soll die Leistung bei gleichem Takt um 7 % höher sein. Die Leistungsaufnahme sinkt im Vergleich um 4 %. Zudem belegt der Cortex-A78 eine um 5 % geringere Fläche auf dem Wafer.

Der Cortex-A78 ist also kein Upgrade-Pfad zum Cortex-A77, sondern wird von SoC-Herstellern in Erwägung gezogen werden, die anstatt in 7 nm inzwischen in 5 nm fertigen wollen.

Mehr von allem: Cortex-X1

Highlight ist sicherlich der Cortex-X1. Es handelt sich dabei um einen Custom-Core, der von ARM angepasst wurde und einige Sonderbedürfnisse der SoC-Hersteller abdecken soll. Das Cortex-X1-Design ist nicht mehr weitestgehend ausbalanciert, sondern tendiert klar in Richtung Leistung.

Die einzelnen Kerne verfügen über einen fünf statt vier Befehle breiten Decoder für Instruktionen. Aus dem Mop-Cache können nun acht anstatt sechs Befehle bezogen werden. Das Front- und Backend wächst an allen Ecken und Enden an. Dies gilt auch für die Puffer mit meist verdoppelten Entries. Die Integerleistung soll um 22 bis 30 % steigen. Die Leistung in Machine-Learning-Anwendungen soll sich sogar verdoppeln, was durch verbesserte Neon-Einheiten, bzw. die darin integrierten Gleitkomma-Pipelines gelingt.

Die größeren Caches und Funktionseinheiten sorgen dafür, dass die Fläche eines Cortex-X1-Kerns deutlich höher ausfällt, als dies bei einem Cortex-A78 der Fall ist. Die Leistung des Cortex-X1 fällt um 30 % höher aus, als beim Cortex-A77. Die Fläche des Kerns allerdings ebenfalls 15 % größer. Das Cortex-X1-Design wird mutmaßlich als einzelner Kern in einem SoC zum Einsatz kommen. So kann er beispielsweise mit drei Cortex-A78-Kernen kombiniert zum Einsatz kommen.

In den kommenden Monaten sollen die ersten SoCs vorgestellt werden, die auf den Cortex-A78 oder Cortex-X1 setzen. Wie genau diese dann eingesetzt werden, wird sich zeigen müssen. Für den Cortex-A78 kann man sich dies noch recht gut vorstellen, wie es jedoch um den Cortex-X1 bestellt ist, wird sich zeigen müssen. Bis wir die ersten Smartphones sehen, in denen die Kerne zum Einsatz kommen, wird noch einige Zeit vergehen. Ob wir in diesem Jahr noch ein solches sehen werden, ist eher unwahrscheinlich.

Der Cortex-X1 ist ein klarer Angriff auf Apples eigene ARM-Designs. Hinsichtlich der Leistung setzt Apple die Messlatte immer höher an, vor allem im Hinblick auf die Single-Threaded-Leistung.