NEWS

Bis zu 12 Kerne

ARM stellt den Cortex-X3 und neue Tri-Cluster-Varianten vor

Portrait des Authors


ARM stellt den Cortex-X3 und neue Tri-Cluster-Varianten vor
1

Werbung

ARM hat auf einer Konferenz die neuen Cortex-Kerne und GPUs für zukünftige SoCs vorgestellt. Der Cortex-X3 wird als High-Performance-Kern schneller und von noch effizienteren Effizienz-Kernen unterstützt. Außerdem soll es neue Cluster-Varianten geben, die bis zu 12 Kerne in einem SoC packen. Aber es werden auch alte Zöpfe abgeschnitten und die GPUs bekommen dedizierte Raytracing-Hardware.

Der Cortex-X3 ist der neue High-Performance-Kern von ARM und soll im Vergleich zum Cortex-X2 bei gleichem Takt um 11 % schneller sein. Zusammen mit einer verbesserten Fertigung soll das Leistungsplus bis zu 25 % betragen. Das Front-End der dazugehörige Pipeline wurde überarbeitet, was für weniger Leerlauf sorgen soll. Die zur Verfügung stehenden Ressourcen werden also besser genutzt. Die L1- und L2-Caches werden um 50 % größer bzw. im Falle des L2-Cache von 512 auf 1.024 kB sogar  verdoppelt, zugleich gibt es größere Branche Prediction Buffer für diese Caches und eine verbesserte Sprungvorhersage. Der Micro-Op-Cache fast nun 1.536 anstatt 1.024 Einträge.

Breiter, schneller, effizienter - so könnte man die Änderungen am Cortex-X3 zusammenfassen.

In einem Tri-Cluster für die Energieeffizienz verantwortlich sein werden die Cortex-A715-Kerne. Auch hier hat ARM das Front-End stark verbessert. Auch hier geht es hauptsächlich um die Effizienz in der Pipeline und damit um die Sprungvorhersage. Bei gleicher Leistung zum Vorgänger Cortex-A710 soll der Cortex-A715 um 20 % sparsamer sein. Bei gleicher Leistungsaufnahme zugleich aber nur um 5 % schneller. An diesen Zahlen lässt sich der Fokus in der Entwicklung des Cortex-A715 erkennen. Die Unterstützung von AArch32 wird komplett eingestellt, so dass der Cortex-X715 keinerlei 32-Bit-Programme mehr ausführen kann. Hier schneidet ARM die eben erwähnten alten Zöpfe ab.

Die kleinsten Kerne bekommen nur einen kleinen Refresh. Der Cortex-A510 spart 4-5 % an Energie ein oder wird um 5 % schneller – je nachdem auf welchem Punkt der Fokus in der Entwicklung eines SoCs liegt. Weitere Änderungen gibt es hier nicht.

Kleine Verbesserung gibt es für den Corelink-CI-700-Interconnect, den Arm einsetzt um die CPU-Cluster mit dem System Level Cache (SLC), den DSUs und der GPU zu verbinden. 

Bis zu 12 Kerne werden nun unterstützt, so dass zur bisher bekannten High-End-Konfiguration mit 1+3+4-Kernen nun auch weitere hinzukommen. ARM sieht hier 1+4+4 und 2+2+4 für Smartphones und Tablets vor. Aber auch Notebooks und Desktop-Systeme sollen mit solchen Prozessoren ausgestattet werden. Hier sieht ARM sogar ein 8+4+0-Design vor – also acht Cortex-X3-Kerne in einem SoC.

Immortalis-G715, Mali-G715 und Mali-G615

Die neuen GPUs basieren allesamt weiterhin auf der Valhalla-Architektur, die in der vierten Generation aber einige Änderungen erhalten hat. Die Mali-G715 und Mali-G615 unterscheiden sich im Ausbau der Shadereinheiten, exklusive für Immortalis-G715 gibt es die Raytracing-Units (RTU), die eine Hardwarebeschleunigung für Raytracing-Berechnungen ermöglichen.

ARM adressiert mit der Immortalis-G715-GPU Smartphone-SoCs. Dementsprechend auch die Ausrichtung hinsichtlich der Leistung und der Software-Unterstützung, denn nur die Vulkan-API wird unterstützt. Je nachdem wie der IP-Kunde die GPUs umsetzen möchte, kommen hier unterschiedliche Shadereinheiten-Ausbaustufen zum Einsatz. Möglich sind 10 bis 16 Shader-Cores und ebenso viele RTUs. Der L2-Cache ist in Slices aufgeteilt und kann bis zu 1 MB groß sein.

Die Mali-G715 ist zwischen sieben und neun Shader-Cores groß, verzichtet aber wie gesagt die RTUs. Auf ein bis sechs Shader-Cores bringt es die Mali-G615-GPU.

Mit den ersten SoCs bzw. deren Ankündigungen auf Basis der neuen Designs ist ab Ende 2022 zu rechnen. Als Kunde für ein 12+4-0-Design mit eben 12 Cortex-X3-Kernen kommt vor allem Qualcomm in Frage. Aber auch Mediatek und viele weitere werden mit ihren SoCs für 2023 auf die neuen CPU- und GPU-Blöcke von ARM wechseln.