Werbung
Im Oktober des vergangenen Jahres stellte Apple mit dem M1 Pro und M1 Max die bisher größten Chips auf Basis der eigenen Entwicklung vor. Die vier Hochleistungskerne des M1 wurden für beide größeren Varianten auf acht verdoppelt. Dafür wurde die Anzahl der Effizienzkernen von vier auf zwei reduziert. Eine lineare Skalierung gab es beim GPU-Ausbau. Sind es für den M1 acht, wird dies für den M1 Pro auf 16 verdoppelt – mit einer weiteren Verdopplung auf 32 für den M1 Max.
Heute hat Apple den vierten Chip der M1-Serie vorgestellt: Den M1 Ultra. Hier fasst Apple zwei Apple M1 Max zusammen. Dazu verwendet man eine (vermutlich zusammen mit TSMC) entwickelte Silicon-Interposer-Technologie namens UltraFusion, die 10.000 Verbindungen zwischen den beiden Chips verwendet. Über den versteckten Bereich des M1 Max haben wir bereits vor einigen Wochen berichtet, denn natürlich ist der M1 Max bereits darauf vorbereitet. Die beiden M1 Max verhalten sich wie ein einzelner Chip. Die Bandbreite des Silicon-Interposer liegt bei 2,5 TB/s.
M1 | M1 Pro | M1 Max | M1 Ultra | |
Transistoren | 16 Milliarden | 33,7 Milliarden | 57 Milliarden | 114 Milliarden |
Fertigung | 5 nm | 5 nm | 5 nm | 5 nm |
Chipgröße | 119 mm² | ~ 240 mm² | ~ 420 mm² | ~ 840 mm² |
Hochleistungskerne | 4 | 8 | 8 | 16 |
L1-Instruction-Cache | 192 kB | 192 kB | 192 kB | 192 kB |
L1-Data-Cache | 128 kB | 128 kB | 128 kB | 128 kB |
L2-Cache | 12 MB | 24 MB | 24 MB | 48 MB |
Energieeffizienzkerne | 4 | 2 | 2 | 4 |
L1-Instruction-Cache | 128 kB | 128 kB | 128 kB | 128 kB |
L1-Data-Cache | 64 kB | 64 kB | 64 kB | 64 kB |
L2-Cache | 4 MB | 4 MB | 4 MB | 4 MB |
GPU-Kerne | 8 | 16 | 32 | 64 |
GPU-Rechenleistung | 2,6 TFLOPS | 5,2 TFLOPS | 10,4 TFLOPS | 20,8 TFLOPS |
Arbeitsspeicher | 16 GB LPDDR4X-4266 128 Bit 68 GB/s | 32 GB LPDDR5-6400 256 Bit 200 GB/s | 64 GB LPDDR5-6400 512 Bit 400 GB/s | 128 GB LPDDR5-6400 1.024 Bit 800 GB/s |
Gefertigt wird der M1 Ultra in 5 nm bei TSMC. Die Anzahl der Transistoren verdoppelt sich von 57 auf 114 Milliarden Transistoren. Die Chipfläche dürfte somit auf 840 mm² ansteigen. Wie sich an den Angaben zur Anzahl der Transistoren, der Größe des Chips und der vorhandenen Funktionseinheiten und Caches erkennen lässt, skaliert Apple die M1-Familie vom ursprünglichen M1 bis zum M1 Ultra in nahezu linearer Form. Dies ermöglicht es Apple mit einem Grunddesign vom iPad Air bis zum Mac Studio die notwendige Leistungsklasse anzubieten.
Zum Einsatz kommen 16 Hochleistungskerne und vier Effizienzkerne. Hinzu kommen 64 GPU-Kerne. An Arbeitsspeicher auf dem Package vorhanden sind 128 GB ab LPDDR5-6400 mit einer Speicherbandbreite von 800 GB/s. Bei acht LPDDR5-Speicherchips erreicht das Speicherinterface eine Breite von 1.024 Bit.
Der M1 Ultra soll bei einer Leistungsaufnahme von 60 W eine um 90 % höhere Leistung im Vergleich zu einem Desktop-Prozessor mit 16 Kernen aufweisen. Die GPU des M1 Ultra soll zudem so leistungsstark wie eine aktuelle High-End-Grafikkarte sein, verbraucht dabei jedoch 200 W weniger.
Interessant wäre es auch zu wissen, wie Apple den Einsatz zweier GPUs in einem Package in der Praxis umsetzt. Die Präsentation gab leider wenig Auskunft darüber, in welcher Form die beiden GPUs zusammenarbeiten oder ob es in zwischen für Apple möglich ist diese als eine große GPU funktionieren zu lassen. Für die CPU-Kerne ist die Aufteilung in 2x 8 Performance- und 2x 2 Efficiency-Kerne nicht weiter problematisch und wird so auch schon seit Jahren von verschiedenen Herstellern in Form von Chiplet-Designs praktiziert. Für zwei Chips mit jeweils einer GPU in einem Package kennen wir aber noch keine Umsetzung in dieser Form.
Den ersten Einsatz des M1 Ultra sehen wir im Mac Studio. Dieser wird allerdings auch mit dem M1 Max erhältlich sein. Apple sprach zwar auch einen neuen Mac Pro an, ob dieser aber ebenfalls mit dem M1 Ultra ausgestattet sein wird oder schon auf die nächste Generation zurückgreifen wird, bleibt offen.