Werbung
Anfang März musste Intel verkünden, dass man die Datacenter-Roadmap im Bereich der GPU-Beschleuniger etwas zusammenstreicht und zwei eigentliche geplante Generationen von Beschleuniger-Karten überspringt bzw. ersetzt. Zusammen mit dem Abgang von Raja Koduri dürfte dies das Unternehmen sowie die Partner und Kunden etwas durchgerüttelt haben.
Um positive Nachrichten bemüht, präsentierte Intel ein Update seiner Datacenter und AI Group (DCAI). Darin spricht Ronak Singhal, Intel Senior Fellow und Chief Architect für die Xeon-Roadmap, über die Pläne Intels. Vor etwas mehr als einem Jahr verkündete das Unternehmen an gleicher Stelle, dass es nach der nächsten Xeon-Generation Emerald Rapids, zukünftige zweigleisig weitergehen wird. Granite Rapids wird der Standard-Xeon-Pfad und Sierra Forest soll ein neues Marktsegment abdecken, welches besonders auf Effizienz ausgelegt ist und daher rein auf Efficiency-Kerne setzt.
Aber nicht nur zu diesem Punkt, sondern auch zu weiteren gibt es einige Neuigkeiten, auf die wir nun eingehen werden. Zunächst einmal aber wird Intel nicht müde zu betonen, wie zufrieden man mit dem Start und der prognostizierten Entwicklung der vierten Generation der Xeon-Scalable-Prozessoren alias Sapphire Rapids ist. Bereits Mitte des Monats veröffentlichte man dazu eine Pressemitteilung. Daher gehen wir an dieser Stelle auch nicht noch einmal darauf ein. Intel stellt die Situation um Sapphire Rapids auch besser dar, als sie sicherlich von vielen empfunden wird, denn erschienen ist diese Generation mit knapp zwei Jahren Verspätung und zudem hat Intel gut ein Dutzend Steppings benötigt, um einen fehlerfreien Chip auf dem Markt zu bringen.
Noch in diesem Jahr will Intel mit einer weitere Xeon-Generation nachlegen, die ebenfalls auf dem Sockel LGA4677 bzw. der Eagle-Stream-Plattform aufsetzen wird. Emerald Rapids soll dabei mehr Kerne als aktuell Sapphire Rapids zu bieten haben, wird aber ebenfalls in Intel 7 gefertigt. Man darf hier also gespannt sein, wie Intel die höhere Anzahl an Kernen im gleichen Package unterbringt.
Die ersten Samples von Emerald Rapids sollen sich bereits bei den Partnern befinden, sodass ein offizieller Start im vierten Quartal anvisiert werden kann. Ähnlich wie bei Sapphire Rapids müssen wir uns vom Gedanken verabschieden, dass es einen harten Starttermin gibt. Die Hardware wird teilweise bereits weit im Vorfeld an Großkunden ausgeliefert und der Wechsel von einer zur nächsten Generation stellt mehr und mehr einen fließenden Übergang dar.
P- und E-Core-Xeons laufen parallel
Wie viele andere Hersteller auch, geht Intel davon aus, dass ein "One size fits it all"-Ansatz im Datacenter zukünftig bei den Prozessoren nicht mehr funktionieren wird. Dazu sieht man die eben bereits erwähnte Aufteilung in Xeon-Prozessoren mit Performance-und Efficiency-Kernen vor. Ein Hybrid-Design hat man offenbar nicht ins Auge gefasst. ARM legt seine Neoverse-Designs einmal optimiert auf Leistung pro Kern und Leistung pro Watt aus, AMD sieht mit Zen 4 für die EPYC-Prozessoren und Zen 4c für die Bergamo-Modelle ähnliches vor.
Die zwei Entwicklungspfade will Intel also ebenfalls etablieren, sieht dabei aber eine gewisse Gemeinsamkeit in der Plattform vor. Sowohl Granite Rapids als reines P-Core-Design als auch Sierra Forest als reines E-Core-Design teilen sich eine gemeinsame Plattform (Birch Stream) und werden im gleichen Sockel zueinander kompatibel sein. Intel verwendet hier auch die gleichen I/O-, Mesh- und Speichercontroller-Komplexe bzw. Tiles. Hier und da kann es leichte Unterschiede geben, dies sich durch den unterschiedlichen Anwendungsbereich begründen lassen.
Sierra Forrest ist für die erste Jahreshälfte 2024 geplant. Granite Rapids soll ebenfalls in diesem Zeitraum, aber kurz nach Sierra Forest erscheinen.
Core-Design | Fertigung | Termin | Plattform | Ausrichtung | |
Emerald Rapids | P-Cores | Intel 7 | Q4 2023 | Eagle Stream | mehr Kerne höhere Perf/W |
Sierra Forest | E-Cores | Intel 3 | H1 2024 | Birch Stream | 144 Kerne Perf/W Perf/Area hoher Durchsatz |
Granite Rapids | P-Cores | Intel 3 | 2024 | Birch Stream | mehr Kerne Speicher & I/O Innovationen |
Clearwater Forest | E-Cores | Intel 18A | 2025 | - |
So wie in obiger Tabelle sieht Intels aktueller Fahrplan bei den Xeon-Prozessoren also aus. Ursprünglich war Granite Rapids in Intel 4 geplant, aufgrund der guten Erfahrungen in der Entwicklung von Intel 3 hatte man bereits im vergangenen Jahr verkündet auf eine Fertigungsstufe darunter, sprich Intel 3, zu setzen. Allem Anschein nach ist Meteor Lake damit als einziger Prozessor übriggeblieben, der noch in Intel 4 gefertigt werden soll. Sierra Forest ist somit das sogenannte Lead Vehicle für Intel 3, kurz darauf kommt Granite Rapids hinzu.
Sierra Forest soll bereits in den Labs getestet werden. Nach weniger als 18 Stunden hat Intel offenbar erfolgreich ein Betriebssystem auf den ersten Chips booten können – dies soll die Funktionstüchtigkeit der Hardware unter Beweis stellen.
Intel präsentierte Granite Rapids bereits mit DDR5-6400 im Quad-Channel-Betrieb. Heute nun geht man einen weiteren Schritt und zeigte die übernächste Xeon-Generation gemeinsam mit MCR DIMM DDR5-8800. Intel, Renesas und SK hynix haben den MCR DIMM (Multiplexer Combined Ranks) gemeinsam entwickelt.
Der Trick des MCR DIMM ist ein Puffer-Speicher, bzw. eine Bündelung der Datenleitungen, die von den Speicherchips kommen. Die Speicherchips sind in zwei Ranks organisiert und werden zu jeweils 64 Bytes an Übertragungsmöglichkeiten in den Puffer geführt. Von dort geht es dann mit 128 Byte über das Speicherinterface an den Prozessor.
Durch die höhere Transferrate von MCR DIMM DDR5-8800 erreicht Intel in einem 2S-System bis zu 1,5 TB/s an Speicherbandbreite.
Der Nachfolger von Sierra Forest hat nun einen Namen: Clearwater Forest. Erscheinen soll dieser 2025 und setzt dabei nicht auf den nächsten Schritt hinsichtlich der Fertigung, Intel 20A, sondern geht direkt auf Intel 18A. Clearwater Forest wird die erste Xeon-Serie sein, die auf eine Fertigung in Intel 18A setzt. Das entsprechende P-Core-Gegenstück hat noch keinen Namen, soll den aktuellen Gerüchte zufolge auf den Namen Diamond Rapids hören.
Melville Sound und Gaudi 3
Zusammen mit der Einstellung von Lancaster Sound verkündete Intel vor einigen Wochen den Fokus nun auf Melville Sound legen zu wollen. In der kompletten DCAI-Roadmap ebenfalls ersichtlich wird, dass auf den HPC-Beschleuniger Ponte Vecchio direkt die ersten Shores-Generation alias Falcon Shores folgen wird.
Dediziert auf AI-Anwendungen ausgelegt, sind die Gaudi-Chips der Habanalabs. Hier soll der Nachfolger Gaudi 3 das Tape-In hinter sich gebracht haben, was bei Intel gleichbedeutend damit ist, dass erste Chips aus der Fertigung kommen und nun validiert werden. In etwa im ersten Halbjahr 2024 dürfte mit Gaudi 3 zu rechnen sein.
Während der GPU-Bereich also etwas zurechtgerückt wurde, hält Intel an seiner Xeon-Strategie weiter fest und ergänzt diese nun mit einer weiteren E-Core-Xeon-Generation. Der Tile-Ansatz bei den Xeon-Prozessoren wird sicherlich interessant. Granite Rapids und Sierra Forest werden die ersten Xeon-Prozessoren sein, die darauf setzen werden. Hier soll das zukünftige Tile-Design dann auch bei den Datancenter-CPUs zum Tragen kommen. Die I/O Tiles können zwischen Granite Rapids und Sierra Forrest beibehalten werden, einzig die Compute Tiles und Caches werden ausgetauscht. Der Interconnect zwischen den Kernen und dem Speichercontroller soll ebenfalls identisch sein.
Nicht abhängen lassen ...
Die Large Language Models (LLM) und allen voran Generative Pre-trained Transformer 4 (GPT-4) sind aktuell in aller Munde und bescheren von allem NVIDIA aktuellen einen wahren Boom, denn für das Training dieser riesigen Netzwerke an Rechenbeschleunigern notwendig, von denen NVIDIA mit den A100 und neuen H100 eben solche im Programm hat. Auf der GTC23 vor wenigen Tagen stellte man sogar eine H100-Variante vor, die mit größerem Speicher dediziert für diese LLMs aufgelegt ist.
An dieser Stelle will sich Intel nicht abhängen lassen. Bis 2027 sieht man das Marktpotenzial für bis zu 40 Milliarden US-Dollar in diesem Segment und davon will man natürlich ein Scheibchen abhaben. Den Fokus auf die GPUs sieht man allerdings nicht und spricht davon, dass in etwa 60 % des "AI Silicon" noch durch Prozessoren abgedeckt würde und 40 % auf GPU-Beschleuniger fallen, die dann die riesigen Modelle berechnen.
Grundsätzlich profitieren dürften vom Boom alle beteiligten Unternehmen – die einen mehr, die anderen weniger. Keiner will hier nun den Anschluss verlieren. Intel hätte den Vorteil, dass man sowohl die Prozessoren mit ausreichend Rechenleistung für kleine und mittlere AI-Modelle hat und zudem die entsprechenden GPUs im Programm hat. Bisher aber dominiert NVIDIA den Markt für die größten Modelle, von AMD und Intel ist hier wenig zu hören bzw. sehen.
Update:
Im Rahmen des Webinars gab es einige weitere Informationen und Fotos, die wir nun noch nachreichen wollen.
Unter anderem zeigte Intel einen Sierra-Forest-Prozessor mit 144 Kernen unter Vollast (Bild links) sowie ein Granite-Rapids-System mit MCR DIMM DDR5-8800.
Außerdem wurde das Package eines Xeon-Prozessors der nächsten Generation alias Emerald Rapids gezeigt. Auf dem Package befinden sich zwei Chips, die in etwa auf eine Chipfläche von 770 mm² kommen. Diese 770 mm² erreichen auch die MCC-Dies der Sapphire-Rapids-Generation und auf diesem arbeiten 32 Kerne. Emerald Rapids wird ebenfalls in Intel 7 gefertigt und somit könnten die Prozessoren auf 64 Kerne kommen.