Werbung
Einer der größten Profiteure des aktuellen AI- und LLM-Booms (Large Language Model) ist sicherlich NVIDIA. Alle großen Modelle werden auf Systemen mit NVIDIA-GPU trainiert – seien es Googles A3-Instanzen, GPT-4 bei OpenAI oder eines der wenigen Open-Source-Modelle MPT-7B von MosaicML. Von AMD ist aus dieser Richtung bisher wenig zu hören und wohl aufgrund der zahlreichen Verzögerungen ist auch Intel bisher mit Ponte Vecchio ,bzw. der GPU Max Series nicht wirklich zum Zuge gekommen.
Für Intel wird die Zeit knapp, denn ansonsten hat NVIDIA bereits einen Großteil des Marktes abgeschöpft. Entsprechend wird man nicht müde, weitere Leistungsdaten zu zeigen.
So vergleicht Intel die Data Center GPU Max 1550 mit NVIDIAs aktuellem Flaggschiff, dem H100-Beschleuniger und sieht sich hier in Industrie-Benchmarks, vor allem aber in praxisrelevanten Anwendungen teilweise deutlich im Vorteil. Man gibt allerdings zu, dass es noch Bereiche gibt, in denen man aufzuholen hat.
Im Hinterkopf haben sollte man, dass Intel hier die Data Center GPU Max 1550 als OAM-Modul mit einer TDP von bis zu 600 W gegen die PCI-Express-Variante des H100-Beschleungiers heranzieht, dessen TDP bei maximal 350 W liegt. Die Leistungsaufnahme des Intel-Beschleunigers liegt also etwa 70 % über der des Konkurrenten und dies relativiert die Zahlen dann doch wieder.
Die nicht vorhandene Verfügbarkeit ist ein weiterer Punkt, den wir anmerken wollen. Laut Intels eigener Produktdatenbank ist die Data Center GPU Max 1550 ab dem ersten Quartal diesen Jahres verfügbar. Die PCI-Express-Variante Data Center GPU Max 1100 soll im zweiten Quartal folgen. Data Center GPU Max 1450 wird erst im vierten Quartal folgen und dementsprechend ist die Hardware eigentlich noch gar nicht verfügbar, während NVIDIA bereits tausende H100-Beschleuniger ausliefert. Erst im Juli sollen die Data Center GPU Max 1550 bei den OEMs verfügbar sein. Im kommenden Monat startet die Auslieferung des kleineren der beiden Subsysteme x4-OAM mit vier GPUs, im Juli soll die heute neuangekündigte Variante mit acht OAM-Modulen folgen.
Ponte Vecchio muss nun 1,5 Jahre durchhalten, bis die Serie dann 2025 von Falcon Shores abgelöst wird. Inwieweit sich Intel gegen NVIDIAs Dominanz wird durchsetzen können, wird sich zeigen müssen.
Falcon Shores offiziell GPU-only
Mit der Abkündigung von Rialto Bridge und Lancaster Sound als GPU-Beschleuniger der nächsten Generation rückte Falcon Shores in den Fokus. Falcon Shores soll die aktuelle GPU-Strategie zusammenführen. CPU-, GPU-, AI-, Speicher-Tiles in einem Package sollen die Chips flexibel auf den jeweiligen Anwendungsfalls ausrichten können. x86-Kerne und eine Xe-Architektur in einem Package – dies erinnert stark an AMDs Instinct MI300A, der CDNA-3-Chiplets und Zen-Kerne zusammenbringt.
Bereits im März deutete sich an, dass Intel mit einer ersten Generation keine CPU- und GPU-Kerne zusammenführen werde. Aktuell sei der Markt so stark in Bewegung, dass eine Festlegung auf einen bestimmten Mix in der Hardware kaum möglich sei. Wie viel CPU- und GPU-Leistung soll den beiden Bereichen im Verhältnis zugestanden werden? Mit einer XPU/APU – oder wie auch immer man diese Hardware bezeichnen will – legt man sich für dieses Verhältnis in Form von Hardware fest. Änderungen sind kaum mehr möglich. Stattdessen will man bei Intel flexibel bleiben und wird die CPU- und GPU-Strategie in Form getrennter Produktreihen fortsetzen. Falcon Shores wird somit ausschließlich Compute-Tiles mit einer GPU-Architektur verwenden. CPU-Kerne wird man hier vergeblich suchen.
Dafür gibt Intel bekannt, dass die in den Gaudi-Beschleunigern ähnlich tief integrierten Ethernet-Schnittstellen Einzug halten werden. Zudem wird das Falcon-Shores-Package HBM3 verwenden und hinsichtlich seines I/O-Angebotes gut aufgestellt sein. Die Gaudi-Produktlinie wird nach Gaudi 3 planmäßig ebenfalls in Falcon Shores aufgehen.
Letztendlich versucht Intel in der Tatsache, dass man die ambitionierten Ziele nicht umsetzen konnte, etwas gutes zu sehen. Das Verhältnis aus CPU- und GPU-Leistung kann über zwei getrennte Produkte besser kontrolliert und angepasst werden. Die Xe-Architektur ist zudem in der Lage, sowohl HPC- als auch AI-Anwendungen gleichermaßen gut zu bedienen. Wie genau sich Falcon Shores manifestieren wird, muss sich allerdings zeigen.
Xeon-Pläne bereits ausführlich vorgestellt
Erst vor wenigen Wochen hatte Intel seine Pläne für die nächsten Xeon-Generationen ausführlich vorgestellt. Emerald Rapids soll als Drop-In-Lösung der aktuellen Plattform deren Effizienz verbessern und mehr Kerne bieten können. Bereits im vierten Quartal 2023 soll der Startschuss fallen. Der Nachfolger aus der P-Core-Serie Granite Rapids wird dann in Intel 3 gefertigt, bietet abermals mehr Kerne und soll vor allem durch den Einsatz von MCR DIMM (Multiplexer Combined Ranks) profitieren. Intel hat diese Speichertechnik entwickelt und lässt sie von der JEDEC als Standard festlegen, so dass Speicher- und CPU-Hersteller diesen umsetzen können. Granite Rapids soll 2024 auf den Markt kommen.
Für die erste Jahreshälfte 2024 geplant ist Sierra Forest, die erste reine E-Core-Umsetzung bei den Xeon-Prozessoren. 144 Kerne und eine hohe Effizienz sollen diese Serie auszeichnen. Die Tiles mit den CPU-Kernen werden in Intel 3 gefertigt. Der Nachfolger Clearwater Forest soll dann schon auf Intel 18A setzen. Alle Details dazu in einem ausführlichen Artikel, der Ende März erschienen ist.