NVIDIA stellt L4-Beschleuniger vor

ASRock Rack qualifiziert GPU-Server

Von Andreas Schilling
Mittwoch, 22.03.2023 um 08:54 Uhr

ASRock Rack qualifiziert GPU-Server

Neben der H100 NVL für große KI-Modelle sowie der A4000 SFF und neuen RTX-Workstation-GPUs für Notebooks hat NVIDIA auf der GTC 23 eine neue L4-Beschleunigerkarte für AI-Video vorgestellt. Vorrangig geht es hier also um die Verarbeitung von Video-Inhalten, wenngleich die Karten reine AI- und Grafik-Anwendungen ausführen können. Der Vorgänger basierte als T4 noch auf der Turing-Architektur, bei der L4 kommt nun eine GPU auf Basis der Ada-Lovelace-Architektur zum Einsatz. Welche GPU dies genau ist, darüber gibt es noch keine Informationen.

In der Google-Cloud kommt die L4 in den G2-Instanzen zum Einsatz, die eine Videobearbeitung in der Cloud ermöglichen. Google verwendet die L4 aber auch für seine Text-zu-Bild-AI Dream. Das schnöde Decodieren von Videostreams ist mit der Karte ebenfalls möglich. Dabei soll die L4 bis zu 1.040 Streams gleichzeitig bearbeiten können.

Die Effizienz spielt eine große Rolle: Die L4 verfügt offenbar über eine TDP von gerade einmal 70 W und kann daher über den PCI-Express-Steckplatz versorgt werden.

Rund 30 OEMs und SIs wollen die NVIDIA L4 anbieten, bzw. qualifizieren ihre Systeme dafür. Auch einige Cloud-Anbieter, wie zum Beispiel Google, nutzen sie für ihre Instanzen.

ASRock Rack hat einige seiner GPU-Server bereits entsprechend qualifiziert und nennt folgende Server als bereit für den Einsatz mit NVIDIAs L4:

Quellen und weitere Links