NEWS

UPMEM

DDR4-DIMMs bekommen integrierte AI-Prozessoren

Portrait des Authors


DDR4-DIMMs bekommen integrierte AI-Prozessoren
1

Werbung

Für AI-Anwendungen ist es wichtig, den Speicher so nahe wie möglich an den verarbeitenden Prozessor zu bringen. Ein Unternehmen aus Frankreich namens UPMEM hat sich gedacht: "Warum den Prozessor nicht näher an den Speicher bringen?" Auf der Hotchips hat man nun einen DDR4-Speicher vorgestellt, der mit sogenannten DPUs (DRAM Processing Unit) kombiniert wird.

Dabei integriert UPMEM die DPUs als Teil des DRAM-Speicherchips. Bereits in der Fertigung des Speichers, die in 20 nm stattfindet, werden die DPUs in zwei bis drei Metal-Layer integriert. In einem DDR4-2400-Speicherchip mit einer Kapazität von 4 GBit befinden sich aktuell acht DPUs. Die DPUs haben aber nicht Zugriff auf den kompletten Speicher, sondern können sich jeweils 64 MB reservieren. Die Pläne von UPMEM sehen vor, dass später einmal 16 der 4-GBit-Chips auf ein DIMM-Modul verbaut werden, so dass wir auf eine Gesamtkapazität von 8 GB für ein DIMM-Modul kommen, auf dem dann auch 128 DPUs arbeiten.

Das letztendliche Ziel aber ist die Umsetzung von 128-GB-Modulen, die dann auf 2.048 DPUs kommen. Jeder DPU besitzt eine Speicherbandbreite von 1 GB/s zu den exklusiven 64 MB an DRAM. Bei 2.048 DPUs spricht UPMEM von einer Gesamtdatenrate von 2 TB/s.

Die DPUs arbeiten mit einem Takt von 500 MHz und natürlich bedeutet dies auch, dass die Leistungsaufnahme der einzelnen Speicherchips und des kompletten DIMM-Moduls steigt. Für ein DIMM-Modul spricht UPMEM von einer Leistungsaufnahme von etwa 20 W. Intels DC Optane Persistent Memory kommt ebenfalls auf bis zu 18 W, lässt sich aber auch deutlich niedriger konfigurieren. Auch UPMEM will eine konfigurierbare Leistungsaufnahme anbieten.

Dies ist auch nötig, denn auf der einen Seite muss das Mainboard die zusätzliche Leistungsaufnahme über den DIMM-Steckplatz liefern können, auf der anderen Seite muss der Server bzw. dessen Kühlung auch in der Lage sein, die Abwärme abzuführen.

Der Zugriff auf die DPUs ist ohne weitere Hardware-Modifikationen möglich. Die Speichercontroller moderner Prozessoren sollen damit zurecht kommen. Es kann aber ein BIOS-Update notwendig sein – so UPMEM. Eine API ermöglicht dann den Zugriff auf die DPUs. Zur Rechenleistung will sich UPMEM noch nicht genauer äußern. Für bestimmte Anwendungsfälle rechnet das Unternehmen aber vor, dass ein Server für 40.000 US-Dollar für deutlich weniger angeboten werden kann.

Die ersten Samples will UPMEM im Oktober ausliefern. Es gibt bereits Softwaresimulatoren sowie Amazon AWS-Instanzen, über die sich die DPUs simulieren lassen. Zeil ist es natürlich, den interessierten Entwicklern bereits eine Plattform zu geben, auf der sie arbeiten können.