Werbung
Auf seinem Dev Day hat Tenstorrent die nächste Generation seiner RISC-V-Beschleuniger vorgestellt, die auch ab sofort bestellt werden können. Die letzten Div-Kits mit der vorherigen Generation (Wormhole) können in einer luft- und wassergekühlten Version seit Mitte des vergangenen Jahres vorbestellt werden.
Blackhole ist eine Weiterentwicklung von Wormhole. Die betrifft fast alle Aspekte der Architektur bzw. des Aufbaus des Chips. Die Tensix Cores sind als Matrix-Beschleuniger im Grunde noch identisch, mit Blackhole führt Tenstorrent aber bis zu dedizierten General Purpose RISC-V-Kerne ein, die als Big Cores bezeichnet werden. Mehr SRAM, größerer und schnellerer Speicher, eine schnellere Anbindung der Beschleuniger an das Host-System – in vielen Aspekten macht Tenstorrent hier die nächsten Schritte.
p100a | p150a | n150d | n300d | |
Architektur | Blackhole | Blackhole | Wormhole | Wormhole |
Fertigung | 6 nm | 6 nm | 12 nm | 12 nm |
Tensix Cores | 120 | 140 | 72 | 128 |
Takt | 1,35 GHz | 1,35 GHz | 1 GHz | 1 GHz |
"Big RISC-V"-Kerne | 16 | 16 | - | - |
SRAM | 180 MB | 210 MB | 108 MB | 192 MB |
Speicher | 28 GB GDDR6 | 32 GB GDDR6 | 12 GB GDDR6 | 24 GB GDDR6 |
Speicherbandbreite | 448 GB/s | 512 GB/s | 288 GB/s | 576 GB/s |
Netzwerk | - | 4x QSFP-DD 800G | 2x QSFP-DD 200G | 2x QSFP-DD 200G |
TDP | 300 W | 300 W | 160 W | 300 W |
Stromanschlüsse | 1x 12V-2x6 | 1x 12V-2x6 | 1x 4+4-pin EPS12V | 1x 4+4-pin EPS12V |
Host-Interface | PCIe 5.0 x16 | PCIe 5.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
Kühlung | aktiv | aktiv | aktiv | aktiv |
Preis | 999 USD | 1.299 USD | 1.099 USD | 1.449 USD |
Vorweg sei gesagt, dass Wormhole in 12 nm bei TSMC gefertigt wurde und Tenstorrent für Blackhole auf eine Fertigung in 6 nm zurückgreifen kann. Die Varianten n150d und n300d in der Wormhole-Generation unterscheiden sich in der Tatsache, dass für die n300d-Variante zwei Chips auf dem PCB verwendet wurden. Die 128 Tensix Cores teilen sich in zweimal 64 auf, was auch für die 192 MB SRAM (96 MB pro ASIC), den Speicher (zweimal 12 GB GDDR6) und die Speicherbandbreite (2x 288 GB/s) gilt. Die Anbindung an das Host-System erfolgten über PCI-Express 4.0 mit 16 Lanes. Zwei QSFP-DD-Anschlüsse ermöglichten eine Ethernet-Anbindung mit jeweils 200 GBit/s. Die aktiv gekühlten Variante hatten eine TDP von 160 bzw. 300 W und kosteten 1.099 bzw. 1.449 US-Dollar.
Bei der nun neuen Generation Blackhole ist nur ein Chip auf dem PCB verbaut. Tenstorrent bietet zur Steuerung der Ausbeute eine Variante mit 120 und 140 Tensix Cores an. Bei beiden Chips sind aber 16 der "Big RISC-V"-Kerne aktiv. Der SRAM ist mit 180 bzw. 210 MB deutlich angewachsen. An dediziertem Speicher stehen 28 bzw. 32 GB GDDR6 zur Verfügung, die an einem 192 bzw. 256 Bit breiten Speicherinterface auf eine Speicherbandbreite von 448 bzw. 512 GB/s kommen.
Die p150a-Variante verfügt über gleich vier QSFP-DD-Anschlüsse mit jeweils 800 GBit/s. Die TDP liegt jeweils bei 300 W und die Versorgung findet über einen 12V-2x6-Anschluss statt. Die Anbindung an das Host-System erfolgt hier über PCI-Express 5.0. Die Preise fallen mit 999 bzw. 1.299 US-Dollar sogar günstiger als beim Vorgänger aus.
Analog zu Wormhole gibt es auch bei Blackhole eine passiv gekühlte Variante des RISC-V-Beschleunigers.
Die einzelnen Karten und aktuell noch die mit den Wormhole-Karten bestückten TT-QuietBox und TT-LoudBox mit den Wormhole-Karten sind für die KI-Entwicklung und KI-Forschung gedacht. Die TT-QuietBox und TT-LoudBox wird es in Kürze auch mit den Blackhole-Karten geben – im Falle der TT-QuietBox mit Blackhole findet sich die Möglichkeit der Vorbestellung für 11.999 US-Dollar bereits. Die Rack-Systeme Tenstorrent Galaxy soll es in Kürze ebenfalls mit den Blackhole-Beschleunigern geben.