Werbung
NVIDIA nutzt die Supercomputing Konferenz 2015 (SC15) vom 15. bis 20. November zur Vorstellungen neuer Technologien. Mit zwei neuen Tesla-Produkten will NVIDIA dem Bedarf an wachsenden Videoinhalten gerecht werden, die im sogenannten Hyperscale-Computing eingesetzt werden. Von den dazugehörigen Anforderungen wissen die meisten Nutzern von YouTube, Twitch, Facebook oder Periscope meist nichts. NVIDIA hat aber auch gleich ein paar Zahlen zur Hand, die helfen, die Dimensionen zu verstehen.
So produzieren 10 Millionen Nutzer auf Periscope pro Tag Videomaterial von 40 Jahren. Auf YouTube werden pro Minute sogar 300 Stunden an Video hochgeladen. Auf Twitch tummeln sich inzwischen 1,7 Millionen Nutzer, die einen Stream anbieten, der durchschnittliche Nutzer betrachtet diese 1,5 Stunden pro Tag. Viele weitere Zahlen nannte NVIDIA in der Präsentation. Worauf es ankommt ist die Tatsache, dass dieser Inhalt nicht nur einfach auf einen Server geladen und wieder heruntergeladen wird, sondern das Video muss transcodiert werden, oftmals findet eine Datenanalyse statt oder aber die Inhalte werden anderweitig verarbeitet. All dies geschieht auf Servern von Google, Twitch, Netflix bzw. namenslosen Dienstleistern, ohne dass der Nutzer davon etwas merkt.
NVIDIA Tesla M40 und Tesla M4
Mit der Tesla M40 und Tesla M4 adressiert NVIDIA dazu die entsprechenden Bedürfnisse. Während die Tesla M40 ein Deep Learning Toolkit ermöglicht und die Daten entgegennimmt und verarbeitet, soll die Tesla M4 in kleinerem Maßstab für eine Verarbeitung sorgen, die letztendlich dazu führt, dass ein Video auf dem Rechner, Smartphone oder Tablet landet. Deep Learning ist bei diesem Thema ein wichtiger Punkt, den NVIDIA spätestens auf der GTC 2015 genauer ausführte.
NVIDIA Tesla M40 und Tesla M4
Kommen wir zu den technischen Daten der beiden Karten: Die NVIDIA Tesla M40 arbeitet mit der GM200-GPU und kommt daher auf 3.072 Shadereinheiten. Bisher setzt NVIDIA diese GPU nur auf der GeForce GTX Titan X und Quadro M6000 ein. Den Shadereinheiten zur Seite stehen 12 GB an GGDR5-Speicher, der per ECC gegen Speicherfehler geschützt ist. Die Speicherbandbreite gibt NVIDIA mit 288 GB pro Sekunde an. Die Leistungsaufnahme der Karte soll bei 250 W liegen. Typisch für eine solche Serverkarte ist die passive Kühlung, denn das Server-Rack stellt die benötige Belüftung zur Verfügung. NVIDIA gibt eine Rechenleistung von 7 TFLOPS bei einfacher Genauigkeit an, die für den vorgesehenen Verwendungszweck auch der entscheidende Maßstab ist. Bei doppelter Genauigkeit dürfte die Leistung demnach bei 291 GFLOPS liegen.
NVIDIA Tesla M40 und Tesla M4
Für das Transcodieren der Videos sowie das Processing von Videos und Fotos sieht NVIDIA die Tesla M4 vor. Sie verwendet eine GPU mit 1.024 Shadereinheiten. Auch sie basiert auf der Maxwell-Architektur der zweiten Generation und hört auf den Namen GM206, die beispielsweise auf der GeForce GTX 960 verwendet wird. NVIDIA gibt eine Rechenleistung von 2,2 TFLOPS an. Die 4 GB GDDR5-Speicher arbeiten mit einer Speicherbandbreite von 88 GB pro Sekunde. Entscheidend bei der Karte sind im Zusammenspiel mit der Leistung aber auch die Abmessungen, denn sie kommt im Low-Profile-Format daher. Die Leistungsaufnahme kann vom Anbieter anhand des GPU-Taktes und den Anforderungen variiert werden. NVIDIA gibt zwischen 50 und 75 W an.
NVIDIA Tesla M40 und Tesla M4
Laut NVIDIA ist aber nicht nur die Hardware neu und entscheidend, sondern auch die Zusammenarbeit mit der dazugehörigen Software. Dazu stellt NVIDIA die GPU Rest Engine vor, die Echtzeit-beschleunigte Anwendungen für Entwickler besser zugänglich machen soll. Mit FFMPEG bieten beide Tesla-Karten auch eine per GPU beschleunigte Unterstützung für ein schnelles Video-Transcoding. Gleiches gilt für ein Computing von Bildern direkt auf der GPU.
NVIDIA Tesla M40 und Tesla M4
Einmal mehr betont NVIDIA also die Vorteile der GPUs gegenüber klassischen CPUs. Bei den Supercomputern zeigt sich dieser Trend bereits seit einigen Jahren und so verwenden in den Top 500 der Supercomputer über 90 % auch Beschleunigerkarten zur Berechnung der verschiedensten Daten. Gerne sieht NVIDIA hier natürlich die eigenen Produkte an der Spitze. In einem Vergleich wird eine Server-Anwendung zum Angebot von 5.000 Livestreams in unterschiedlichen Auflösungen herangezogen. Während ein rein auf CPUs basierendes Datacenter dabei rund 60 % der zur Verfügung stehenden Rechenleistung beanspruchen würde und dabei auch noch 10,8 MW verbraucht, kommt ein System mit Tesla-M40 und M4-Karten auf gerade einmal 1,2 MW. Die Auslastung ist mit 5 % der CPU-Leistung und 20 % der zur Verfügung stehenden GPU-Leistung ebenfalls weitaus geringer und bietet somit ein weitaus größeres Potenzial für zukünftige Anforderungen.
Die beiden Beschleunigerkarten Tesla M40 und Tesla M4 sollen in Kürze im Handel erhältlich sein. Preise hat NVIDIA nicht kommuniziert.