NVIDIA Unveils Pascal GPU: 16GB of memory, 1TB/s Bandwidth | VR World
ich würde das bei einer dual-GPU karte nicht ausschließen, das verhältnis von FP32 zu FP64 soll bei Pascal ja auch nicht mehr so groß sein, die karte kann man dann auch als Quadro umgelabelt noch teurer verkaufen.
NV braucht zeitnah wohl eine neue HighEnd GPU für den HPC Bereich... Intel zieht nach und AMD ist mit Hawaii schon effizienter unterwegs. Der GK210 stinkt dagegen schon ziemlich ab. GM200 ist nicht DP tauglich...
Also wird es wohl so laufen, dass der große Pascal wieder als HighEnd Chip für den Profimarkt kommt, dort als Tesla/Quadro für schweine teuer Geld zu erstehen geht und mit größter Warscheinlichkeit auch NVLink beherscht.
Das heist, sollte sich NV dazu entschließen, diesen GP100 oder wie man ihn nennen wird, als GTX irgendwas oder Titan irgendwas im "Mainstream HighEnd" zu bringen, dann KANN der Chip definitiv NVLink. Bestenfalls wird man die DP Performance für die nicht Titan Version wieder einkürzen wie üblich. Die Titan Version kann es dann wieder in vollem Speed mit vollem RAM.
Was halt völlig unklar ist, ob NV eine Dual GPU Karte auf Basis des großen Pascal bringen kann und wird? Warscheinlicher, weil viel einfacher zu bauen ist wohl eher, dass man zu Anfang erstmal nen Dual GP104 baut. Dank der wohl deutlich besseren Fertigung zu heute mit den 28nm und der sicher deutlich gesteigerten Energieeffizienz wäre sicher ein GP104 dazu in der Lage, einen vollen GM200 in die zweite Reihe zu verweisen. Im Doppelpack gibt so ein Konstrukt also auch entsprechend viel Power. Ob der GP104 auch NVLink bekommen wird, ist aber fraglich... Das ist eher Profimarkt und in den Bereichen gehts idR um DP Power anstatt um SP Power. GP104 wird wohl keine DP Power haben, analog allen anderen Performanceklasse GPUs davor.
Was macht dich da so sicher, ELKINATOR? Ich bin mir sicher dass, wenn denn überhaupt eine dual GPU kommt, diese ebenfalls nur einen PLX Switch nutzen wird. NVLink ist einfach sehr teuer und du musst ja eine Gewinnschwelle erreichen was auf die Art wohl nix wird (siehe dual GK110).
Der PLX Chip (oder eine Alternative dazu) wird so oder so notwendig sein, oder wie soll man sonst zwei GPUs über PCIe in einem PCIe Slot betreiben?
Mit NVLink hat das alles überhaupt nix zu tun. Die alles entscheidende Frage ist, baut NV im Profi/HPC Markt eine eigene GPU ausschließlich für diesen Markt oder nicht? Bis dato hat NV dies nicht getätigt... Es gibt/gab nur den GK210 als quasi GK110 "Refresh" dediziert im Profimarkt. Das war aber keineswegs was neues, sondern bestenfalls eine leichte Überarbeitung.
Ebenso verbaute/nutzte man idR die dicken Profimarkt GPUs für HighEnd Gamerkarten... Es spricht nicht viel dafür, warum man das mit Pascal anders machen sollte. Was im Umkehrschluss bedeutet, die große Pascal GPU wird ziemlich sicher NVLink beherschen. Zusätzlich wird das Teil ziemlich sicher ein PCIe Interface haben. Ob man allerdings beides nutzen kann (Dual GPU Karte), wird sich rausstellen müssen.
Aber ich glaube ihr habt auch ne falsche Vorstellung, was NVLink da überhaupt bringen kann??
Wozu sollte man das brauchen? Das wird bestenfalls mit DX12 interessant und auch dann nur, wenn sich SFR flächendeckend durchsetzen wird. Mit DX11 wird man weiterhin auf AFR gehen. Ob da nun deutlich mehr Bandbreite zwischen den GPUs ist oder nicht? Ist doch völlig hupe. AFR nutzt weiterhin den Speicher beider GPUs für den gespiegelten Dateninhalt usw.
Zumal ich auch die Euphorie dahingehend wenig nachvollziehen kann. Was will man denn (überspitzt gesagt) mit 80GB/sec auf dem Papier zwischen den GPUs, wenn die Speicherzugriffe auf den lokalen HBM Speicher mit 1000GB/sec geht und dazu sicher eine viel geringere Latenz aufweist?
Mit 80GB/sec wäre man zwar näher im Verhältnis zur heutigen VRAM/PCIe Bandbreite dran, aber auch nur um den Faktor 2x. Heute gibts um die 350GB/sec VRAM Bandbreite bei 16GB/sec PCIe Durchsatz (+1GB/sec SLI Brücke). Und morgen dann 1000GB/sec VRAM Bandbreite bei 80GB/sec NVLink Durchsatz. Das eine ist 1/21tel, das andere nunmehr 1/12tel. Beide Fälle im Vergleich aber viel zu langsam für dauerhaft dedizierte VRAM Zugriffe GPU übergreifend!
Wer übrigens glaubt, dass man HBM2 in Performance-Segmenten findet sollte mal den Wecker stellen und aufwachen. Und 4 GB auf einem Produkt vom Schlage der GTX 980 wird man auch nicht mehr bringen (können).
Da wäre ich mir gar nicht mal so sicher. Denn mit HBM "Generation 2" ist es doch möglich, mit den größen schön zu skalieren. Technisch wäre doch sogar ein 1 oder 2 Stack HBM Ausbau möglich. Sprich halbe Bandbreite und halbe Größe. Selbst eine 1 Stack Version mit doppelter Größe zu den 4GB wäre doch technisch drin. (wenn man bis 32GB mit vier Stacks gehen will/kann)
Das ist dann unterm Strich mit ziemlicher Warscheinlichkeit auch deutlich günstiger als die vollen vier Stacks zu verbauen in entsprechender Größe. Denn der reine Speicher und das "SI" an der GPU dürften so viel nicht kosten. Teuer ist doch eher der Interposer und das ganze noch zu verheiraten...
Wie wir aber NV kennen, werden die keineswegs zu viel machen, wenn man es nicht unbedingt muss. Selbst mit halber Bandbreite von HBM hätte man mehr als genug Bumms zwischen VRAM und GPU für ne neue Mittel/Performanceklasse. Ein viertel davon wäre da schon viel eher warscheinlich/realistisch.
Ob ein GP104 mit nem 256Bit GDDR5(X) Interface auskommt, muss sich rausstellen. Die Fertigung lässt ziemlich sicher ALU Anzahlen von 3072 oder mehr zu, ohne dass die Chipfläche explodiert. Auch in der Energieeffizienz dürfte sich das Teil eher bei GM204 einfinden.