ich frag mich einfach, wann und wieso denn AMD genau bei den grakas diesen rückstand eingefahren hat.
so wies aktuell aussieht, können Sie 2016 nur im midrange mithalten und 2017 gerade mal die pascal-karten ein- bzw. knapp überholen.
Das dürfte viel eher an einer Entscheidung bei AMD gelegen haben und ggf. an einer Fehleinschätzung bzgl. GP102 und GP104 bei NV (seitens AMD)
-> nimmt man es genau, so viel unterschiedlich ist der Ansatz beider Hersteller nun nicht. GP104 hat ein paar mehr ALUs, die Rohleistung ist also etwas höher. Das, was den Unterschied heute ausmacht ist der Takt. Wenn da 1,8-2GHz für GP104 stehen und AMD mit Karten bei ~1,2-1,3GHz rumkrebst, ist da ne gewaltige Lücke.
Man könnte fast meinen, es war zu erwarten, dass NV analog dem GK104 damals mit dem GP104 ähnlich agiert. Kleine GPU, hoher Takt... Einzig der GP102 kam erstaunlich früh, dafür ist der Abstand zur 1080er aber auch erstaunlich klein (default vs. default)
Wo liegt eig. das Problem Vega 10 einfach doppelt so groß wie eine 470X aufzubauen? Die scheint ja sehr gut zu skalieren, insbesondere auch in Hinsicht der Bandbreite, wo 2x HBM2 Stacks ja ebenfalls genau doppelt so schnell sind.
Theoretisch gibt es da eigentlich keins... Die Frage ist, ob AMD ein 8x FrontEnd baut oder nicht? Bis dato gab es das nicht... Bspw. hat man von Tonga auf Fiji (beides die selbe GCN Generation) das FrontEnd nicht verbreitert, die ALU Anzahl aber verdoppelt. Warum und wieso? Keine Ahnung, vielleicht technische Gründe, vielleicht wäre der Aufwand so ein FrontEnd zu betreiben zu hoch? Man weis es nicht genau...
Dabei wäre es echt so einfach, die neuen Slots einfach zumindest in der Übergangszeit hinten einfach offen lassen, dann funktionieren auch längere alte Karten.
Eine x12 Karte würde auch in jeden x16 Slot passen.
Für was soll das gut sein?
Das macht den Spaß doch trotzdem nicht flexibel... Flexibilität erreicht man bspw. durch PLX Brückenchips. Ich kann auf meinem (schweine teuren) WS Asus Brett effektiv stecken was ich will und habe volle Performance. Nur nicht gleichzeitig. Aber das betreibt idR ja auch Niemand gleichzeitig.
Begrenzte Lanes nun umzuverteilen halte ich für unsinn. Lieber die Flexibilität erhöhen. Ähnlich den PLX Chips, von mir aus auch mit dynamischer Lanezuordnung direkt von CPU zu den Slots. Oder eben durch sharing vorhandener Lanes... Im Endeffekt hat da Jeder was von.
Die 32 Lanes, die zwei GPUs heute wegfressen, verpuffen, wenn gerade keine Last anliegt. Mit 2x12 hingegen wird das nicht viel besser... Bei flexibler Verteilung können die GPUs aber mit je 16x, ein Raidcontroller oder SAS PCIe Device außerhalb der GPU Last aber auch mit vollem Speed usw.