eine noch höhere parallelisierung ist halt nur noch in sonderfällen möglich.... allerdings ist in den bereichen häufig die gpu die bessere wahl was den absatzmarkt für solche systeme weiter einschränkt.
ich vermute mal, dass amd das absatzpotential solcher systeme im vorfeld schon geprüft hat und zu dem schluss gekommen sein wird dass bei singel-rag-systemen mehr als 128 threads auf cpu nicht ausreichend gefragt sind. ist ja nicht so, dass man bei bedarf nicht einfach mehrere rags zusammenschalten könnte... die resourcen für so viele kerne müssen die boards schließlich auch noch hergeben und irgendwann wirds halt effizienter diese auf mehrere teil-systeme aufzusplitten...
Das mit der GPU ist doch Käse - die GPU kann bei weitem nicht für jegliche Rendertasks genutzt werden. Leider merkt man halt mal wieder, dass ihr das selbst nie gemacht habt - der GPU fehlt es schlicht an VRAM um da richtig gut abzuschneiden, komplexe Szenen gehen gern mal über 50GB+ an Speicherbedarf, selbst wenn du da schweine teure Tesla GV100 GPUs mit 32GB HBMv2 nutzen würdest - die wirklich schnell sind!, die Teile sehen kein Land bei Speichermangel.
Der Cinebench ist von 2013! Das Threadlimit von 256 kommt viel eher davon, dass es zur damaligen Zeit als höchstes der Gefühle ein 4P Westmere EX System mit 80 Threads gab. Bisschen später dann Ivy-EX mit 120 Threads, aber auch das ist weit unter Limit.
Auch die Aussage zu den Boards halte ich für falsch - was soll das Board da bereit stellen? Der Spaß ist quasi vollständig in der CPU. Die Daten liegen im RAM - der an der CPU direkt klemmt - die Anbindung zwischen den DIEs läuft nicht übers Board (außer bei 2P+ Systemen), die Anbindung der CPU zum Restsystem ist mit popligem PCIe 3.0 4x lange nicht das Problem.
Renderfarmen im Clusterbetrieb gibt es - aber auch dort hast du ein massives Skalierungsproblem, wenn das Backend nicht passt - du musst die Rohdaten eben extrem schnell bereit stellen, damit das funktioniert, das heist, niedrig-latente und hoch-bandbreitige Netzwerkinfrastruktur oder sehr schnelle lokale Datenvorhaltung.
What? Muss mir das Video mal ansehen, aber hat er dafür auch eine weiterreichende Erklärung/Rechnung? Okay im Vergleich zu nem Ryzen R7 2700X wäre es eine (fast) Vervierfachung der benötigten Bandbreite, dafür hat er aber auch Quad-Channel Anbindung (ist immernoch die Frage wie die genau realisiert ist). Aber trotzdem, beim Encoding kommen doch bei weitem nicht die Datenmengen zusammen, dass da der Speicher limitieren würde ??
Da gibts keine Erklärung dazu - und ich meine auch, das Roman das auch so im Video gar nicht gesagt hat. Weis nicht, habe nicht das verlinkte Englische Video gesehen sondern das deutsche von seinem YT Kanal - aber da viel eher die Aussage, dass die Skalierung da obenraus mit dem Takt nicht mehr so gut ist - mit der Vermutung, dass der Speicher einfach nicht schnell genug ist. Das kann auch alles sein, hat aber mit der Aussage von oben aber nichts zu tun, denn da gibts um die Skalierung von 1P auf 2P.
Epyc nutzt übrigens ein Oktachannel SI - ein Dual Epyc sogar ein Dual-Oktachannel SI. Es ist exakt 4x Ryzen pro CPU. Mit zwei dieser Teile dann eben 8x Ryzen. Die Skalierung ist hier so schlecht, weil der Run nicht mal ne Hand voll Sekunden braucht. Um so kürzer der Run, desto beschissener die Skalierung. Real hat so ein Dual Epyc annähernd 100% mehr Performance, wenn die NUMA Nodes nicht um Problem werden - also du massiv auf unabhängige Threads bauen kannst (was der CB-R15 tut - deswegen skalieren auch Dual/Multi CPU Systeme sehr gut, deswegen verliert Threadripper sogut wie keine Punkte durch das NUMA Konstrukt und auch Epyc mit seinen 4-8x NUMA Nodes skaliert annähernd perfekt)
Kurzum, der Bench ist ein Bestcase Szenario - real im Rendern erreichst du sowas - in vielen vielen anderen Bereichen kommst du da lange nicht hin... (interessiert aber die Fans nicht - die wedeln sich einen von den CB-Punkten, wie ich vor geraumer Zeit schon vorhersagte)
Wirklich interessant wird es wohl in etwa einem halben Jahr mit EPYC Rome - sollten 64 Kerne kommen und sich diese wie erwartet auf um die 5 GHz+ takten lassen, prophezeie ich für ein Singlesocket System bereits um die 15000 Punkte - DAS wird ein richtiger Schlag für Intel
Das interessiert den extreme OCer - und ein paar begeisterte Nerds, mehr aber auch nicht. Real hat der Dual Epyc nen Takt von 2,2GHz Base udn ~2,7GHz Allcore im großen Modell. Das ist schlapp mal die 3/4tel bis die Hälfte von dem, was Roman da drauf drückte... Du kommst real mit einem OCed Threadripper 32C wahrscheinlich recht nahe an die Werte ran, was der Dual Eypc stock macht... Nur wie auch der Vergleich von Roman im Video zum 4P Intel - der Dual Eypc Stock macht das wieder und immer wieder, inkl. Garantie, inkl. Support und allem drum und dran - so ein über OC Threadripper oder Epyc 1P mit Kompressor/Chiller oder LN2 Kühlung macht das eben nur ne Hand voll mal - und dann krankt es irgendwo.
Allein die Tatsache, dass hier im Video 2x500W versoffen werden, die Wandler ner Hand voll Sekunden richtung 100°C gehen mit ner steil ansteigenden Temp-Kurve -> was erwartest du da bitte von 64C/128T?? Das Ding wird irgendwo ca. 50%+-x effizienter sein können, aber mehr als doppelten Takt, doppelte Coreanzahl UND dann noch die Prozessverkleinerung, also Flächenersparnis, die auch AMD da nutzen wird irgendwo um die DIE Sizes nicht ausarten zu lassen?? MMn hast du völlig falsche Vorstellungen was da ansatzweise realistisch ist...
zum vergleich mit dem quad-sockel intel: wo ist bitte das problem? wäre der vergleich nicht gemacht worden würden sich sicher viele fragen wie sich dual-tr zu quad-xeon verhält. mehr info ist doch nix schlechtes. ist ja zumindest seitens der tester hier nicht als schw*nzvergleich gedacht sondern als objektiver vergleich des machbaren. und dazu brauchts auch referenzwerte an denen man etwas messen und vergleichen kann.
Das "Problem" ist, dass ein 4P System nicht für Cinebench R15 Runs gemacht/gebaut ist. Das ganze P/L Gelaber vom ach so viel besseren Verhältnis ist halt unter der Maßgabe, dass das Stock Serversystem den Spaß mit Garantie und Support macht und die OC-Bastelfrucke, getaucht in irgend so ne hunderte bis tausende Euro teure Brühe - damit die Wandler nicht wegbrennen - das nur ein paar Sekunden durchzuhalten, einfach Äpfel mit Birnen. Der Witz ist, das ist ja nichtmal nur pro Intel - sondern klar auch pro AMD. Der (Dual) Eypc macht das Stock auch immer und immer wieder, wie ein 2-8P Intel. Diese OC Frucken hingegen?? Nice to know... Real aber völlig unpraktikabel.