Für die Berechnung wo was wie hingehört ist die CPU zuständig. Draw Calls.
Das ist aber eine absolut eindimensionale Betrachtung der Aufgabe einer CPU. Die macht eben nicht nur Draw Calls, sondern wird häufig durch Rauch- und Explosionseffekte etc. stark belastet. Vor allem auf Ports von Konsolen sind mehr Prozesse auf CPU- Kernen, da es keinen Sinn machen würde, die 8 Kerne teilweise brach liegen zu lassen, und so Leistung zu verschwenden. Netterweise hat die Unreal Engine hier einen Workaround, die Berechnung der Partikel auf die GPU auszulagern... Der Text zeigt jedoch, dass diese Berechnung höchst parallelisierbar ist, und deshalb die Auslastung von schwach belasteten Kernen erhöhen könnte, wenn sie eben nicht ausgelagert wird, sodass es beim Quadcore zu Rucklern kommt, weil kaum Reserven auf freien Kernen sind -> vgl. die Frametimes(FPS@0.1%)des 7700K vs. 1800X, die schon Hinweise in die Richtung geben, auch wenn es in den einzelnen Fällen alle möglichen anderen Rechnungen sein könnten, die dafür ursächlich waren, und nicht unbedingt Raucheffekte oder Explosionen gewesen sein müssen. Schwer vorstellbar, dass die CPU Partikel noch berechnet, die mangels Auflösung gar nicht sichtbar sind...
1.1 - CPU and GPU Sprite Particles Comparison | Unreal Engine
Daher versucht man GPU Limits zu umgehen in der Hoffnung das die FPS eine Spielabhängigen Richtwert für die Leistungsfähigkeit der CPU darstellt und nicht ein realistischen Szenario.
Die Hoffnung stirbt zuletzt
- Doch leider kann eben diese Darstellung schon alleine deshalb keinen sinnvollen Richtwert darstellen, weil die Aufgaben der CPU leider nicht ganz so leicht zu umfassen sind, wie man es sich vielleicht wünscht. Im Fußball leistet eine Mannschaft auch nur Weltklasse- Performance, wenn der Verteidiger zum richtigen Zeitpunkt die Lücke im Mittelfeld sieht, und sich "zweckentfremdet" dort einsetzt, möglicherweise auch mal auf das Tor schießt.
In der Spieleprogrammierung ist ungenutzte Leistung sehr schädlich für die Bildqualität/Physik etc. und in letzter Konsequenz ist der Ansatz, sämtliche Rechen- und Speicherkapazitäten zur Leistungssteigerung einzubinden, auch derjenige, der mit der
Heterogeneous System Architecture(HSA) verfolgt wird. Nur in dem Fall vor allem in die andere Richtung, nämlich in Programmen vor allem CPU und GPU in Kooperation zu nutzen, also mehr von der CPU auf die GPU zu verlagern. Aber das Grundprinzip ist genau das gleiche.
Wenn man stattdessen mit 4 Titan X etwa 200-250% der Leistung von einer Karte bekommt, könnte man vielleicht für die nächste Generation in 7nm schon präzisere - und vor allem realistischere - Voraussagen treffen, ob die CPU für künftige Ansprüche besser geeignet ist, als der 7700K.