FCAT Teil 2: AFR und Input-Lag

Don · 22.05.2013

fdsonne · 22.05.2013

sontin schrieb:
Nein, ohne Frame-Metering ist der Abstand der Verarbeitung zwischen den beiden Karten minimal. Die Frametimes spielen keine Rolle, da Karte 2 ja das Ergebnis von Karte 1 immer sofort überschreibt. Und nur dadurch entstehen diese Lücken von 8 - 24 - 8 - 24ms bei Fraps.
Die Verarbeitung wäre aber immer nur 1,4,17,20,33,36ms...

Ja, das schon klar mit dem überschreiben.
Nur 8 - 24 - 8 - 24 - ... sind im Schnitt 16 ms.
Das heist knapp 60 FPS.
Irgendwoher müssen diese 8ms ja kommen...
Wäre der Umstand so minimal, wie auf der dritten Folie, müsste es eher 1 - 33 - 1 - 33 sein. Macht nämlich am Ende ebenso knapp 60 FPS.

Und die von dir angesprochenen 8 von 34 sind weit mehr wie der Abstand zwischen Frame 1 und n+1 der Folie

Das mein ich damit. Auch wenn die Folie nur eine Illustation sein soll schaut mir das nach etwas zu viel Worstcase aus...
8 ms Abstand als niedrigste Ausgabe ist bei mir bei nem Durchschnittswert von 16ms Ausgabezeit im Schnitt alles andere als "sofort überschreibt".
Bildlich wäre dies auf der Folie also ziemlich exakt mittig zwischen dem metered und dem unmetered Bild angeordnet. (mit den Werten von dir)

MusicIsMyLife schrieb:
3. Mich stört ein wenig das festgesetzte Limit auf 21 Zeilen, ab welchem ein Bild erst gezählt wird. Klar muss man irgendwo eine Grenze ziehen, allerdings hat das auch einen Nachteil. Man stelle sich den Vergleich zweier Grafiklösungen vor, die beide konstant 100 FPS liefern. Bei Lösung 1 wird jeder zweite Frame mit genau 20 Zeilen dargestellt (und deshalb als runt gewertet) und bei Lösung 2 wird jeder zweite Frame mit 21 Zeilen dargestellt (und deshalb komplett gewertet). Obwohl die Lösungen technisch gesehen nur um 5 Prozent differieren (20 vs. 21 Zeilen), liegen ihre observed FPS glatt 100 Prozent auseinander (50 vs. 100 FPS). Das dieser Unterschied in der Realität Niemandem auffallen dürfte, versteht sich von selbst (und wer das merkt, hat meinen tiefsten Respekt! -> das meine ich ernst! ).

Praktisch dürften es ja weit weniger RUNT Frames sein

Auch bei den PCP Messungen scheint das CF zwar da etwas höher zu liegen als das SLI, in Summe dürften aber eher die DROP Frames das Problems ein...
Ansonsten sehe ich das aber auch wie du, denn diese wenigen Zeiten nutzen einem wenig bis nichts...

Interessant wäre ggf. noch die Auswertung der RUNT Frames. So nach dem Motto, wie viele Zeilen sind so und so oft vertreten.
Würde mich mal interessieren wie dort die Verteilung ist.

Auch wäre dies interessant, was die DROP Frames angeht. Denn ein weggelassenes Frame ist genau so gut (oder schlecht) wie zwei aufeinander folgende Frames mit dem selben Inhalt. Da CF scheinbar teils sehr viele Frames dropt (PCP Messungen) müsste man das mal gegenhalten. Keine Ahnung ob man den Bildinhalt selbst mit FCAT auswerten kann auf Veränderungen.

dürfte aber wohl schwer werden.

MusicIsMyLife schrieb:
4. FCAT hin oder her - die gleichmäßige Bildausgabe mag man damit messen können. Den Bildinhalt kann man damit jedoch nicht automatisch analysieren, weshalb ein FCAT-Ergebnis auch etwas aussagen könnte, was in der Praxis nicht so ist. Denn ich vermute wie fdsonne, dass man nur fertig gerenderte Frames so verzögern kann, dass die Ausgabe möglichst homogen erfolgt. Das hat dann aber zur Folge, dass Bildinhalte ausgegeben werden, die zum Zeitpunkt der Berechnung noch ganz woanders hingehören und deshalb bei der Ausgabe quasi an der falschen Stelle zu sehen sind. Auf Seiten von FCAT würde man ein super Ergebnis erhalten (weil die Bilder mit gleichmäßigen Abständen ausgegeben werden), das Spielempfinden könnte aber nach wie vor hakelig ausfallen (zwar wahrscheinlich deutlich besser als ohne Eingriff, aber noch immer nicht perfekt).

Jupp richtig, wobei man das schon machen kann mit dem Verzögern...
Die Frage ist halt, ob es am Ende auch wirkt.
Denn man will ja mit FCAT auch das Problem aufzeigen, das nach der Frapsmessung unterschiedlich lange Zeit noch an Verarbeitung drauf kommt... Würde man hier "vorn" verzögern, wäre hintenraus diese Zeit immernoch stark schwankend. Was das Ergebnis eher zunichte macht.

Komisch ist auch, die Messungen, wo das SLI vergleichsweise schlecht abschneidet (also wo die Timings schwanken), da zeigen die Werte trotzdem ein ähnliches Bild zu AMD. Heist widerkehrendes Schwanken von große Zahl auf kleine Zahl und das recht gleichmäßig. Das widerspricht zumindest der Theorie, dass das Schwanken mitunter maßgeblich erst nach dem Teil kommt, den Frames messen kann...

sontin · 22.05.2013

fdsonne schrieb:
Ja, das schon klar mit dem überschreiben.
Nur 8 - 24 - 8 - 24 - ... sind im Schnitt 16 ms.
Das heist knapp 60 FPS.
Irgendwoher müssen diese 8ms ja kommen...
Wäre der Umstand so minimal, wie auf der dritten Folie, müsste es eher 1 - 33 - 1 - 33 sein. Macht nämlich am Ende ebenso knapp 60 FPS.

Das ist Fraps. Mit FCAT ist der Abstand sogar größer, da hier ja Pixellinien gemessen werden. Hier erreicht man also wirklich diese 1 - 33 - 1 - 33ms Abstände. Und 20pixel sind nichtmal 2% der Zeit. Also bei 33ms pro Bild weniger als 1ms.

Und die von dir angesprochenen 8 von 34 sind weit mehr wie der Abstand zwischen Frame 1 und n+1 der Folie Das mein ich damit. Auch wenn die Folie nur eine Illustation sein soll schaut mir das nach etwas zu viel Worstcase aus...
8 ms Abstand als niedrigste Ausgabe ist bei mir bei nem Durchschnittswert von 16ms Ausgabezeit im Schnitt alles andere als "sofort überschreibt".
Bildlich wäre dies auf der Folie also ziemlich exakt mittig zwischen dem metered und dem unmetered Bild angeordnet. (mit den Werten von dir)

8ms wäre Fraps. In Wirklichkeit ist man ohne Framemetering wesentlich tiefer. Damit hat man ohne Framemetering auch keinen besseren Input-Lag. Der läge hier also eigentlich auf dem selben Niveau als wenn man ohne AFR spielen würde.
Jetzt mal abgesehen, ob "besser" bei AFR überhaupt stimmt.

Schaffe89 · 22.05.2013

fdsonne schrieb:
Neja, in dem Fall, das das Metering die Zeit nicht angleichen muss, erhöht sich auch das Inputlag nicht...

In den Fall sollte das so sein ja, allerdings betrachtet man ja schon die ganze Zeit AMD´s fehlendes Metering mit Nvidias Metering und bei AMD sieht es halt immer kacke aus was die Flüssigkeit der Bildabfolge betrifft, insofern sollte es (außer Nvidia hat noch andere Mittel zur µrucklerbekämpfung) fast ausnahmlos zu einem höheren Input respektive Outputlag führend und da sehe ich persönlich das Problem wenn man die neuen Treiber beider Hersteller am Ende vergleichen will.

AMD könnte beispielsweise die Bildabfolge öfter stärker verzögern um bessere FCAT Ergebnisse zu erreichen, was aber den Outputlag stellenweise stärker ansteigen lassen würde als bei Nvidia.
Nur kann man dies nicht messen, das halte ich für das Problem.

Phantomias88 · 23.05.2013

MusicIsMyLife schrieb:
Jetzt mal ganz weg von meinen Befürchtungen. Ich habe noch eine Frage speziell zu der Herangehensweise von Hardwareluxx:

Die Capture-Daten werden ja in eine Ramdisk geschrieben. Diese ist zwar recht üppig dimensioniert, im Vergleich zu den anfallenden Daten jedoch schnell gefüllt. Kurze Benchmark-Sequenzen wären hier also an der Tagesordnung. Wie würde das in Bezug auf Boost-Szenarien geregelt, wie zum Beispiel bei Titan? HT4U hat je recht ausführlich gezeigt, dass es sich bei Boost 2.0 ohne irgendwelche Eingriffe in PT und TT quasi um ein Benchmark-Feature handelt, da bei längerer Belastung immer häufiger nur noch der Standardtakt anliegt.

Da ich davon ausgehe, dass sowohl NVIDIA als auch AMD weiter in Richtung Boost investieren werden (es möglicherweise irgendwann zum Standard jeder Grafikkarte gehört), könnten kurze Benchmark-Sequenzen solchen Boost-Szenarien prinzipiell in die Karten spielen.

Gibt es bereits Überlegungen, wie damit umgegangen werden soll ("vorheizen" oder nicht)?

Wow, das finde ich mal gut kombiniert, Watson! :bigok:

sontin schrieb:
Das ist Fraps. Mit FCAT ist der Abstand sogar größer, da hier ja Pixellinien gemessen werden. Hier erreicht man also wirklich diese 1 - 33 - 1 - 33ms Abstände. Und 20pixel sind nichtmal 2% der Zeit. Also bei 33ms pro Bild weniger als 1ms.

8ms wäre Fraps. In Wirklichkeit ist man ohne Framemetering wesentlich tiefer. Damit hat man ohne Framemetering auch keinen besseren Input-Lag. Der läge hier also eigentlich auf dem selben Niveau als wenn man ohne AFR spielen würde.
Jetzt mal abgesehen, ob "besser" bei AFR überhaupt stimmt.

Sollte sich ein Einzelbild nicht auch einfach zur 2 Karten Transferieren lassen mittels CF/SLI Brücke?
Also ich finde mein CfX schon besser als eine Karte in den meisten Spielen, sonst wäre sicher nur noch eine HD7970 drin.

Schaffe89 schrieb:
In den Fall sollte das so sein ja, allerdings betrachtet man ja schon die ganze Zeit AMD´s fehlendes Metering mit Nvidias Metering und bei AMD sieht es halt immer kacke aus was die Flüssigkeit der Bildabfolge betrifft, ...

Eigentlich gibt es ja 4 Himmelsrichtungen bei Egoshootern, also sollten soviele Bilder wie möglich vorbereitet werden, auch wenn diese im nachinein verworfen werden weil der user sich in eine andere Richtung bewegt.
Sieht halt sch... aus im Diagramm, aber vor dem Schirm ist ein wohltat im vergleich zur zähen Single GPU.

fdsonne · 24.05.2013

sontin schrieb:
Das ist Fraps. Mit FCAT ist der Abstand sogar größer, da hier ja Pixellinien gemessen werden. Hier erreicht man also wirklich diese 1 - 33 - 1 - 33ms Abstände. Und 20pixel sind nichtmal 2% der Zeit. Also bei 33ms pro Bild weniger als 1ms.

Die Messungen von Don beim CF ohne den Prototyp Treiber zeigen aber irgendwie was anderes...
http://www.hardwareluxx.de/images/s...t/analyse/crysis3-amd-prototyp-frametimes.png
Da sehe ich speziell im rechten drittel irgendwas mit 6 zu 26.

Oder ist das via Fraps gemessen?

Phantomias88 schrieb:
Wow, das finde ich mal gut kombiniert, Watson!

In dem Zusammen hat aber der Boost so gar keine Bewandnis. Klar, die Karte wird ein Stückweit schneller in der kurzen Szene... Aber das ändert ja am Verhalten der Frames nix.
Mir wäre nicht bekannt, das sich die Frametimes Taktabhängig verhalten. Das gleiche gilt fürs Inputlag.
Was beeinflusst wird, ist die Geschwindigkeit. Also mehr Boost = kürzere Frametimes. Tendentiel wird dadurch bestenfalls die Vergleichbarkeit etwas schwer, weil die Abstände kleiner. Am Verhalten ändert sich aber nix.

Suche

FCAT Teil 2: AFR und Input-Lag

Don

[printed]-Redakteur, Tweety

fdsonne

Legende

sontin

Enthusiast

Schaffe89

Banned

Phantomias88

Banned

fdsonne

Legende