[Sammelthread] NVidia PhysX Performance/Bildqualitäts-Thread CPU/GPU

NVidia PhysX Performance/Bildqualitäts-Thread CPU/GPU


nvidia_physxpa5j.png


Hallo Leute,
da in den letzten Tagen vermehrt über Performancemessungen und Bildqualitätsvergleiche in PhysX Anwendungen diskutiert wurde, möchte ich an dieser Stelle eine Plattform schaffen, welche allen einen möglichen Überblick über die derzeitige PhysX Umsetzung seitens NVidia gibt.

Der Thread wird von Zeit zu Zeit mit neuen Ergebnissen gefüllt.


1. Fluidmark

Als erstes möchte ich anhand des Benchmarks Fluidmark Version 1.2.0 (Downloadlink) aufzeigen, was man von aktuellen CPUs/GPUs erwarten kann.
Natürlich könnt ihr hier auch mit euren mit Sicherheit teilweise besseren Systemen Werte posten, welche ich dann auch gerne im Startpost übernehmen werde.

Fluidmark ist ein Tool, welches mithilfe des PhysX SDKs erstellt wurde. Es nutzt in der aktuellen Version 1.2.0 volle Multicore/Multi CPU Funktionalitäten. Es ist in der Lage, die Berechnungen auf aktuellen (seit dem G80) NVidia GPUs auszulagern.
Dies lässt einen sehr schönen Vergleich zwischen CPU und GPU Leistung zu.

fuildmark_demo2bt7.jpg

Fluidmark Version 1.2.0 Beispielbild​

In Fluidmark wird die Auslastung mehrerer CPU Kerne dadurch erreicht, indem man mehrere Quellen (sogenante Ermitters) für die Partikel im Bild verwendet. Soll die Berechnung in einem Thread ablaufen, so verwendet man eine Quelle. Soll sie in zweien ablaufen, so eben zwei usw.
Aktuell kann man bis zu 31 Quellen im Bild platzieren und hat somit Support für maximal 31 Threads. Selbst für aktuelle Dual Hexacore Systeme (Intel Nehalem EP) oder aktuelle AMD Dual 12 Kern Systeme steht also nix im Wege...


Ich habe auf meiner Workstation also ein paar Test laufen lassen...
Zunächst einmal die Hardware/Software:
CPUs: 2x Intel (Woodcrest) Xeon 5160 @ 3,33GHz
RAM: 10240MB DDR2-667 FBDimm
GFX: PoV NVidia Geforce 465GTX @ 470GTX @ 750/1500/1600MHz
OS: Windows Vista Business SP2 x64
Treiber: Forceware 258.96 + PhysX 9.10.0513

1.1 Fluidmark Einstellungen:

Also ich habe mal verschiedene Konstellationen durchgetestet. Alle Tests liefen mit folgenden Settings:

fuildmark_settings2heq.jpg

Fluidmark Einstellungen (nicht über den Screen wundern, der ist mit einem anderen PC geschossen)

- 1680x1050, 0xMSAA
- Fullsreen
- enable Multi-core PhysX
- disable Async mode
- benchmarking
- Time-based = 60000ms
- use particle count = 10000-120000
- # of ermitters = 1-31
- enable Force PhysX CPU (or disable for use GPU)


1.2 Messwerte und Erklärung:

fluidmark_1.2.0_physx_xfog.jpg

Messwerte - Spalten=Partikel, Zeilen=Berechnungsart​


Man erkennt sehr schön die 1A Skallierung bei steigender Anzahl der CPU Kerne. Mein System hat zwei physische CPUs mit jeweils zwei CPU Kernen. Normal müsste die Skallierung größer 4 Ermitters stark wegbrechen. Trotzdem skalliert das ganze mit steigender Anzahl der Ermitters weiter. Zwischen 4 und 31 liegen grob 40% Performancezuwachs. Die CPU Auslastung lag bei den CPU Tests idR bei 99-100% (außer eben bei den Tests mit weniger als 4 Ermitters)
Die Messwerte für einen CPU Ermitter sinken ab einem bestimmten Punkt nicht mehr. Das liegt daran, das eben ein Ermitter nicht ausreicht um die ganzen Partikel ins Bild zu bringen. So sind die Ergebnisse immer gleichbleibend. Aus Vergleichsgründen habe ich bei diesen Werten eine "0" vergeben, um die Vergleichbarkeit zu wahren, denn im Bench musste die CPU bei einem Ermitter ab 70000 Partikeln nur noch ~65000 berechnen...

Die GPU Werte sind ebenso unten angehängt.
Man erkennt sehr schön, das die GPU weniger stark einbricht, als es die CPU tut. Dennoch sinken die FPS Raten größer 110000 Partikeln unter die 25er Marke.
Mit dem letzten Punkte hatte ich versucht eine 460GTX zu simulieren. Da eine 470GTX in Schnitt ohne AA/AF in etwa 25% schneller rendert als eine 460GTX, habe ich die Taktraten für GPU und Shader im selben Verhältniss (ca. 25%) abgesenkt. Zu meinem Erstaunen musste ich feststellen, das aber die Messwerte weit weniger gesunken sind. Es scheint also so, das PhysX bzw. speziell Fluidmark deutlich mehr auf mehr Ausführungseinheiten reagiert als auf Takt derselben... Aus diesem Grund habe ich die Messwerte mit den Standard 470GTX Taktraten gleich weggelassen und nur OC vs. simulierte 460GTX getestet. Die echte 470GTX liegt so ziemlich genau zwischen den Messwerten, was ich Stichprobenartig ausgetestet hab.

Zum Schluss noch das ganze in einem Diagramm zusammengefasst:

fluidmark_1.2.0_physx_ug49.jpg

Diagramm​

1.3 Fazit Fluidmark:

Wie man anhand der Messwerte sehen kann skallieren selbst betagtere PC Systeme (mein Testsystem ist von Jan. 2007) sehr gut mit PhysX. Im Vergleich zum CPU Test gewinnt die aktuelle HighEnd GPU ca. um das 2,5 fache. Leider sind diese Werte bei weitem nicht beeindruckend in meinen Augen. Denn wenn man bedenkt, aktuelle HighEnd NVidia GPUs können bis über 1000GFlop/s liefern. CPUs schaffen da nur einen Bruchteil im Bereich 50GFlop/s. Es bleibt unterm Strich also eine extrem ineffiziente Umsetzung seitens NVidia für die GPU.
Aber, man muss ebenso erwähnen, die Werte stützen sich einzig und allein auf einen Benchmark. Im Moment fehlt es aber an weiteren Aussagekräftigen und vor allem Vergleichbaren Benchmarks um mehr Messwerte zu erziehlen.



2. BQ Vergleich Mafia II Benchmark:

Zuguter letzt in diesem Thread möchte ich noch ein kleines Vergleichsvideo vorstellen. Ich habe Mafia II einmal im CPU Modus und einmal im GPU Modus gebencht. Die Leistung soll hier in erster Linie erstmal im Hintergrund stehen. Sondern es geht einzig und allein um die Vergleichbarkeit dieser beiden Messungen.
Man erkennt sehr schön, das beide Messungen etwas unterschiedlich sind... Aber bildet euch selbst eine Meinung ;)

YouTube - Mafia_II_PhysX_Vergleich_CPU/GPU

Am besten ihr schauts in 720p an, sonst leidet die Qualität leider ein wenig ;)



letztens - Allgemeiner Hinweis

Dies ist ein Sammelthread für NVidias PhysX und dessen Umsetzung, das heißt, es darf und soll hier über die Software und auch über die Umsetzung diskutiert werden.

Was allerdings nicht hier rein gehört:
- Offtopic Beiträge (beispielsweise eine Technikdiskussion über die Architektur des RV770 a la HD 48x0), Gespamme oder "Privatkriege -> NV vs. ATi".
- Sinn und Unsinnigkeitsmeldungen über PhysX

Es ist nur im Interesse des Forums, dass es hier gesittet abläuft.

Bei Postings, die zu sehr OT sind oder etwa nur reine Provokation, am Besten gar nicht darauf eingehen, sondern durch Benutzen des "Beitrag melden-Buttons" (
report.gif
) die Moderatoren/-innen die Angelenheit regeln lassen.

Sollte es zu mehrmaligem Verstoß gegen die Regeln kommen, so können auffällige User eine Auszeit von diesem Thread erhalten.


In diesem Sinne...
fdsonne :wink:
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
@FS03
hast du eine oder zwei CPUs verbaut?
Und dreh mal auf 31 Ermitters beim CPU Bench... das gibt nochmal nen Leistungsschub...
Aber schon krass, wie das ganze auf der CPU performt ;)
 
Ja, bin auch sehr überrascht. Hab nur eine CPU auf nem Gigabyte X58A-UD3R verbaut. Wie das erst mim SR2 abgehen muss. ich werd mal nen kolleg anhauen, der hat so ein Setup :)
 
@FS03
hast du eine oder zwei CPUs verbaut?
Und dreh mal auf 31 Ermitters beim CPU Bench... das gibt nochmal nen Leistungsschub...
Aber schon krass, wie das ganze auf der CPU performt ;)
bin ich mal gespannt wie das bei der sandybridge wird, laut semiconductors haben die CPUs einen block für solche anwendungen drauf.
 
bin ich mal gespannt wie das bei der sandybridge wird, laut semiconductors haben die CPUs einen block für solche anwendungen drauf.

Was heist für solche Anwendungen... Wenn du Software das nicht unterstützt, wird das wohl nix werden. Und ich glaube kaum, das Intel hier NVs Sachen beschleunigen wird. Wo doch sowieso klar ist, das NV vorrangig hier ihre Hardware pushen will.
Aber wäre schon interessant, wenn Intel hier was Hardwarebeschleunigen könnte, vllt sogar richtig stark, dann sehen die GPUs ziemlich alt aus.
Vllt bequemt sich NV dann auchmal und optimiert wenigstens für ihre GPUs mal richtig...
 
Semiaccurate sind aber auch böse spammer. Bei denen glaub ich erstmal nichts :)
 
Abwarten... Bisschen Wahrheit steckt idR immer drin ;)
 
damit bist du nur knapp hinter der 280GTX von HisN... Und das mit "nur" 6 Kernen und schlappen 2,27GHz... Woher kommen eigentlich die 3400MHz auf deinem Screen bei der CPU?
Hast du ein SR2? Oder betreibst du das Teil auf nem Desktop Board?

Aber selbst wenn es 3400MHz wären, wäre das schon ziemlich beeindruckend. Und zeigt immernoch, wie ineffizient NVs Umsetzung aktuell ist...
 
Auflösung spielt keine Rolle. Ich hab bei mir mal in 640x480 und in 1680x1050 getestet, Unterschied Null Komma gar nix beim Ergebniss.
Einzig die MSAA Einstellung könnte das Ergebniss drücken, leider greift diese aktuell in der Version 1.2.0 nicht...
 
Die 3400 kommen vom 17er Multi mit ner 200er BCKLR. Aber eigentlich bleibt läuft der mim Turbo Multi von 19, also 3800 mhz. Alle Tools zeigen das falsch an. Laufen tut die CPU auf nem Gigabyte X58A-UD3R.

Das mit der Auflösung kann ich bestätigen, zeigt keine Veränderung an der Score.
 
@massaker
Ich hab in einem Game noch nie mehr als 60% gesehen (Mafia2), aber Fluidmark schafft ganze 80%

Während des eingebauten Benches in Mafia2 hat Afterburner 53% als höchste PhysX-GPU-Auslastung bei mir registriert, VRAM der PhysX-Graka wird konstant mit 254MB belastet.
Beim Fluidmark:
47% /300MB @HeavyPhysX (120.000 Particles)
45% /310MB @Deine Einstellungen (60.000@7E)

Also im Moment reicht wohl eine halb so schwache Graka wie 460er und mit 512MB für aktuelle PhysX-Herausforderungen dicke aus, hab mich echt extrem überschätzt...:fresse:

P.S.: zur Info: im IDLE-Zustand taktet sich die PhysX-Graka auf 51Mhz@0% runter und VRAM wird komischerweise immer noch mit ca 150MB belastet. (ach ja, da hängt noch 'ne Glotze am HDMI-Ausgang der PhysX-Graka, weiss nicht ob das eine Rolle spielt)
 
Ich habe gehört, das wenn man eine GTX 480 verbaut hat ,
man trozdem noch die Performans bei manschen games Steigern kann, wenn man eine Zusätzliche Physx Karte verbaut ( GTX 460 )
Stimmt das ? oder bringt das nichts ?
 
KurzschlussElektroniker

Die Antwort ist eindeutig JA, mit Betonung auf "bei manschen games" :) Hoffe auch dass mehr Spiele dieser Sorte rauskommen, bin schon mal gespannt was meine gtx460 in 2worlds2 bringen wird...
 
Das würd mich auch interessieren. Hab hier noch eine 8600 rum liegen, langt die für physx bei 1920x1200er Auflösung ?
 
Das würd mich auch interessieren. Hab hier noch eine 8600 rum liegen, langt die für physx bei 1920x1200er Auflösung ?

Ich wiederhole den Post vor Dir: "bei manchen Games". Wirst bestimmt gelesen haben.
Es hängt von Deiner Software ab und PhysX hat wenig mit der Auflösung zu tun.

Langen 100PS
Langen 10cm
Langen 100Euro
 
Nu, die Karte ist bestellt ;=) für 160 Euro kann man ja mal experimentieren.
Bekommt man ja bestimmt auch wieder zu einem gutem Preiß los, wenns eimem nicht
so zusagt.
Einige Fragen habe ich dan noch.

1) muss ich 2 Triber Installieren ?
2) Ist das dann so, das ich dann einfach die GTX 460 als PhysXkarte auswehlen kann ?
( so wie wenn ich von CPU zu GPU alls PhysXberechner wechseln kann )
 
Zuletzt bearbeitet:
1) macht das System für Dich wenn der Treiber schon im Windows ist
2) Lass Dich überraschen beim Blick ins Control Panel

 
Zuletzt bearbeitet:
Jawohl. Ich würde dann trotzdem das Dir von HisN gezeigte Menü anklicken um auf sicher zu gehen, dass 460er für Physx ausgewählt ist. In dem "Klappmenü" habe ich dann 3 Auswahlmöglichkeiten: GTX 480 - GTX 460 - CPU. Kannst dann dort rumexperimentieren und über deine Erfahrungen Berichten.

HisN
übrigens GENAU SO ein Menü fehlt mir aber um für CUDA-Berechnungen 'ne Graka besimmen zu können :( Kann aber dazu leider nichts finden :( Benutze nämlich CoreAVC-Codec (Glotze hängt am HDMI-Ausgang der 460er) und es ist mir halt nicht egal ob während des ganzen Filmes die 480er im 3D-Takt arbeitet wenn 460er schon so wie so bechäftigt werden muss... Hoffe ich kann das eines Tages richtig konfigurieren....
 


ist in die 3D-Einstellungen gewandert seit dem 200er
Ist bei mir genau das gleiche, CoreAVC auf der 240er damit die große Karte nicht volle Pulle läuft.
 
Zuletzt bearbeitet:
Wow, VIELEN DANK, genau das was ich brauche:banana:, you made my day, kudos:bigok:
 
Was soll das den ??

Habe gestern einen Beitrag hir in diesem Tehma erstellt und jetzt is er verschwunden ??

Na ja auch egal, dan frage ich halt noch mal ;)

und zwar, müssen ( sollten ) die Taktraten wie bei SLI bei beiden Karten gleich sein oder ist das unwichtig ?

Meine gtx 480 leuft mit einem GPU Takt von 870mHz und meine GTX 460 mit 720Mhz

kostet mich das performenc ?
 
Unwichtig.
Und natürlich ist die Performance vom Takt der Karte abhängig^^. Sonst würde ja Übertakten gar keinen Spaß machen.
 
Ja, das ist mir schon klar ;) aber dürfet dann die PhysX-berechnung über die gtx 480
nicht schneller sein ? ( aufgrund der höeren taktrater meiner gtx 480 )
oder verstehe ich da was falsch ?
 
Jop...reine PhysX-Benchmarks OHNE viel Grafik-Berechnungen (FLUIDMARK!) werden auf gtx480 schneller ablaufen. ABER dafür ist ja deine Hauptgraka nicht gedacht, denn in richtigen Spielen ist sie ja ohnehin schon sehr belastet und dafür steckst du ja eine PhysX-Graka rein um die haupt-Graka von PhysX-Berechnungen zu entlasten... was gibt's da falsch zu verstehen? Wenn du wenigstens die letzte Seite dieses Threads gelesen hast, dann weisst du, dass eine gtx460 für heutige PhysX-Aufgaben bereits einen Overkill darstellt. Wenn du eine Kombi aus gtx480 und 250 hättest, dann solltest du evtl dir Sorgen um den Takt der 250er machen. Deine gtx460 wird ganz bestimmt auch in Kombination mit gtx580 SLI nicht zur "PhysX-Bremse", zumindest bei heutigen PhysX-Herausforderungen
 
Bei Mafia 2 ist ne GTX460 als reine PhysiX Karte bestimmt kein Overkill.
 
Also laut meinen Fluidmark Messungen scheint die PhysX Performance recht schlecht mit dem Takt zu skallieren. Sprich ob die Karte nun mit Stock Taktraten rennt oder massiv OCed ist, wird an der PhysX Leistung recht wenig ändern...

@KurzschlussElektroniker
es gab die Tage mal einen Datenbank Ausfall hier im Forum und es musste ein Backup eingespielt werden, logischerweise sind alle Beiträge wärend dieser Zeit (waren aber nur ein paar wenige Stunden) auf nimmer Wiedersehen verschwunden ;)
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh