[Sammelthread] NVidia PhysX Performance/Bildqualitäts-Thread CPU/GPU

Hardwarekenner · 25.08.2010

wer oder was ist c´t? :asthanos:

fdsonne · 25.08.2010

TobiWahnKenobi schrieb:
dass CPU-physX nicht multicore geflaggt ist, muss nicht mal an nvidia liegen. hier sind die spielentwickler gefragt, ihre physik-effekte auf mehrere threads zu verteilen. dass NVs physX-compiler auf die eigenen GPUs ausgelegt ist, würde ich denen jetzt jedenfalls nicht ankreiden.

Letzteres will wohl auch niemand ankreiden, es sollte klar sein, das NV ihr Produkt so auslegen kann wie sie möchten. (zumal PhysX kein Compiler ist

sondern eine Engine bzw. Ansammlung von Bibliotheken)
Aber zum Multicore Support. Ich denke hier ist ganz klar NV der Ausschlaggebende Punkt. Denn man kann die Geschichte über ein einfaches setzen einer Einstellung voll Multicore Ready machen (und das geht bei PhysX eben von Haus aus, ohne da groß Sachen auf mehrere Threads auslegen zu müssen)
Die Spieleentwickler würden einen Teufel tun, sich an eine propritäre Lösung zu binden, einfach weil man eben mal schlappe 50% des Marktes links liegen lässt. Zählt man dann noch die Onboard Intel User hinzu (die zwar wenn überhaupt nur auf niedrigen Details zocken können, aber so wenigstens PhysX Effekte hätten) bleiben nur grob 30%...
Sowas macht kein Softwareentwickler, denn die Implementation von PhysX per GPU kostet Zeit und somit Geld, welche sie in keinster Form wieder reinbekommen...

TobiWahnKenobi schrieb:
für die spieler mit NV-hardware sollte das allerdings alles unerheblich sein, denn wenn eine einstellung im treiber die framedrops abfängt und auf höherem niveau stabilisiert, als es eine reine CPU-berechnung ermöglicht, profitiert man unmittelbar. klar ist es schön, wenn sich die situation noch ändert und verbessert, aber wer heute metro spielt fährt halt mit GPU-physik flüssiger.. und es kommt nunmal immer drauf an, was hinten rauskommt.

Bedenke, nicht jeder hat ne Fermi based NV GPU... Was sagen die Leute mit G92 oder G200 Chips, oder gar G80 Karten... Ne G80 GTX reicht für heutige Games mit teils hohen bis sehr hohen Details durchaus noch aus. Aber PhysX ist damit nicht drin. Bei den G200ern und G92ern ähnlich. Bei Karten aus dem Mittelklassebereich sieht es noch schlimmer aus...
PhysX als exklusiv Feature im HighEnd Bereich anzubieten ist zwar auch keine schlechte Idee, eben um mehr Details präsentieren zu können, aber ganz ehrlich, die paar Effekte haben wohl niemanden vom Hocker gehauen... (soll jetzt kein schlechtmachen sein

) Und gemessen an dem, was man an Performance verliert, ist hier ganz klar Optimierungsarbeit von nöten...

TobiWahnKenobi schrieb:
mir ist klar, dass viele technikverliebte, die hier unterwegs sind, diverse funktionen gar nicht brauchen (können) und sich dann an der technik aufhängen, aber es gibt halt auch die anwender, die gebotene möglichkeiten einfach nutzen und sich dran erfreuen, dass es so funktioniert, wie es ist.

Das ist durchaus richtig, für den Endkunden zählt das, was hinten rauskommt... Aber wie gesagt, man schaue sich mal im Otto normalo PC Markt um. Da haben die wenigsten irgendwelche richtig dicken NV GPUs im PC, sondern dort geht quasi nix über die Mittelklasse... Aber man muss doch nurmal durch den Blödmarkt laufen. Sogut wie jeder PC im Preisbereich 500-700€ wird mit nem Quadcore ausgeliefert.

Was wäre also die für den Endkunden praktikablere Lösung? Seine so schon idR limitierende Grafikkarte mit noch mehr Sachen überladen oder seine wenn überhaupt nur halb ausgelastete CPU voll auszunutzen...
Wie man anhand der Fluidmarkmessung sieht, erreicht meine GF100 GPU inkl. OC auf ca. 480GTX Niveau gerade mal die 2-3 Fache Leistung meines schon 3,5Jahre alten CPU Gespanns. (Das Teil ist vergleichbar mit nem QX6800 da selbe Architektur mit 3,33GHz - 370,5MHz FSB und 9er Multi)

Gemessen an der eigentlichen Mehrleistung der NV GPU müsste am Ende normalerweise auch deutlich mehr PhysX Leistung bei rumkommen... Aber diese scheint aktuell irgendwo im Nirvana zu verpuffen

DeViN · 25.08.2010

TobiWahnKenobi schrieb:
[OT]
ist mir bekannt, aber drittanbieter-player interessieren mich nicht sonderlich. das ist nicht meine baustelle. auf sowas greife ich bestenfalls zurück, wenn ich am schreibtisch sitze und in file mal schnell per doppelklick hineinschauen will.

hauptsächlich verwende ich vom sofa aus das windows media center. das notebook habe ich mir seinerzeit z.b. von dem autoren-honorar gekauft, das mir c't (heise) für meinen ersten publizierten media-center-praxis-artikel gezahlt hat.
[/OT]

(..)

mfg
tobi

ebenfalls OT:

man kann auch nur die standalone-Filter nutzen

Hardwarekenner · 25.08.2010

mal ne frage, wenn ich mir das mal genau anschaue, und mit meinen erfahrungen damals ( Physx auf 9800GT/ Physx auf 9800GT+9800GT als Physx Karte/ Physx auf 9800GT SLI / Physx auf 9800GT SLI + 8400GT als Physx karte, kann es da sein, das der Treiber fehlerhaft ist, und die zusatzkarten einfach nicht voll mit eingebunden werden, bzw. der Hauptkarte nicht die komplette Physx berechnung abnehmen, und deshalb diese mauen ergebnisse bei zusatzkarten ?

fdsonne · 25.08.2010

Hardwarekenner schrieb:
mal ne frage, wenn ich mir das mal genau anschaue, und mit meinen erfahrungen damals ( Physx auf 9800GT/ Physx auf 9800GT+9800GT als Physx Karte/ Physx auf 9800GT SLI / Physx auf 9800GT SLI + 8400GT als Physx karte, kann es da sein, das der Treiber fehlerhaft ist, und die zusatzkarten einfach nicht voll mit eingebunden werden, bzw. der Hauptkarte nicht die komplette Physx berechnung abnehmen, und deshalb diese mauen ergebnisse bei zusatzkarten ?

Denke ich nicht...
Aber was heist maue Ergebnisse bei Zusatzkarten?

Die PhysX Leistung auf der NV GPU ist allgemein Mau

Ob nun auf der Zusatzkarte oder nicht. Die Frage ist halt immer, wie viel Leistung wird zwingend benötigt um überhaupt erstmal spielbare FPS Raten zu ermöglichen. Das scheint beispielsweise bei Mafia II deutlich mehr zus ein als bei sagen wir Metro oder Batman.
Auch schwören einige ja darauf, das im SLI Gespann (wo beide Karten sowohl 3D als auch PhysX berechnen müssen) die Leistung stark wegbrechen soll und eine dedizierte Karte hier von Vorteil wäre

wink: an scully)
Lässt sich aber so leider nicht beweisen aus mangel an vergleichbaren Kartengespannen zu Einzelkarten usw.

Aber mir ist aufgefallen, die PhysX Leistung skalliert recht schlecht mit dem Takt der Karte. Ich hab bei grob 35% Taktreduzierung gerade mal 8-20% Leistung verloren. Im Mittel eher im Bereich 10-15%. Auffallend ist auch, um so mehr Partikel berechnet werden müssen, desto weniger skalliert das ganze mit dem Takt. Obwohl das ganze normal eigentlich genau andersrum ausschauen müsste...
Bleibt unterm Strich also, es bringt wohl für PhysX per GPU mehr, eine dicke GPU mit weniger Takt als eine schlankere GPU mit viel Takt zu nehmen. Fermi wäre hier Ideal. Viele Ausführungseinheiten bei recht wenig Takt. Der G92 hingegen das genaue Gegenteil, recht wenig Ausführungseinheiten, dafür sehr viel mehr Takt...

Hardwarekenner · 25.08.2010

eine 9800GT hatte sagen wir mal 100% leistung bei Physx, wenn ich dann 2x 9800GT (im SLI ) hatte waren es 150%, wenn ich aber 9800GT + 9800GT genommen hatte, also eine 9800GT nur für Physx waren es nur 120%.

mayer2 · 25.08.2010

SLI und PHy ging noch nie...bei SLI >SLI aus und ein Karte für PHy zuweisen sollte ja nicht so schwer sein bei den tausenden von Games :lol:

übrigens hat das Cuda Wasser in JC2 damit nix zutun

das Halbwissen erschlägt mich mal wieder

fdsonne · 25.08.2010

Hardwarekenner schrieb:
eine 9800GT hatte sagen wir mal 100% leistung bei Physx, wenn ich dann 2x 9800GT (im SLI ) hatte waren es 150%, wenn ich aber 9800GT + 9800GT genommen hatte, also eine 9800GT nur für Physx waren es nur 120%.

Neja kann durchaus sein... Wenn du eine Karte für beides nutzt, wird diese wohl am Anschlag laufen. Nutzt du beide im SLI, so steht neben mehr PhysX Leistung auch mehr 3D Leistung bereit, sprich man wird bei dieser Konstellation wohl am schnellsten fahren. (Einfach weil hier die Lastzuteilung dynamisch geschiet) Verwendest du eine als PhysX Karte und eine für 3D, so bleibt die 3D Leistung identisch wie wenn du eine Karte verwendest bei PhysX aus. Die PhysX Effekte erzeugen ja zusätzlich ebenso Last für die Berechnung des Bildeffektes, sprich die Karte für die 3D Berechnung wird mehr gefordert wie bei PhysX off. Die zweite Karte welche nur die Physikberechnungen tätigt ist, wird dann halt insoweit gefordert, wie das die Anwendung für nötig hält...

mayer2 schrieb:
SLI und PHy ging noch nie...bei SLI >SLI aus und ein Karte für PHy zuweisen sollte ja nicht so schwer sein bei den tausenden von Games übrigens hat das Cuda Wasser in JC2 damit nix zutun das Halbwissen erschlägt mich mal wieder

Du weist schon das es hier die ganze Zeit um PhysX geht... Auch wenn PhysX auf Cuda aufsetzt haben sonstige Cuda Späße haben hier im Thread nix verloren... Von Halbwissen kann also gar nicht die Rede sein...

mayer2 · 25.08.2010

ja?
Ich habe darauf geantwortet obs sich lohnt ne Zusatzkarte zu stecken und das lohnt, da es nicht nur PHy gibt das die Karte übernehmen kann um die "Hauptkarte zu entlasten, siehe >Mass2 etc pp. ansonsten löscht meine Beiträge einfach.

Harito · 26.08.2010

HALLO, ich hab grad fluidmark probiert und hab diese Einstellung "versucht":
Mit Cpu kann ich benchen über die 65000 particles (hab 90000 mal eintippt),
aber versuch mit der gpu zu benchen, verschwinden bei ca. 65000 die partikel.
Ich verwend den Rechner aus der SysInfo.
Soll ich mal die gts ausbauen?

fdsonne · 26.08.2010

Was hast du genau versucht?

Mir ist aufgefallen, das das Programm wohl noch bisschen Buggy ist. Sprich wenn du den "unlock ermitters" Haken wegnimmst, kommt nix auf der GPU

Da hilft nur ein Neustart des Tools und eben den Haken rein. Die Einstellungen zwischen ein,zwei oder drei ermitters auf der GPU macht keinen Unterschied. Liegt im Messtolleranzbereich... Warum und wieso das so ist, keine Ahnung, aber bei GPU Messungen muss der Haken definitv gesetzt sein bei mir. Und wenn das nix hilft, dann einfach Tool zumachen und wieder aufmachen und danach benchen, ohne diesen Haken anzufassen...

Mich täten mal die Ergebnisse anderer Karten interessieren...
Also was im Bereich G80, G92 und G200... Und vor allem, wie sich dort der GPU/Shadertakt auf die Performance auswirkt...

Powerplay · 26.08.2010

So ich habe eben mal etwas probiert!
60000 Particle bei cpu 31 emitters
AMD X4 965@ 4,16Ghz = 160 Points -->SPS 26
Intel Core i5 750@ stock = 127 Points -->SPS 21
Nvidia GT240 1024MB = 150 Points -->SPS 25

Jetzt wäre mal nen X6 oder Intel I7 interessant!

fdsonne · 26.08.2010

Schreib mal lieber den SPS Wert hier rein... Diese Punkteangaben sind mir bisschen suspekt...

Harito · 26.08.2010

Ich wollt ausprobieren 10000-120000 particel einzustellen, so wie Am Threadanfang beschreiben zu benchen.
Also ich hab eine G92 8800gts 512mb drin, und ich weiss gar nicht mehr weiter.
hab 232 sps "glaub" ich mit der karte.
Wenn ich PHysx auf Gtx460 einstell, hab ich aber genauso 230sps
und ja mit intel core i7-930 @ 3.6ghz hab ich grad 130sps gehabt.

---------- Beitrag hinzugefügt um 09:21 ---------- Vorheriger Beitrag war um 09:20 ----------

sry hab mich verschreieben

fdsonne · 26.08.2010

ja wenn du nicht weiter weist, dann frag halt

Wo klemmts denn genau?

Harito · 26.08.2010

was ich bin erst aufgestanden, der sps wert bei cpu ist 21.
was fürein wert sollt ich mit einer gtx460 haben?

---------- Beitrag hinzugefügt um 10:10 ---------- Vorheriger Beitrag war um 10:03 ----------

Ich hab mit nv syseinstellung physx auf gtx460 38sps
und wenn ich umstell auf gts8800 g92 hab ich genauso 38sps

LD · 26.08.2010

Powerplay schrieb:
So ich habe eben mal etwas probiert!
60000 Particle
AMD X4 965@ 4,16Ghz = 160 Points
Intel Core i5 750@ stock = 127 Points
Nvidia GT240 1024MB = 150 Points

Jetzt wäre mal nen X6 oder Intel I7 interessant!

Man müsste aber auch wissen wie viele Emitters du eingestellt hast, bei mehr Emitters ist die CPU schneller.

Powerplay · 26.08.2010

LD schrieb:
Man müsste aber auch wissen wie viele Emitters du eingestellt hast, bei mehr Emitters ist die CPU schneller.

Habs editiert! Es ist schön zu sehen das ein 4kerner sehr gut mit einer 96shader karte mithalten kann!
ein x6 sollte da nochmal gut mehr leisten können!

LD · 26.08.2010

Powerplay schrieb:
Habs editiert! Es ist schön zu sehen das ein 4kerner sehr gut mit einer 96shader karte mithalten kann!
ein x6 sollte da nochmal gut mehr leisten können!

Ich hatte mit 4,2Ghz i7 mit 31 emitters und 60000 Partikeln 264 punkte und 43 SPS.

Powerplay · 26.08.2010

LD schrieb:
Ich hatte mit 4,2Ghz i7 mit 31 emitters und 60000 Partikeln 264 punkte und 43 SPS.

Ja damit biste dann ca so schnell wie eine GTX470! Also wo sind denn da bitte NVs argumente geblieben??

LD · 26.08.2010

Powerplay schrieb:
Ja damit biste dann ca so schnell wie eine GTX470! Also wo ist dann dann bitte NVs argumente geblieben??

Naja das konnte man sich schon denken, wieso würden die sonst multicore Unterstützung und sonstige sachen sperren. Aber es sieht wirklich so aus dass mit richtige multicore Unterstützung und eine schnelle CPU wäre man wohl sogar schneller bei Spiele mit CPU Physx als GPU Physx weil die CPU weniger ausgelastet ist.

fdsonne · 26.08.2010

Ich denke im Leistungsbereich von 2 Kernen kann man im Schnitt bei heutigen Games (PC mit Quadcore) freimachen... Bei ner GPU kann man idR gar nix frei machen, denn da limitieren selbst die schnellsten Karten teils massiv bei neuen Games mit max. Details AA und AF schon...

Was mich aber wirklich interessieren würde, wohin verpufft die Leistung der NV GPU... Normal darf/kann das eigentlich nicht sein? Oder behält sich NV hier die Optimierungen für den Ernstfall vor, wenn mal Konkurenz im PhysX Markt aufkommt?

TobiWahnKenobi · 26.08.2010

ich habe mir den fluidmark jetzt auch mal gezogen und auch die ergebnisse in mein preview der karte mit eingebaut (link in der signatur)

hier ein paar ergebnisse.

fluidmark standard, erzwungenes CPU-physX

fluidmark standard, GPU-physX

fluidmark vollbild/fullHD, erzwungenes CPU-physX

fluidmark vollbild/fullHD, GPU-physX

2x fluidmark standard, erzwungenes CPU-physX

2x fluidmark standard, GPU-physX

(..)

mfg
tobi

Powerplay · 26.08.2010

Mach das gleich mal statt 2x Fluidmark mit 1xfurmark und 1xFluidmark

fdsonne · 26.08.2010

@TobiWahnKenobi
deine CPU Messungen musst du nochmal wiederholen

Du hast bei der ermitters Einstellung Std. auf 3 gelassen, heist es waren nur drei Kerne aktiv. Dreh das auf 31 hoch und staune

PS:
die MSAA Einstellung greift übrigens nicht. Das war aber bei meinen Tests auch so...

TobiWahnKenobi · 26.08.2010

sry, freaks, aber ich mache da jetzt gar nichts mehr.. das hat heute schon genug zeit gekostet, die dinger laufen zu lassen und zu screenshotten respektive in die webseite einzubauen und upzuloaden.. das bindet zuviel unbezahlte zeit..

was soll ich da staunen?

btw,
das mit dem MSAA ist mir auch aufgefallen.

(..)

mfg
tobi

fdsonne · 26.08.2010

Ich sagte doch 31 ermitters...

Bei nem Quad steigt die PhysX Leistung für die CPU zwischen 4 und 31 ermitters um gute 40-50% obwohl nicht mehr Kerne hinzukommen. Bei Intel mit SMT dürfte das sogar noch mehr sein.

Von den 11SPS im ersten Wert oben wirst du also mit 31 ermitters gute 20-22SPS rausbekommen, vllt sogar noch mehr... das mal glatt das doppelte von der ersten Messung.

TobiWahnKenobi · 26.08.2010

fdsonne schrieb:
Ich sagte doch 31 ermitters...

Bei nem Quad steigt die PhysX Leistung für die CPU zwischen 4 und 31 ermitters um gute 40-50% obwohl nicht mehr Kerne hinzukommen. Bei Intel mit SMT dürfte das sogar noch mehr sein.

Von den 11SPS im ersten Wert oben wirst du also mit 31 ermitters gute 20-22SPS rausbekommen, vllt sogar noch mehr... das mal glatt das doppelte von der ersten Messung.

das ergibt doch gar keinen sinn.. wenn ich etwas vergleichen will, muss ich einstellungen nehmen, die auch beide lösungen beherrschen. die letzte messung, die sowohl von GPU- als auch von CPU-physX unterstützt werden, sind 8 emitter.

und selbst da ist die GPU-leistung dreimal so hoch..

fdsonne schrieb:
Bei nem Quad steigt die PhysX Leistung für die CPU zwischen 4 und 31 ermitters um gute 40-50% obwohl nicht mehr Kerne hinzukommen. Bei Intel mit SMT dürfte das sogar noch mehr sein.

das wird dir in einer spielengine aber nie begegnen.. also dass die kompletten CPU-ressourcen für eine physik-berechnung eingesetzt werden/ werden können. da bleibt unterm strich nämlich nichts für die engine und die zulieferung der daten richtung grafikkarte, KI und soundberechnung übrig. da physik nunmal nur ein teil der gleichung/ ein teil des spiels ist, wäre man damit schlechter unterwegs, als mit einer GPU-physX-lösung + ~~komplett~~ nahezu freier CPU, die sich um physik nicht kümmern muss..

(..)

mfg
tobi

LD · 26.08.2010

TobiWahnKenobi schrieb:
das wird dir in einer spielengine aber nie begegnen.. also dass die kompletten CPU-ressourcen für eine physik-berechnung eingesetzt werden/ werden können. da bleibt unterm strich nämlich nichts für die engine und die zulieferung der daten richtung grafikkarte, KI und soundberechnung übrig. da physik nunmal nur ein teil der gleichung/ ein teil des spiels ist, wäre man damit schlechter unterwegs, als mit einer GPU-physX-lösung + ~~komplett~~ nahezu freier CPU, die sich um physik nicht kümmern muss..

(..)

mfg
tobi

Dazu wurde ja schon vorher geschrieben dass man in der regel keine eigene Physx Grafikkarte im Rechner hat. Die Karte muss also nicht nur die Grafik sondern auch das Physik rechnen obwohl es in der regel schon mit Grafikrechnung voll ausgelastet wird. Die cpu hat also weitaus mehr freie Resourcen als die GPU.

TobiWahnKenobi · 26.08.2010

das lässt sich nicht pauschal sagen, weil es vom content abhängt. allerdings taugen die freien ressourcen auf der CPU einfach nicht für physX. und ob das jetzt an mangelnder thread-optimierung oder an fehlenden instruktionserweiterungen liegt, ist eigentlich banane, denn man kann es nur so nutzen, wie es im moment ist.. es gibt ja nur an oder aus.. andere alternativen bieten sich nicht.. egal wieviel man rumjammert, wettert und schimpft..

wenn ich mein spielerlebnis in metro heranziehe, können die GPU-reserven nach gpu-physX gar nicht so gering sein.. zumindest nicht beim fermi.

ich weiss nicht, wieviele rechenwerke gpu-physX in beschlag nimmt und ich weiss auch nicht, ob es da unterschiede von karte zu karte gibt.. es würde mich nichtmal wundern, wenn pauschal X rechenwerke auf grafkkarten-generation Y eingesetzt werden.

vielleicht gucke ich mir den fluidmark am nächsten we nochmal auf meinem notebook an.. die 9600M-GT ist ja wirklich stark in der leistung reduziert.. zumindest anhand der eckdaten.

(..)

mfg
tobi

[Sammelthread] NVidia PhysX Performance/Bildqualitäts-Thread CPU/GPU

Legende

Legende

Enthusiast

Legende

Legende

Legende

Banned

Legende

Banned

Enthusiast

Legende

Legende

Legende

Enthusiast

Legende

Enthusiast

Enthusiast

Legende

Enthusiast

Legende

Enthusiast

Legende

TobiWahnKenobi

Guest

Legende

Legende

TobiWahnKenobi

Guest

Legende

TobiWahnKenobi

Guest

Enthusiast

TobiWahnKenobi

Guest

Ähnliche Themen