Doom³ ATI Workaround

D€NNIS

Pharao
Thread Starter
Mitglied seit
25.12.2003
Beiträge
4.098
Hi,

ich hab hier n interessanten Workaround für die ATI-Fraktion um D³ ein wenig Beine zu machen.

Wäre Klasse wenn ggf. ein paar Leute das testen könnten und mittels Benches und Screens vorher nachher Resultate hier publizieren würden.
Insbesondere Benches mit AF sind gefragt aber alle anderen sind auch interessant.

WICHTIG:
!!!Files vorher backupen!!!

Folgendes:

1.) Geht in euer D³ Base Verzeichnis /%doom³%/base
2.) Klickt auf die Datei pak000.pk4 und öffnet diese mit WinRAR
3.) Innerhalb von WinRAR geht in das Verzeichnis glprogs der
eben geöffneten pak000.pk4.
4.) Öffnet die Datei interaction.vfp mit einem Editor (Wordpad)da wir die Datei verändern wollen

5.) Scrollt zur Fragment-Shader Sektion und sucht nach
folgendem Code:

PARAM subOne = { -1, -1, -1, -1 };
PARAM scaleTwo = { 2, 2, 2, 2 };

6.) Fügt diese Codezeile unmittelbar ans Ende des obig genannten Codes:

PARAM specExp = { 16, 0, 0, 0 };

7.) Ab zur nächsten Sektion:

# perform a dependent table read for the specular falloff
TEX R1, specular, texture[6], 2D;

8.) Kommentiert die TEX Codezeile mit nem # Zeichen aus so das diese nicht mehr aktiv ist.

9.) Nun fügen wir folgende Codezeile ein:

POW R1, specular.x, specExp.x;

Das ganze sollte dann so aussehen:

# perform a dependent table read for the specular falloff
# TEX R1, specular, texture[6], 2D;
POW R1, specular.x, specExp.x;


10.) Speichert die Veränderungen in interaction.vfp entsprechend ab WinRAR wird euch ebenfalls fragen ob die Veränderungen im Archiv übernommen werden soll auch hier ist mir Ja zu bestätigen.

Und jetzt ist eure Initiative gefragt Vorher - Nachher Benches :d

Source: beyond3d Forum

-------

“When I read the shader it striked me how many texture accesses it did compared to the relatively short shader, even for stuff that could just as well be done with math for a small cost in instructions. Using a dependent texture lookup for POW evaluation makes a lot of sense for R200 level hardware due to instruction set limits, but for R300 and up it's much better to just spend the three cycles it takes to evaluate POW with math instead of risking texture cache trashing with a dependent texture read, which may be much more costly, especially since the access pattern in this case will be far from linear. Also, using math improves the quality too, even though it may not be very noticable in this game,” said Humus, a well-known graphics specialists who now works for ATI Technologies.
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Dieser Patch bewirkt eine Verlagerung von Texturoperationen auf mathematische Operationen dort wo das Resultat quasi dasselbe ist.

Humus einer der beyond3d Foren Mitglieder war der Ansicht das für die relativ kleinen Shader zuviele Texture Ops angewendet werden obgleich seiner Behauptung nach dasselbe Resultat eben mit mathematischen Operationen erreicht werden kann.

Durch diese Verlagerung soll eine höhere CacheEffizienz erreicht werden.
 
Also ich habe jetzt keine Screens.

Aber hier mal der Vergleich:

Abit IC7
P4 2,6Ghz
9800Pro
1GB Ram
DX 9.0c
Hybrid v.2

1024x768, High Details, noAA / 8x AF (standart bei High Details)

vorher: 42fps
nachher: 43,7fps

Bring also in etwa 2fps mehr im Schnitt

mfg
 
alles unter + 5-10 fps ist meiner Meinung nach unnötig....
Bedenke das 65 zu 67 wie du getestet hast immer mal als Schwankungen da sein können...Temp Veränderungen...reste im Virt.Ram usw....Das sagt noch gar nix....

Ich wate lieber auf 4.9 final
 
Das deckt sich ungefähr mit den Erfahrungen der Member bei beyond3d.
Optimal wären Benches mit einer X800Pro oder besser.
 
tolonamele - Falsch! Die Timedemo-Messungen sind bei mir extrem konstant, die Schwankungen betragen nie mehr als max. 0,2 fps.

Ängerungen lassen sich so doch recht gut testen.
 
Zuletzt bearbeitet:
Ok...dann machst du es sauber...gibt aber Leute die stopfen ihren VirtRam voll...tausend Tasks im Hintergrund....deswegen..

Werde es mit X800pro@XT mal mit der normalen Pro Taktung testen ...mal schauen ob da was geht bei den "schlechten"
default X800pro werten.....
 
ich habs auch mal ausprobiert. Config ist:

xp 2500@3200(200*11)
512 MB ram
Radeon 9800 Pro

High Detail(AA aus, AF aus)
vsync aus

vorher: 46,3
nachher: 47,1
 
Ich bin von 42.1fps auf 43.6fps gekommen :banana:


Ihr müsst mal r_shadows auf "0" setzen, echt heftig was der Schatten an Leistung zieht, denn ohne Schatten bin ich bei 60fps !!!
 
Zuletzt bearbeitet:
Jau ...bei mir ca 2fps mehr......
1600x1200 High,noAA -von 52,2 auf 54,1 !!
1280x1024 High 2xAA 60 fps auf 62

ist doch schon mal was...aber den spielablauf, wie in einigen englischen Foren berichtet,
beschleunigt es bei mir nicht!!
 
Also
1. Ich hab keine Fehler entdecken können.

2. Zu den Ergebniss: Graka@ 520/500 High Quality

1280x1024 53FPS ohne Fix und 57FPS mit

Also bringt viel finde ich
 
Also ich weis nicht was bei mir das Problem ist!! habe mir das Spiel gestern gekauft und es ist ansich wunderbar doch die Frame-Zahle lässt zu wünschen übrig!
mein sys
Athlon XP1700 @ 2,2GHZ 200FSB synchron
Abit-NF7 s (Nforce-2 400)
2X 512 DDR PC400 T.: 2-2-3-7
Radeon 9800pro 128mb ram
SATA raid
Win. XP SP. 1
Alle aktuellen graka und main treiber drauf!
habe jetzt keine benches gemacht oder so, aber das spiel läuft bei einer auflösung von 1024*768 Ultra Hight einstellunge (im game) und AA aus AF in den ATI Treibern auf 16X gestellt, Trueform aus, vsync aus, sonst eigentlich alles auf qualität und halt AA auf Standard, ich denke mal das das aus bedeutet!!
den tweak von oben habe ich noch net ausprobiert da ich gerade auf arbeit hocke!
es ist auch eher das problem da, das man es merkt wenn er bestimmt abschnitte/gegner läd, immer wenn man um eine ecke geht, ruckelt es, dann geht es wieder für ein paar schritte bis wieder ein gegner kommt oder ein andere raum...
was muss ich eigentlich für den doom3 bench in die konsole tippen?? ist das wie bei quake /timedemo 1 oder wie?

nen thx schonmal im vorraus!!
 
müsstest du nicht den link von diesem thread in dem von don posten ... ;) ist genau dasselbe.
 
1gb pc400 DC
ist ja net wenig speicher!!!
hmmm....
auf was sollte ich denn AF stellen?? so das ich kaum ein unterschied merke!?
den ich brauche meine schöne grafik!! :)
 
Murder_Inc schrieb:
die Frame-Zahle lässt zu wünschen übrig!
Athlon XP1700 @ 2,2GHZ 200FSB synchron
Radeon 9800pro 128mb ram
1024*768 Ultra High
Ultra High ist für zukünftige Grafikkarten mit 512 MB Speicher gedacht. Schraub mal eine Stufe runter in der Qualität.
 
Performer schrieb:
Mit POW_SAT R1, specular.x, specExp.x; verschwinden die Beleuchtungsfehler.

Also das Ganze basiert ja auf dem Humus Tweak aus diesem Thread, aber was
mir noch aufgefallen ist, das die Performance mit AF irgendwie seltsam hoch ist:

Original:

  • noAF ---> 54,1 FPS
  • 8xAFbi --> 43,7 FPS
  • 8xAFtri -> 41,3 FPS

Humus:

  • noAF ---> 55,6 FPS
  • 8xAFbi --> 54,5 FPS
  • 8xAFtri -> 52,3 FPS

Wie kann das sein ?

Also normalerweise hat man ab High Details standartmäßig 8x AF an!
Also müsstest du, um ohne AF zu testen, es in der Config auf 0 setzen.

mfg
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh