[Sammelthread] wPrime & Pifast Performance/Tweak Thread

hydrotoxin

Enthusiast
Thread Starter
Mitglied seit
15.04.2008
Beiträge
3.749
wPrime & Pifast Performance/Tweak Thread


Einleitung:8

Viele kennen es: Man hat ein wPrime/Pifast Ergebnis das man hart erarbeitet hat und liegt hinter einem Ergebnis das eigentlich von den settings schwächer einzuordnen wäre...
Taktmäßig weit überlegen und doch unterlegen....


Es gibt einige Faktoren die man beachten sollte, andere Faktoren widerum sind unumgänglich und erschweren das benchen künstlich.

+
  • Einstellung des Systems gemäß der Charakteristik des Benchmarks vornehmen (Ramtakt- Latenznutzen)
  • "Speedup" durch die wahl des richtigen OS
  • Tweaks kennen und nutzen

-
  • wPrime war in manchen früheren versionen (zb. v1.43) schneller.
    Nun ist nurnoch v1.55 erlaubt (sonst wird der score gelöscht) und die alten scores gelten trotzdem,
    was es umso schwieriger macht diese zu schlagen.
    Ein Spekulatius hierzu ist dass einer (bzw. mehrere) der Kerne/Threads bei der neueren version hinterherhink t/en und man dem durch die Echtzeitpriorität entgegensteuern kann.
    Calculating "Wahrheitsgehalt" = *Error*


Allgemein
1

Un-tweak
  • Festplattenzugriff hat absolut keine relevanz (daher ist Ramdisk/iRam/SSD/Raid nicht relevant)
  • Soviel Prozesse wie möglich zu killen inkl. Explorer, bringt keinen (sichtbaren) Performancezuwachs bei frischen XP's.
    Bei 24/7 BS gibt es natürlich einige prozesse die es zu beenden wert ist.
    Die "Explorer.exe" gehört nicht dazu. (wenn doch dann im 1/1000 -tel bereich)
Tweaks
  • Klassisches Theme sowohl XP als auch Vista (bringt bei wPrime einige zehntel @32m)
  • Grafiktreiber installieren
    Mit Grafiktreiber

    Ohne Grafiktreiber


9
Pifast

Betriebssystem:2
  • Systemübergreifende Vergleiche:
    • Intel - Kentsfield
      pifastratinghm6t.jpg

      Testsystem
      Hardware
      • Q6600 @ default 2,4 GHz
      • GA-P35-DS3
      • 2 GB DDR2 800er Billig-RAM
      • X1950 Pro 512MB
      Software:
      • Windows XP Home, ServicePacks wurden einzeln ohne andere Updates installiert
      • Catalyst 8.9
    • AMD - Windsor
      hydrospifastperformancf6gw.jpg

      Anmerkungen:
      Das Vista 24/7 Ergebnis (also das alltagssystem) ist nicht sehr aussagekräftig da er merkwürdigerweise nur dort und wirklich nur dort Bluescreens ausgespuckt hat und ich dann mit lascheren timings gebencht habe.

      Testmachine:
      Hardware
      • AMD X2 6000+ F3 @ 3,4GHz @1.45V
      • DFI Lanparty UT 790FX-M2R
      • 2GB 1066er Cellshock (D9GMH) @5-4-4-11-10-1T
      • Radeon 4870X2
      Software:
      • Windows XP Professional SP0/SP1a/SP2/SP3 ; Windows Vista SP1
      • Catalyst 8.8 (Nur Grafiktreiber ohne CCC installiert); Vista 8.9; 24/7 Vista 8.10
    • AMD - Agena


      Testmachine:
      Hardware:
      • AMD Phenom 9750 @3.104GHz @ 1.401V
      • DFI Lanparty UT 790FX-M2R
      • 2GB 1066er Cellshock (D9GMH) @259mhz @5-5-5-18-23-2T
      • Radeon 4870X2
      Software:
      • Windows XP Professional SP0/SP1a/SP2/SP3
      • Catalyst 8.12

Ramtakt vs. Latenz
3
  • Der Benchmark profitiert von jedem MHz Ramtakt, Latenzen bringen ebenso etwas zeit,
    aber das Hauptaugenmerk sollte man auf maximalem Ramtakt legen.
    Details ->

    Anmerkungen:
    Die Latenzen wurden immer mit 227mhz gebencht.
    Der Ramtakt wurde immer mit 5-5-5-15-15-2T genommen.
    Wie man sieht skaliert Pifast sehr gut mit beidem.

    Testmachine:
    Hardware
    • AMD X2 6000+ F3 @ 3,4GHz @1.45V
    • DFI Lanparty UT 790FX-M2R
    • 2GB 1066er Cellshock (D9GMH)
    • Radeon 4870X2
    Software:
    • Windows XP Professional SP3 - Klassisches Theme - ati2evxx.exen gewaltsam per taskmanager beendet
    • Catalyst 8.8 (Nur Grafiktreiber ohne CCC installiert)
  • Das Prog. ist zudem sehr pingelig was vCore und zu scharfe Latenzen anbelangt.
    (Er rechnet möglicherweise fertig aber das ergebnis wird als ungültig gebrandmarkt)

Tweaks4

Derzeit noch ziemlich erfolglos erforschtes Gebiet...
  • Der einzig bekannte ist das ausführen des Benchmarks im Vollbild, was allerdings lt. Teamthread und meinen Erfahrungen keine verbesserung bringt.
    Nur wenn man keinen Grafiktreiber installiert hat kann man ein Leistungsplus verbuchen, allerdings ist man mit Grafiktreiber mindestens gleichschnell. Das führt diesen Tweak ad absurdum.

    So führt man diesen Tweak richtig aus:
    1. Man erstelle eine Verknüpfung der *.bat
    2. Dann stellt man in den Eigenschaften der Verknüpfung ein dass die Applikation im Vollbildmodus startet.
    3. Zuletzt noch den Benchmark über die Verknüpfung starten

  • Der "ATI-Hot Key Poller" (Bei ATI-Grakfiktreibern inbegriffen) der zwei prozesse (ati2evxx.exe) belegt zu beenden
    bringt in etwa eine, konstante, 0.05s geringere zeit (CCC hatte ich absichtlich nicht installiert, also kann ich dazu nichts sagen)
  • Um ein paar runs hintereinander zu machen habe ich die Stapelverarbeitungsdatei etwas modifiziert:
    Code:
    :abc
    @echo off
    echo Running Hexus Pifast to 10M places...
    pifast41.exe < hexus.txt
    echo Jot down your results or take a screenshot :)
    pause
    goto abc
    Nützlich wenn man sich den schnellsten run rauspicken will ;)
10
wPrime
Betriebssystem:5

Es hat sich gezeigt dass nicht alle CPU's (bisher nur 90nm AMD's) von SP3/Vista profitieren,
welche in der Regel einen Performancezuwachs bringen.
Unter XP SP3 zeigt dies keine negativen Auswirkungen, aber Vista liegt dadurch, dass es überladener und schlechter zu "entschlacken" als XP ist, wieder merklich zurück.
Ob dies auch bei CPU's der Fall ist die von SP3/Vista profitieren wird sich noch zeigen.

  • Systemübergreifende Vergleiche:
    • Intel-Kentsfield

      Man sieht dass der Kentsfield extrem von SP3 profitiert (und wahrscheinlich dann auch von Vista, aber SP3 ist schlanker und damit schneller).

      Testsystem
      Q6600 @ default 2,4 GHz
      GA-P35-DS3
      2 GB DDR2 800er Billig-RAM
      X1950 Pro 512MB

      Software:
      Windows XP Home, ServicePacks wurden einzeln ohne andere Updates installiert, Catalyst 8.9 installiert
    • AMD-Brisbane
      "Deutliches Leistungsplus durch Vista/XP SP3 gegenüber XP SP2" - In Arbeit
    • AMD-Windsor

      Anmerkungen:
      Nicht wirklich viel unterschied zwischen den Ergebnissen, aber entscheidend ist die wohl beste tweakbarkeit des SP3 :)

      Testmachine:
      Hardware
      • AMD X2 6000+ F3 @ 3,4GHz @1.45V
      • DFI Lanparty UT 790FX-M2R
      • 2GB 1066er Cellshock (D9GMH) @5-5-5-15-15-2T
      • Radeon 4870X2
      Software:
      • Windows XP Professional SP0, SP1a, SP2, SP3 - Vista SP1
      • Catalyst 8.8 (Nur Grafiktreiber ohne CCC installiert), Vista cat. 8.9, 24/7 Vista cat. 8.10
    • AMD - Agena


      Testmachine:
      Hardware
      • AMD Phenom 9750 @ 3,104GHz @1.408V (bzw. bei Vista x64 @1.424V)
      • DFI Lanparty UT 790FX-M2R
      • 2GB 1066er Cellshock (D9GMH) @259mhz @5-5-5-18-23-2T
      • Radeon 4870X2
      Software:
      • Windows XP Professional SP0, SP1a, SP2, SP3 - Vista SP1
      • Catalyst 8.12
Ramtakt vs. Latenz6
  • Ram scheint dem Programm gänzlich schnuppe zu sein....

    Weder Ramtakt, Latenzen noch HT-Link & NB-Takt bei AMD's , soweit sie auch auseinander liegen mögen,
    scheinen auf den Endscore einen Einfluss zu haben.

    Wenigstens kann der Ram dann nichtmehr instabil werden :)

    Details:

    Anmerkungen:
    Die Latenzen wurden immer mit 227mhz gebencht.
    Der Ramtakt wurde immer mit 5-5-5-15-15-2T genommen.
    Da dieser Benchmark extrem schwankt sollte man eher 1024m als Referenz nehmen. Die maximalschwankung von 0,35% finde ich bemerkenswert..... (812,44 - 809,594)

    Testmachine:
    Hardware
    • AMD X2 6000+ F3 @ 3,4GHz @1.45V
    • DFI Lanparty UT 790FX-M2R
    • 2GB 1066er Cellshock (D9GMH)
    • Radeon 4870X2
    Software:
    • Windows XP Professional SP3 - Klassisches Theme - ati2evxx.exen gewaltsam per taskmanager beendet
    • Catalyst 8.8 (Nur Grafiktreiber ohne CCC installiert)

Tweaks7
  • Echtzeitpriorität der x-Prozesse (x=Kerne bzw. Threads) die sich kurz nach dem start des benches öffnen.
    Daher sollte man sich dabei beeilen
    Ich empfehle diesen Tweak nur für 1024m. Bei 32m verliert man eher zeit durch die interaktion während dem benchmark.
  • Mehrmals den Bench durchlaufen lassen. Der erste durchlauf ist oftmals nicht der schnellste.
    Für den besten score der vll 0.2s unterhalb liegt braucht man manchmal sehr viele runs :/
  • Unter XP SP3 mehrere Instanzen von CPU-Z während des wPrime runs geöffnet lassen.
    Bewirkte bei mir mit AMD X2 6000+ ein deutliches Leistungsplus von 0,8s (25,3s - 24,5s)

    Dieser Tweak funktionierte bisher mit diesen CPU's

Auswirkungen der wPrime Tweaks (@XP SP3):
Ohne Tweak

5x CPU-Z 1.49

5x CPU-Z 1.49 + Echtzeit @1024m - ohne Echtzeit @32m da es die zeit nur verschlechtert


32m von 25,438s auf 24,562s
1024m von 813,171 auf 789,172s

Ich würde mich sehr freuen wenn jemand:
  • meinen Roman korrigiert. (sowohl inhaltlich als auch von der Rechtschreibung. Bei letzterem bitte gleich ne größere Liste)
  • verbesserungsvorschläge bringt.
  • weitere Tweaks hinzufügt.
  • selbst testet. (wird bei brauchbarkeit postwendend eingebaut)
  • Kritik hervorzubringen hat. (anscheinend gibts keine, also arbeite ich perfekt :p)

Happy Benching :wink:

Historie
13.12.08 -Thread erstellt
13.12.08 - Berserker -wPrime "Tweaks" hinzugefügt
14.12.08 - Historie hinzugefügt
14.12.08 - Übersichtlichkeit durch Auflistungsfunktion des Boards verbessert
14.12.08 - Kleine Wortdreher ausgebessert
14.12.08 - "Performance Allgemein" hinzugefügt
20.12.08 - Hayabua1300's wPrime&Pifast Performancerating hinzugefügt
20.12.08 - Nützliche Links hinzugefügt
20.12.08 - Hyperluxx - "hwbot-Offensive: WPrime + PiFast Tweaks" zu nützlichen links hinzugefügt
22.12.08 - Textstelle überarbeitet (wPrime - Betriebssystem)
22.12.08 - Hässliche Tabellen durch Grafiken ersetzt
22.12.08 - wPrime Diagramme als Thumbnails ausgeführt
22.12.08 - Textstelle überarbeitet (Pifast - Ramtakt vs. Latenz)
24.12.08 - hydrotoxin - Tweak hinzugefügt
24.12.08 - "Cpu-z erst nach dem Benchingrun starten..." gelöscht, da es sich als haarsträubender unsinn herausstellte :fresse:
24.12.08 - "Performance Allgemein" durch "Un-tweak" ersetzt
24.12.08 - Dem nächsten update vorgegriffen und den zu 0% erkennbaren skalierungsfaktor von ramtakt/latenzen @wPrime vermerkt
24.12.08 - google - "[Info] wPrime32m, wPrime1024m & PiFast" zu nützlichen links hinzugefügt
24.12.08 - Pifast Tweak (magicrun) inkl. modifizierter Stapelverarbeitungsdatei hinzugefügt
24.12.08 - "Alle Prozesse Killen" zu Untweak hinzugefügt
24.12.08 - Einleitung mit neuem text zugekleistert + "[im Aufbau]" aus Threadtitel entfernt :)
24.12.08 - Textpassage "wPrime -> Betriebssystem" aus Layouttechnischen gründen umformuliert.
24.12.08 - Der Pifast Performancerating überschrift ein hinweisendes "(XP)" hinzugefügt
24.12.08 - Erklärung zum Pifast-Vollbildtweak hinzugefügt
24.12.08 - "Allgemein" vor "Un-Tweak" geschoben
24.12.08 - Vermerkt dass HT-Link ebenso keinen Einfluss auf das wPrime-Ergebnis ausübt
24.12.08 - Nummerierung der Erklärung des Vollbild Pifast Tweaks nacheditiert
24.12.08 - wprime.net, pifast & DL links zu nützlichen links hinzugefügt
24.12.08 - wPrime-Betriebssystem; die unterlegenheit von Vista gegenüber XP SP3 angemerkt
24.12.08 - Allgemeine Tweaks hinzugefügt -> klassisches Theme
24.12.08 - Überschriften farblich hervorgehoben
24.12.08 - Ramtakt & Latenz Charakteristik d. Benchmarks zu "Lösenden Faktoren" hinzugefügt
24.12.08 - wPrime Abschnitt eine andere Farbcharakteristik verpasst (DarkOrange)
24.12.08 - Schlussworte gegliedert und bearbeitet; Pifast & wPrime überschriften auf "5" vergrößert und zentriert
24.12.08 - wPrime Tweak bearbeitet; Ursache ist nun klar CPU-Z 1.49!
24.12.08 - einen umgangssprachlich "bähmischen" satz neu formuliert...
24.12.08 - Wortdreher @Pifast "Ramtakt vs. Latenz" ausgebessert
24.12.08 - Pifast Performancerating in verschiedene cpus aufgeteilt schonwieder.. da sich beim Windsor ein anderes Bild abzuzeichnen scheint.
24.12.08 - Pifast und wPrime Diagramme in der Sparte "Ramtakt vs. Latenzen" eingefügt
24.12.08 - Windsor Performancerating hinzugefügt
24.12.08 - wPrime Tweakauswirkungen eingefügt
25.12.08 - Thumbnail fixed
25.12.08 - Grafik überarbeitet (wPrime 32m Ramtakt vs Latenz)
25.12.08 - Pifast;Betriebssystem -> "Performancerating" in "Systemübergreifende Vergleiche:" umgeändert (steht ja bei wPrime auch da, also -> vereinheitlichung)
26.12.08 - "Funktionierte mit diesen CPU's" zu CPU-Z 1.49 tweak hinzugefügt
11.1.09 - "AMD - Agena Performancerating" hinzugefügt
11.1.09 - Brisbane aus dem Pifast Performancerating entfernt (leer nützt eben nix...)
11.1.09 - Agena Performancerating @ Pifast resized + wPrime Thumbs qualität erhöht
28.1.09 - Links zu den einzelnen Abschnitten am "Threadstart" eingefügt
31.3.09 - Pifast "tweak" entfernt da "bugged runs" nicht erlaubt sind
18.7.09 - Formulierung des wPrime CPU-Z Tweaks überarbeitet da es nun sehr offensichtlich scheint dass es nur 90nm AMD's funktioniert (aber warum?? :confused:)
Nützliche Links
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Thx - update (werde das dann @phenom bzw. X2 testen)
 
Zuletzt bearbeitet:
Kleines Update!

thx @ Hyperluxx :)

Hab mich mal heute hingesetzt und werde voraussichtlich bis spätestens morgen nochmal ein größeres Update nachschieben.

Veränderungen sind in der Historie ersichtlich ;)
 
Zuletzt bearbeitet:
ich hab bei wprime die erfahrung gemacht dass es etwas bringt, wenn man dass wprime fenster möglichst schnell nach dem start minimiert

einziger nachteil ist, dass man nen fehler in der berechnung erst sieht wenn man weis wie lange wprime normal rennt und es dann zu der zeit noch nicht fertig ist

bzw bringt es bei wprime auch entwas wenn man mehrere runs hineineinader macht. der erste ist nie der schnellste

@ hydro

hast du auch XP ohne SP getestet?
 
Zuletzt bearbeitet:
Noch nicht aber hayabusa1300 hat mit SP0 = kein SP getestet.
 
ist aber auch ein intel und kein amd

wäre echt phat wenn du auch mit windsor und brisbane nen XP SP0, XP SP1, XP SP2, XP SP3, VISTA SP0, VISTA SP1 vergleich jeweils mit und ohne grafiktreiber machen könntest

wäre aber ne heiden arbeit :-(
 
Zuletzt bearbeitet:
hydrotoxin schrieb:
Hab mich mal heute hingesetzt und werde voraussichtlich bis spätestens morgen nochmal ein größeres Update nachschieben.
Daran arbeite ich grade ;)

€: Hatte grad ne idee.... Da der FP-Zugriff wirklich keine Rolle spielt einfach so mal 6 Windoofs auf einer FP installieren :eek:

€ (21.12 13:20): Wird noch unbestimmte zeit lang dauern, da es sich etwas schwierig gestaltet nen SP0 zu installieren... (frickel mir grad aus 2 zerkratzten SP0 cd's & evtl. ner SP2 nen SP0 zusammen xD)
 
Zuletzt bearbeitet:
Mußte grad feststellen das Vista bei nem 939er Manchester keinen Leistungszuwachs bringt :heul: .
 

Anhänge

  • w3.JPG
    w3.JPG
    144,7 KB · Aufrufe: 62
  • Unbenannt.jpg
    Unbenannt.jpg
    157,7 KB · Aufrufe: 78
gibn ihm doch mal mehr spannung!

zzum benchen verkraftet der kurzeitig bei normaler wako ohne probs 1,6V

bei wassertemps um die 0°C wie sie im freien derzeit sind, könntest du ihm für superpi 1m auch 1,7 oder so geben
 
Das wird schonnoch,ich will ja die nächsten Tage auch noch was zu tun haben :d .
 
Mußte grad feststellen das Vista bei nem 939er Manchester keinen Leistungszuwachs bringt :heul: .
Schade, aber das packst schon ;)

€:
XP SP0 ist eeeeendlich repariert und auf nem viruellen pc erfolgreich ausprobiert worden...
juhuu ^^
 
Zuletzt bearbeitet:
*doppepostistmirdochwurst*

Es hat sich einiges getan seit der Threaderstellung :)

Grund genug für : Update!

Was sich in der zwischenzeit geändert hat ist in der Historie ersichtlich.

Den OS vergleich + Ramtakt/Latenz skalierung der beiden benchmarks, bin ich noch schuldig, aber das sollte bald fertig sein ;)

Ebenso freue ich mich wenn ihr dieses berücksichtigt:
hydrotoxin schrieb:
wPrime
Tweaks
  • Echtzeitpriorität der x-Prozesse (x=Kerne bzw. Threads) die sich kurz nach dem start des benches öffnen.
    Daher sollte man sich dabei beeilen bzw. beim Nehalem kann man das @32m gleich vergessen...
  • Mehrmals den Bench durchlaufen lassen. Der erste durchlauf ist oftmals nicht der schnellste.
    Für den besten score der vll 0.2s unterhalb liegt braucht man manchmal sehr viele runs :/
  • Cpu-Z und Memset vor dem run öffnen und offen lassen.
    Bewirkte bei mir mit AMD X2 6000+ ein deutliches Leistungsplus von 0,7s (25,4s - 24,7s)
    Den genauen auslöser (cpu-z, memset) muss ich noch herausfiltern. Ebenso ob es sich mit anderen Cpu's gleich verhält.
    DAHER bitte erfahrungen hier im Thread posten, danke ;)
 
Zuletzt bearbeitet:
Freut mich wenns gefällt.

btw. bezieht sich dein tweak eher auf 1024m?
Hatte den eigentlich nur mit 32m ausprobiert und könnte gut möglich sein weshalb es bei mir noch nicht gefunzt hat.

Allg. Frage:
Soll ich bei den "Un-Tweaks" und dergleichen Screens zur verdeutlichung beileigen?

Ich könnte mir nämlich vorstellen dass das dann viel zu überladen sein könnte...
 
Zuletzt bearbeitet:
sowohl als auch

blos bei 32m muss man wirklich extrem schnell sein,damit es funkt!
 
Warum bringt den bei dir oben das installieren der Grakatreiber nix? Bei Pifast.
Danke dass du mich nochmals darauf hinweist. Das 2. ist das falsche pic.... ohne grakatreiber sind es mehr als 38s, hatte leider keine zeit mehr das in der zwischenzeit auszubessern.

€:fixed, aber nun habe ich einen kleinen fehler in einer grafik entdeckt ^^
€: der nun auch behoben ist.
 
Zuletzt bearbeitet:
Um darauf zurückzukommen:

http://www.wprime.net/?q=about
wPrime uses a recursive call of Newton's method for estimating functions, with f(x)=x2-k, where k is the number we're sqrting, until Sgn(f(x)/f'(x)) does not equal that of the previous iteration, starting with an estimation of k/2. It then uses an iterative calling of the estimation method a set amount of times to increase the accuracy of the results. It then confirms that n(k)2=k to ensure the calculation was correct. It repeats this for all numbers from 1 to the requested maximum.

[..........................blahhhh.............]

Name

So what's 'Prime' got to do with square roots? Well nothing, initially I had planned a Prime number calculator but no logical pattern for each prime number is known so it's difficult to confirm accuracy of the results. Square roots however, have a logical and simple reverse (the square).
 
Zuletzt bearbeitet:
Ich werde hoffentlich morgen (ist seit 14min schon heute^^) dazukommen einen möglichen wprime "tweak" den mir Graka vor längerer zeit schon gesteckt hat zu testen.

Genau geht es darum dass Singlechannel schneller sein könnte als Dualchannel[/Triplechannel(?)]

Hab das bisher mit zwei runs auf meinem 24/7 sys mit wprime 1024m runs bestätigen können (395s vs. 402s), sagt aber noch nicht viel aus
 
Hey!

Was ist denn jetzt besser für wPrime.

XP SP3 oder Windows 7?

gruß!
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh