[User-Review] Quad Sli

ap0k.

Neuling
Thread Starter
Mitglied seit
06.09.2009
Beiträge
388
Ich moechte hier ein kleinen Erfahrungsbericht posten, der sich nicht immer ausschließlich auf die "rohen" Benchmarks bezieht, sondern der sich insbesondere den Mikrorucklern und den anderen SLI Problemchen widmet.

Außerdem werde ich mich mit dem Leistungseinbruechen bei hohen Aufloesungen auseinander setzen und meine damit verbundenen Erfahrungen aussprechen.
Auch der Aspekt der Usebility wird naeher beleuchtet, da solch ein Systemaufbau nicht unbedingt alltaeglich ist.


Zu allererst mein Testsystem:
Intel Xeon w3520 @ 4.2Ghz HK3.0 LC
EVGA x58 SLI ENZOTECH evx-58
6GB Mushkin enhanced OC-Edition CL7 1600Mhz

Gekuehlt wird das ganze von 4 Aquacomputer Airplex 420 Radiatoren mit NB Blacksilend 140mm Lueftern, die mit etwa 550rpm drehen. Die Wassertemperatur gleicht meist etwa 28°.



Jetzt zu den Karten:
Ich benutze zwei GTX 295 die mit einem EK FC 295gtx gekuehlt werden.
Beide sind 16 fach angebunden. Forceware 259.31 und 270.61 wurde verwendet, da diese am besten funktionierten.

Die Taktraten:
Core Clock: 756Mhz
Shader Clock: 1630Mhz
Memory Clock: 1200Mhz
VCore: 1.174V

Damit ist ein Leistungsschub guten 30% drin (im Vergleich zu den Standardtaktraten), allerdings nur unter Vorbehalt. Aber dazu spaeter mehr.



Benchmarks in 5760x1080 Pixeln:

F1 2010 (Max Sets, AF 8x, AA 2x) = 51 fps (min fps: 45,5)

Dirt 2 (Max Sets, AF 8x, AA 2x) = 60 fps (min fps 49,5)

BF Bad Company 2 (DX9! sonst alles Max, AF 8x, AA 2x) = 62 fps (Multiplayerdurchschnitt)

Crysis 2 (Max Sets, 8x AF, AA 2x) = 38 fps (min fps: 17!)

TF2 (Max Sets, 8x AF, AA 2x) = 90 fps (Hier ist der Bildratenunterschied enorm groß, jedoch nie unter 60 Frames. 60-135, die Spielbarkeit leidet hierunter mMn nicht, da die FPS noch ausreichend sind.)

Spiele mit der Unreal Engine 3 habe ich nicht mit einbezogen, da die Frames sehr denen der Source Engine aehneln. Außerdem geraet die Bildrate nie in den roten Bereich, sodass eine genauere Untersuchung eher unwichtig ist. Egal ob in 1920x1080 oder in 5760x1080.



Vergleich zu konventionellen Aufloesung (1920x1200) am Beispiel F1 2010:

F1 2010 habe ich deshalb als Beispiel genommen, da es recht Vram lastig ist und ich mir dachte, dass es interessant sein koennte das Verhalten der im "Forum-verschriehenen Vramkrueppel" zu untersuchen.
Außerdem hat die Ego Engine in vielen Spielen Verwendung gefunden, sodass die Ergebnisse teils uebertragbar sind. Die Sets sind bei allen Test gleich; Max, AF 8, AA 2)

F1 2010 1920x1200 = 65 fps Mit Werkstaktraten (576Mhz...)

F1 2010 1920x1200 = 74 fps Mit den oben erwaehnten Taktungen (756Mhz...)

F1 2010 5760x1080 = 38 fps Mit Werkstaktraten (576Mhz...)

F1 2010 5760x1080 = 51 fps Mit den oben erwaehnten Taktungen (756Mhz...)

Hier sieht man schoen, dass die hoeheren Taktraten erst bei wirklich hohen Aufloesung ein im Verhaeltnis besseres Ergebnis liefern.


Besonderheiten/Auffaelligkeiten: Die FPS in 1920x1200 sind meist nahezu identisch bei 3x SLI und bei 4x SLI (Unterschiede im Zehntelbereich). Allerdings ist 3x sli hier vorzuziehen, da durch die nun staerker bemerkbaren Mikroruckler (bei 4x SLI) Anwendungen unspielbar werden.

In 5760x1080 zeigt sich ein deutliches Leistungsplus bei der Verwendung von 4 GPU's, wodurch der geringe Unterschied von 74 zu 51 fps zu erklaeren ist.

Erstaunlich ist außerdem, dass die Min FPS nicht besonders niedrig sind, obwohl der Speicher etwas unterdimensioniert ist.


Ebenso ist bemerkenswert, dass die 4 GPU's ueberraschend gut skalieren! Viel besser als in 1920x1200. Die dazukommenden hohen Taktraten fuehren dazu, dass die Karten wirklich schnell werden.

Hier der Vergleich von zwei gtx 580 bei nahezu gleichen Einstellungen.

2x GTX 580 --> F1 2010 = 55 FPS

4x GTX 26(5) --> F1 2010 = 51 FPS


SLI Probleme:
Hierzu wurden 1 GTX 260, 2 GTX 260, 3 GTX 260 und 4 GTX 260 getestet.

Mikroruckler treten ab 2er SLI auf (logisch). Jedoch sind diese ab 30 fps eher dezent und wirklich kaum auffaellig. Allerdings gibt es vereinzelnd den ein oder anderen heftigen Ruckler (der sich allerdings nur schlecht messen laesst, da die Aktuallisierungsrate vom Afterburner zu niedrig ist, sodass keine Kellerframes angezeigt werden).

3er SLI verhaelt sich mitlerweile nahezu gleich wie ein 2er SLI System.

Bei 4 GPU's wird dann alles anders; jedenfalls bei Singlemonitorbetrieb.
Denn auch ueber 100 Frames erscheinen die Spiele nicht richtig fluessig. Daher ist Quad SLI voellig unbrauchbar. Gerade auch deswegen, weil sich meist KEIN Leistungsplus einstellt, auch wenn Nvidia was anderes verspricht (CB hat einen Quad SLI Test der GTX 295 (Quad 260 in 55nm) veroeffentlicht, der ein Leistungsplus von Quad zeigt. Das jedoch nur wenn man es mit dem 2er SLI Modus vergleicht. Meist zeigen 3er SLI Kombos gleiche Leistungen wie die Quadsysteme).

Sollte man jedoch ein Quad SLI System und ein Multimonitorsystem benutzten wird Quad sli wieder interessanter. Denn durch NV's Surroundtechnologie steuert (bei meinem System) GPU 4 Monitor 3 an. Dadurch treten die typischen Quad SLI Probleme NICHT auf.
Erst ab der magischen Grenze von 30 Frames wirds kritisch und die typischen Probleme treten ein.


Generell begleitende SLI Probleme: Schattenflimmern, schlechtes FPS-zu-Energiebedarfsverhaeltnis, Treibersupport bei neuen Engines.


"Plug-in and Play" oder "... ich hol' schomal den Bleistift raus zum Voltagetweak."?
Die Verwaltung der 4 GPU's ist nicht zu vergleichen mit einem konventionellen 2er SLI System und man muss schon ziemlich leidensfaehig sein damit man irgendwann dann auch beim Spielen Spaß hat. FOV Mods (usw.) sind darin dann noch nicht erhalten.

Es gibt einfach noch große Probleme mit dem Treibersupport. So koennen die GTX 260 bis zur Treiberfamilie 260.xx kaum mehr als 2x AA in 5760x1080 dastellen, obwohl eigentlich mehr Leistung vorhanden ist. ( Bsp.: TF2 2AA = 90FPS; TF2 4AA 25 FPS --> Absturz in den 2d Modus mit den entsprechenden Taktraten)

Außerdem ist auffaellig, dass solch ein System ohne Wakue kaum zu kuehlen ist, da die 4 GPU's in 5760x1080 erstaunlich gut skalieren, sodass natuerlich auch die Hitzeentwicklung stark zunimmt. Gerade dann noch bei knappen 1.2V und bei zunehmender Verdreckung des Lu-kuehlers wirds dann sehr schnell eng und die 105° werden schnell erreicht.

Bringt man dann doch irgendwann alles richtig zum Laufen, steht dem Spielespaß nichts mehr im Wege.
Daher wuerde ich's jeder Zeit wieder machen, da das System außerdem sehr guenstig war.

Konsten
2 GTX 295 mit EK Wasserkuehler wurden vor etwa 2 Monaten gekauft, fuer 240.-
(via HWLUXX Forum und ebay)



Vor- und Nachteile:

Vorteile:

+Die 4 GPU's skalieren im Surroundsetup wirklich gut

+Sehr dezente Mikroruckler bei NV Surround

+Vram (der mit 896 knapp bemessen ist) offenbart trotz der hohen Aufloesung bis 2 AA kaum Engpaesse

+Große Anschlussmoeglichkeiten bei 4 GPU's

+4 CUDA GPU's

+Letztendlich sehr gute Leistungen (Wenn man bei AA Abstriche machen kann blaest man so ziemlich
alles weg was man beim Großhaendler bekommen kann)

Nachteile:


-Viel Bastelarbeit/schlechter Treibersupport

-Katastrophale Energieeffizienz

-Mehr oder weniger Wakuepflicht

-Mikroruckler, die bei 4x SLI zur Unspielbarkeit fuehren, sofern alle GPUs einen Monitor ansteuern

-Mehr als 8xAA in 5670x1080 sollte nicht benutzt werden

-Fuer Singlemonitorsysteme eher unsinnig, da alle Spiele in 1920x1200 auch schon mit guenstigen Karten fluessig spielbar sind.



Fazit:
Es gibt eine ganze Menge Erkenntnisse, die ich bei meinen Tests gewonnen habe.
(Zwar wurde hier alles anhand der etwas eingestaubten g200b Chips in 55nm getestet, jedoch denke ich, dass die Ergebnisse auf aktuellere GK-Generationen uebertragbar sind und sich dort aehnliche Ergebnisse zeigen werden.)

Zum einen faellt auf, dass die hohen Aufloesungen zwar eine gewisse Groeße des Vrams voraussetzen, jedoch keines Falls mehr als 2GB oder aehnliches voraussetzen.
Zum anderen ist interessant, dass die Skalierung der Karten in hohen Aufloesungen wirklich gut ist und dadurch nicht mit uebermassigen FPS Einbruechen gerechnet werden muss.

Trotzdem kann ich eine Empfehlung fuer solch ein System beim besten Willen nicht aussprechen, da der Stromverbrauch und die erbrachte Leistung in keinem gesunden Verhaeltnis stehen und die Bastelfreude beim User schon enorm groß sein muss.
(Behalten werde ich mein System vorerst trotzdem ;))



Abschließende Worte

Ich hoffe mein Bericht hat euch gefallen und sollten noch Fragen, Anregungen oder Verbesserungsvorschlaege euch einfallen, schreibts mir. Ueber Feedback wuerde ich mich sehr freuen.
(Es ist jetzt halb 4 in der Nacht und ich bin komplett muede; sollten also Rechtschreibfehler oder grammatikalische Faux-Pas' im Text enthalten sein, so entschuldigt es bitte.)

Edit.: Hier noch ein paar Bilder vom System, dem Monitorsetup und der Benchsession.
Bild: 20110612_01097r6.jpg - abload.de

Bild: 20110612_009j75x.jpg - abload.de

Bild: 20110612_005p7ny.jpg - abload.de

Nachtrag: Auslastungsverteilung anhand der GPU usage.

TF2

GPU1=45%
GPU2=46%
GPU3=50%
GPU4=51%
FPS= 111


GPU1=42%
GPU2=41%
GPU3=50%
GPU=50%
FPS: 120

Dirt2

GPU1=53%
GPU2=52%
GPU3=62%
GPU4=61%
FPS: 59


GPU1=53%
GPU2=53%
GPU3=61%
GPU4=62%
FPS: 64


GPU1=53%
GPU2=54%
GPU3=63%
GPU4=62%
Fps: 63

Auffaelligkeiten/Analyse: Die Verteilung der Last ist recht gut geloest, da sich eigentlich alle Auslastungdifferenzen im Bereich von unter 18% bewegen.
Was mich jedoch wundert, ist die eigentlich sehr geringe Auslastung der GPUs. Denn die gelieferte Leistung duerfte eigentlich bei solch geringen Auslastungen nicht erbracht werden koennen.

Daher spekuliere ich, dass das Auslastungsoptimum nicht bei 100% liegt, sondern weit darunter. Die Annhame, dass der Afterburner nicht absolut ist, ist bei dem recht unkonventionellen Setup sicherlich nicht ganz abwegig.
Die Lastenverteilung ist also ueberraschend gut (fuer Quad), daher sind auch Bildrateneinbrueche selten.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Hi ap0k.
sehr interessanter Test...

Vor allem interessiert mich die Aussage:
"-Mikroruckler, die bei 4x SLI zur Unspielbarkeit fuehren, sofern alle GPUs einen Monitor ansteuern"

Hast du dazu mal genauere Angaben, was wie und wo genau getestet wurde?
Mich würde dazu noch interessieren, ob du davon mal Frametime Aufnahmen machen kannst... Also ne Szene raussuchen. Und mal mit Fraps Frametimes aufzeichnen für ein paar Sekunden. Das gleiche dann mit dem zweiten Setup. Und am besten hier hochladen ;)

Ansonsten ist noch auffällig an deinem Test, die GPU Auslastungen sind irgendwie ziemlich mau. Könnte an einer zu schwachen CPU liegen. Oder im allgemeinen fehlt Bandbreite bei der Syncronisierung der GPUs. (über den SLI Connector/PCIe Bus)

Könntest du in dem Zusammenhang mal mehr/weniger CPU Takt gegenprüfen?
 
Wuerde ich sofort machen, aber leider ist gestern mein Board uebern Jordan gegangen. Die Tests werde ich natuerlich versuche nachzureichen.

-Mikroruckler, die bei 4x SLI zur Unspielbarkeit fuehren, sofern alle GPUs einen Monitor ansteuer

Es scheint so als wuerde GPU 3 und 4 (also die 2te GTX 295) das Bild fuer den Monitor 3 seperat erstellen, daher ist die Problematik mit den Microrucklern nicht so auffaellig wie im Single Monitorbetrieb.
Als Beweis fuer meine Annahme habe ich einmal die Taktraten der 2ten gtx 295 in den Keller gesetzt und geschaut ob sich die Bildwiederholrate auf allen Bildschirmen veraendert oder nur auf einem. Als Ergebnis stellte sich heraus, dass das Bild des Monitors3 (der von gpu 3 und 4 anscheinend speziell angesteurt wird, dessen Taktraten niedriger sind) stockte, waehrend die Fluessigkeit der Bildabfolge auf Monitor 1 und 2 nicht betroffen war.
 
Mhhh das ist äußerst komisch. Denn das Absenken der Taktraten von einer GPU (oder von zweiten) hat zur Folge, das auch alle anderen GPUs im Verbund takte aussetzen. Bzw. die Last niedriger wird.

Interessant wäre noch zu wissen. Welcher Rendermodi verwendet wurde (also AFR oder SFR)
Im AFR rechnet jede GPU ihr Bild selbst alleine. Es werde bei vier GPUs eben drei Bilder im vorraus berechnet. Bei allen anderen Rendermodi rechnen alle GPUs an einem Bild.

Ich frage deshalb, weil theoretisch geht das gar nicht was du schreibst. Die FPS Rate kann gar nicht auf nur einem Bildschirm weniger werden. Auf den anderen beiden aber nicht!?

Vllt kann sich dazu auch mal jemand anderes noch äußern, der sowas mal nachstellen könnte. (müssen ja nicht zwei Dual GPU Karten sein, sondern können auch mehrere SingleGPU Kartens ein)
 
Das ja krass... Beim ersten Video hängt die linke Anzeige ja extrem...

Was passiert eigentlich wenn du den rechten Monitor auch noch an die Karte klemmst, wo jetzt der linke steckt?
Also so das nur die Mitte von Karte 1 (GPU 0/1) angesteuert wird?


Ansonsten, kannst du mal ein Bild vom SLI Menü im Treiber hochladen?
Dort wird ja auch gezeigt auf dem Bild, wie die Monitore klemmen (an welchen GPUs/Karten)
 
Ich hab's mehrfach ausprobiert und jedes mal wenn bei einer der beiden gtx 295 die Taktraten hinutersetze ist die entsprechenden Bildwiederholraten des angeschloessenen Display(s) stockend.
Bei der Karte mit den hohen Taktraten dagegen ist alles fluessig.

Ansonsten, kannst du mal ein Bild vom SLI Menü im Treiber hochladen?
Dort wird ja auch gezeigt auf dem Bild, wie die Monitore klemmen (an welchen GPUs/Karten)

Schick mir 'n EVGA x58 sli rueber und ich machs sofort :d
 
Zuletzt bearbeitet:
Ich hab's mehrfach ausprobiert und jedes mal wenn bei einer der beiden gtx 295 die Taktraten hinutersetze ist die entsprechenden Bildwiederholraten des angeschloessenen Display(s) stockend.
Bei der Karte mit den hohen Taktraten dagegen ist alles fluessig.

Hab ich das jetzt richtig verstanden, wenn die GPUs alle hoch takten, so läuft es dennoch flüssig?
Weil in dem verlinkten von mir oben (#2) liest es sich so, als wären MR anders Wahrnehmbar, wenn die Monitore anders stecken. (von allen GPUs berechnet werden, was sie ja auch eigentlich immer tun)
Daher die Frage...


Schick mir 'n EVGA x58 sli rueber und ich machs sofort :d

mhhh stimmt... Ich vergaß :fresse:
 
Hab ich das jetzt richtig verstanden, wenn die GPUs alle hoch takten, so läuft es dennoch flüssig?
Weil in dem verlinkten von mir oben (#2) liest es sich so, als wären MR anders Wahrnehmbar, wenn die Monitore anders stecken. (von allen GPUs berechnet werden, was sie ja auch eigentlich immer tun)
Daher die Frage...

Die Monitore und Karten stecken alle komplett identisch bei beiden Videos. Beim ersten Video laufen GPU 1/2 bei 756MHz Settings. GPU 3/4 dagegen nur bei 400Mhz.
Ergebnis: Die Bildabfolge von dem rechten Monitor und dem mittigen ist fluessig. Beide Displays haengen an GPU 1/2 (also der ersten gtx 295 mit 756Mhz)
Die Bildabfolge vom linken erscheint als stockend. Dieses Display haengt an GPU 3/4 (400Mhz).

Bei dem zweiten Video sind alle Karten gleich schnell getaktet und alles funktioniert problemlos und es erscheint alles fluessig.
 
Also ist der eine Punkt in den Nachteilen doch nicht treffend? Oder wie?
Irgendwie steh ich nun aufm Schlauch :fresse:
 
Also ist der eine Punkt in den Nachteilen doch nicht treffend? Oder wie?
Irgendwie steh ich nun aufm Schlauch

Doch schon. Aber nur wenn alle 4 GPU's einen Monitor in z.B 1920x1200 befeuern. Bei 3 Displays in Surround gibts komischerweise diese extremen Mikroruckler nicht.
 
Indem man 2 gtx 295 sli schaltet. Denn eine gtx 295 ist sind exakt 2 gtx 260 in 55nm.
 
Eine GPU der 295er entspricht keiner single Karte der 200er Gen. ;)
Die 295GTX hat 240 1D ALUs, wärend ne 260GTX nur 192/216 davon hat.
Takttechnisch ist sie aber auf dem Level der 260er und nicht der 280/285er...

Am nähesten kommt eine GPU der 295er noch ner 275GTX... Auch wenn diese immernoch paar MHz höher taktet ;)
 
Ochja, stimmt. Das habe ich ja komplett uebersehen. Zonk!
Danke fuer den Tipp.
 
Ich denke aber auch, das ist ein Punkt, der äußerst unwichtig ist ;)
 
ap0k., probierst du mal den fps-Limiter, der bei diesem Programm integriert ist, aus?

Dxtory.com | Home

Sollte Mikroruckler komplett eliminieren. Kannst ja mal berichten :)
 
Mein Testsystem hat sich ja gestern leider verabschiedet. Daher wirds im Moment mit einem Test etwas schwer...
 
Sollte Mikroruckler komplett eliminieren. Kannst ja mal berichten :)

Ich glaube eher das es bei seinem Setup eine Mischung aus Bandbreitenlimitierung wegen Vram Mangels und unausgegorenenen SLI Profilen sein wird

Mit ner Karte die 896 MB an Speicherpotential vorzuweißen hat für Full HD und mehr,solche Settings fahren zu wollen beschwört ja falsche Interpretationen die nicht im vollem Umfang einer MR Problematik zuzuordnen sind herauf

Wenn der Speicherbus dicht ist dann fängts an zu Ruckeln egal wie gut die Multi GPU Profile im allgemeinen sind
 
Zuletzt bearbeitet:
Hi,

ich hatte ebenfalls mal ein System Core I 7 4,2 Ghz mit 2 * 295 GTX, also Quad SLI und kam praktisch zur gleichen Erkenntnis, allerdings ohne diese ausführlichen Tests.
SLI und 3 Way SLI skalieren sehr gut und sind absolut empfehlenswert, Quad SLI mit 2 * 295 GTX ist allerdings eine Katastrophe. Habe mit den 2 * 295 GTXn einen Monitor angesteuert und konnte nahezu kein Game aufgrund der Mikroruckler flüssig zoggen => Spielspaß gleich 0, man meint man zoggt mit 10-30 FPS durchgehend, bekommt allerdings 60-100 FPS angezeigt. Achja hinzu kommt dass die 295er auf nahezu keinen Treiber einwandfrei im Quad SLI läuft, hatte auch nur einen älteren Treiber auf welchen ich überhaupt Quad SLI aktivieren konnte in der Nvidia Systemsteuerung, bei den neueren Treibern war kein Quad SLI mit 2 * 295 GTX möglich.
Nur meine Erfahrungen so am Rande;-)

Gruß
Tawwa
 
Bei mir hats auch mit dem 258.xx und dem 259.xx am besten funtioniert. Aber auch mit dem 270er ging noch manchmal 'ne Menge. Das Merkwuerdige ist halt nur, dass man im Surroundmodus verhaeltnismaessig wenig Probleme hat.
 
Ja vll war das auch nur mit den 295er ein Problem, mich würde mal interessieren wie heute Quad SLI funktioniert mit 4 * 560, 570, 580 GTX oder
480,470,460 GTX oder 4 * 285 GTX.
Mit den alten Karten war ja nur mit der 285 GTX von EVGA 4 Way SLI möglich?
Und eben die 295 GTX.

Gruß
Tawwa
 
Ob 4 Way sli mit einer gtx 285 bin ich mir nicht so sicher. Ich meine erst bei der 480 bei irgendeinem Treiberupdate gelesenzuhaben "adds 4 way sli support for the gtx 480". Ob das ganze abwaertskompatibel war/ist weiß ich nicht.
 
Übrigens, zu beachten ist auch, 4Way SLI geht nur bei DX10 und 11 ;)
Wird DX9 gebencht, so skallieren im max. nur drei Karten... Weil das prerenderlimit bei DX9 hart auf 3 steht. Es können also nur drei Bilder im AFR Modus berechnet werden.
SFR könnte hingegen gehen. Aber SFR skalliert sehr mau ;) (und wird nahezu nicht verwendet)
 
Mag sein, trotzdem erhalte ich in DX9 mit sli x4 bei NV Surround bessere Leistungen als mit sli x3.

Ich bin mir der Problematik des Vorrenderlimits bewusst (auch wenns man es in der Forcewear auf 8 einstellen kann, ist in DX nicht mehr als 3 drin), aber in meinen Test in NV Surround klappts mit 4er besser.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh