nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Status
Für weitere Antworten geschlossen.
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

nVidia GK110/Geforce 7xx [Speku-, News- & Diskussionsthread]

nvidia-kepler-gk110-dmvid9.jpg

Dieshot eines GK110


Nachdem GK104 nun erschienen ist, wird das Themengebiet in den Sammler von Edge verschoben: http://www.hardwareluxx.de/communit...ches-bei-fragen-erste-seite-lesen-880765.html danke, an dieser Stelle für den Thread.

Hier soll es nun um GK110 gehen.


Short Facts:

Release: Tesla im Q4/2012, Geforce im Q1/2013
Zu erwartene Chips: sollte 7xx zutreffen dann 780, 770. Eine Dualversion kann man offiziel wohl ausschließen.

Daten zum Chip gibt es weiter unten.



1.1 Die Architektur

Nvidia hat auf der GTC viele neue Details zum GK110 verraten.

So soll der 7,1 Milliarden (!) Transistoren schwere Chip zuerst auf der Tesla K20 arbeiten, die gegen Ende des Jahres erscheinen soll. Mit dieser Masse an Transistoren stellt er den bis dato größten Chip der Geschichte dar. Desktoplösungen werden erst 2013 folgen, was zum einen niedrigen Yields als auch der bisher guten Position Nvidias in diesem Markt geschuldet sein kann.


Anders als beim GK104 bestizt GK110 pro SMX zusätzlich 64 DP-Einheiten um dort die Leistungsfähigkeit zu steigern (SP : DP = 3:1). Nicht ganz klar ist allerdings wie diese Einheiten aussehen. Bei Fermi arbeiteten einfach zwei Unified-Shader an einer DP-Berechnung, das hat den Vorteil keinen zusätzlichen Platz für DP-Einheiten aufbringen zu müssen. Würde NV bei GK110 nun wieder einen anderen Weg gehen dürfte die Chipfläche ohne massige erhöhung der Transistordichte nicht unter 600mm² bleiben. Immerhin müssten so 960 wietere Einheiten auf dem Chip untergebracht werden.
Auch der restliche Aufbau ist stark HPC orientiert, so kann ein Thread jetzt mehr Register nutzen als bei GK104 und mit Hyper Q sowie Dynamic Parallelism (Cuda 5.0) finden noch zwei weitere Features Einzug die GK104 nicht bot, aber für Desktopanwender keine Rolle spielen dürften. Allgemein ist GK110 stark Richtung HPC entwickelt worden, da in diesem Bereich der GK104 aufgrund mangenlder Fähigkeiten für DP nicht positioniert ist.

die-vergleich60uby.jpg

Die-Vergleich von GK110 und GK104. Achtung, die Größe ist nicht Maßstabsgetreu! (siehe weiter unten)

Für Spieler interessant könnte sein das NV angibt die TMUs nicht nur verdoppelt zu haben, sodern sie auch effizienter arbeiten. Ob man als Vergleich "nur" GF110 heranzieht oder wirklich GK104 ist zwar ungewiss, allerdings sprächen auch in letztem Fall die 240 TMUs für ausreichend Texturierleistung.

tesla_gk110_k20_3qtr_b38n0.jpg

Bild einer Tesla K20 Karte mit GK110





1.2 kleiner Chart

gk110v2nuaxd.jpg

1.3 Aussichten

Leistungsfähigkeit

Da Nvidia vor hat bei der Tesla K20 nur 13 oder 14 SMX zu aktivieren dürfte der Geforce wohl ein ähnliches Schicksal ereilen. Das steigert zum einen die Yields für NV und lässt natürlich auch Spekulationen über eine spätere Version mit allen Einheiten zu.

Ginge man von 13 SMX für die erste Version aus kämen wir bei einem halbwegs realistischen Chiptakt von 900 MHz auf 4,493 TFlops. Das wären immerhin ca. 45% mehr als bei GK104 (ohne Turbo). Dazu kommen noch die 208 verbleiben TMUs, was auch etwas 46% höhere Texturleistung bei 900 MHz entspricht und die um 50% höhere Bandbreite.

Summa Summarum scheinen 50% mehr Leistung also drin zu sein zum GK104, wieviel davon real bleibt muss man natürlich abwarten. Nvidia selbst gibt nur recht schwammige Aussagen über die Leistungsfähigkeit. So soll die DP-Leistung bei >1 TFlops liegen, was bei dem Ratio von 3:1 immerhin 3 TFlops SP bedeiten würde. Für die oben errechneten 4,5 TFlops sollten es dann aber schon 1,5 TFlops DP sein ;)


110104vergleich2w4uf7.jpg

Größenvergleich eines GK110 mit ca. 550mm² und einem GK104 mit ca. 295mm² (real sind es 294mm²)


Möglicher Refresh?

Interessant ist natürlich auch was bei einem Refresh zum GK110 drin wäre.

Ein Chip mit vollen SMX und einem höheren Takt von 950 MHz käme auf 5,472 TFlops, also ca. 21% mehr Leistung gegenüber der Version mit 13 SMX. Gleiche 21% gelten auch bei den Texturleistung.

Beim Speicher wird sich dagegen wohl kaum was ändern, denn GDDR5 scheint so langsam an seine bezahlbaren Grenzen zu kommen. Insgesamt wären also 15%+/- Mehrleistung drin um die Zeit bis Maxwell zu überbrücken.

Ob es so kommt weiß natürlich nur Nvidia selbst.


1.4 Linkliste

Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q (Golem, de)
GTC 2012: GK110-Grafikchip hat bis zu 2880 Shader-Kerne (heise, de)
GTC 2012: Die GK110-Schöpfer über Performance und zukünftige Herausforderungen (heise, de)
Nvidia gibt erste Infos zum großen Kepler GK110 bekannt (computerbase, de)
GK110: Weitere Details zur größten GPU der Welt [Update: Inside Kepler] (pcgh, de)
nVidias GK110-Chip mit 2880 Shader-Einheiten - im Gamer-Bereich aber erst im Jahr 2013 (3DCenter, de)






Thread im Aufbau!

Ich bitte alle User die an diesem Thread teilnehmen sich an eine gewisse Netiquette zu halten. Bitte lasst den Thread auch nicht zu einem Flamewar Rot gegen Grün verkommen sondern spekuliert aufgrund bekannter Fakten über den GK110. Versucht eigene Meinungen so wenig wie möglich in euren Post einfließen zu lassen, ebenso sind eure Wünsche und Kaufpläne evtl für andere User uninteressant.


Über ein Danke würde ich mich natürlich sehr freuen :wink:
 
Zuletzt bearbeitet:
Ich spiele derzeit nur WoW und Battlefield 3. Dank den neuem 13.2er läuft nun auch Battlefield in Verbindung mit 4xSSAA und OC maxed out super smooth. Da ich nur einen 60 Hz Monitor besitze und in FullHD spiele, wäre eine Titan für mich total oversized. Crysis 3 läuft in FullHD ebefalls super smooth, warum soll ich wechseln. Ich brauch kein SSGSSAAXYZ, was auch immer. :fresse:
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Crysis 3 läuft auf 1920 mit 4AA und allem auf hoch wirklich absolut ruckelfrei? Hört sich gut an, dann hält der Titan noch deutlich länger :)

Und dass man jetzt schon BF3 mit Ultra Einstellungen und 4SSAA ruckelfrei spielen kann....mein Gott:eek:
 
Crysis 3 läuft auf 1920 mit 4AA und allem auf hoch wirklich absolut ruckelfrei? Hört sich gut an, dann hält der Titan noch deutlich länger :)

Nene mit SMAA 2TX, was übrigens bei Crysis 3 deutlich besser aussieht als MSAA und performanter läuft, SMAA TX2 sieht bei Crysis besser aus als 8xMSAA.

SMAA 2TX:
http://www.imagebanana.com/view/dj21f1kr/Crysis32SMAA.png

8xMSAA:
http://www.imagebanana.com/view/d1odq7q3/Crysis38MSAA.png

Und dass man jetzt schon BF3 mit Ultra Einstellungen und 4SSAA ruckelfrei spielen kann....mein Gott:eek:

Mit 4xSSAA ist das schon anspruchsvoll, mit einer GPU.
 
Zuletzt bearbeitet:
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Ich habe ja einen dell 30"
Also eine 1600p Auflösung. Da ware ich froh, wenn der titan Power genug hat, auch mal far cry 3 mit 8xaa zu befeuern!

Gesendet von meinem GT-N7100 mit der Hardwareluxx App
 
Du hast uns doch selbst Screens mit um die 70 FPS oder so gezeigt im BF3 Thread wo die GPU Load niedrig war.
Durch noch mehr GPU LOad also viel mehr CPU Takt steigt die Load der GPUs weiter an und im gleichen Atem Zug auch deine FPS.

Hier von dir die Screens immer dicke am rum pimmeln die Karten das was dir fehlt ist CPU Power so schräg und absurt das auch klingen mag .
http://www.hardwareluxx.de/communit...hmarks-zu-bf3-bf3_2013_01_06_23_09_04_829.jpg
Pic-Upload.de - bf3_2013_01_06_23_09_04_829.jpg

Wenn du mut hast schreib den Powerplay an der hat nen Yamakasi Monitor .
Mit GTX 680ern sollen bis zu 140 Hertz raus zu holen sein bei 2560*1440 ich habe mich noch nicht getraut gibt auch nen Thread drüber hier im LUXX.

Hallo,
wenn das bei mir zutrifft
überspringe ich titan im sli und warte einfach bis ivry bridge E kommt.
eventuell wäre die option das 680 sli durch eine titan single zu ersetzten,
wobei ich anzweifle das die deutlich besser ist als das 680 sli.
naja wir werden es sehen, auf jeden fall bleibt es spannend.

kemen
 
Ja gibts immer noch keine konkreten Infos/Leaks? Die Katze spannt uns ja ganz schön auf die Folter. Nichtmal einen Teaser mit "are you ready"...
 
Hallo,
wenn das bei mir zutrifft
überspringe ich titan im sli und warte einfach bis ivry bridge E kommt.
eventuell wäre die option das 680 sli durch eine titan single zu ersetzten,
wobei ich anzweifle das die deutlich besser ist als das 680 sli.
naja wir werden es sehen, auf jeden fall bleibt es spannend.
In CPU Limit relevanten Situationen wird sie auf jeden Fall mit halten bringt man die Karte ins GPU Limit wird das 680SLI bestimmt schneller bleiben da ich nicht glaube das der Titan 100% auf die 680 bekommt .
 
Ich werd wohl - wenn die bisherigen Gerüchte sich als Wahr herausstellen - meine 680 GTX im Zweit-PC durch Titan ersetzen.
Simulationen wie pCARS skalieren derzeit im SLI noch recht mau. Da könnte Titan die Brücke bis zum Ende des Jahres schlagen.

Knapp 5 GHz sollten für 1 x Titan in FullHD reichen oder?
 
Nein, bis dato noch nicht.
Daher isses hinsichtlich SLI derzeit auch etwas "sinnlos".

Gerade deshalb könnte Titan da Abhilfe schaffen.
 
Was passiert, wenn du AFR mit 0x00000001 einfach anmachst?
Oder probier mal das, hat Google ausgespuckt:

shocking performance in triple screen until i remembered its the shift 2 engine so needs the sli fix, i renamed the cars.exe to "AFR-FriendlyD3D.exe" and that enabled sli, switching sli to afr2 in nvidia inspector
 
Spiele pCARS ja nicht (mehr) im SLI.
Hatte das letztes Jahr mal mit meinem Quad-SLI probiert, da wars grottig. Danach dann probeweise mal auf dem Haupt-PC im 680er SLI laufen lassen. War zwar - dank diverser - Änderungen der .exe besser aber bringt trotzdem derzeit noch nicht den gewünschten Effekt. Gerade im Regen brechen die FPS enorm ein (mit und ohne SLI).

2 x Titan i.V.m. ner 5 GHz Sandy-Bitch wird ja wahrscheinlich einen CPU-Bottleneck in FullHD (bei 120 Hz) geben oder? Zumindest, wenn ich die letzten Beiträge hier zwischen Kemen und Thunder verfolge.
 
100pro. 120fps schafft keine CPU in so einer Simulation außer vielleicht mit massivstem OC. Ende 2012 kam ein 4,5GHz 3770K auf gut 100fps, und ich bin mir sicher, das war nicht unbedingt ein Worst Case und konstante 100+ fps eh nicht.
Test: Grafikkarten 2012 (Anhang 17) - ComputerBase

Es sei denn, sie haben deutlich was optimiert inzwischen.
 
Vergesst nicht dass Kepler auch sehr vom Compiler abhängig ist. Fermi weniger. GK110 müsste ich jetzt konkret nachschauen, aber da ich auf Arbeit bin ist das erst mal schlecht ;) Glaube das ist wieder komplett in Hardware (scheduling, dispaching.. ).
Kenne pCars und deren Entwickler nicht also kann ich mich dazu nicht äußern. CD Projekt RED z.B. arbeitet sehr eng mit den Treiberteams beider IHVs.
 
5 GhZ und es geht immer noch Stellenweise runter auf 70 FPS bei GPu Loads von ca 75 % im CF oder SLi
 
Vergesst nicht dass Kepler auch sehr vom Compiler abhängig ist. Fermi weniger. GK110 müsste ich jetzt konkret nachschauen, aber da ich auf Arbeit bin ist das erst mal schlecht ;) Glaube das ist wieder komplett in Hardware (scheduling, dispaching.. ).

Unwarscheinlich das NV bei Kepler GK104 den Spaß aus der GPU genommen und in Software gegossen hat, und das man dies mit GK110 wieder ändert. Da man sich aus der Softwareimplementation genau einen Vorteil zum Fermi erschaffen wollte/hat.
Eventuell ändert es sich beim Nachfolger wieder. Wer weis... Aber bei Kepler ist es absolut unwarscheinlich. Zumal GK110 ja schon lange fertig ist... Und gemessen an K20/K20X "nur" grob ein halbes Jahr nach GK104 den Markt erreicht hat.

Man müsste um das zu ändern schon komplett zweigleichsig fahren. -> was widerum genau so unwarscheinlich ist.
 
gibts da schon dedizierte Infos zu den ARM Kernen?
Gehört habe ich davon auch schon... Aber soweit im Vorfeld kursieren ja viele viele Gerüchte, teils völlig ohne Sinn :fresse:

Eine Option wäre es aber sicher. Die Frage, die sich mir stellt, warum so einen Aufwand betreiben?
Die InGPU Hardwareimplementation hat sicher gewisse Speedvorteile. Aber auch gewisse Nachteile... Mit ner Software auf CPU Auslagerung legt man die Arbeit auf die CPU und verlässt sich drauf, das diese fix genug ist.
Aber ARM? Rein vom Speed her dürfte sich das zu ner Softwareimplementation auf CPU Basis wohl nicht viel nehmen.
Könnte aber auch einfach simpel darum gehen, den Spaß auf der Karte zu lassen. Aber mit ner Softwareimplementation die Flexibilität zu wahren. Und dedizierte x86 Technik kann Intel ja nicht... Auch AMD und Intel werden wohl da nicht mitmachen wollen. Ne ARM based CPU liegt also schon nahe für sowas. -> ob es dediziert was bringt?
Wir werden sehen, wie sich GK110 schlägt. Speziell CPU Skalierungstests könnten da Interessant sein.
 
Zuletzt bearbeitet:
Latenz? Muss nicht über den Bus. Und man hat es ja gemacht, um die Streamingprozessoren kleiner und sparsamer zu machen. Vielleicht würde man bei den ARM-Kernen eine andere Art von Transistor einsetzen, ähnlich wie beim 4+1 von Tegra. Damit hätte man beide Vorteile evtl. vereint - wieder besseres Scheduling (wobei ich da aktuell eigentlich keine Probleme sehe, man müsste mal die CPU-Last untersuchen bei Kepler vs Fermi im GPU-Limit) und trotzdem sparsame Rechenkerne.

Bei AMD ist das Scheduling aktuell in Software oder in Hardware?
 
Vergesst nicht dass Kepler auch sehr vom Compiler abhängig ist. Fermi weniger. GK110 müsste ich jetzt konkret nachschauen, aber da ich auf Arbeit bin ist das erst mal schlecht ;) Glaube das ist wieder komplett in Hardware

Das ist falsch. nVidia hat den Teil des Hardwareshedulings in den Treiber gepackt, der vorhersehbar ist. Kepler ist genauso wenig abhängig wie Fermi.
 
Wie schaut es eigentlich mit Patenten aus bei so Geschichten wie adaptivem VSync, Turbo etc.? AMD will auch einen Turbo wie bei Kepler einführen. Grundsätzlich natürlich schön, aber Ideenklau find ich jetzt nicht so prickelnd.
 
Was isn mit Hardwareluxx, habt ihr die Karte auch schon? Und dürft ihr nicht mal sagen, wann das NDA genau fällt? Wahrscheinlich genau am 25. :(
 
Mit Maxwell könnte man das Scheduling auf die ARM-Kerne legen? Ob das was bringt?

Wenn sich der Co Prozessor dann nicht in den Schwanz der CPU beißt,sollte das schon Entlastung bringen können.

Das ist aber derzeit wohl noch reichlich früh um da praxisnah zu philosophieren,daran denkt derzeit schließlich auch noch keine Spieleschmiede im entferntesten:)
 
Es wird Zeit das Informationslücken geschlossen werden.:heul:
Wenn sie rockt wird zu mindest 1 sofort gekauft.
Dann gibt es gleich im BF3 Thread Titan vs.1250MHZ HD7970 zu sehen.
Sollte er sie ohne OC nicht deklassieren geht der sofort wieder zurück.
Die Single Player Benchmarks sind fürn Po
 
Zuletzt bearbeitet:
Wenn sie rockt wird zu mindest 1 sofort gekauft.
Dann gibt es gleich im BF3 Thread Titan vs.1250MHZ HD7970 zu sehen.
Sollte er sie ohne OC nicht deklassieren geht der sofort wieder zurück.

Ist letzteres nicht eine Bedingung zum Rocken? :d Ich denke du steckst in einem Teufelskreis... :d
 
Das ist falsch. nVidia hat den Teil des Hardwareshedulings in den Treiber gepackt, der vorhersehbar ist. Kepler ist genauso wenig abhängig wie Fermi.

Ah, danke. Ich bin immer etwas tüdelig wenn es um solche Detailfragen geht daher sagte ich auch das ich glaube es sei so. GK110 hat aber ebenso wie Tahiti dynamic paralism und eben HyperQ. Das könnten wichtige Komponenten im Endergebnis sein. Auf K20x konnten 15% Zuwachs verzeichnet werden.
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh