nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Status
Für weitere Antworten geschlossen.
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

nVidia GK110/Geforce 7xx [Speku-, News- & Diskussionsthread]

nvidia-kepler-gk110-dmvid9.jpg

Dieshot eines GK110


Nachdem GK104 nun erschienen ist, wird das Themengebiet in den Sammler von Edge verschoben: http://www.hardwareluxx.de/communit...ches-bei-fragen-erste-seite-lesen-880765.html danke, an dieser Stelle für den Thread.

Hier soll es nun um GK110 gehen.


Short Facts:

Release: Tesla im Q4/2012, Geforce im Q1/2013
Zu erwartene Chips: sollte 7xx zutreffen dann 780, 770. Eine Dualversion kann man offiziel wohl ausschließen.

Daten zum Chip gibt es weiter unten.



1.1 Die Architektur

Nvidia hat auf der GTC viele neue Details zum GK110 verraten.

So soll der 7,1 Milliarden (!) Transistoren schwere Chip zuerst auf der Tesla K20 arbeiten, die gegen Ende des Jahres erscheinen soll. Mit dieser Masse an Transistoren stellt er den bis dato größten Chip der Geschichte dar. Desktoplösungen werden erst 2013 folgen, was zum einen niedrigen Yields als auch der bisher guten Position Nvidias in diesem Markt geschuldet sein kann.


Anders als beim GK104 bestizt GK110 pro SMX zusätzlich 64 DP-Einheiten um dort die Leistungsfähigkeit zu steigern (SP : DP = 3:1). Nicht ganz klar ist allerdings wie diese Einheiten aussehen. Bei Fermi arbeiteten einfach zwei Unified-Shader an einer DP-Berechnung, das hat den Vorteil keinen zusätzlichen Platz für DP-Einheiten aufbringen zu müssen. Würde NV bei GK110 nun wieder einen anderen Weg gehen dürfte die Chipfläche ohne massige erhöhung der Transistordichte nicht unter 600mm² bleiben. Immerhin müssten so 960 wietere Einheiten auf dem Chip untergebracht werden.
Auch der restliche Aufbau ist stark HPC orientiert, so kann ein Thread jetzt mehr Register nutzen als bei GK104 und mit Hyper Q sowie Dynamic Parallelism (Cuda 5.0) finden noch zwei weitere Features Einzug die GK104 nicht bot, aber für Desktopanwender keine Rolle spielen dürften. Allgemein ist GK110 stark Richtung HPC entwickelt worden, da in diesem Bereich der GK104 aufgrund mangenlder Fähigkeiten für DP nicht positioniert ist.

die-vergleich60uby.jpg

Die-Vergleich von GK110 und GK104. Achtung, die Größe ist nicht Maßstabsgetreu! (siehe weiter unten)

Für Spieler interessant könnte sein das NV angibt die TMUs nicht nur verdoppelt zu haben, sodern sie auch effizienter arbeiten. Ob man als Vergleich "nur" GF110 heranzieht oder wirklich GK104 ist zwar ungewiss, allerdings sprächen auch in letztem Fall die 240 TMUs für ausreichend Texturierleistung.

tesla_gk110_k20_3qtr_b38n0.jpg

Bild einer Tesla K20 Karte mit GK110





1.2 kleiner Chart

gk110v2nuaxd.jpg

1.3 Aussichten

Leistungsfähigkeit

Da Nvidia vor hat bei der Tesla K20 nur 13 oder 14 SMX zu aktivieren dürfte der Geforce wohl ein ähnliches Schicksal ereilen. Das steigert zum einen die Yields für NV und lässt natürlich auch Spekulationen über eine spätere Version mit allen Einheiten zu.

Ginge man von 13 SMX für die erste Version aus kämen wir bei einem halbwegs realistischen Chiptakt von 900 MHz auf 4,493 TFlops. Das wären immerhin ca. 45% mehr als bei GK104 (ohne Turbo). Dazu kommen noch die 208 verbleiben TMUs, was auch etwas 46% höhere Texturleistung bei 900 MHz entspricht und die um 50% höhere Bandbreite.

Summa Summarum scheinen 50% mehr Leistung also drin zu sein zum GK104, wieviel davon real bleibt muss man natürlich abwarten. Nvidia selbst gibt nur recht schwammige Aussagen über die Leistungsfähigkeit. So soll die DP-Leistung bei >1 TFlops liegen, was bei dem Ratio von 3:1 immerhin 3 TFlops SP bedeiten würde. Für die oben errechneten 4,5 TFlops sollten es dann aber schon 1,5 TFlops DP sein ;)


110104vergleich2w4uf7.jpg

Größenvergleich eines GK110 mit ca. 550mm² und einem GK104 mit ca. 295mm² (real sind es 294mm²)


Möglicher Refresh?

Interessant ist natürlich auch was bei einem Refresh zum GK110 drin wäre.

Ein Chip mit vollen SMX und einem höheren Takt von 950 MHz käme auf 5,472 TFlops, also ca. 21% mehr Leistung gegenüber der Version mit 13 SMX. Gleiche 21% gelten auch bei den Texturleistung.

Beim Speicher wird sich dagegen wohl kaum was ändern, denn GDDR5 scheint so langsam an seine bezahlbaren Grenzen zu kommen. Insgesamt wären also 15%+/- Mehrleistung drin um die Zeit bis Maxwell zu überbrücken.

Ob es so kommt weiß natürlich nur Nvidia selbst.


1.4 Linkliste

Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q (Golem, de)
GTC 2012: GK110-Grafikchip hat bis zu 2880 Shader-Kerne (heise, de)
GTC 2012: Die GK110-Schöpfer über Performance und zukünftige Herausforderungen (heise, de)
Nvidia gibt erste Infos zum großen Kepler GK110 bekannt (computerbase, de)
GK110: Weitere Details zur größten GPU der Welt [Update: Inside Kepler] (pcgh, de)
nVidias GK110-Chip mit 2880 Shader-Einheiten - im Gamer-Bereich aber erst im Jahr 2013 (3DCenter, de)






Thread im Aufbau!

Ich bitte alle User die an diesem Thread teilnehmen sich an eine gewisse Netiquette zu halten. Bitte lasst den Thread auch nicht zu einem Flamewar Rot gegen Grün verkommen sondern spekuliert aufgrund bekannter Fakten über den GK110. Versucht eigene Meinungen so wenig wie möglich in euren Post einfließen zu lassen, ebenso sind eure Wünsche und Kaufpläne evtl für andere User uninteressant.


Über ein Danke würde ich mich natürlich sehr freuen :wink:
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ein interessanter Plan björn .
Scheisse sieht schon geil aus das Bild von Chip Hell fast zu schade auf Wakkü zu bauen.
 
Wenn ich mir die 690 nochmal anschaue, sieht Titan aus, als ob man die 690 einfach in der mitte durchgeschnitten hätte und die eine hälfte dann auf Titan gesetzt hätte:fresse:
 
Basistakt liegt wohl bei 837 MHz, Turbo bei 876 MHz und die TDP beträgt 250W.

http://www.abload.de/img/8pydhazdkdrs.jpg

Rein von der Rohleistung würde das Titan 45-50% (durchschnittlichen Turbo vs durchschnittlichen Turbo) schneller machen als eine GTX680, evtl. "IPC"-Steigerungen nicht berücksichtigt.

Könnte schon hinkommen. Auch wäre der GPU Powerboost angemessen bei 50% mehr Bandbreite.

Misst man es mal aus der 670er Sicht, die ein ausgewogeneres Verhältnis zwischen Rohleistung und Bandbreite hat als die 680er wären das:
ca. 50% mehr Bandbreite sowie ca. 78,8% mehr Rohleistung.

Gemessen daran, das die 680er ca. aus 20% mehr Rohleistung bei gleicher Bandbreite ~10% mehr FPS ziehen kann, würde das bedeuten, Titan skaliert auf eine 670er mit guten 50% 1:1 zwischen Rohpower + Bandbreite. Bleibt (1,788/1,5) 1,192 übrig. Diese annähernd 20% dürften analog der 680er 2:1 skalieren. Heist also 1,5*1,1. Wären gute 65% über ner 670er.
Und somit gute ~50% über ner 680er im Mittel.
Natürlich nur, wenn kein CPU Limit oder sonstige Handbremsen...

Zu der ROP Leistung ist aber nach wie vor nix bekannt. Könnte durchaus sein, das da noch ein paar Prozente liegen bleiben... Aber alles in allem wirds schon kein Beinbruch.

PS: box, sollte das so stimmen, hättest du natürlich recht mit deinen ~50% auf die 680er von vor ein paar Wochen.
Ich muss aber zu meiner Verteidung sagen, das man aktuell von ~250W ausgeht. Damals waren ja um die 225-235W im "Gespräch" ;)

Na das ist doch ne Win Win Situation für dich zweimal Hardware zum anfassen:d

Wieso zwei? Wenn dann drei... Oder soll sein Frauchen sich für links oder rechts entscheiden? :fresse:

Ich wäre mir da gar nicht mal so sicher. Es würde ja schon reichen einem GK204 nen 384Bit SI draufzuschnallen ->und schon sind mindestens 15% mehr Performance sicher. Mehr Einheiten und mehr Takt und schon sollte man bei rund 30% sein. Falls AMD auch 15% auf die HD 7970 GHz Ed. drauflegt wäre man wieder grob gleichschnell, ohne aber den Titan ernsthaft zu gefährden. Aber wohl erst ende des Jahres.

Ich glaube nicht an einen zweiten Chip mit 384Bit SI... Ich könnte eher vorstellen, man sitzt den ganzen Kram noch weiter aus und geht dann auf GDDR6...
Ggf. noch den Zwischenschritt mit noch höher taktenden GDDR5 Modulen. 3,3-3,5GHz scheinen ja zumindest sogar spezifiziert möglich. Das wären immernoch gute 10-15% über aktuellen Ausführungen.

Btw das Plus an Speicher soll abgesehen vom "Standby"-Verbrauch bei der Leistungsaufnahme keinen Unterschied machen, da der Energieverbrauch bandbreitenabhängig ist. Hier eine anschauliche Erklärung von skysnake aus dem 3DC:

...

LKWs = Speicherchips
Fahrer = benutzte Speichercontroller

Ich sagte ja von Anfang an, das der Speicherverbrauch nicht so extremst ist...
Wobei ich diese bildliche Erklärung irgendwie nicht so 100% treffend finde.
Denn es ist ja auch so, das der Verbrauch von Speichermodulen mit dem Füllstand steigt.
Wenn bei 6GB VRAM verbaut 1GB belegt wird, und auch ordentlich angesprochen wird (read/write), so hast du weniger Verbrauch, als wenn das selbe mit nem Füllstand von 4 oder 5GB passieren würde.
Dazu kommt, das die Speicherzellen idR ja gleichmäßig beschrieben werden, damit man eben auch volle Bandbreite erzielen kann.
Auch spricht man ja idR von ner "Splittung" des Speichercontrollers in 64Bit Hälften.
Heist also bei 384Bit wären das sechs Teile. Jeder 64Bit Teil bekommt normal 2 Speichermodule zu 32Bit angehangen. Im Titan bzw. Teslafall wären es aber vier Module zu je 16Bit, wenn mich nicht alles täuscht.

Wenn nun also die LKW Fahrer im bildlichen Beispiel nun Daten abkippen in den VRAM, so würde jeder 64Bit LKW inkl. Fahrer auch gleichsam vier VRAM Bausteine ansprechen. Ergo auch viermal so viel Arbeit in Summe.


Oder um es nochmal mit nem anderen Beispiel zu untermauern. Damals zu Dual S771 Zeiten hat Intel sich entschieden. FB-Dimm Speicher zu verbauen.
Diese Speicher haben bei default ~1,8V und DDR2 typischen 667/800MHz gut und gerne 14-15W pro 1GB Riegel verfressen.
Ich hab zwei so ne Kisten hier stehen. Macht man mit dem Teil nix, sprich einfach nur OC idle bei wenigen 100MB Verbrauch, haben die Riegel Temps von 50-60°C. Legst du dort aber Last drauf, sprich schreibst alle Nase lang die VRAMs voll, bekommst du da teils 90-100°C gemessen durch die Riegelsensoren. Und das mit! aktiver Belüftung.
Und es verbrauchen natürlich auch 2GB Riegel etwas mehr Saft als 1GB Riegel. Genau so wie wiederum 4GB Riegel mehr Saft brauchen als 2 oder 1GB Riegel.
 
"Spielst du schon oder hoffst du noch " woher kommt mir das bekannt vor:d

Könnte n neuer Werbeslogan werden
 
Zuletzt bearbeitet:
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Also der eine ist ein Fanboy.
Der andere aber auch.
 
Der Kühler spricht wohl auch wie bei der GTX690 da für das ed nur bei Ref bleibt.
Bin gespannt wieviel Spannung uns über bleibt die wir für OC nutzen können.
 
7 Volt bei 4000W

hab schon ne Kaskade bestellt :d
 
Ich sagte ja von Anfang an, das der Speicherverbrauch nicht so extremst ist...
Wobei ich diese bildliche Erklärung irgendwie nicht so 100% treffend finde.
Denn es ist ja auch so, das der Verbrauch von Speichermodulen mit dem Füllstand steigt.
Wenn bei 6GB VRAM verbaut 1GB belegt wird, und auch ordentlich angesprochen wird (read/write), so hast du weniger Verbrauch, als wenn das selbe mit nem Füllstand von 4 oder 5GB passieren würde.
Dazu kommt, das die Speicherzellen idR ja gleichmäßig beschrieben werden, damit man eben auch volle Bandbreite erzielen kann.
Auch spricht man ja idR von ner "Splittung" des Speichercontrollers in 64Bit Hälften.
Heist also bei 384Bit wären das sechs Teile. Jeder 64Bit Teil bekommt normal 2 Speichermodule zu 32Bit angehangen. Im Titan bzw. Teslafall wären es aber vier Module zu je 16Bit, wenn mich nicht alles täuscht.

Wenn nun also die LKW Fahrer im bildlichen Beispiel nun Daten abkippen in den VRAM, so würde jeder 64Bit LKW inkl. Fahrer auch gleichsam vier VRAM Bausteine ansprechen. Ergo auch viermal so viel Arbeit in Summe.


Oder um es nochmal mit nem anderen Beispiel zu untermauern. Damals zu Dual S771 Zeiten hat Intel sich entschieden. FB-Dimm Speicher zu verbauen.
Diese Speicher haben bei default ~1,8V und DDR2 typischen 667/800MHz gut und gerne 14-15W pro 1GB Riegel verfressen.
Ich hab zwei so ne Kisten hier stehen. Macht man mit dem Teil nix, sprich einfach nur OC idle bei wenigen 100MB Verbrauch, haben die Riegel Temps von 50-60°C. Legst du dort aber Last drauf, sprich schreibst alle Nase lang die VRAMs voll, bekommst du da teils 90-100°C gemessen durch die Riegelsensoren. Und das mit! aktiver Belüftung.
Und es verbrauchen natürlich auch 2GB Riegel etwas mehr Saft als 1GB Riegel. Genau so wie wiederum 4GB Riegel mehr Saft brauchen als 2 oder 1GB Riegel.

Du hättest auch einfach die 50% auf die 680 draufzählen können wegen den 50% mehr Bandbreite. Hätte deine Rechnung etwas kürzer gemacht :d

Bzgl. Speicher sehe ich die Logik schon. Der Füllstand ist egal, denn du kannst pro Zeiteinheit nur auf eine bestimmte Menge zugreifen, egal wieviel Speicher du hast. Und diese Menge wird durch die Transferrate über das Interface bestimmt. Ich kann eine riesige Flasche haben oder eine kleine, wenn ich kippe fließt bei gleichem Flaschenhals dieselbe Menge pro Zeiteinheit raus. Und diese rausfließende Menge muss weiter hinten in der Flasche auch "addressiert" werden, also ist das ein und dasselbe.
 
Naennon dann reicht wohl doch eine :bigok:
Für 2 Karten @OC bin ich gut gerüstet mit dem 1200W Enermax peak 1650W @Platimax.
Past auch irgendwie gut zu Platinium Titanium.
 
Zuletzt bearbeitet:
kommt wakü drauf
 
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Klar :)

Ne hab mein Cooler Master Silent Pro Gold 850
Das reicht ne ganze Weile
 
Jetzt mal Spaß bei Seite Horror Scenario wäre nur 1.1 V unter Turbo und Spannungsspere .
Da brauch man auch keine Wakkü mehr.

2 Scenario wie bei der GTX 680 1.175V.
1.21V durch bios flash .

An Voltage free glaube ich irgend wie nicht mehr.
 
Naja, wenn die Karte wirklich ne Sperre bei 1,1 oder sogar nur 1,05V hat, könnte man sogar davon ausgehen, dass Nvidia wohl noch einen Refresh bringen wird und versucht zu verhindern, dass diese leistung schon mit Titan erreichbar ist.
Mal abwarten, was kommt:)

Hier nochmal ein größeres Bild:
rjmuqbiuwqp5.jpg
 
Bei so einer tiefen Sperre bleibt von meiner Sicht das Teil beim Händler.
Ich will minimum 1.175 V haben .
Vielleich würde ich mich mit 1.15V breitschlagen lassen.

Björn habe doch mein Note 2 zum surfen.
 
Zuletzt bearbeitet:
Jetzt mal Spaß bei Seite Horror Scenario wäre nur 1.1 V unter Turbo und Spannungsspere .
Da brauch man auch keine Wakkü mehr.

2 Scenario wie bei der GTX 680 1.175V.
1.21V durch bios flash .

An Voltage free glaube ich irgend wie nicht mehr.

Naja ich denke das der chip mit sehr großer sicherheit weniger spannung als die GTX680 anliegen hat da auch deutlich weniger takt anliegt aber da der chip ja eine gewissen größe hat wird er auch deutlich mehr verheizen und daswird mit sicherheit mit luft schwer zu kühlen.
20% oc wird der chip auch auf jedenfall mitmachen!

Allerdings bin ich der meinung das bei dem preis die karte keine volt sperre haben sollte besonders nicht beim VRAM
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh