nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Status
Für weitere Antworten geschlossen.
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

nVidia GK110/Geforce 7xx [Speku-, News- & Diskussionsthread]

nvidia-kepler-gk110-dmvid9.jpg

Dieshot eines GK110


Nachdem GK104 nun erschienen ist, wird das Themengebiet in den Sammler von Edge verschoben: http://www.hardwareluxx.de/communit...ches-bei-fragen-erste-seite-lesen-880765.html danke, an dieser Stelle für den Thread.

Hier soll es nun um GK110 gehen.


Short Facts:

Release: Tesla im Q4/2012, Geforce im Q1/2013
Zu erwartene Chips: sollte 7xx zutreffen dann 780, 770. Eine Dualversion kann man offiziel wohl ausschließen.

Daten zum Chip gibt es weiter unten.



1.1 Die Architektur

Nvidia hat auf der GTC viele neue Details zum GK110 verraten.

So soll der 7,1 Milliarden (!) Transistoren schwere Chip zuerst auf der Tesla K20 arbeiten, die gegen Ende des Jahres erscheinen soll. Mit dieser Masse an Transistoren stellt er den bis dato größten Chip der Geschichte dar. Desktoplösungen werden erst 2013 folgen, was zum einen niedrigen Yields als auch der bisher guten Position Nvidias in diesem Markt geschuldet sein kann.


Anders als beim GK104 bestizt GK110 pro SMX zusätzlich 64 DP-Einheiten um dort die Leistungsfähigkeit zu steigern (SP : DP = 3:1). Nicht ganz klar ist allerdings wie diese Einheiten aussehen. Bei Fermi arbeiteten einfach zwei Unified-Shader an einer DP-Berechnung, das hat den Vorteil keinen zusätzlichen Platz für DP-Einheiten aufbringen zu müssen. Würde NV bei GK110 nun wieder einen anderen Weg gehen dürfte die Chipfläche ohne massige erhöhung der Transistordichte nicht unter 600mm² bleiben. Immerhin müssten so 960 wietere Einheiten auf dem Chip untergebracht werden.
Auch der restliche Aufbau ist stark HPC orientiert, so kann ein Thread jetzt mehr Register nutzen als bei GK104 und mit Hyper Q sowie Dynamic Parallelism (Cuda 5.0) finden noch zwei weitere Features Einzug die GK104 nicht bot, aber für Desktopanwender keine Rolle spielen dürften. Allgemein ist GK110 stark Richtung HPC entwickelt worden, da in diesem Bereich der GK104 aufgrund mangenlder Fähigkeiten für DP nicht positioniert ist.

die-vergleich60uby.jpg

Die-Vergleich von GK110 und GK104. Achtung, die Größe ist nicht Maßstabsgetreu! (siehe weiter unten)

Für Spieler interessant könnte sein das NV angibt die TMUs nicht nur verdoppelt zu haben, sodern sie auch effizienter arbeiten. Ob man als Vergleich "nur" GF110 heranzieht oder wirklich GK104 ist zwar ungewiss, allerdings sprächen auch in letztem Fall die 240 TMUs für ausreichend Texturierleistung.

tesla_gk110_k20_3qtr_b38n0.jpg

Bild einer Tesla K20 Karte mit GK110





1.2 kleiner Chart

gk110v2nuaxd.jpg

1.3 Aussichten

Leistungsfähigkeit

Da Nvidia vor hat bei der Tesla K20 nur 13 oder 14 SMX zu aktivieren dürfte der Geforce wohl ein ähnliches Schicksal ereilen. Das steigert zum einen die Yields für NV und lässt natürlich auch Spekulationen über eine spätere Version mit allen Einheiten zu.

Ginge man von 13 SMX für die erste Version aus kämen wir bei einem halbwegs realistischen Chiptakt von 900 MHz auf 4,493 TFlops. Das wären immerhin ca. 45% mehr als bei GK104 (ohne Turbo). Dazu kommen noch die 208 verbleiben TMUs, was auch etwas 46% höhere Texturleistung bei 900 MHz entspricht und die um 50% höhere Bandbreite.

Summa Summarum scheinen 50% mehr Leistung also drin zu sein zum GK104, wieviel davon real bleibt muss man natürlich abwarten. Nvidia selbst gibt nur recht schwammige Aussagen über die Leistungsfähigkeit. So soll die DP-Leistung bei >1 TFlops liegen, was bei dem Ratio von 3:1 immerhin 3 TFlops SP bedeiten würde. Für die oben errechneten 4,5 TFlops sollten es dann aber schon 1,5 TFlops DP sein ;)


110104vergleich2w4uf7.jpg

Größenvergleich eines GK110 mit ca. 550mm² und einem GK104 mit ca. 295mm² (real sind es 294mm²)


Möglicher Refresh?

Interessant ist natürlich auch was bei einem Refresh zum GK110 drin wäre.

Ein Chip mit vollen SMX und einem höheren Takt von 950 MHz käme auf 5,472 TFlops, also ca. 21% mehr Leistung gegenüber der Version mit 13 SMX. Gleiche 21% gelten auch bei den Texturleistung.

Beim Speicher wird sich dagegen wohl kaum was ändern, denn GDDR5 scheint so langsam an seine bezahlbaren Grenzen zu kommen. Insgesamt wären also 15%+/- Mehrleistung drin um die Zeit bis Maxwell zu überbrücken.

Ob es so kommt weiß natürlich nur Nvidia selbst.


1.4 Linkliste

Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q (Golem, de)
GTC 2012: GK110-Grafikchip hat bis zu 2880 Shader-Kerne (heise, de)
GTC 2012: Die GK110-Schöpfer über Performance und zukünftige Herausforderungen (heise, de)
Nvidia gibt erste Infos zum großen Kepler GK110 bekannt (computerbase, de)
GK110: Weitere Details zur größten GPU der Welt [Update: Inside Kepler] (pcgh, de)
nVidias GK110-Chip mit 2880 Shader-Einheiten - im Gamer-Bereich aber erst im Jahr 2013 (3DCenter, de)






Thread im Aufbau!

Ich bitte alle User die an diesem Thread teilnehmen sich an eine gewisse Netiquette zu halten. Bitte lasst den Thread auch nicht zu einem Flamewar Rot gegen Grün verkommen sondern spekuliert aufgrund bekannter Fakten über den GK110. Versucht eigene Meinungen so wenig wie möglich in euren Post einfließen zu lassen, ebenso sind eure Wünsche und Kaufpläne evtl für andere User uninteressant.


Über ein Danke würde ich mich natürlich sehr freuen :wink:
 
Zuletzt bearbeitet:
Mit 5183 wäre die knapp 2,5x schneller als die GTX580 im 11er Markt.

Vergleicht man das mit AMD - im 11er immerhin knapp 60% - ist es verständlich, dass nVidia den Launch nach hinten verschoben hat. Solche Leistung letztes Jahr für $500? AMD hätte ja die Preise sofort um 50% senken müssen...

Du kannst die Ergebnisse im 3DMark11 nicht zwischen verschiedenen Architekturen vergleichen, das passt nicht genau. Kepler vs Kepler ist aber ok und lässt sich auch auf Spiele übertragen.

Und ich bezweifle sehr stark, dass GK110 vor Spätherbst 2012 überhaupt so günstig herzustellen war, dass man ihn auf eine 500 Euro-Karte hätte stecken können. Wäre AMD schneller gewesen, hätte man nichts entgegenzusetzen gehabt. Alleine von Tapeout bis zur Massenproduktion dauert es 6 Monate, und dann ist immer noch nicht garantiert, dass die Yields gut genug sind. Wir sprechen hier über einen sehr jungen 28nm Prozess Anfang 2012. Jetzt ist es über ein Jahr später, das ist was ganz anderes.

Nvidia hat GK104 zuerst gebracht, weil sie auf dem GF100-Debakel gelernt haben, nicht wegen AMD. So früh wie diese Entscheidung getroffen werden musste, kann Nvidia unmöglich über Tahiti Bescheid gewusst haben.
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ja mal einer geoct 680 er durch den 11er.
 
Nachricht gelöscht
 
Zuletzt bearbeitet von einem Moderator:
Das bringt ja nun reichlich wenig Daniel



Hier mit OC...nur ein bissschen
AMD Radeon HD 7970 video card benchmark result - Intel Core i7-3770K Processor,ASRock Z77 OC Formula score: X5027 3DMarks

Mir bringt das sehr viel!
Denn zum Benchen hat eine 680 gar keine Chance gegen ATIs! Und da ich nur das mache - ist die ATI schon ne extrem geile Karte....jetzt warten wir mal ab...@DEFAULT sollte der Titan schon min. die 6000 schaffen...ansonsten bin ich wirklich nicht geneit sie zu kaufen!
 
Und ich bezweifle sehr stark, dass GK110 vor Spätherbst 2012 überhaupt so günstig herzustellen war, dass man ihn auf eine 500 Euro-Karte hätte stecken können. Wäre AMD schneller gewesen, hätte man nichts entgegenzusetzen gehabt. Alleine von Tapeout bis zur Massenproduktion dauert es 6 Monate, und dann ist immer noch nicht garantiert, dass die Yields gut genug sind. Wir sprechen hier über einen sehr jungen 28nm Prozess Anfang 2012. Jetzt ist es über ein Jahr später, das ist was ganz anderes.

nVidia hat keine Probleme mit dem 28nm Prozess. GK106 und GK110 werden beide als A1 verkauft. GK106 wurde sogar nachhinten verschoben, weil man keine Kapazitäten hatte. GK110 war wohl zur selben Zeit fertig. Deswegen wohl auch kein 11.1.
 
Hier mit OC...nur ein bissschen
AMD Radeon HD 7970 video card benchmark result - Intel Core i7-3770K Processor,ASRock Z77 OC Formula score: X5027 3DMarks

Mir bringt das sehr viel!
Denn zum Benchen hat eine 680 gar keine Chance gegen ATIs!

Nur das das Herabsetzen des Tesselationsgrades keine reelle Vergleichbarkeit mehr bietet

Ist doch klar,das wenn sich eine Karte an die Norm hält,und ackern muss wie blöde,durch den Tess Grad,diese dann nen anderen Score zeigt,wie eine Karte die das Ganze umgeht

Werden denn solche Ergebnisse in HWbot zugelassen,wenn sie bei Futuremark konsequent aus dem Raster fallen?
 
Zuletzt bearbeitet:
nVidia hat keine Probleme mit dem 28nm Prozess. GK106 und GK110 werden beide als A1 verkauft. GK106 wurde sogar nachhinten verschoben, weil man keine Kapazitäten hatte. GK110 war wohl zur selben Zeit fertig. Deswegen wohl auch kein 11.1.

Ich spreche nicht von jetzt oder GK106-Launch Zeitpunkt, ich spreche von Jahresbeginn 2012. Der Chip kann A1 haben, schön und gut, aber wenn die Prozessyields beschissen sind zu Beginn, bringt dir das nichts - du musst dann von den großen Chips viele wegwerfen. Auch die Binning Yields brauchen Zeit um zu reifen. Was meinst du, warum AMD nicht gleich die GHz Edition gelauncht hat, sondern erst nach 6 Monaten? Weil mit 925MHz die Yields höher waren und man mehr an den Chips verdient hat. Und wenn du dann noch eine begrenzte Waferzahl hast, kannst du einen 550mm2 Chip unmöglich wirtschaftlich herstellen.
 
Zuletzt bearbeitet:
Du musst von den kleineren Chips noch erheblich mehr wegschmeißen, wenn die Yields beschissen sind.
Große Chips kann man noch deaktiviert verkaufen, aber ein GK107 mit gerademal 1SMX statt 2SMX wird auch im Notebookmarkt kein Blumentopf gewinnen.
 
Kapp 60% in Games wäre schon super +30%OC und wir haben die Reinkarnation des Bösen im Rechner.
 
Du musst von den kleineren Chips noch erheblich mehr wegschmeißen, wenn die Yields beschissen sind.
Große Chips kann man noch deaktiviert verkaufen, aber ein GK107 mit gerademal 1SMX statt 2SMX wird auch im Notebookmarkt kein Blumentopf gewinnen.

Es kann bei den großen Chips aber auch nicht-redundante Teile betreffen, besonders wenn die Defektdichte recht hoch ist. Es leuchtet mir nicht ein, dass große Chips gleich problematisch oder unproblematischer sein sollen als kleine Chips.
 
Du musst von den kleineren Chips noch erheblich mehr wegschmeißen, wenn die Yields beschissen sind.
Große Chips kann man noch deaktiviert verkaufen, aber ein GK107 mit gerademal 1SMX statt 2SMX wird auch im Notebookmarkt kein Blumentopf gewinnen.

Es kann bei den großen Chips aber auch nicht-redundante Teile betreffen, besonders wenn die Defektdichte recht hoch ist. Es leuchtet mir nicht ein, dass große Chips gleich problematisch oder unproblematischer sein sollen als kleine Chips.

Weißte, jetzt leg ich mir grad ne passende antwort zurecht, scrolle runter... und was ist, du hast sie bereits geschrieben :p

Hinzufügen muss man noch das man ja meist Fehlstellen auf den Wafer hat. Die sind normalerweise gleich hoch, egal ob kleinen oder großen Chip. Gehen wir bei nem Fehler von einem Totaldefekt aus, ist es so das du bei 300 Chips auf dem Wafer halt 10 wegschmeißt, bei 100 Stück aber auch. Die Yields sind also logischerweise höher und das macht große Chips etwas problematischer.

Es sei denn wie Sotin schon sagt das es sich um Fehler in Chipbereichen handelt die man deaktivieren kann oder mehrere Fehler in einem Chip, was bei großen auch nicht selten vorkommen sollte. Sowas lässt die YIelds natürlich wieder etwas steigen.
 
Nur das das Herabsetzen des Tesselationsgrades keine reelle Vergleichbarkeit mehr bietet

Ist doch klar,das wenn sich eine Karte an die Norm hält,und ackern muss wie blöde,durch den Tess Grad,diese dann nen anderen Score zeigt,wie eine Karte die das Ganze umgeht

Werden denn solche Ergebnisse in HWbot zugelassen,wenn sie bei Futuremark konsequent aus dem Raster fallen?
jap
 

Na dann sollte Nvidia vielleicht auch mal nen Tess Cheat in den Treiber implementieren,allerdings find ich die Haltung von Futuremark da konsequenter so wie damals bei PhysX gleiches Recht/Pflicht auch für Tesselation

Wird gefummelt ists ungültig u fließt nicht in die Wertung ein
 
Zuletzt bearbeitet:
Die Fehler sind statistisch verteilt. Angenommen, du hast einen Chip A, der viermal so groß ist wie Chip B. Damit ist auch die Fehlerwahrscheinlichkeit für A viermal höher als für B - das betrifft eben auch "tödliche" Fehler. Die Frage wäre, wie bei beiden Chips das Verhältnis zwischen diesen fatalen Fehlern und Fehlern, die abschaltbare Teile betreffen, ist.
 
Oh Oh,vielleicht muss ich dann meine 2x 680 doch noch verkaufen. Aber ich warte erstmal ab bis die Titan etwas am Markt ist, ohne Wakü kann ich damit eh nix anfangen. Hoffentlich lässt sich das Ding auch so gut übertakten wie die 680. SLI ist ja gut und schön, aber ne Single GPU die ähnlich schnell ist würde ich bevorzugen.
 
Die Fehler sind statistisch verteilt. Angenommen, du hast einen Chip A, der viermal so groß ist wie Chip B. Damit ist auch die Fehlerwahrscheinlichkeit für A viermal höher als für B - das betrifft eben auch "tödliche" Fehler. Die Frage wäre, wie bei beiden Chips das Verhältnis zwischen diesen fatalen Fehlern und Fehlern, die abschaltbare Teile betreffen, ist.

Das kannst du ja nicht pauschal beantworten. Man kann ein paar hunder Wafer herstellen und den Mittelwert bilden. AMD und NV dürften das vorher schon berechnen können anhand der Wahrscheinlichkeiten, aber das bekommen wir hier nicht hin. Außerdem müsste man sowas für jeden Chip einzeln erstellen.

Ich frage mich aber worauf du überhaupt hinaus möchtest? Ein teildeaktivierter Chip lässt sich zwar noch verkaufen, bringt aber deutlich weniger Gewinn ein als ein voll funktionsfähiger, immerhin waren die Herstellungskosten gleich.
 
Hoffentlich lässt sich das Ding auch so gut übertakten wie die 680. .

Wenn man jetzt mal rein von der Versorgung als Grundlage für die Auslegung des Powertarget ausgeht,dürfte Titan mehr Saft zum verbraten haben

GK104 2x6Pin 195erTDP/225Watt ~30Watt

GK110 1x8Pin+1x6Pin 234erTDP/300Watt ~75Watt
 
Zuletzt bearbeitet:

warum das schlussendlich zugelassen wird bei HWbot entzieht sich meinem Verständnis. Ist doch ne Selbstverarsche von Leistung die die Karte nicht wirklich bringt.
Dann habe ich lieber anständige Vergleiche die tatsächliche Leistungen wiederspiegeln.


Kinder ? ich habe 3 mit 15-13-8
seit froh das eure noch klein sind und keine Ansprüche stellen.

Kapp 60% in Games wäre schon super +30%OC und wir haben die Reinkarnation des Bösen im Rechner.

...abwarten, schön wäre es ja
 
Das kannst du ja nicht pauschal beantworten. Man kann ein paar hunder Wafer herstellen und den Mittelwert bilden. AMD und NV dürften das vorher schon berechnen können anhand der Wahrscheinlichkeiten, aber das bekommen wir hier nicht hin. Außerdem müsste man sowas für jeden Chip einzeln erstellen.

Ich frage mich aber worauf du überhaupt hinaus möchtest? Ein teildeaktivierter Chip lässt sich zwar noch verkaufen, bringt aber deutlich weniger Gewinn ein als ein voll funktionsfähiger, immerhin waren die Herstellungskosten gleich.

Ich will darauf hinaus, dass es eben nicht so einfach ist, wie sontin sich das vorstellt. Da spielen viele Dinge mit rein, von denen wir nichts wissen.
 
So nach ner 24 Stunde schickt 3 Stunden gepennt, also 27 Stundne hier nicht im Forum, und immer noch nix handfestes hier zum Titan^^
 
Wenn man jetzt mal rein von der Versorgung als Grundlage für die Auslegung des Powertarget ausgeht,dürfte Titan mehr Saft zum verbraten haben

GK104 2x6Pin 195erTDP/225Watt ~30Watt

GK110 1x8Pin+1x6Pin 234erTDP/300Watt ~75Watt

hauptsache spannung ist nicht zu knapp bemessen so das man nicht weit kommt! So einer GPU sollte man wie bei AMD auch feuer geben dürfen :(
 
Ich hoffe du hast recht weil wenn high end dann auch mit richtiger spannungsversorgung!
Normalerweise müsste das teil 2x8pin haben und freie voltage einstellung zulassen so das die GPU auch in richtung 1200Mhz geht :d

@scully

nicht das das echt der Tegra 4 wird :fresse:
 
Zuletzt bearbeitet:
Ich hoffe du hast recht weil wenn high end dann auch mit richtiger spannungsversorgung!
Normalerweise müsste das teil 2x8pin haben und freie voltage einstellung zulassen so das die GPU auch in richtung 1200Mhz geht :d

Naja die Pins sind ja erstmal nur kosmetischer Natur entscheident ist wie weit über dem Cliff nvidia zulässt u was die Schiene des Netzteils hergibt.Da könnten auch gut u gerne 350Watt fließen falls erlaubt:)

Allerdings glaub ich da weniger dran so restriktiv wie man mit GK104 verfahren ist
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh