nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Status
Für weitere Antworten geschlossen.
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

nVidia GK110/Geforce 7xx [Speku-, News- & Diskussionsthread]

nvidia-kepler-gk110-dmvid9.jpg

Dieshot eines GK110


Nachdem GK104 nun erschienen ist, wird das Themengebiet in den Sammler von Edge verschoben: http://www.hardwareluxx.de/communit...ches-bei-fragen-erste-seite-lesen-880765.html danke, an dieser Stelle für den Thread.

Hier soll es nun um GK110 gehen.


Short Facts:

Release: Tesla im Q4/2012, Geforce im Q1/2013
Zu erwartene Chips: sollte 7xx zutreffen dann 780, 770. Eine Dualversion kann man offiziel wohl ausschließen.

Daten zum Chip gibt es weiter unten.



1.1 Die Architektur

Nvidia hat auf der GTC viele neue Details zum GK110 verraten.

So soll der 7,1 Milliarden (!) Transistoren schwere Chip zuerst auf der Tesla K20 arbeiten, die gegen Ende des Jahres erscheinen soll. Mit dieser Masse an Transistoren stellt er den bis dato größten Chip der Geschichte dar. Desktoplösungen werden erst 2013 folgen, was zum einen niedrigen Yields als auch der bisher guten Position Nvidias in diesem Markt geschuldet sein kann.


Anders als beim GK104 bestizt GK110 pro SMX zusätzlich 64 DP-Einheiten um dort die Leistungsfähigkeit zu steigern (SP : DP = 3:1). Nicht ganz klar ist allerdings wie diese Einheiten aussehen. Bei Fermi arbeiteten einfach zwei Unified-Shader an einer DP-Berechnung, das hat den Vorteil keinen zusätzlichen Platz für DP-Einheiten aufbringen zu müssen. Würde NV bei GK110 nun wieder einen anderen Weg gehen dürfte die Chipfläche ohne massige erhöhung der Transistordichte nicht unter 600mm² bleiben. Immerhin müssten so 960 wietere Einheiten auf dem Chip untergebracht werden.
Auch der restliche Aufbau ist stark HPC orientiert, so kann ein Thread jetzt mehr Register nutzen als bei GK104 und mit Hyper Q sowie Dynamic Parallelism (Cuda 5.0) finden noch zwei weitere Features Einzug die GK104 nicht bot, aber für Desktopanwender keine Rolle spielen dürften. Allgemein ist GK110 stark Richtung HPC entwickelt worden, da in diesem Bereich der GK104 aufgrund mangenlder Fähigkeiten für DP nicht positioniert ist.

die-vergleich60uby.jpg

Die-Vergleich von GK110 und GK104. Achtung, die Größe ist nicht Maßstabsgetreu! (siehe weiter unten)

Für Spieler interessant könnte sein das NV angibt die TMUs nicht nur verdoppelt zu haben, sodern sie auch effizienter arbeiten. Ob man als Vergleich "nur" GF110 heranzieht oder wirklich GK104 ist zwar ungewiss, allerdings sprächen auch in letztem Fall die 240 TMUs für ausreichend Texturierleistung.

tesla_gk110_k20_3qtr_b38n0.jpg

Bild einer Tesla K20 Karte mit GK110





1.2 kleiner Chart

gk110v2nuaxd.jpg

1.3 Aussichten

Leistungsfähigkeit

Da Nvidia vor hat bei der Tesla K20 nur 13 oder 14 SMX zu aktivieren dürfte der Geforce wohl ein ähnliches Schicksal ereilen. Das steigert zum einen die Yields für NV und lässt natürlich auch Spekulationen über eine spätere Version mit allen Einheiten zu.

Ginge man von 13 SMX für die erste Version aus kämen wir bei einem halbwegs realistischen Chiptakt von 900 MHz auf 4,493 TFlops. Das wären immerhin ca. 45% mehr als bei GK104 (ohne Turbo). Dazu kommen noch die 208 verbleiben TMUs, was auch etwas 46% höhere Texturleistung bei 900 MHz entspricht und die um 50% höhere Bandbreite.

Summa Summarum scheinen 50% mehr Leistung also drin zu sein zum GK104, wieviel davon real bleibt muss man natürlich abwarten. Nvidia selbst gibt nur recht schwammige Aussagen über die Leistungsfähigkeit. So soll die DP-Leistung bei >1 TFlops liegen, was bei dem Ratio von 3:1 immerhin 3 TFlops SP bedeiten würde. Für die oben errechneten 4,5 TFlops sollten es dann aber schon 1,5 TFlops DP sein ;)


110104vergleich2w4uf7.jpg

Größenvergleich eines GK110 mit ca. 550mm² und einem GK104 mit ca. 295mm² (real sind es 294mm²)


Möglicher Refresh?

Interessant ist natürlich auch was bei einem Refresh zum GK110 drin wäre.

Ein Chip mit vollen SMX und einem höheren Takt von 950 MHz käme auf 5,472 TFlops, also ca. 21% mehr Leistung gegenüber der Version mit 13 SMX. Gleiche 21% gelten auch bei den Texturleistung.

Beim Speicher wird sich dagegen wohl kaum was ändern, denn GDDR5 scheint so langsam an seine bezahlbaren Grenzen zu kommen. Insgesamt wären also 15%+/- Mehrleistung drin um die Zeit bis Maxwell zu überbrücken.

Ob es so kommt weiß natürlich nur Nvidia selbst.


1.4 Linkliste

Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q (Golem, de)
GTC 2012: GK110-Grafikchip hat bis zu 2880 Shader-Kerne (heise, de)
GTC 2012: Die GK110-Schöpfer über Performance und zukünftige Herausforderungen (heise, de)
Nvidia gibt erste Infos zum großen Kepler GK110 bekannt (computerbase, de)
GK110: Weitere Details zur größten GPU der Welt [Update: Inside Kepler] (pcgh, de)
nVidias GK110-Chip mit 2880 Shader-Einheiten - im Gamer-Bereich aber erst im Jahr 2013 (3DCenter, de)






Thread im Aufbau!

Ich bitte alle User die an diesem Thread teilnehmen sich an eine gewisse Netiquette zu halten. Bitte lasst den Thread auch nicht zu einem Flamewar Rot gegen Grün verkommen sondern spekuliert aufgrund bekannter Fakten über den GK110. Versucht eigene Meinungen so wenig wie möglich in euren Post einfließen zu lassen, ebenso sind eure Wünsche und Kaufpläne evtl für andere User uninteressant.


Über ein Danke würde ich mich natürlich sehr freuen :wink:
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wieso Wartest du mit der GTX470?
Das lohnt doch richtig von der Karte auf den 680 Kepler umzusteigen (außer dein kleine Fermi läuft auf 950MHz^^)

tue ich auch
ist wohl eher eine preisfrage :)

eine 470 auf 950 puhh da muss man schon einen guten chip erwischt haben und ordentlich spannung geben :d
 
Wieso Wartest du mit der GTX470?
Das lohnt doch richtig von der Karte auf den 680 Kepler umzusteigen (außer dein kleine Fermi läuft auf 950MHz^^)

Ne leider nicht.
Keine gute GPU erwischt.
Muss mich mit deutlich humaneren taktfrequenzen zufrieden geben (700/1800 :( )^^

Aber dennoch ist für mich die 470 noch recht performant und möchte eben einen großen sprung machen.
 
40-50% mehr Leistung als ne GTX680 ist doch ne geile Sache, auch wenn das Gesamtpaket etwas schlechter ist. Mit mehr Ram ist dann sogar DS mit einer Karte drin. Für weitere 5 Monate ein guter Leistungssprung, wenn man bedenkt wie lange es von der GTX580 zur 680 gedauert hat :fresse: Was will man mehr :)
Für HydroCoppervarianten dann nochmal 1-3 Monate länger, aber ok wenn man ein 580er SLI/7970er CF oder eine 680 als übergang hat wird die Zeit versüßt.
Da die 680er sehr leise sein sollen überlege ich vielleicht doch nicht auf Wasser zu setzen, auch wenn die mich schon sehr reizt :d

Allerdings ist ja immernoch nicht klar ob bigK wirklich direkt mit 4GB daher kommt, oder es wie bei der GTX680 gemacht wird, dass man wieder ein paar Monate warten muß. Das würde mich dann schon sehr stören. Das ist dann wohl der Grund warum ich übergangsweise zur 680 greife. Wenn 685/780 dann anständig. (EVGA HC)
 
Glaubt mal bitte nicht das Märchen von 50%, das ist nicht realisierbar mit Luftkühlung jungs ;)

Ich rechne so mit 30%.
 
Sind es weniger als 30% wäre es mehr als enttäuschend ... zumindest im Gamingbereich. Da würden HWBOTler eher auf ihre Kosten kommen. Dann wahrscheinlich richtig.
 
man muss bedenken das GK104 noch nicht am Taktlimit ist. Da stell ich mir die frage wie hoch taktet GK110? Vielleicht kann er ja dank zuvieler Cuda Cores nicht so hoch und der abstand geht zurück.

Ausserdem hat NV so nen gemisch aus Performance und High end karte mit der 680 gebracht.
 
GTX480
Chiptakt: 700MHz, Speichertakt: 924MHz, Shadertakt: 1401MHz • Chip: GF100 • Speicherinterface: 384-bit • Stream-Prozessoren: 480 • Textureinheiten: 60 • Fertigung: 40nm • Maximaler Verbrauch: 320W
GTX580
Chiptakt: 772MHz, Speichertakt: 1002MHz, Shadertakt: 1544MHz • Chip: GF110 • Speicherinterface: 384-bit • Stream-Prozessoren: 512 • Textureinheiten: 64 • Fertigung: 40nm • Maximaler Verbrauch: 244W

Leistungsurteil
Die GeForce GTX 580 rendert durch die Bank ein gutes Stück schneller als GeForce GTX 480 und Radeon HD 5870. So agiert der neueste Nvidia-Spross unter 1680x1050 ohne Anti-Aliasing sowie der anisotropen Filterung um 14 Prozent flotter als der direkte Vorgänger. Unter 1920x1200 sind es 16 Prozent und unter 2560x1600 gleich 18 Prozent.

Mann sollte auch bedenken das NV sehr lange Zeit hat für den GK110 unmöglich wären 35-40% nicht unbedingt.
 
Zuletzt bearbeitet:
gleich kommt nen user review von mir mit der 680vs 7970 und 680 vs 580. auch bei gleichem takt.


Viele beschweren sich hier und sagen die 580 wäre genau so schnell bei gleichem takt usw,das die 680 unnötig ist. ABER der schritt von 480 zu 580 war deutlich kleiner. So wer hat alles ne 580? Was habt ihr bezahlt? Sry musste mal raus :d
 
Ich bin zur Zeit mittellos gar keine Karte so wie die 680er da her kommt hat sie mich noch nicht überzeugt.
 
schade dass das Precision X noch nicht funktioniert. Wüsste gerne wie gut das mit dem fps Target funzt^^

Warum funktioniert das noch nicht? Geht das nur mit der GTX680?

So wie ich das verstehe, wird nicht nur die fps limitiert, sondern auch der Takt&Voltage der Grafikkarte dynamisch angepasst wird?
 
Von HD6950 auf Kepler?

Achso alles klar: "aufgrund des Defektes meiner beiden 6950@6970er"
Das hört man öfter das die geflashten 6950 abrauchen.

Da hast du zwar Recht aber in meinem fall leider Unrecht.

Die Karten liefen beide @ 1GHz Problemlos seit dem ich sie hatte.
Seit der umrüstunf auf Sandy-E hat mir das Asus Rampage 4 Formula beide Karten nacheinander geschrottet und meine Ausweichskarte ne 6870@stock neu ebenfalls nach 2 tagen.
 
Wenn es dann im August nen Paperlaunch oder ähnliches gibt dauert es ja sowieso noch ein Weilchen. Ich rechne mal ganz entspannt auf Q4/2012, bis dahin werkelt die 580 mit 3GB noch im PC.
 
Wenn es dann im August nen Paperlaunch oder ähnliches gibt dauert es ja sowieso noch ein Weilchen. Ich rechne mal ganz entspannt auf Q4/2012, bis dahin werkelt die 580 mit 3GB noch im PC.

Ich gehe davon aus das GK110 nicht mehr dieses Jahr kommt (ausser für die GPU computing rechenknechte auf profikarten)
Und soviel langsamer wie Klein-Kepler ist Ferkli ja nicht halt nur mit dem Nachteil das ungeheuren Stromhungers
 
Am Ende war der GK110 schon vorm GK104 fertig .
Siehe GTX480, der 512er Chip war da aber zu heiß und zu hungrig also haben sie ihn beschnitten.
 
Das mit dem 512er GF100 war aber ein bisschen anders, da war die Ausbeute so dermaßen beschissen da pro Wafer nur ganz wenige funktionstüchtige Chips abgefallen sind. An der Stromaufnahme (wo die GTX580 auch tüchtig zulangen würde wenn nvidia da nicht ne bremse eingebaut hätte) und Temperatur lag das nicht.

Aber ähnliches Problem könnte Groß-Kepler jetzt auf 28nm auch haben. Einen Lauffähigen Chip haben die jedenfalls laut Gerüchten seit Ende Februar/Anfang März aber vermutlich ist da pro Waver fast nur Müll dabei den man höchstens als Salvage Chip verwenden könnte daher wird mit dem grossen Chip gewartet bis 28nm geschmeidig läuft.

davon kann man wohl erst Anfang nächstem Jahres ausgehen.

NV-Pres3.jpg
 
Zuletzt bearbeitet:
Hier das sagt Nvidia, meinste wirklich die 32 Shadereinheiten mehr von 480 hätten die Chipausbeute so enorm gesenkt? ;)
Das haben sie einfach gesagt um die beschneidung zu rechtfertigen, so war der Chip mit roher gewallt wenigstens irgendwie Kühlbar gewesen und sie mussten den Fermi nicht noch weiter aufschieben und AMD den Markt überlassen.

Außerdem gabs als die 480 Tesla mit 512 ;)



Und nein es ist keine GTX580, zum vergleich hab ich extra mal Screen mit hochgeladen.
 
Zuletzt bearbeitet:
jo n paar gabs davon
 
Ich wollt mal eine simple Rechnung präsentieren, die zeigt, wie die 2304 SPs im GK110 zustandekommen könnten.

Nvidia hat beim GK104 gegenüber dem GF104/114 folgendesn gemacht: Jeder Straming Multiprocessor im GF104/114 mit 48 SPs und 8 TMUs wurde verdoppelt, dann wurde die Anzahl der SPs nochmal verdoppelt, um den Wegfall des Hotclocks auzugleichen. So kommt es zu den SMX mit 192SPs und 16 TMUs, von denen es auf dem GK104 acht Stück in 4 GPCs gibt. Der GF114 wurde also im Prinzip nach der Umstellung von Hotclock auf doppelte Shader nochmal verdoppelt, wobei die Anzahl an SMs bzw SMX mit je 8 gleich geblieben ist.

Der GF100/110 hat ja bekanntlich ein anderes Verhältnis von SPs zu TMUs in einem SM, nämlich 32 SPs und 4 Textureinheiten. Führt man jetzt die gleiche Vervielfachung durch, kommt man auf ein SMX mit 128 SPs und 8 TMUS (33% mehr SPs je TMU).
Hätte der GK110 jetzt wie der GF100/110 mit seinen 16 SMs auch 16 SMX, hätte er 2048 SPs, ebenfalls 128 TMUs und wahrscheinlich auch 48 ROPs. Die 2304 SPs können jetzt erreicht werden, indem 18 statt 16 SMX verbaut werden, so kommt man auf 2304 SPs und 144 TMUs.
Dies halte ich für sehr wahrscheinlich, da eine simple Vergrößerung des GK104 auf 2304 SPs dazu führen würde, dass der Chip auch 192 TMUs hat, was eine ganz Menge ist. Mit der anderen Struktur gehen aber noch weitere Merkmale einher, z.B. hat jedes SM bzw SMX eine Polymorph-Engine für Tessalation, so dass der GF100/110 doppelt so viele davon hat wie der GF104/114, trotz gleicher TMU-Anzahl. ein auf 2304 SPs aufgepumpter GK104 hätte also immernoch nur 2/3 der Polymorph-Engines eines GF100/110 (allerdings hat Nvidia bei Kepler den Tessalationdurchsatz verdoppelt). Es gibt noch weitere Unterschiede der SMs zwischen GF114 und GF110, die übertragbar wären, z.B. hat der GF114 doppelt so viele Dispatchunits pro SM, aber das sind alles Dinge, die mir nicht viel sagen.

Was mich nur etwas verwirrt sind die > und = Zeichen in der Tabelle. >=2304 SPs müsste dann je nach SMX-Aufbau 2560 SPs (20 SMX nach GF110-Aufbau) oder 2688 SPs (14 SMX nach GK104-Aufbau) heißen, mit 160 oder 224 TMUs heißen, >128 TMUs ist natürlich bei >=2304 SPs in jedem Fall gegeben. >48 ROPs und >=384Bit SI passt aber nicht so ganz zusammen, da >48 ROPs auch auf jeden Fall >384Bit SI bedingen würde.
Diesize 550mm² halte ich für realistisch, schon wenn man das Größenverhältnis zwischen GF114 und GF110 auf den GK104 anwendet, müsste der GK110 460mm² groß sein, wenn er dann noch zwei zusätzliche SMX bekommt, kommt das hin.

Zu bedenken ist natürlich, dass im Falle eines Fakes natürlich der Erfinder der Daten sich das Gleiche iwe ich dabei gedacht haben könnte.

Da der Taktvorteil von der GTX680 gegenüber der GTX560Ti "nur" ~22-40% je nach Turbo ausmacht und ansonsten der Chip einfach verdoppelt wurde, sich aber durchschnittlich um 190%von der GTX560Ti absetzen kann (ok, Speicherbandbreite und VRAM spielen sicher auch eine Rolle) find ich das schon eine erstaunliche Leistung.
Es kann nicht mal zufällig jemand mit einer GTX560 Ti 2GB und einer GTX680 diese bei identischen Taktraten durch die Benchmarks jagen um zu sehen, wieviel schneller als um den Faktor 2 die GTX680 ist?
 
Zuletzt bearbeitet:
Gut, bei den Rops sollte ich wohl noch nen "=" dazu machen.

Die TMUs könnten evtl. sogar stagnieren, also 128 wie bei GK104. Dafür halt mehr ALUs, evtl. wirklich 3k und mehr Cache. Im 3DC redet man schon von bis zu 2MB L2 (GF110: 768kB).

Im Moment ist bei GK110 halt wirklich alles drin. Interessant wäre auch ob nV dann gleich eine ganz neue Reihe, also GK11x bringt und die alten Modelle auslaufen lässt. Ist allerdings natürlich fraglich was man beim GK104 noch alles ändern kann/will/sollte.
 
also BigK done well ship ohne vorherigen Release des schlechteren...kann passen. Dann werden die den aber immernoch 110 schimpfen denke ich :)
 
Wer weiss ob der mit den angepeilten 550mm² kommt, vielleicht kommt der nur mit 400mm² mitlerweile is das alles drin *hmpf*
 
ich glaube auch nicht das er soviel schneller wird und die frage ist auch zu was für nen preis(stromaufnahme usw)
 
Alles Marketing Strategie, muß man etwas länger warten, hoffentlich werden jetzt nicht immer die Mid Range Karten als erstes herausgegeben.:coffee:
 
Und ich bezweifle ehrlich gesagt, dass NV beim GK110 soviel anders macht als beim GK104. Wesentlich mehr als ein verdoppelter GF110 wird es nicht sein, vielleicht eben mit 1-2 GPC mehr. Ein dickeres SI als 384 Bit und damit mehr ROPs ist auch absolut unnötig, wenn der Speicher auch nur annähernd so schnell wie auf der GTX680 taktet, wahrscheinlich kann man sich auch langsameren erlauben.

Ich glaub einfach nicht, dass NV sich so ein schwer zu beherrschendes, hitzköpfiges Monster schaffen will, wenn der GK110 nach diesem Muster ohnehin schon problematische wird. So sehr kann sich die 28nm-Fertigung bis zum Sommer garnicht verbessern. Es ist auch beim GK110 nicht alles drin, wie hier viele sagen, eine komplett andere Aufteilung der SMX halte ich für nahezu ausgeschlossen, also 3K ALUs bei weiterhin 128 TMUs z.B.. Bei 128 TMUs werden es höchstens 2048 ALUs und das wär auch völlig ausreichend.
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh