nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Status
Für weitere Antworten geschlossen.
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

nVidia GK110/Geforce 7xx [Speku-, News- & Diskussionsthread]

nvidia-kepler-gk110-dmvid9.jpg

Dieshot eines GK110


Nachdem GK104 nun erschienen ist, wird das Themengebiet in den Sammler von Edge verschoben: http://www.hardwareluxx.de/communit...ches-bei-fragen-erste-seite-lesen-880765.html danke, an dieser Stelle für den Thread.

Hier soll es nun um GK110 gehen.


Short Facts:

Release: Tesla im Q4/2012, Geforce im Q1/2013
Zu erwartene Chips: sollte 7xx zutreffen dann 780, 770. Eine Dualversion kann man offiziel wohl ausschließen.

Daten zum Chip gibt es weiter unten.



1.1 Die Architektur

Nvidia hat auf der GTC viele neue Details zum GK110 verraten.

So soll der 7,1 Milliarden (!) Transistoren schwere Chip zuerst auf der Tesla K20 arbeiten, die gegen Ende des Jahres erscheinen soll. Mit dieser Masse an Transistoren stellt er den bis dato größten Chip der Geschichte dar. Desktoplösungen werden erst 2013 folgen, was zum einen niedrigen Yields als auch der bisher guten Position Nvidias in diesem Markt geschuldet sein kann.


Anders als beim GK104 bestizt GK110 pro SMX zusätzlich 64 DP-Einheiten um dort die Leistungsfähigkeit zu steigern (SP : DP = 3:1). Nicht ganz klar ist allerdings wie diese Einheiten aussehen. Bei Fermi arbeiteten einfach zwei Unified-Shader an einer DP-Berechnung, das hat den Vorteil keinen zusätzlichen Platz für DP-Einheiten aufbringen zu müssen. Würde NV bei GK110 nun wieder einen anderen Weg gehen dürfte die Chipfläche ohne massige erhöhung der Transistordichte nicht unter 600mm² bleiben. Immerhin müssten so 960 wietere Einheiten auf dem Chip untergebracht werden.
Auch der restliche Aufbau ist stark HPC orientiert, so kann ein Thread jetzt mehr Register nutzen als bei GK104 und mit Hyper Q sowie Dynamic Parallelism (Cuda 5.0) finden noch zwei weitere Features Einzug die GK104 nicht bot, aber für Desktopanwender keine Rolle spielen dürften. Allgemein ist GK110 stark Richtung HPC entwickelt worden, da in diesem Bereich der GK104 aufgrund mangenlder Fähigkeiten für DP nicht positioniert ist.

die-vergleich60uby.jpg

Die-Vergleich von GK110 und GK104. Achtung, die Größe ist nicht Maßstabsgetreu! (siehe weiter unten)

Für Spieler interessant könnte sein das NV angibt die TMUs nicht nur verdoppelt zu haben, sodern sie auch effizienter arbeiten. Ob man als Vergleich "nur" GF110 heranzieht oder wirklich GK104 ist zwar ungewiss, allerdings sprächen auch in letztem Fall die 240 TMUs für ausreichend Texturierleistung.

tesla_gk110_k20_3qtr_b38n0.jpg

Bild einer Tesla K20 Karte mit GK110





1.2 kleiner Chart

gk110v2nuaxd.jpg

1.3 Aussichten

Leistungsfähigkeit

Da Nvidia vor hat bei der Tesla K20 nur 13 oder 14 SMX zu aktivieren dürfte der Geforce wohl ein ähnliches Schicksal ereilen. Das steigert zum einen die Yields für NV und lässt natürlich auch Spekulationen über eine spätere Version mit allen Einheiten zu.

Ginge man von 13 SMX für die erste Version aus kämen wir bei einem halbwegs realistischen Chiptakt von 900 MHz auf 4,493 TFlops. Das wären immerhin ca. 45% mehr als bei GK104 (ohne Turbo). Dazu kommen noch die 208 verbleiben TMUs, was auch etwas 46% höhere Texturleistung bei 900 MHz entspricht und die um 50% höhere Bandbreite.

Summa Summarum scheinen 50% mehr Leistung also drin zu sein zum GK104, wieviel davon real bleibt muss man natürlich abwarten. Nvidia selbst gibt nur recht schwammige Aussagen über die Leistungsfähigkeit. So soll die DP-Leistung bei >1 TFlops liegen, was bei dem Ratio von 3:1 immerhin 3 TFlops SP bedeiten würde. Für die oben errechneten 4,5 TFlops sollten es dann aber schon 1,5 TFlops DP sein ;)


110104vergleich2w4uf7.jpg

Größenvergleich eines GK110 mit ca. 550mm² und einem GK104 mit ca. 295mm² (real sind es 294mm²)


Möglicher Refresh?

Interessant ist natürlich auch was bei einem Refresh zum GK110 drin wäre.

Ein Chip mit vollen SMX und einem höheren Takt von 950 MHz käme auf 5,472 TFlops, also ca. 21% mehr Leistung gegenüber der Version mit 13 SMX. Gleiche 21% gelten auch bei den Texturleistung.

Beim Speicher wird sich dagegen wohl kaum was ändern, denn GDDR5 scheint so langsam an seine bezahlbaren Grenzen zu kommen. Insgesamt wären also 15%+/- Mehrleistung drin um die Zeit bis Maxwell zu überbrücken.

Ob es so kommt weiß natürlich nur Nvidia selbst.


1.4 Linkliste

Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q (Golem, de)
GTC 2012: GK110-Grafikchip hat bis zu 2880 Shader-Kerne (heise, de)
GTC 2012: Die GK110-Schöpfer über Performance und zukünftige Herausforderungen (heise, de)
Nvidia gibt erste Infos zum großen Kepler GK110 bekannt (computerbase, de)
GK110: Weitere Details zur größten GPU der Welt [Update: Inside Kepler] (pcgh, de)
nVidias GK110-Chip mit 2880 Shader-Einheiten - im Gamer-Bereich aber erst im Jahr 2013 (3DCenter, de)






Thread im Aufbau!

Ich bitte alle User die an diesem Thread teilnehmen sich an eine gewisse Netiquette zu halten. Bitte lasst den Thread auch nicht zu einem Flamewar Rot gegen Grün verkommen sondern spekuliert aufgrund bekannter Fakten über den GK110. Versucht eigene Meinungen so wenig wie möglich in euren Post einfließen zu lassen, ebenso sind eure Wünsche und Kaufpläne evtl für andere User uninteressant.


Über ein Danke würde ich mich natürlich sehr freuen :wink:
 
Zuletzt bearbeitet:
und wenn wir ne 680 und ne 670 mit gleichem Takt gegeneinander antreten lassen?
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
und wenn wir ne 680 und ne 670 mit gleichem Takt gegeneinander antreten lassen?

Dann rechne dir den unterschied doch aus. Die GTX 680 (standardboost 1058MHz) hat ja rund 8% mehr Takt als die 980MHz der GTX 670. Da kommen dann vllt rund 4 bis 6% mehr Leistung rum. In den meisten Games dürften beide Karten inetwa gleich schnell sein, mal mehr mal weniger.
 
Die 670 hat auch ein SMX weniger.
Es ist schon komisch: Die 660 und 660 Ti liegen oft gleichauf - im selben Benchmark die 670 und 680 aber nicht bzw. nicht ganz obwohl der Abstand zwischen den beiden Paaren eigentlich auch ein Bandbreitenlimit bei 670/680 vermuten lassen würde.

Um einen VRAM-OC Test mit der 680 kommt man wohl nicht herum.
 
wow, dann muß AMD aber ordentlich was machen. Intel als Monopol wäre auch nicht so prickelnd.
 
Habe ich gestern auch gelesen - das wäre der Todesstoss für AMD...

Glaube aber nicht dass das jemals passieren wird - da würde die Kartellaufsicht nen Knüppel ins Getriebe werfen.

LG Marti

(via Sony Xperia Tipo Dual gesendet)
 
Wahrscheinlich gibts wie beim GK104 bis März nahezu gar keine gescheiten Infos. Die halten sich doch wieder viel zu bedeckt und hauen das Teil dann im März-April raus.
 
Wahrscheinlich gibts wie beim GK104 bis März nahezu gar keine gescheiten Infos. Die halten sich doch wieder viel zu bedeckt und hauen das Teil dann im März-April raus.

Wieso? GK104 ist lange aus dem Sack... ;)
Aber auch bei dieser GPU gab es im Vorfeld einiges an Infos. Der ALU Ausbau sowie der wegfall der HotClocks war ziemlich sicher und schon weit im Vorfeld bekannt...
 
Habe ich gestern auch gelesen - das wäre der Todesstoss für AMD...

Glaube aber nicht dass das jemals passieren wird - da würde die Kartellaufsicht nen Knüppel ins Getriebe werfen.

LG Marti

(via Sony Xperia Tipo Dual gesendet)

zumindest dr tei ldas nvidia momentan sehr viel geld kosten würde, grade für intel und es sich deswegen lohnt klingt plausibel.
denke aber es is ne ente, wobei mit der gedanke mit huang als intel boss gefällt :bigok:
 
wow, dann muß AMD aber ordentlich was machen. Intel als Monopol wäre auch nicht so prickelnd.

Da wird wie auch im Text geschrieben schon allein aus katellrechtlicher Sicht nix kommen

Huang ist denke ich da wo er jetzt ist,der richtige Man am richtigen Fleck.Firmenverbundenheit ist mit das Wichtigste für ein erfolgreich geführtes Unternehmen.

Intel hat in ihren Reihen sicherlich auch fähige Köpfe,die zudem noch mit den internen Abläufen besser vertraut sind,wie ein Außenstehender wie Huang es wäre.

Zudem holt Intel mit Xeon Phi auch so langsam in dem Marktsegment auf,wo bisher nur AMD/ATI bzw Nvidia das Sagen hatte

Ich plädiere dafür das diese News ne Ente ist

Intel hat genügend finannzielle Mittel,um aus dem Larrabee Projekt was konkurenzfähiges zu kreieren,ohne dabei Gefahr zu laufen,ins Schussfeld der Kartellaufsicht zu kommen
 
Zuletzt bearbeitet:
meine GTX 580 wird nächste Woche 2 Jahre, aber ist toll das eine so teure Anschaffung schön lange durchgehalten und sich bezahlt gemacht hat
 
Die 580er war mir damals (Feb. 2011) zu teuer für den Leistungszuwachs zur 570er. Das gleiche wie GTX 670 auf 680. Ich stand vor der Entscheidung: GTX 570 um 295€ oder die 580er für knappe ~450-500€ bei meinem Shop in der Nähe. Natürlich wurde es dann die 570er. :)
 
ich will high end und davon nochma das beste, habe direkt zum release gerne 560 euro für die 580 bezahlt
 
@boxleitnerb
Hab hier jetzt ne EVGA GTX 680 im Markplatz geschossen (310€ :d)
Werde dann mal testen, wie die Karte nun wirklich an der Bandbreite hängt. Kann diese Games anbieten:

BF3
Crysis Warhead
Crysis 2
The Witcher 2
Batman Arkham City
Skyrim
Dirt Showdown
Dragon Age Origins + 2
Metro 2033

Mal schauen, wie die Karten mit den unterschiedlichen Taktraten skalieren. Wird dann in etwa so aussehen:
1. 800/2504 MHz - 800/3004 MHz - 800/3504 MHz
2. 1058/2504 MHz - 1058/2004 MHz - 1058/3504 MHz
3. 1250/2004 MHz - 1250/3004 MHz - 1250/3504 MHz
 
Schön schön!
Klemmst du den Takt fest mit dem Inspector Trick? Ich weiß nicht, wie konstant der Turbo da agiert.

AvP Benchmark kannste noch mit aufnehmen, der scheint sehr bandbreitenlimitiert zu sein. Vielleicht gibts noch andere Standalone Benchmarks, die mir grad nicht einfallen. Warte mal, Just Cause 2 glaub ich und Stalker CoP.

Ich denke bei so vielen Spielen kannst du ein paar Settings streichen, die mit 800 MHz GPU-Takt z.B. Sonst ist das ja ne Heidenarbeit :)
 
Yo, AvP Benchmark kann ich auch noch machen. Werde den Takt auch fixen, damit der der Boost nicht alle Ergebnisse kaputt macht. Und wieviel Games ich nun benchen werde, und mit welchen Taktraten, muss ich mal schauen. Hab zwar ab Freitag Ferien, aber dennoch :d Werde dazu aber auch einen neuen Thread eröffnen.
 
Der "volle" wenn es nach der Architektur geht wären 15 SMX Pakete

Die beiden Teslachips haben aber nur 13 bzw 14 Shadercluster K20/K20X
 
Bitte gleich zu beginn den Vollausbau nicht so wie mit der GTX480 und dann der GTX580 NV hat mich nun lange genug bestraft in dem sie die Highend Chips um Jahr nach hinten geschoben haben.
 
Da kommt es wohl drauf an wie gut die Ausbeute ist. Ich rechne ja nicht damit das wir am Anfang ne Geforce mit 15 SMX sehen werden.
 
Wenn die 14 SMX-Version ausreicht, um komfortabel in Führung zu liegen (1 SMX macht blei gleichen Taktraten etwa 5% Performance aus), dann vermute ich, dass man den Vollausbau + 10% höheren Taktraten erst mit einer Refresh-Karte bringt. Zumindest würde das Sinn machen, wenn sich der Maxwell-Launch weiter nach hinten ziehen würde.

Die Ausbeute würde wohl auch dafür sprechen.

Oder man bringt eine (limitierte) Karte mit vollen 15 SMX und fürstlichem Aufpreis - so etwas ähnliches wie die damals die 7800 GTX 512 MB oder 8800 Ultra. :)

Vielleicht gibt es zur CES neue Infos, auch wenn es dieses Jahr in Sachen GK104 leider düster aussah.
 
Zuletzt bearbeitet:
@Edgecrusher86

Ich wäre ja lieber für ersteres. Dann wären auch die Preise etwas humaner. Allerdings liegt es vollkommen an AMD und deren HD 8970, wie schnell GK110 als GTX 780 letzten Endes wirklich und mit wievielen SMX diese kommen wird.
 
Wenn die 14 SMX-Version ausreicht, um komfortabel in Führung zu liegen (1 SMX macht blei gleichen Taktraten etwa 5% Performance aus), dann vermute ich, dass man den Vollausbau + 10% höheren Taktraten erst mit einer Refresh-Karte bringt. Zumindest würde das Sinn machen, wenn sich der Maxwell-Launch weiter nach hinten ziehen würde.

Die Ausbeute würde wohl auch dafür sprechen.

Wir nehmen alles was kommt,nur muss die Katze auch endlich mal Stoff liefern:d

Weihnachten ist vorbei,somit auch die Spekulatiuszeit,jetzt wirds Zeit für die dicken Brocken Nvidia:shot:
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh