nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Status
Für weitere Antworten geschlossen.
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

nVidia GK110/Geforce 7xx [Speku-, News- & Diskussionsthread]

nvidia-kepler-gk110-dmvid9.jpg

Dieshot eines GK110


Nachdem GK104 nun erschienen ist, wird das Themengebiet in den Sammler von Edge verschoben: http://www.hardwareluxx.de/communit...ches-bei-fragen-erste-seite-lesen-880765.html danke, an dieser Stelle für den Thread.

Hier soll es nun um GK110 gehen.


Short Facts:

Release: Tesla im Q4/2012, Geforce im Q1/2013
Zu erwartene Chips: sollte 7xx zutreffen dann 780, 770. Eine Dualversion kann man offiziel wohl ausschließen.

Daten zum Chip gibt es weiter unten.



1.1 Die Architektur

Nvidia hat auf der GTC viele neue Details zum GK110 verraten.

So soll der 7,1 Milliarden (!) Transistoren schwere Chip zuerst auf der Tesla K20 arbeiten, die gegen Ende des Jahres erscheinen soll. Mit dieser Masse an Transistoren stellt er den bis dato größten Chip der Geschichte dar. Desktoplösungen werden erst 2013 folgen, was zum einen niedrigen Yields als auch der bisher guten Position Nvidias in diesem Markt geschuldet sein kann.


Anders als beim GK104 bestizt GK110 pro SMX zusätzlich 64 DP-Einheiten um dort die Leistungsfähigkeit zu steigern (SP : DP = 3:1). Nicht ganz klar ist allerdings wie diese Einheiten aussehen. Bei Fermi arbeiteten einfach zwei Unified-Shader an einer DP-Berechnung, das hat den Vorteil keinen zusätzlichen Platz für DP-Einheiten aufbringen zu müssen. Würde NV bei GK110 nun wieder einen anderen Weg gehen dürfte die Chipfläche ohne massige erhöhung der Transistordichte nicht unter 600mm² bleiben. Immerhin müssten so 960 wietere Einheiten auf dem Chip untergebracht werden.
Auch der restliche Aufbau ist stark HPC orientiert, so kann ein Thread jetzt mehr Register nutzen als bei GK104 und mit Hyper Q sowie Dynamic Parallelism (Cuda 5.0) finden noch zwei weitere Features Einzug die GK104 nicht bot, aber für Desktopanwender keine Rolle spielen dürften. Allgemein ist GK110 stark Richtung HPC entwickelt worden, da in diesem Bereich der GK104 aufgrund mangenlder Fähigkeiten für DP nicht positioniert ist.

die-vergleich60uby.jpg

Die-Vergleich von GK110 und GK104. Achtung, die Größe ist nicht Maßstabsgetreu! (siehe weiter unten)

Für Spieler interessant könnte sein das NV angibt die TMUs nicht nur verdoppelt zu haben, sodern sie auch effizienter arbeiten. Ob man als Vergleich "nur" GF110 heranzieht oder wirklich GK104 ist zwar ungewiss, allerdings sprächen auch in letztem Fall die 240 TMUs für ausreichend Texturierleistung.

tesla_gk110_k20_3qtr_b38n0.jpg

Bild einer Tesla K20 Karte mit GK110





1.2 kleiner Chart

gk110v2nuaxd.jpg

1.3 Aussichten

Leistungsfähigkeit

Da Nvidia vor hat bei der Tesla K20 nur 13 oder 14 SMX zu aktivieren dürfte der Geforce wohl ein ähnliches Schicksal ereilen. Das steigert zum einen die Yields für NV und lässt natürlich auch Spekulationen über eine spätere Version mit allen Einheiten zu.

Ginge man von 13 SMX für die erste Version aus kämen wir bei einem halbwegs realistischen Chiptakt von 900 MHz auf 4,493 TFlops. Das wären immerhin ca. 45% mehr als bei GK104 (ohne Turbo). Dazu kommen noch die 208 verbleiben TMUs, was auch etwas 46% höhere Texturleistung bei 900 MHz entspricht und die um 50% höhere Bandbreite.

Summa Summarum scheinen 50% mehr Leistung also drin zu sein zum GK104, wieviel davon real bleibt muss man natürlich abwarten. Nvidia selbst gibt nur recht schwammige Aussagen über die Leistungsfähigkeit. So soll die DP-Leistung bei >1 TFlops liegen, was bei dem Ratio von 3:1 immerhin 3 TFlops SP bedeiten würde. Für die oben errechneten 4,5 TFlops sollten es dann aber schon 1,5 TFlops DP sein ;)


110104vergleich2w4uf7.jpg

Größenvergleich eines GK110 mit ca. 550mm² und einem GK104 mit ca. 295mm² (real sind es 294mm²)


Möglicher Refresh?

Interessant ist natürlich auch was bei einem Refresh zum GK110 drin wäre.

Ein Chip mit vollen SMX und einem höheren Takt von 950 MHz käme auf 5,472 TFlops, also ca. 21% mehr Leistung gegenüber der Version mit 13 SMX. Gleiche 21% gelten auch bei den Texturleistung.

Beim Speicher wird sich dagegen wohl kaum was ändern, denn GDDR5 scheint so langsam an seine bezahlbaren Grenzen zu kommen. Insgesamt wären also 15%+/- Mehrleistung drin um die Zeit bis Maxwell zu überbrücken.

Ob es so kommt weiß natürlich nur Nvidia selbst.


1.4 Linkliste

Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q (Golem, de)
GTC 2012: GK110-Grafikchip hat bis zu 2880 Shader-Kerne (heise, de)
GTC 2012: Die GK110-Schöpfer über Performance und zukünftige Herausforderungen (heise, de)
Nvidia gibt erste Infos zum großen Kepler GK110 bekannt (computerbase, de)
GK110: Weitere Details zur größten GPU der Welt [Update: Inside Kepler] (pcgh, de)
nVidias GK110-Chip mit 2880 Shader-Einheiten - im Gamer-Bereich aber erst im Jahr 2013 (3DCenter, de)






Thread im Aufbau!

Ich bitte alle User die an diesem Thread teilnehmen sich an eine gewisse Netiquette zu halten. Bitte lasst den Thread auch nicht zu einem Flamewar Rot gegen Grün verkommen sondern spekuliert aufgrund bekannter Fakten über den GK110. Versucht eigene Meinungen so wenig wie möglich in euren Post einfließen zu lassen, ebenso sind eure Wünsche und Kaufpläne evtl für andere User uninteressant.


Über ein Danke würde ich mich natürlich sehr freuen :wink:
 
Zuletzt bearbeitet:
danke für die Info Scully :wink:
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ebenso wie Nutzer von Intels Xeon Phi unterschreiben auch die Nutzer von K20 eine Verschwiegenheitserklärung. Da wird also nicht viel bei rauskommen. Also immer nur Geschwafel, Gerüchte, Vermutungen, Spekulationen oder Traumdeutungen ;)

Edit: Bis ein NVIDIA-Mitarbeiter "Scheiße" baut :bigok:

Das einzige, was man wohl noch leaken kann, ist die Ausprägung von K20 - also wieviel Einheiten und Taktraten.

Da aber nVidia so gerne auf das dreifache Perf/Watt Verhältnis hinweist und dabei auf DGEMM verweißt, muss man im Grunde auch nicht raten:
M2090 erreicht 440TFLOPs/s. K20 sollte also bei ca. 1200TFLOPs/s nutzbarer DP-Rechenleistung liegen. Die Effizienz bei DGEMM soll dabei bei über 80% liegen. Ergo ergibt das eine DP-Rechenleistung von 1263TFLOPs/s (95%) bis 1481TFLOPs/s (81%).

Alles andere wäre zwar enttäuschend, da aber die Konkurrenz deutlich schlechter ist - Fail-GCN erreicht im Serverbereich nur 800TFLOPs/s - wohl nicht groß tragisch.
 
Woher hast du solche Zahlen?? Mir sind 0,35 TFlops der M2090 in DGEMM bekannt :hmm: GCN 0,848 TFlops. Wobei GCN 90% peak schafft. GK110 soll 0,8+ TFlops bei 81% Effizienz schaffen.

Edit: Übrigens sind 0,848 TFlops, ECC SRAM und 6 GB VRAM out-of-the-box für 520€ ein absoluter Witz. Da ist nichts fail! Nachteil ist dass halt viele schon CUDA nutzen und hier auf OpenCL umsteigen müssten.
 
Zuletzt bearbeitet:
Für die Gamer muss das ja nichts schlechtes heissen vielleicht besinnt man sich doch zu einem kleinerem Chip der knapp 400mm² erreicht 1000MHZ und mehr Einheiten alls beim GK104 da zu ein breiteres SI und das Teil würde auch ordentlich Leistung ab liefern.

So etwas ähnliches klang ja schon vor ein Paar Wochen mal durch.
Würde sich nur noch die Frage stellen wieso man dan trotzdem erst so spät mit der Karte kommt.
 
Zuletzt bearbeitet:
Konsequent wäre ja das GK104 Erfolgsmodell weiter auszubauen

Entschlackt von großen Teilen des GPGPU Parts für DP Berechnungen,mehr Transistoren für SP,und geboren ist die effizentere 7er Reihe

GK110 ist nunmal nicht optimal als Geforce,weil er Ballast mit sich schleppt,den der Geforce schlicht und ergreifend nicht benötigt
 
Zuletzt bearbeitet:
Ja eine höhere Ausbeute wäre so möglich mehr Gewinn und zu guter letzt vielleicht noch mal ne Dualgpu Karte wie die GTX 690.
Es bleibt auf jeden Fall spannend vieleicht sehen wir den Gk110 ja nie im Desktop bereich das wäre ja auch ein Ding.
 
fände es sogar richtig gut wenn nvidia nochma einen reinen gamerchip ala GK104, nur eben mit doppelten einheiten o.ä. in petto hätte. Kannja nur gut sein ohne den unnützn gp-gpu ballast, warscheinlich höhere taktraten und weniger abwärme
 
Von mir aus kann ruhig so ein Chip kommen, allerdings erwarte ich dennoch 384Bit und 3GB VRAM und weiterhin 50% schneller als GK104@1536.
Aber: Irgendwie wäre so eine art GK114 doch auch langweilig. Das technisch Maximal-Mögliche zu haben hat auch seinen Reiz.
 
Quelle: OBR Hardware
:xmas: :bigok:

Fud...

Eidt: Das einzige was denkbar wäre: Sämtlicher threading-kram wurde herausgenommen, da die Spieleindustrie eh zu lahm ist. Dann gäbe es weder dynamic paralism noch HyperQ. Vllt. noch etwas geschrumpfte register... dann von "completely different" zu reden ist aber, na ja, übertrieben.
 
Zuletzt bearbeitet:
Ach ja.

Ich verstehe nicht was so schwer daran zu verstehen ist das es zu teuer und aufwendig ist zwei große Chips zu bringen. Es wird einen Refresh von GK104 geben und darüber wird GK110 rangieren. (Punkt)
 
Ach ja.

Ich verstehe nicht was so schwer daran zu verstehen ist das es zu teuer und aufwendig ist zwei große Chips zu bringen. Es wird einen Refresh von GK104 geben und darüber wird GK110 rangieren. (Punkt)

Meinst du mich? :hmm:
 
Von mir aus kann ruhig so ein Chip kommen, allerdings erwarte ich dennoch 384Bit und 3GB VRAM und weiterhin 50% schneller als GK104@1536.
Aber: Irgendwie wäre so eine art GK114 doch auch langweilig. Das technisch Maximal-Mögliche zu haben hat auch seinen Reiz.


Ist ja gut und schön sich dann damit brüsten zu können...
man legt nen haufen Kohle aufn Tisch und nutzt den Teil garnicht. Mal ehrlich...zocken, Surfen, Bildchen bearbeiten und vielleicht verrennt sich auch das eine oder andere Officeprogramm auf den Rechnern wo diese Hardware verbaut ist.
Ne weitere Gamerkarte mit allem Pipapo das man sich wünscht ist doch prima.
50% schneller als eine 50% übertaktete Karte ? :fresse2: ..nette Vorstellung^^
 
Konsequent wäre ja das GK104 Erfolgsmodell weiter auszubauen

Entschlackt von großen Teilen des GPGPU Parts für DP Berechnungen,mehr Transistoren für SP,und geboren ist die effizentere 7er Reihe

GK110 ist nunmal nicht optimal als Geforce,weil er Ballast mit sich schleppt,den der Geforce schlicht und ergreifend nicht benötigt

Hey scully, was denn los :fresse:
Als ich damals noch gesagt habe, es könnte eine GK114 als GK104 Nachfolger geben, warst du noch strickt dagegen und hast den GK110 dahingestellt wo ich den GK114 als entschlackten Gamerchip stellen wollte :fresse2:

Unterm Strich finde ich das nach wie vor ziemlich konsequent. Eventuell hat man auch einfach die Beführchtung, das man mit nem riesen GK110 nicht wirklich weit kommen wird im Gamermarkt. Die in etwa zu erwartende Mehrleistung für die 8000er AMDs scheint ja auch mehr oder weniger fix. Ein etwas aufgebohrter GK114 mit ggf. höherem Turbo und minimal mehr Takt dürfte da gut realisierbar sein.

Was mich da aber wieder wurmt, wenn es um GK114 als GTX 780 geht, wirds wohl bei 2GB bleiben bzw. später dann ein 4GB doppeltes VRAM Modell geben. -> meine Meinung :(
 
Zuletzt bearbeitet:
Na ja aber wie man sieht wird auch compute-power immer mehr an Bedeutung gewinnen. Die 4A- oder EGO-Grafik-Engine zeigen ja nun wohin die Tripp gehen könnte und wieviel Leistung man noch zusätzlich bereitstellen kann. Wichtig ist dann halt nur, dass die neuen Gens nicht an Bandbreite oder kleine Caches verrecken.
Hier und hier sieht man wie GCN davon ziehen kann. Dirts Lichtberechnungen laufen als eigenständiges computer-Programm, ebenso wie Metros object-based depth of field. Vor allem wenn man noch dazu den Leistungseinbruch mit AA/AF ggü. Kepler betrachtet. Kepler punktet häufig bei Pixel-/Texelfüllrate. Das sieht man bspw. in Skyrim deutlich.
 
50% schneller als eine 50% übertaktete Karte ? :fresse2: ..nette Vorstellung^^

Ich gehe von der GTX 680 mit @1006 MHz aus. 50% mehr Leistung können schon etwas optimistisch sein, allerdings weniger als 40% sollten es auch nicht werden... da kann ich dann mein GTX 580 SLI auch weiter behalten-was ich sagen will: Wenn ich 500-600€ auf den Tisch lege, will ich aber auch etwas gescheites bekommen, nicht so eine langweilige Karte wie die GTX 680 -meine Meinung-
 
More detail later...
 
Unterm Strich finde ich das nach wie vor ziemlich konsequent. Eventuell hat man auch einfach die Beführchtung, das man mit nem riesen GK110 nicht wirklich weit kommen wird im Gamermarkt. Die in etwa zu erwartende Mehrleistung für die 8000er AMDs scheint ja auch mehr oder weniger fix. Ein etwas aufgebohrter GK114 mit ggf. höherem Turbo und minimal mehr Takt dürfte da gut realisierbar sein.

Was mich da aber wieder wurmt, wenn es um GK114 als GTX 780 geht, wirds wohl bei 2GB bleiben bzw. später dann ein 4GB doppeltes VRAM Modell geben. -> meine Meinung :(


uhuu, das wäre ne böse Falle :fresse2:
Ein stinknormales Refresh als next Gen ?
Ich kann mir nicht vorstellen das die weiterhin mit nem 256er SI und 2GB daher kommen. Alleine der Grund das Multimonitoring mit einer Karte und/oder 4k auf dem Programm stehen.
Da braucht es schon ein bischen mehr. Ansonsten fände ich das als absoluten Fail und gebe mein Gespartes anderweitig aus.
384 und 3GB sind min. Vielleicht ist das der Knackpunkt weshalb die Karten so spät kommen ? (mal abgesehen von TSMC Lieferproblemen)
 
@Grinsemann das war nicht auf GK110 bezogen. Der wird zweifelsfrei seine 384Bit SI bekommen bzw. haben.
Mir gings an der Stelle um die Spekulation, welche besagen, das es womöglich keinen GK110 wie man ihn heute kennt, als GTX 780 verkaufen wird. Sondern man ggf. auf einen Refresh des aktuell sehr erfolgreichen GK104 zurückgreift. Als reinrassiger Desktop/Gamingchip wäre dieser Schritt durchaus sinnig. Nur wird man auf diesem Chip wohl kaum ein breiteres SI verbauen ;) -> Meine Meinung... Denn für die, die wirklich mehr VRAM wollen, kann man auch teurere 4GB Karten mit doppelter Ausstattung auf den Markt drücken.

PS: mit 4k Auflösungen rechne ich persönlich nicht vor 3-4 Jahren am breiten Markt. In 2 Jahren gibts wohl erste Monitore. Klar HighEnd Modelle werden auch von Enthusiasten gekauft. Aber das dürfte im Vergleich nicht wirklich den Kohl fett machen ;)
 
Na wollen wir mal hoffen das du in dem Punkt falsch liegst fdsonne soll nicht heissen das es nicht passieren könnte nach GK104 kann man NV fast alles zu trauen.
Ein grösseres SI wäre schon genial bei solch einem chip.
Wenn es aber den GK110 noch als creme della creme geben würde im Desktop Bereich dan wäre es mir auch Wurst da man ja dann die Wahl hätte.
Schaun wa mal.
 
Zuletzt bearbeitet:
Na ja aber wie man sieht wird auch compute-power immer mehr an Bedeutung gewinnen. Die 4A- oder EGO-Grafik-Engine zeigen ja nun wohin die Tripp gehen könnte und wieviel Leistung man noch zusätzlich bereitstellen kann. Wichtig ist dann halt nur, dass die neuen Gens nicht an Bandbreite oder kleine Caches verrecken.
Hier und hier sieht man wie GCN davon ziehen kann. Dirts Lichtberechnungen laufen als eigenständiges computer-Programm, ebenso wie Metros object-based depth of field. Vor allem wenn man noch dazu den Leistungseinbruch mit AA/AF ggü. Kepler betrachtet. Kepler punktet häufig bei Pixel-/Texelfüllrate. Das sieht man bspw. in Skyrim deutlich.

Metro2033 braucht einzig und allein Bandbreite. Sieht man sehr schön am Vergleich GTX650 und 7750, letztgenannte wird nämlich in Metro2033 bei HT4U deutlich und bei Computerbase immerhin noch geschlagen. Und beide Karten haben gleichviel Rechenleistung.

Da BigK 50% mehr Brandbreite besitzen wird, wird man alleine deswegen in Metro2033 erheblich schneller als eine GTX680 sein. Und Showdown ist eben nur eine Ausnahme. Hier werden massiv viele Lichtquellen berechnet, da limitiert eben nicht mehr das vollkommen veralterte Frond-End von Lahmiti. In Showdown ist die GTX680 jedoch auch 50% und mehr als 100% schneller als die GTX580 bzw, GTX560TI - kann also ihren theoretischen Vorteil vollends ausspielen.
 
Was suchst du dir denn für settings? Ich rede von FullHD mit AA, da es dass praxisrelevanteste Setting ist. Und die low-end Karten ala GTX 650 verrecken an ganz anderen Dingen. Du redest hier von stotter-framerates. Also bitte... :hmm:
Die GTX 680 verkackt in Dirt Showdown. Warum habe ich bereits gesagt. Und es sind nur 30-35% ggü. GF110.
 
Hey scully, was denn los :fresse:
Als ich damals noch gesagt habe, es könnte eine GK114 als GK104 Nachfolger geben, warst du noch strickt dagegen und hast den GK110 dahingestellt wo ich den GK114 als entschlackten Gamerchip stellen wollte :fresse2:

(

Wusss? Gibt's noch nen scully in diesem Universum?:)

Ich sag schon seit geraumer Zeit das Nvidia eventuell das Geforce Segment vom Tesla/Quadro Bereich abkoppelt um kleinere effizientere Chips/Karten zu bauen

Dies bedingt aber gesonderte Fertigungsstraßen,wo einige andere skeptisch waren,ob sich der Aufwand nur für Geforce lohnen könnte
 
Zuletzt bearbeitet:
Glaube ich zwar nicht - warte trotzdem auf die 780GTX. Habe es aber nicht eilig da meine EVGA 580 GTX HC2 nach wie vor locker für alle Spiele reicht. Möchte nur wieder einmal etwas Neues probieren.
 
Zuletzt bearbeitet:
Irgendwie glaube ich, dass die Verwirrung auch durch die Aussage GK110=GTX780 kommt. Ob dem so ist, wissen wir ja auch noch nicht ;)
 
@Grinsemann das war nicht auf GK110 bezogen. Der wird zweifelsfrei seine 384Bit SI bekommen bzw. haben.
Mir gings an der Stelle um die Spekulation, welche besagen, das es womöglich keinen GK110 wie man ihn heute kennt, als GTX 780 verkaufen wird. Sondern man ggf. auf einen Refresh des aktuell sehr erfolgreichen GK104 zurückgreift. Als reinrassiger Desktop/Gamingchip wäre dieser Schritt durchaus sinnig. Nur wird man auf diesem Chip wohl kaum ein breiteres SI verbauen ;) -> Meine Meinung... Denn für die, die wirklich mehr VRAM wollen, kann man auch teurere 4GB Karten mit doppelter Ausstattung auf den Markt drücken.

PS: mit 4k Auflösungen rechne ich persönlich nicht vor 3-4 Jahren am breiten Markt. In 2 Jahren gibts wohl erste Monitore. Klar HighEnd Modelle werden auch von Enthusiasten gekauft. Aber das dürfte im Vergleich nicht wirklich den Kohl fett machen ;)

ja das würde mir für meine Ansprüche ja schon genügen. Bei 50% mehr von Allem sollten 50% mehr an Leistung für Surround da auf jeden Fall rausspringen.
Ich hoffe nur das die nicht wieder so lange mit ner Dualkarte warten. Diesmal wäre die tatsächlich mal interessanter wenn ich auf die 690 blicke.
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh