nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Status
Für weitere Antworten geschlossen.
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

nVidia GK110/Geforce 7xx [Speku-, News- & Diskussionsthread]

nvidia-kepler-gk110-dmvid9.jpg

Dieshot eines GK110


Nachdem GK104 nun erschienen ist, wird das Themengebiet in den Sammler von Edge verschoben: http://www.hardwareluxx.de/communit...ches-bei-fragen-erste-seite-lesen-880765.html danke, an dieser Stelle für den Thread.

Hier soll es nun um GK110 gehen.


Short Facts:

Release: Tesla im Q4/2012, Geforce im Q1/2013
Zu erwartene Chips: sollte 7xx zutreffen dann 780, 770. Eine Dualversion kann man offiziel wohl ausschließen.

Daten zum Chip gibt es weiter unten.



1.1 Die Architektur

Nvidia hat auf der GTC viele neue Details zum GK110 verraten.

So soll der 7,1 Milliarden (!) Transistoren schwere Chip zuerst auf der Tesla K20 arbeiten, die gegen Ende des Jahres erscheinen soll. Mit dieser Masse an Transistoren stellt er den bis dato größten Chip der Geschichte dar. Desktoplösungen werden erst 2013 folgen, was zum einen niedrigen Yields als auch der bisher guten Position Nvidias in diesem Markt geschuldet sein kann.


Anders als beim GK104 bestizt GK110 pro SMX zusätzlich 64 DP-Einheiten um dort die Leistungsfähigkeit zu steigern (SP : DP = 3:1). Nicht ganz klar ist allerdings wie diese Einheiten aussehen. Bei Fermi arbeiteten einfach zwei Unified-Shader an einer DP-Berechnung, das hat den Vorteil keinen zusätzlichen Platz für DP-Einheiten aufbringen zu müssen. Würde NV bei GK110 nun wieder einen anderen Weg gehen dürfte die Chipfläche ohne massige erhöhung der Transistordichte nicht unter 600mm² bleiben. Immerhin müssten so 960 wietere Einheiten auf dem Chip untergebracht werden.
Auch der restliche Aufbau ist stark HPC orientiert, so kann ein Thread jetzt mehr Register nutzen als bei GK104 und mit Hyper Q sowie Dynamic Parallelism (Cuda 5.0) finden noch zwei weitere Features Einzug die GK104 nicht bot, aber für Desktopanwender keine Rolle spielen dürften. Allgemein ist GK110 stark Richtung HPC entwickelt worden, da in diesem Bereich der GK104 aufgrund mangenlder Fähigkeiten für DP nicht positioniert ist.

die-vergleich60uby.jpg

Die-Vergleich von GK110 und GK104. Achtung, die Größe ist nicht Maßstabsgetreu! (siehe weiter unten)

Für Spieler interessant könnte sein das NV angibt die TMUs nicht nur verdoppelt zu haben, sodern sie auch effizienter arbeiten. Ob man als Vergleich "nur" GF110 heranzieht oder wirklich GK104 ist zwar ungewiss, allerdings sprächen auch in letztem Fall die 240 TMUs für ausreichend Texturierleistung.

tesla_gk110_k20_3qtr_b38n0.jpg

Bild einer Tesla K20 Karte mit GK110





1.2 kleiner Chart

gk110v2nuaxd.jpg

1.3 Aussichten

Leistungsfähigkeit

Da Nvidia vor hat bei der Tesla K20 nur 13 oder 14 SMX zu aktivieren dürfte der Geforce wohl ein ähnliches Schicksal ereilen. Das steigert zum einen die Yields für NV und lässt natürlich auch Spekulationen über eine spätere Version mit allen Einheiten zu.

Ginge man von 13 SMX für die erste Version aus kämen wir bei einem halbwegs realistischen Chiptakt von 900 MHz auf 4,493 TFlops. Das wären immerhin ca. 45% mehr als bei GK104 (ohne Turbo). Dazu kommen noch die 208 verbleiben TMUs, was auch etwas 46% höhere Texturleistung bei 900 MHz entspricht und die um 50% höhere Bandbreite.

Summa Summarum scheinen 50% mehr Leistung also drin zu sein zum GK104, wieviel davon real bleibt muss man natürlich abwarten. Nvidia selbst gibt nur recht schwammige Aussagen über die Leistungsfähigkeit. So soll die DP-Leistung bei >1 TFlops liegen, was bei dem Ratio von 3:1 immerhin 3 TFlops SP bedeiten würde. Für die oben errechneten 4,5 TFlops sollten es dann aber schon 1,5 TFlops DP sein ;)


110104vergleich2w4uf7.jpg

Größenvergleich eines GK110 mit ca. 550mm² und einem GK104 mit ca. 295mm² (real sind es 294mm²)


Möglicher Refresh?

Interessant ist natürlich auch was bei einem Refresh zum GK110 drin wäre.

Ein Chip mit vollen SMX und einem höheren Takt von 950 MHz käme auf 5,472 TFlops, also ca. 21% mehr Leistung gegenüber der Version mit 13 SMX. Gleiche 21% gelten auch bei den Texturleistung.

Beim Speicher wird sich dagegen wohl kaum was ändern, denn GDDR5 scheint so langsam an seine bezahlbaren Grenzen zu kommen. Insgesamt wären also 15%+/- Mehrleistung drin um die Zeit bis Maxwell zu überbrücken.

Ob es so kommt weiß natürlich nur Nvidia selbst.


1.4 Linkliste

Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q (Golem, de)
GTC 2012: GK110-Grafikchip hat bis zu 2880 Shader-Kerne (heise, de)
GTC 2012: Die GK110-Schöpfer über Performance und zukünftige Herausforderungen (heise, de)
Nvidia gibt erste Infos zum großen Kepler GK110 bekannt (computerbase, de)
GK110: Weitere Details zur größten GPU der Welt [Update: Inside Kepler] (pcgh, de)
nVidias GK110-Chip mit 2880 Shader-Einheiten - im Gamer-Bereich aber erst im Jahr 2013 (3DCenter, de)






Thread im Aufbau!

Ich bitte alle User die an diesem Thread teilnehmen sich an eine gewisse Netiquette zu halten. Bitte lasst den Thread auch nicht zu einem Flamewar Rot gegen Grün verkommen sondern spekuliert aufgrund bekannter Fakten über den GK110. Versucht eigene Meinungen so wenig wie möglich in euren Post einfließen zu lassen, ebenso sind eure Wünsche und Kaufpläne evtl für andere User uninteressant.


Über ein Danke würde ich mich natürlich sehr freuen :wink:
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wo sind denn dann jetzt die bombigen Ankündigungen zum GK110 Titan? Wann gehts denn los? Wenn die wirklich in 4 Wochen Gummi geben wollen, dann wirds Zeit. Aber nein, da kommt nix. Warum? Weil der Titan erst April-Juni kommt, oder gar nicht so schnell ist, wie angenommen! So wirds doch kommen, machen wir uns doch nix vor :(

Was willst du hören...
Wenn Titan so auf GK110 Basis kommt, wie aktuell spekuliert, schaut dir K20 bzw. K20X von den Spezifikationen her an. Dann weist du, was Titan können wird.

Was aktuell unklar ist, ist der Takt sowie die TDP Einstufung für den Geforce-Desktop Markt. Aber gerade da der Takt essentiellen Einfluss auf die Einstufung hat und der Takt dazu bis wenige Tage vor Auslieferung ohne Schmerzen noch änderbar ist, weis man aktuell eigentlich alles, was es wissenswertes im Vorfeld gibt.
Die Taktspekulationen gehen aktuell von ~750-850MHz aus. Turbo jeweils oben drauf. Und die TDP liegt irgendwo im Bereich 225-250W. Ggf. mit mehr Takt auch drüber.

Mit dem PCGH-Save stürzt Metro hier beim Laden sofort ab.

Jupp, deswegen der Hinweis zum Save von Broly in seinem Bandbreitenthread.
Das PCGH Save ist irgendwie zermurkst, geht bei mir auch nciht...
 
Wo sind denn dann jetzt die bombigen Ankündigungen zum GK110 Titan? Wann gehts denn los? Wenn die wirklich in 4 Wochen Gummi geben wollen, dann wirds Zeit. Aber nein, da kommt nix. Warum? Weil der Titan erst April-Juni kommt, oder gar nicht so schnell ist, wie angenommen! So wirds doch kommen, machen wir uns doch nix vor :(

Warte mal auf die Chinesen, da werden schon ein paar 3D Mark Screens die Tage/Wochen geleakt werden. So wie immer vor dem Launch von neuen Karten. :drool:
Zumindest wenn Titan wirklich schon Ende Februar erscheint. ;)
 
Zuletzt bearbeitet:
Das es GK 104 an Bandbreite mangelt ist doch schon seit Launch bekannt vor allem bei GPU OC verläuft vieles im Sande bei dem Mittelklassen Layout.
 
Kommt halt auch immer auf die Engine drauf an, wie sich das auswirkt. Wird nicht viel Bandbreite, aber viel Textur-Leistung benötigt, kann sich eine 680er auch schon mal 50 - 60% vor einer 580er absetzen (default je). :) Aber klar, das wird mit dem 110er besser. Man muss ja auch bedenken, dass GK104 um etwa 30% oder so aufgepumpt wurde, um einigermaßen mit Tahiti mithalten zu können (zum Launch hatte man ja treiberbedingt oft auch noch einen Versprung, nun hat AMD halt mehr nachgelegt, die letzten Monate). Ziel war es ja früher mit GK104, mehr oder weniger 580er Leistung bei ~ 300$ MSRP zu ermöglichen :)

Aber gut, zurück zu GK110. ;)
 
Zuletzt bearbeitet:
Beim GK110 bin ich mir eigentlich fast sicher das das ganze dann eher so wird das AMD dann aufpumpen muss.

Auch wenn ich nun abschweife aber eigentlich hat grade AMD alle trümpfe auf der hand wegen den neuen konsolen, da diese ja bekanntlich die angebliche HD8000 beinhalten sollen.
Wenn AMD nun nicht wieder pennt und auch mit den engine entwicklern mal zusammen arbeitet könnten sie diese trümpfe dann auch im PC sektor einsetzen um einen entscheidenen vorteil gegenüber NV zu nutzen.
Bei NV ist ja auch bekannt das diese eng mit den entwicklern zusammen arbeiten und deswegen , vermute ich mal, drehen die NV karten meist immer sofort mit erscheinen eines spiel voll auf wärend AMD immer erst ein treiber navhschieben muss der stück für stück an leistung zu legt.
 
Zuletzt bearbeitet:
So, Metro 2033. Konnte nur bis 1254 beim Speicher runter, tiefer übernimmt er nicht. Bin grad zu faul ein Diagramm zu machen, Zahlenwerte müssen reichen. Immer SingleGPU, SLI machts zu kompliziert und schlecht vergleichbar.

GTX580@783MHz, alles max DX11, advanced PhysX aus

1080p + 4xMSAA
30.6 fps (100%) - 2010MHz VRAM (100%)
28.8 fps (94%) - 1512MHz VRAM (75%)
26.0 fps (85%) - 1254MHz VRAM (62%)

1600p + 4xMSAA
18.6 fps (100%) - 2010MHz VRAM (100%)
16.6 fps (89%) - 1512MHz VRAM (75%)
14.3 fps (77%) - 1254MHz VRAM (62%)

Man sieht:
1. Weniger Bandbreite senkt die fps nicht 1:1
2. Bei 1600p wirkt sich verringerte Bandbreite stärker aus als bei 1080p
 
Wie sieht das ganze aus wenn man mehr fps hat? Also wenn du Fps im bereich von 60 hast und am RAM rumspielst?
 
Wie soll ich mehr fps erreichen? Settings runterstellen? Die Frage ist, ob das nicht auch die Bandbreitenanforderungen mitsenkt und wieviel (mehr wie die benötigte Rechenleistung oder weniger). SLI mach ich wie gesagt nicht, das ist nicht vergleichbar mit SingleGPU wie Titan.
 
Ja ich denke nur das mehr fps wiederum eine schnellere abarbeitung bedeuten würde was wieder mehr speed vom RAM nötig macht.
Weil bei 30FPS zockt ja kaum einer weswegen das doch eigentlich nix sagend ist.
 
Man hätte die GPu auch takten sollen bei dem Test um zu sehen was der Ram macht.
Nicht nur die GTX680 profitiert dort von der Bandvreite bringt man beide auf die selben taktraten in Metro sieht man auch das es wo anders hackt beim GK104.
 
Zuletzt bearbeitet:
Ja ich denke nur das mehr fps wiederum eine schnellere abarbeitung bedeuten würde was wieder mehr speed vom RAM nötig macht.
Weil bei 30FPS zockt ja kaum einer weswegen das doch eigentlich nix sagend ist.

Ob du jetzt viele Berechnungen auf wenig fps verteilst oder weniger Berechnungen auf mehr fps, ist doch eher Schnuppe. Wie wer zockt ist auch irrelevant, es geht hier ja um eine theoretische Betrachtung.

Man hätte die GPu auch takten sollen bei dem Test um zu sehen was der Ram macht.

Das ergibt keinen Sinn :d
Entweder man schaut sich die GPU oder den VRAM isoliert an.
 
Zuletzt bearbeitet:
Was mich mehr interessiert wie schnell müsste den eigentlich der RAM takten damit es aufhört zu scallieren :fresse:
 
Ich würde schätzen bei 1600p ca. 20%

Was jetzt aber komisch ist:
Wenn die Bandbreite nicht hundertprozentig limitiert, müsste die Kepler doch noch etwas flotter sein, gerade in 1080p. Vielleicht liegt es doch an etwas anderem.
 
Zuletzt bearbeitet:
Ihr erzählt doch die ganze Zeit das der GK104 an der Bandbreite verhungert so ist es aber auch bei der 580 und in Summe bei gleichem GPU Takt und gleicher bandbreite verliert der GK104 gegen die 580 in Metro.
Darum sagte ich die ganze Zeit hier ist nicht nur die Bandbreite selbst das Problem.
Da liegt bei mir die Vermutung bei GPGPU.
 
jo box, thx.

Zumindest in 1600p schauts sogar mauer als bei GK104 aus.
Denn 38% weniger = 23% weniger Leistung ist sogar über 2:1, was GK104 angeht.
Ich denke aber mal, den Wert kann man schon fast etwas ausklammern, da er weit massiver Einbricht als noch der -25% Bandbreitenwert. Und das bei beiden Messungen.

Aber schon erstaunlich. 25% weniger Bandbreite = 6% weniger Leistung bei FullHD (also grob 4,2:1)
Und 38% wengier Bandbreite = 15% weniger Leistung bei FullHD = 2,5:1
Aber 25% weniger Bandbreite = 11% weniger Leistung bei 1600p = 2,2:1


Der Bandbreitenbedarf scheint also auch massivst mit der Auflösung zu steigen und zum zweiten besteht eine gewisse Mindestbandbreite, unter welcher die Skalierung nochmals stärker wegbricht...

Die 680er skaliert nach oben hin mit ca. 2:1... Aber schon bei FullHD, bei 1600p wohl sogar noch ne Ecke mehr...
Es bestätigt sich also meine Theorie nicht ganz. Obwohl die Tendenz schon sichtbar ist...
 
jo box, thx.

Zumindest in 1600p schauts sogar mauer als bei GK104 aus.
Denn 38% weniger = 23% weniger Leistung ist sogar über 2:1, was GK104 angeht.
Ich denke aber mal, den Wert kann man schon fast etwas ausklammern, da er weit massiver Einbricht als noch der -25% Bandbreitenwert. Und das bei beiden Messungen.

Aber schon erstaunlich. 25% weniger Bandbreite = 6% weniger Leistung bei FullHD (also grob 4,2:1)
Und 38% wengier Bandbreite = 15% weniger Leistung bei FullHD = 2,5:1
Aber 25% weniger Bandbreite = 11% weniger Leistung bei 1600p = 2,2:1


Der Bandbreitenbedarf scheint also auch massivst mit der Auflösung zu steigen und zum zweiten besteht eine gewisse Mindestbandbreite, unter welcher die Skalierung nochmals stärker wegbricht...

Die 680er skaliert nach oben hin mit ca. 2:1... Aber schon bei FullHD, bei 1600p wohl sogar noch ne Ecke mehr...
Es bestätigt sich also meine Theorie nicht ganz. Obwohl die Tendenz schon sichtbar ist...

bin mal gespannt wie es dann erst beim GK110 aussehen wird...
 
@blair was haben 20 Fps minimum mit Spielbarkeit zu tun.
Der screenshot oben in Full HD sagt genauso aus ob spielbar oder nicht da die min fps mit angezeigt werden da für brauche ich keinen Frameverlauf schon gar nicht von ca 30-60 Sekunden Benchmarks.
Also Essig.

Irgendwelche Balken sagen nichts über Spielbarkeit aus, das wollte ich dir nur damit klar machen. Ob du 20fps für spielbar hälst oder nicht, spielt dabei keine Rolle.
 
Was jetzt aber komisch ist:
Wenn die Bandbreite nicht hundertprozentig limitiert, müsste die Kepler doch noch etwas flotter sein, gerade in 1080p. Vielleicht liegt es doch an etwas anderem.

Eventuell fuscht dem GK104 das in Software ausgelagerte Schedulerzeugs für ne bessere "Effizienz" zwischen?
Eigentlich ist es irgendwie unlogisch. Denn rein von den Daten her müsste GK104 durchaus schneller sein...

Ihr erzählt doch die ganze Zeit das der GK104 an der Bandbreite verhungert so ist es aber auch bei der 580 und in Summe bei gleichem GPU Takt und gleicher bandbreite verliert der GK104 gegen die 580 in Metro.

Wie schon angesprochen. Drückst du GK104 auf GF110 GPU Taktraten dämmst du zwar die Leistung etwas ein. Aber der GK104 bricht massivst in der Pixelfüllrate ein. Das kann man nicht einfach ohne dedizierte Betrachtung des ROP Einflusses bei Metro so unter den Tisch kehren.
Ergo machen Vergleiche bei Taktgleichheit keinen Sinn.

Und wie schon angesprochen, GPGPU kann in der Theorie auch nicht das Thema sein, da Cuda/OpenCL oder was auch immer für Code direkt auf den ALUs läuft, welche beim GK104 in Summe auch mehr Leistung liefern, sogar noch, wenn du Taktgleichheit benchst ;)
 
Die 680er skaliert nach oben hin mit ca. 2:1... Aber schon bei FullHD, bei 1600p wohl sogar noch ne Ecke mehr...
Es bestätigt sich also meine Theorie nicht ganz. Obwohl die Tendenz schon sichtbar ist...

man könnte ja ne GTX 680 nochmal testen, wenn man der Karte ebenfalls rund 500MHz Takt abzieht, also -16,6% Takt. Wäre interessant, wie stark die Karte dann einbricht. Würde ich machen,stelle das dann auch in dem Bandbreitentest mit ein.
 
kannst du auch 1600p testen?
Wäre durchaus interessant. Vllt sogar zusätzlich nach oben hin...
 
Fdsonne man bekommt wenn man nen gescheiten Fermi hat auch die 1000 MHZ hin so liefen bei mir 2 Hydro Gen da mit ist es fair.
 
Eventuell fuscht dem GK104 das in Software ausgelagerte Schedulerzeugs für ne bessere "Effizienz" zwischen?
Eigentlich ist es irgendwie unlogisch. Denn rein von den Daten her müsste GK104 durchaus schneller sein...

Ist doch mit Tahiti genauso! schau dir mal die daten an. das müsste eigentlich ein mega monster sein kann aber auch nicht richtig loslegen!
Ich kenne mich da nun auch nicht so gut aus aber wie sieht es mit den ROPs aus könnten die vieleicht nicht auch ein flaschenhals darstellen?
 
Ein Unterschied wäre ja noch in den Shadertaktraten zu finden na ja was soll es so lange die dicke Berta nicht da ist.
 
So, hier der Metro Bench ->mit weniger Speichertakt bricht die GTX 680 recht stark ein:fresse:

Also: -17% Speichertakt -> in etwa -14% Leistung. Andersrum bietet die standard GTX 680 20% mehr Bandbreite und daraus resultierend 16% mehr Leistung gegenüber der 680 mit 160GB/s.
 
Zuletzt bearbeitet:
Fdsonne man bekommt wenn man nen gescheiten Fermi hat auch die 1000 MHZ hin so liefen bei mir 2 Hydro Gen da mit ist es fair.

Nein eben nicht...
Der GPU Takt ändert alle relevanten Leistungsdaten 1:1. Außer die Speicherbandbreite. Es ist gehopst wie gesprungen, GK104 runter auf den Takt von GF110 oder GF110 rauf auf den Takt von GK104 hat immer zur Folge, dass das beispielsweise ALU zu ROP Performanceverhältnis exakt identisch bleibt.

GK104 läuft in Metro scheinbar nur mit angezogener Handbremse. Und nach den Tests von Broly mit gesenktem Takt und noch krasserer Skalierung gehe ich weiterhin davon aus, das ein riesiger Teil der mauen Skalierung im Vergleich zu anderen Games primär von der Bandbreite/dem SI/bzw. allgemein dem Speichermanagement kommt.
Denn wie man sieht, ausgehend von default Takt erreicht das Teil in Brolys Run ne Skalierung von 2,41:1 bei VRAM Takt Erhöhung! Aber ne negative Skalierung von 1,2:1 bei VRAM Takt Absenkung.

Wie man den Knick visuel sieht, zeigt folgendes Diagramm aufbauend auf den benannten Werten.
attachment.php


Also wer hier nicht sieht, das es eine extreme VRAM Takt/Bandbreitenabhängigkeit gibt, der muss eindeutig zum Optiker :fresse:
Theoretisch müsste man zur genaueren Analyse nun noch ein paar mehr Benches mit verschiedenen VRAM Taktraten machen um den Punkt genauer zu definieren.
Auch könnte man das ganze noch in Relation zum GPU Takt setzen, was ich nun hier nicht gemacht habe (sondern die default Takte genommen habe, sprich ob der Knick eher passiert, wenn der GPU Takt höher/niedriger ist)
Man erkennt aber wunderschön, unterhalb von 3004 MHz hängt das Teil fast 1:1 am Speichertakt... Da könnt ihr mir erzählen was ihr wollt, ein Limit, was derart massiv negativ beeinflusst, löst sich nicht mit etwas mehr Takt einfach so in Luft auf...
 

Anhänge

  • Unbenannt.JPG
    Unbenannt.JPG
    42,1 KB · Aufrufe: 167
Zuletzt bearbeitet:
Naja hört sich gut an, aber ist schon sehr unglaubwürdig bisher. Aber ich sehe gerade, dass die 690GTX immernoch 850€ kostet. Da kann ich nur hoffen, dass die 780 Titan unter der 690 liegt, wenn auch nur knapp ^^. Sonst kommen wir auf 900€ + :(

Das Ti im Namen wäre aber purer Müll. Ti bei aktuellen Karten ist jawohl Mist....
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh