nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Status
Für weitere Antworten geschlossen.
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

nVidia GK110/Geforce 7xx [Speku-, News- & Diskussionsthread]

nvidia-kepler-gk110-dmvid9.jpg

Dieshot eines GK110


Nachdem GK104 nun erschienen ist, wird das Themengebiet in den Sammler von Edge verschoben: http://www.hardwareluxx.de/communit...ches-bei-fragen-erste-seite-lesen-880765.html danke, an dieser Stelle für den Thread.

Hier soll es nun um GK110 gehen.


Short Facts:

Release: Tesla im Q4/2012, Geforce im Q1/2013
Zu erwartene Chips: sollte 7xx zutreffen dann 780, 770. Eine Dualversion kann man offiziel wohl ausschließen.

Daten zum Chip gibt es weiter unten.



1.1 Die Architektur

Nvidia hat auf der GTC viele neue Details zum GK110 verraten.

So soll der 7,1 Milliarden (!) Transistoren schwere Chip zuerst auf der Tesla K20 arbeiten, die gegen Ende des Jahres erscheinen soll. Mit dieser Masse an Transistoren stellt er den bis dato größten Chip der Geschichte dar. Desktoplösungen werden erst 2013 folgen, was zum einen niedrigen Yields als auch der bisher guten Position Nvidias in diesem Markt geschuldet sein kann.


Anders als beim GK104 bestizt GK110 pro SMX zusätzlich 64 DP-Einheiten um dort die Leistungsfähigkeit zu steigern (SP : DP = 3:1). Nicht ganz klar ist allerdings wie diese Einheiten aussehen. Bei Fermi arbeiteten einfach zwei Unified-Shader an einer DP-Berechnung, das hat den Vorteil keinen zusätzlichen Platz für DP-Einheiten aufbringen zu müssen. Würde NV bei GK110 nun wieder einen anderen Weg gehen dürfte die Chipfläche ohne massige erhöhung der Transistordichte nicht unter 600mm² bleiben. Immerhin müssten so 960 wietere Einheiten auf dem Chip untergebracht werden.
Auch der restliche Aufbau ist stark HPC orientiert, so kann ein Thread jetzt mehr Register nutzen als bei GK104 und mit Hyper Q sowie Dynamic Parallelism (Cuda 5.0) finden noch zwei weitere Features Einzug die GK104 nicht bot, aber für Desktopanwender keine Rolle spielen dürften. Allgemein ist GK110 stark Richtung HPC entwickelt worden, da in diesem Bereich der GK104 aufgrund mangenlder Fähigkeiten für DP nicht positioniert ist.

die-vergleich60uby.jpg

Die-Vergleich von GK110 und GK104. Achtung, die Größe ist nicht Maßstabsgetreu! (siehe weiter unten)

Für Spieler interessant könnte sein das NV angibt die TMUs nicht nur verdoppelt zu haben, sodern sie auch effizienter arbeiten. Ob man als Vergleich "nur" GF110 heranzieht oder wirklich GK104 ist zwar ungewiss, allerdings sprächen auch in letztem Fall die 240 TMUs für ausreichend Texturierleistung.

tesla_gk110_k20_3qtr_b38n0.jpg

Bild einer Tesla K20 Karte mit GK110





1.2 kleiner Chart

gk110v2nuaxd.jpg

1.3 Aussichten

Leistungsfähigkeit

Da Nvidia vor hat bei der Tesla K20 nur 13 oder 14 SMX zu aktivieren dürfte der Geforce wohl ein ähnliches Schicksal ereilen. Das steigert zum einen die Yields für NV und lässt natürlich auch Spekulationen über eine spätere Version mit allen Einheiten zu.

Ginge man von 13 SMX für die erste Version aus kämen wir bei einem halbwegs realistischen Chiptakt von 900 MHz auf 4,493 TFlops. Das wären immerhin ca. 45% mehr als bei GK104 (ohne Turbo). Dazu kommen noch die 208 verbleiben TMUs, was auch etwas 46% höhere Texturleistung bei 900 MHz entspricht und die um 50% höhere Bandbreite.

Summa Summarum scheinen 50% mehr Leistung also drin zu sein zum GK104, wieviel davon real bleibt muss man natürlich abwarten. Nvidia selbst gibt nur recht schwammige Aussagen über die Leistungsfähigkeit. So soll die DP-Leistung bei >1 TFlops liegen, was bei dem Ratio von 3:1 immerhin 3 TFlops SP bedeiten würde. Für die oben errechneten 4,5 TFlops sollten es dann aber schon 1,5 TFlops DP sein ;)


110104vergleich2w4uf7.jpg

Größenvergleich eines GK110 mit ca. 550mm² und einem GK104 mit ca. 295mm² (real sind es 294mm²)


Möglicher Refresh?

Interessant ist natürlich auch was bei einem Refresh zum GK110 drin wäre.

Ein Chip mit vollen SMX und einem höheren Takt von 950 MHz käme auf 5,472 TFlops, also ca. 21% mehr Leistung gegenüber der Version mit 13 SMX. Gleiche 21% gelten auch bei den Texturleistung.

Beim Speicher wird sich dagegen wohl kaum was ändern, denn GDDR5 scheint so langsam an seine bezahlbaren Grenzen zu kommen. Insgesamt wären also 15%+/- Mehrleistung drin um die Zeit bis Maxwell zu überbrücken.

Ob es so kommt weiß natürlich nur Nvidia selbst.


1.4 Linkliste

Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q (Golem, de)
GTC 2012: GK110-Grafikchip hat bis zu 2880 Shader-Kerne (heise, de)
GTC 2012: Die GK110-Schöpfer über Performance und zukünftige Herausforderungen (heise, de)
Nvidia gibt erste Infos zum großen Kepler GK110 bekannt (computerbase, de)
GK110: Weitere Details zur größten GPU der Welt [Update: Inside Kepler] (pcgh, de)
nVidias GK110-Chip mit 2880 Shader-Einheiten - im Gamer-Bereich aber erst im Jahr 2013 (3DCenter, de)






Thread im Aufbau!

Ich bitte alle User die an diesem Thread teilnehmen sich an eine gewisse Netiquette zu halten. Bitte lasst den Thread auch nicht zu einem Flamewar Rot gegen Grün verkommen sondern spekuliert aufgrund bekannter Fakten über den GK110. Versucht eigene Meinungen so wenig wie möglich in euren Post einfließen zu lassen, ebenso sind eure Wünsche und Kaufpläne evtl für andere User uninteressant.


Über ein Danke würde ich mich natürlich sehr freuen :wink:
 
Zuletzt bearbeitet:
sry, meinte vernickelt^^ Dir scheint ja auch mal ein Begriff zu entfallen :d Man könnte auch mal beim Galvaniker vorbei schauen, der vernickelt oder verchromt...dürfte bei 1000 Lappen die Karte wohl noch drin sein :fresse2:
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ich kann dir Alu eloxieren. Zufälligerweise haben wir eine Multi-Millionen-Euro Anlage :d
 
viel interessanter finde ich die max clock frequency mit lediglich einer Angabe von 875mhz ... gar kein Turbo ??
OC ala GTX580? :d

Die Frage ist eher, was ist das für ein Wert!?
Weil MAX_CLOCK_FREQUENCY klingt schon nach Turbo...
ABER! was hat die 705 in der Spalte der 690er zu suchen? 705MHz hat das Teil schlicht nicht...
Die 705 würden beispielsweise auf K5000 Quadro passen, das sind meine ich 705MHz... Aber die hat wenig bis nix mit ner 690er gemein. Außer eben der GPU.

Mich würde interessieren, woher das Bild stammt... Weis das jemand?

naja man kann mit 384 Bit auch 1GB anbinden oder 25GB
ist vollkommen unproblematisch
das Interface meiselt nicht in Stein wieviel dranhängt

Neja doch schon...
Du hast nur mit 1,5/3/6GB volle Bandbreite über die gesamte VRAM Größe.
Mischbetrieb wäre potentiell möglich, siehe Gk104 mit 192Bit SI und 2GB. Aber da werden dann unterschiedlich große Speicherbausteine eingesetzt, die eben runtergebrochen pro MB nur mit halben Speed angebunden sind.
Denn das sind dann 4x256MB Bausteine, je an einem 64Bit Controller. Sowie 2x512MB Bausteine ebenfalls je an einem 64Bit Controller.
Macht in Summe 6x64Bit = 192Bit SI.
Nur kann das Teil eben maximal 1536MB mit voller Busbandbreite ansprechen. Die letzten 512MB werden nur mit weniger Speed ansprechbar sein und bleiben. Denn die hängen nur an 128Bit (in Summe 2x64Bit)...

Für mich macht so eine 4GB Bestückung keinen Sinn... Weil einfach das SI vorhanden ist.
Bei den Karten bis dato, die eben so ne Krüppelbestückung bekommen haben, war es immer so, das das SI eben zu klein war für den VRAM Ausbau. Im Fall des GK104 wären eben 1,5GB oder 3GB linear drin. Erstes wohl zu wenig, letzteres zu viel. Also geht man den unschönen Mittelweg. Bei GK110 ist dies definitiv nicht der Fall. Denn 3GB wären potentiell ausreichend und 6Gb wären auch nicht verkehrt für so ein Teil.
4GB mit 384Bit wären aber 8x256MB + 4x512MB. Und somit 3GB mit Vollspeed + 1GB mit weniger Bandbreite.
Warum sollte man das machen? Vor allem da ja bekannt ist, das das die Bandbreite schon beim GK104 etwas anfängt zu limitieren.
 
Zuletzt bearbeitet:
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

"....such as EVGA, Asus, MSI..."

Heißt nicht "nur EVGA, Asus, MSI" - sondern eher "Anbieter wie EVGA, Asus, MSI.."
Können also auch andere sein.

Klar gehen technisch auch 384 und 4 oder 5GB, wäre aber eben ein Paradigmenwechsel, wie es ihn noch nicht gab. Wohl klar was ich meinte, oder?
fdsonne hat es ja technisch untermauert, Sinn machen 4GB und 384bit SI nicht - aber kommt ja eh nicht so.

Und ... Alu: ist wohl analog zum Magnesium-Body der 690 zu sehen.
Nur könnte der Body eben mit Alu versehen sein. Kann schon schick werden, der Luftkühler....
 
Zuletzt bearbeitet:
Sorry, aber wiewiel schneller zur GTX 680 könnte laut obrigen Specs die Karte nun werden.
Die ca. 50% Mehrperformance bei Games sollten somit wohl schwer zu halten sein... oder irre ich mich hier gewaltig ?
 
"....such as EVGA, Asus, MSI..."

Heißt nicht "nur EVGA, Asus, MSI" - sondern eher "Anbieter wie EVGA, Asus, MSI.."
Können also auch andere sein.

Klar gehen technisch auch 384 und 4 oder 5GB, wäre aber eben ein Paradigmenwechsel, wie es ihn noch nicht gab. Wohl klar was ich meinte, oder?

Und ... Alu: ist wohl analog zum Magnesium-Body der 690 zu sehen.
Nur könnte der Body eben mit Alu versehen sein. Kann schon schick werden, der Luftkühler....

Ach das is Magnesium? Bin bisher immer von Alu ausgegangen. Muss zu meiner Schande aber auch gestehen das ich nie ein Review dieser Karte gelesen habe :d
 
Sorry, aber wiewiel schneller zur GTX 680 könnte laut obrigen Specs die Karte nun werden.
Die ca. 50% Mehrperformance bei Games sollten somit wohl schwer zu halten sein... oder irre ich mich hier gewaltig ?

Es ist nichts entgültiges bekannt aktuell...
Im Bild zu sehende 875MHz ohne Turbo bei 14 SMX würden theoretische 44,7% mehr Performance auf ne GK104 GPU im min. Turbo von 1,058GHz ergeben.
Dazu die spekulierten +50% Bandbreite und du bekommst ~45-50% mehr Performance. In VRAM limitierenden Settings von GK104 (2GB) gern auch mehr.
Zumindest wenn man simpel rechnet. Die ein oder andere Optimierung kann da schon noch mehr rausquetschen. Der Schnitt würde aber so in etwa hinkommen. Zumahl Kepler GPUs aktuell ziemlich analog mit ALU/Takt sowie Bandbreite nach oben skalieren. Da würde wohl GK110 nicht aus der Reihe fallen...

Würde theoretisch sogar mit dem Verbrauch hinkommen. Denn ~175W für ne GK104 680er Karte real mal 45% wären 253,75W -> passt!
 
Zuletzt bearbeitet:
Muss zu meiner Schande aber auch gestehen das ich nie ein Review dieser Karte gelesen habe :d

Ah deswegen hast im 3D-Center gemeint, die ist laut ^^

---------- Post added at 11:00 ---------- Previous post was at 10:59 ----------

Es ist nichts entgültiges bekannt aktuell...
Im Bild zu sehende 875MHz ohne Turbo bei 14 SMX würden theoretische 44,7% mehr Performance auf ne GK104 GPU im min. Turbo von 1,058GHz ergeben.
Dazu die spekulierten +50% Bandbreite und du bekommst ~45-50% mehr Performance. In VRAM limitierenden Settings von GK104 (2GB) gern auch mehr.
Zumindest wenn man simpel rechnet. Die ein oder andere Optimierung kann da schon noch mehr rausquetschen. Der Schnitt würde aber so in etwa hinkommen. Zumahl Kepler GPUs aktuell ziemlich analog mit ALU/Takt sowie Bandbreite nach oben skalieren. Da würde wohl GK110 nicht aus der Reihe fallen...

Würde theoretisch sogar mit dem Verbrauch hinkommen. Denn ~175W für ne GK104 680er Karte real mal 45% wären 253,75W -> passt!

Ich würde GK110 sogar nochmal 5-10% mehr Performance dazu rechnen, aufgrund größerer Caches etc.

siehe hier:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9652392&postcount=2774
 
Zuletzt bearbeitet:
Das erinnert mich eher an Bier :d Für gluck gluck hab ich keine Kohle :P

sh!t wir werden OT, Jungs.

Äh..äääh hat GK110 Silizium onboard?
 
Zuletzt bearbeitet:
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Verdichtet sich ja mehr und mehr :)
 
Ach ja noch mal zu CL_DEVICE_MEM_BASE_ADDR_ALIGN:

Describes the alignment in bits of the base address of any allocated memory object.

Quelle. Danke skysnake @3DC.
 
The card will definitely look better than the GTX 690, although the design will mirror it’s dual-gpu brother. The GeForce GTX Titan will be covered with the magnesium alloy, while the whole card will be metallic silver


Hört sich an wie der Duft frischer Brötchen:fresse:
 
Hört sich an wie der Duft frischer Brötchen:fresse:

Wow, noch besser als ne 690 vom Board her. Also ich bin wirklich gespannt was da kommt. Ich bin nur mehr am überlegen, ob ich sofort am Launch zwei Karten kaufen soll, oder doch lieber ein paar Wochen warte. Bei der 690 hab ich direkt beim Launch gekauft, zwei Stück um 2k €. Wirklich billiger sind sie IMO erst viel später geworden.
 
Mich graut es schon wieder davor am schicken Kleidchen das Amputationswerkzeug an zu setzen aber einmal Wakü immer Wakü:d
 
Wäre eigentlich mal angebracht, die Karte für 50-100 Euro weniger ohne Kühler zu verkaufen - an die, die eh Wakü draufschnallen :)
Ich finds schade, die tollen Kühler werden bei mir sofort in der Ecke landen.
 
Der dänische Lappenladen war doch sogar unter 1000€. Also 1000 werdens net, das wäre ne Spur zu exklusiv. Dann wars das für mich :(

Ich bin aber immernoch gespannt, auch wenns Banane aussieht.

Warum verkaufen die das Teil nicht einfach für 10000€? Der ein oder andere Millionär/Milliardär wird zuschlagen! Exklusiver gehts dann kaum :)
 
Zuletzt bearbeitet:
Was ich auch super finde: Anscheinend bekommen die Reviewer gleich 3 Karten um 3-Way-SLI zu testen.
 
Guckt man sich den aktuellen Preis der GTX690 an, sollte die Karte für uns bei 850€ liegen.
Immerhin ist die langsamer als die GTX690 und ich bezweifel, dass nVidia AFR mGPU der Lächerlichkeit preisgeben will.
 
Ich würde GK110 sogar nochmal 5-10% mehr Performance dazu rechnen, aufgrund größerer Caches etc.

siehe hier:
3DCenter Forum - Einzelnen Beitrag anzeigen - nVidia - GK110 - High-End-Kepler - Q1 2013

Der Vergleich hinkt aber etwas finde ich...
Da Fermi und Kepler Grundverschiedene Thematiken sind.
Auch sind gewisse Sachen aus dem Scheduling aus der Hardware auf die CPU gewandert.

Gemessen daran, das GK104 aus der reinen Roh ALU Performance im Vergleich zu GF110 nur unwesentlich mehr FPS Power ziehen kann, wage ich zu bezweifeln, das größere Caches hier massiv viel mehr bringen. Denn es macht viel eher den Eindruck, als limitiert an der ganzen Technik was anderes, als die reine ALU Rohpower. Denn mit SP GPGPU Tools bekommst du zum Teil GK104 auch deutlich schneller als GF110, weit mehr wie ~35%, wie sie uns Games zeigen.
Was genau, ist schwer zu beurteilen, könnte Bandbreite sein, könnte TMU Leistung sein, könnte ROP Leistung sein, könnte auch simpel irgendwelches Schedulerzeugs sein usw.

PS: ich finde die Rechnung in deinem Link auch irgendwie komisch...
Vor allem, die Cacherechnung von Fermi. Nur weil HotClock kann man die ALU Anzahl nicht mal zwei nehmen... Das ist quark. ;)
Auch macht in meinen Augen so eine pro ALU Rechnung keinen Sinn. Denn der L2 Cache ist ein Shared Cache. Und kein dediziert einer Einheit zugeordneter Cache. Das heist, theoretisch kann eine einzige ALU sowohl bei Fermi GF110 als auch bei Kepler GK104 oder GK110 jeweils den vollen Cache alleine benutzen.
Wie dort aber richtigerweise geschrieben wurde, hängt der Vorteil eines Caches massiv von der Berechnung selbst ab. Hochkomplexe Berechnungen mit vielen und vor allem großen Zwischenergebnissen werden Vorteile aus großen Caches ziehen. Kleinstberechnungen bzw. Simple Berechnungen eher wenig bis gar nix.
Dazu hängt der Spaß auch am Durchsatz des Caches. Denn Cache ist nur dann auch schnell, wenn dieser genügend Durchsatz bietet. Da GK110 aber langsamer als GK104 takten wird, büßt er folglich auch etwas Potential ein.

Und wie so oft bei Caches ist der reine Performanceeinfluss so gar nicht vorhersagbar.
GK106 hat wohl 384KB L2 Cache. GK104 hat 512KB. GK107 kommt immerhin noch auf 128KB (wenn ich das recht in Erinnerung habe)
Man erkennt aber zumindest, das diese simple ALU pro Cache Rechnung mit GK104 schlechter für diesen ausschaut als bei den anderen beiden der Fall ist. Dennoch flacht die Leistungskurve nicht ab! Der Spaß skaliert in Richtung FPS Leistung ziemlich simpel linear nach reiner mehr theoretischer Performance sowie Bandbreite. GTX 660 non TI zu GTX670, 32,8% mehr theoretische GPU Power (jeweils min Turbo) sowie 33,3% mehr Bandbreite = laut CB 34% mehr Performance. -> Null Einfluss vom abgeflachten Cacheverhältnis!
 
Zuletzt bearbeitet:
Wie dort aber richtigerweise geschrieben wurde, hängt der Vorteil eines Caches massiv von der Berechnung selbst ab. Hochkomplexe Berechnungen mit vielen und vor allem großen Zwischenergebnissen werden Vorteile aus großen Caches ziehen. Kleinstberechnungen bzw. Simple Berechnungen eher wenig bis gar nix.

Also brauchen wir gar nicht weiter um den heißen Brei reden,solange keiner sieht wie sich das große Cachedesign,auf zukünftige oder auch schon heutige Spieletitel auswirkt die aktiv supportet werden im Nvidia Portfolio,wirds keiner mit Sicherheit vorhersagen können

Was haben wir denn hier

7e971435_hmmmredacted.png
 
Zuletzt bearbeitet:
Es haben nur einige wenige 3 Karten erhalten, nicht jede Redaktion. ;) Bitte nicht falsch verstehen. Afaik techpowerup.com und hierzulande vllt. computerbase.de. CB ist allerdings eher die Schülerzeitung unter den online-Magazinen ;)
Ich hoffe das Peter von ht4u ein sample hat da die Tests dort immer sehr ausführlich sind. Imo die besten deutschsprachigen Reviews.
 
Die 705 MHz sind einfach zu erklären - das gilt schon seit GK104-Launch. :)
Da wurde der NVAPITest verwendet und der kann P0 nicht mehr korrekt auslesen - das ist auch der Grund, warum 3DM hier den falschen Baseclock ausliest, obwohl NV darauf hingewiesen hat, dass das nicht mehr stimmt. Nur für P5 & P8 funktioniert das Auslesen so noch korrekt.
 
Zuletzt bearbeitet:
scully richtig, deswegen ja der Vergleich zwischen Kepler klein und Kepler noch kleiner ;) Wo das ablachende Cache zu ALU Verhältnis keinen Einfluss hat. Nämlich 409,60 Byte pro ALU bei GK106 zu 341,33 Byte pro ALU bei GK104. (um es mit der Rechnung aus dem 3DCenter zu bestätigen)

PS: bei GK110 wären es 546,13 Byte pro ALU.
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh