nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

Status
Für weitere Antworten geschlossen.
nVidia GK110/Geforce 7xx/Geforce Titan [Speku-, News- & Diskussion] (1. Seite lesen!)

nVidia GK110/Geforce 7xx [Speku-, News- & Diskussionsthread]

nvidia-kepler-gk110-dmvid9.jpg

Dieshot eines GK110


Nachdem GK104 nun erschienen ist, wird das Themengebiet in den Sammler von Edge verschoben: http://www.hardwareluxx.de/communit...ches-bei-fragen-erste-seite-lesen-880765.html danke, an dieser Stelle für den Thread.

Hier soll es nun um GK110 gehen.


Short Facts:

Release: Tesla im Q4/2012, Geforce im Q1/2013
Zu erwartene Chips: sollte 7xx zutreffen dann 780, 770. Eine Dualversion kann man offiziel wohl ausschließen.

Daten zum Chip gibt es weiter unten.



1.1 Die Architektur

Nvidia hat auf der GTC viele neue Details zum GK110 verraten.

So soll der 7,1 Milliarden (!) Transistoren schwere Chip zuerst auf der Tesla K20 arbeiten, die gegen Ende des Jahres erscheinen soll. Mit dieser Masse an Transistoren stellt er den bis dato größten Chip der Geschichte dar. Desktoplösungen werden erst 2013 folgen, was zum einen niedrigen Yields als auch der bisher guten Position Nvidias in diesem Markt geschuldet sein kann.


Anders als beim GK104 bestizt GK110 pro SMX zusätzlich 64 DP-Einheiten um dort die Leistungsfähigkeit zu steigern (SP : DP = 3:1). Nicht ganz klar ist allerdings wie diese Einheiten aussehen. Bei Fermi arbeiteten einfach zwei Unified-Shader an einer DP-Berechnung, das hat den Vorteil keinen zusätzlichen Platz für DP-Einheiten aufbringen zu müssen. Würde NV bei GK110 nun wieder einen anderen Weg gehen dürfte die Chipfläche ohne massige erhöhung der Transistordichte nicht unter 600mm² bleiben. Immerhin müssten so 960 wietere Einheiten auf dem Chip untergebracht werden.
Auch der restliche Aufbau ist stark HPC orientiert, so kann ein Thread jetzt mehr Register nutzen als bei GK104 und mit Hyper Q sowie Dynamic Parallelism (Cuda 5.0) finden noch zwei weitere Features Einzug die GK104 nicht bot, aber für Desktopanwender keine Rolle spielen dürften. Allgemein ist GK110 stark Richtung HPC entwickelt worden, da in diesem Bereich der GK104 aufgrund mangenlder Fähigkeiten für DP nicht positioniert ist.

die-vergleich60uby.jpg

Die-Vergleich von GK110 und GK104. Achtung, die Größe ist nicht Maßstabsgetreu! (siehe weiter unten)

Für Spieler interessant könnte sein das NV angibt die TMUs nicht nur verdoppelt zu haben, sodern sie auch effizienter arbeiten. Ob man als Vergleich "nur" GF110 heranzieht oder wirklich GK104 ist zwar ungewiss, allerdings sprächen auch in letztem Fall die 240 TMUs für ausreichend Texturierleistung.

tesla_gk110_k20_3qtr_b38n0.jpg

Bild einer Tesla K20 Karte mit GK110





1.2 kleiner Chart

gk110v2nuaxd.jpg

1.3 Aussichten

Leistungsfähigkeit

Da Nvidia vor hat bei der Tesla K20 nur 13 oder 14 SMX zu aktivieren dürfte der Geforce wohl ein ähnliches Schicksal ereilen. Das steigert zum einen die Yields für NV und lässt natürlich auch Spekulationen über eine spätere Version mit allen Einheiten zu.

Ginge man von 13 SMX für die erste Version aus kämen wir bei einem halbwegs realistischen Chiptakt von 900 MHz auf 4,493 TFlops. Das wären immerhin ca. 45% mehr als bei GK104 (ohne Turbo). Dazu kommen noch die 208 verbleiben TMUs, was auch etwas 46% höhere Texturleistung bei 900 MHz entspricht und die um 50% höhere Bandbreite.

Summa Summarum scheinen 50% mehr Leistung also drin zu sein zum GK104, wieviel davon real bleibt muss man natürlich abwarten. Nvidia selbst gibt nur recht schwammige Aussagen über die Leistungsfähigkeit. So soll die DP-Leistung bei >1 TFlops liegen, was bei dem Ratio von 3:1 immerhin 3 TFlops SP bedeiten würde. Für die oben errechneten 4,5 TFlops sollten es dann aber schon 1,5 TFlops DP sein ;)


110104vergleich2w4uf7.jpg

Größenvergleich eines GK110 mit ca. 550mm² und einem GK104 mit ca. 295mm² (real sind es 294mm²)


Möglicher Refresh?

Interessant ist natürlich auch was bei einem Refresh zum GK110 drin wäre.

Ein Chip mit vollen SMX und einem höheren Takt von 950 MHz käme auf 5,472 TFlops, also ca. 21% mehr Leistung gegenüber der Version mit 13 SMX. Gleiche 21% gelten auch bei den Texturleistung.

Beim Speicher wird sich dagegen wohl kaum was ändern, denn GDDR5 scheint so langsam an seine bezahlbaren Grenzen zu kommen. Insgesamt wären also 15%+/- Mehrleistung drin um die Zeit bis Maxwell zu überbrücken.

Ob es so kommt weiß natürlich nur Nvidia selbst.


1.4 Linkliste

Größter Chip der Welt mit 7 Mrd. Transistoren und Hyper-Q (Golem, de)
GTC 2012: GK110-Grafikchip hat bis zu 2880 Shader-Kerne (heise, de)
GTC 2012: Die GK110-Schöpfer über Performance und zukünftige Herausforderungen (heise, de)
Nvidia gibt erste Infos zum großen Kepler GK110 bekannt (computerbase, de)
GK110: Weitere Details zur größten GPU der Welt [Update: Inside Kepler] (pcgh, de)
nVidias GK110-Chip mit 2880 Shader-Einheiten - im Gamer-Bereich aber erst im Jahr 2013 (3DCenter, de)






Thread im Aufbau!

Ich bitte alle User die an diesem Thread teilnehmen sich an eine gewisse Netiquette zu halten. Bitte lasst den Thread auch nicht zu einem Flamewar Rot gegen Grün verkommen sondern spekuliert aufgrund bekannter Fakten über den GK110. Versucht eigene Meinungen so wenig wie möglich in euren Post einfließen zu lassen, ebenso sind eure Wünsche und Kaufpläne evtl für andere User uninteressant.


Über ein Danke würde ich mich natürlich sehr freuen :wink:
 
Zuletzt bearbeitet:
GK110 wird aber eigentlich für einen anderen Vewendungszweck mitentwickelt.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn Nvidia das Verhältnix zwischen Single und Double-precision wesentlich steigern will, dann müssen sie mehr machen, als GK104 zu verdoppeln.
Es sei denn DP ist bei dem GK104 Chip künstlich beschnitten (Treiber, Bios).
 
was heißt hitzköpfiges Monster^^
wenn man bedenkt, dass bei GK104 kein VaporChamber zu Einsatz kommt, sondern eher ein kleiner Kühler sollte sich das mit dem GK110 relativieren wenn sie den wieder zum Einsatz bringen.
Man muß ja mit einberechnen, dass sie das auto OC nicht vernachlässigen dürfen, welches unter warmen /heißen Umständen quasi sich von selbst auf ein Minimum reduziert. Das können die sich nicht leisten. Prinzipiell gesehen ist es mir eigendlich egal wie sie es zustande bringen. Ich erwarte etwas höhere Temps(unter Wasser mir egal), 30-40% mehr Spieleleistung, 4GB VRAM und eine Karte die die Benchnudel schwillen lässt^^ Eine perfekte Karte für SLI (DS und Multimonitoring) wie sie eigendlich schon hätte released werden sollen *G*
 
Arikus83: Ja, das ist soweit ich weiss eine reine Software-Beschneidung, sogar die GF110-Grakas sind gegenüber den Tesla-Varianten (halbe DP-Leistung) noch beschnitten. Und die GTX680 ist da mit 1/16 deutlich stärker beschnitten, als die GF114-Karten (1/12) es gegnüber den GF110-Karten (1/8) waren.

@Grinsemann: Nur weil der GK104 noch gut kühlbar ist, muss der GK110 es nicht auch sein. Wie war das denn bei GF100 und GF110? Und die meisten hier vermuten ja, dass beim GK110 sogar noch mehr gegenüber dem GF110 verändert wird, als beim GK104 gegenüber dem GF114 und auf jeden Fall die ALUs mehr als vervierfacht werden. Da kommt schon genug zusammen, dass der GK110 wieder ein ziemliches Monster wird, aber ich bin guter Dinge, dass das dank Turbo, Framelimiter und adaptiver VSync weniger stark ins Gewicht fällt.

Hat übrigens schonmal jemand getestet, wie sich diese Features auf ältere Generationen auswirken? Viel Einsparung kommt bei der GTX680 sicher von der fast stufenlosen Spannungs- und Taktanpassung durch den Turbo, aber auch ältere Karten haben da ja gewisse Möglichkeiten und der Verbraucht sinkt auch bei gleichbleibender Spannung und gleichem Takt allein schon dadurch, dass die Karte nicht am Limit arbeiten muss und nciht so heiß wird. Im 3DCenter-Forum hat ja jemand für den 301.10-Triber eine veränderte Inf gepostet, mit dem mann den Treiber mit allen sonst auch noch üblichen GeForce nutzen kann.
 
Zuletzt bearbeitet:
GK110 wird aber eigentlich für einen anderen Vewendungszweck mitentwickelt.

Das könnte für uns 0815 Consumer auch äusserst negativ sein, je nachdem wie lang nvidia schon wusste/ahnte das gk104 reicht gegen die tahiti&co

eventuell hat man den gk100 gecanceled weil es sich abzeichnete das gk104 potent genug sein könnte und den gk100 zum gk110 etwas umgestrickt um hauptsächlich den Profimarkt zu bedienen, soll nicht heissen das der vielleicht nicht schneller als der gk104 wird aber vielleicht nicht in dem Maße wie wir es uns für Consumer Karten erhoffen.
 
Stimmt da haben sie an den teuren Chamber gespart, mit dem Teil wäre der GK104 vielleicht sogar noch mal 10°C kühler.
 
Zuletzt bearbeitet:
deswegen wird der VaporChamber mit 100%er Sicherheit auch wieder zum Einsatz kommen bei den Referenzmodellen. Bei den Customlayouts kommen bestimmt wieder solche fetten Teile wie die Trippleslotlösungen (die einer Handtasche meiner Frau ähnelt^^)zum Einsatz um sie auch leise zu gestalten. Ich bin gespannt ob die bei der Stromversorgung wieder Türmchen bauen, oder lieber wieder alles auf einer Ebene statt finden wird. Ich mags lieber auf schmalem Fuß mit Wasserblock.
Ein Monster darf der GK110 auch ruhig sein, insofern es nur die Leistung betrifft.
Bis zu ner Classified Variante haben wir sicherlich schon Weihnachten, wenn nicht sogar Neujahr durch. Was den Ram betrifft werden die sicherlich direkt aufs volle potential setzen. Ich kann mich auch täuschen.
Möglich wäre, dass sie es wie bei GK104 handhaben. Erst 2GB für Singlecarduser und ein paar Monate später dann 4GB. Wenn dem so sein sollte, dann dürfte erst im nächsten Jahr das kommen worauf einige schon seit monaten warten. Irgendwie voll zum Kotzen*G* und mit Maxwell rechne ich auch nicht vor März 2014.
 
Das ist für uns 0815 Consumer auch äusserst negativ, je nachdem wie lang nvidia schon wusste/ahnte das gk104 reicht gegen die tahiti&co

eventuell hat man den gk100 gecanceled weil es sich abzeichnete das gk104 potent genug sein könnte und den gk100 zum gk110 etwas umgestrickt um hauptsächlich den Profimarkt zu bedienen, soll nicht heissen das der vielleicht nicht schneller als der gk104 wird aber vielleicht nicht in dem Maße wie wir es uns für Consumer Karten erhoffen.

Ich hab das mal korrigiert.
Alles was man mitbezahlt aber vorrangig nicht braucht ist negativ. Schau dir GK104 und Tahiti doch einfach mal an. GK104 zeigt was möglich wäre wenn man versucht nur eine Spielergrafikkarte zu machen und Tahiti zeigt was alles dazu kommt wenn man noch versucht in den HPC-Markt zu kommen.

Genauso wird es GK110 ergehen. Sicherlich wird er schneller als GK104, auch in Spielen, aber eben auf Spielebene bei weitem nicht so effizient im Bezug auf Diesize/TDP/ALUs.
 
Ich finde das echt spannend - denn im Prinzip haben sich jetzt innerhalb von 2 Jahren die Verhältnisse komplett gedreht...
AMD hatte vor 2 Jahren die 5870 am Start welche total auf Spiele ausgerichtet war, noch dazu kühl und leise. Im Gegensatz dazu die GTX480 - total auf HPC optimiert, heiß, laut....trotzdem schnell genug aber naja.

Jetzt ist das total umgekehrt - mit Kepler wurde viel Chipfläche durch Auslagerung der Dispatch Logik vom Chip in den Treiber eingespart und hat diese genutzt um massiv in die Anzahl von Shadern zu investieren. Das wirkt sich natürlich positiv bei Spielen aus - HPC und CUDA ist natürlich eingebrochen. Schon bei der GF114 (GTX460 und GTX560) ging es in diese Richtung -nun ist der Maximalausbau erreicht. Bei gerade mal 18% mehr Transistoren (GF110 auf GK104) ~30% Mehrleistung, stromsparend und leise - ein Erfolg für NVidia.

Bei AMD schauts umgekehrt aus - die haben in die Computing Architektur investiert und den Transistorenpreis dafür bezahlt - mit dem Ergebnis einer Karte, die mehr oder weniger knapp vor einer GTX580 liegt aber leise und stromsparend ist.
Beim Vergleich Kepler zu Fermi schauts noch krasser aus 10% Performance Plus bei knapp 18% weniger Transistoren.... Somit hat sich das Blatt im Vergleich zu vor 2 Jahren genau umgekehrt.

Spannend wird der echte Nachfolger der GTX580 - aber in jedem Fall haben es AMD und NV geschafft, die "Performance - Sektion" für 400€++ an den Mann zu bringen. Schlecht für uns aber gut für die Kasse der Firmen.
Bleibt nur zu hoffen, dass das nicht so bleibt, und dass das echte High End Segment wieder richtig gut wird.
 
Die 680 ist ne echt nette Karte, 7970 +/-15% vor 580 und die 680 5-10% vor der 7970, bei leicht weniger Verbrauch.(Nach Computerbase Rating in Spielen) Was gekauft wird entscheidet der Preis!
 
in full hd ist sie gut 30% schneller ;). Kommt aber aufs game an.


bin ja mal gespannt wie die 670 ti und 670 werden :)
 
Ich könnte mir sogar vorstellen, NV fährt nen extrem niedrigen GPU Takt beim GK110.
Das Turbo Feature scheint ja gut zu funktionieren.

Dreht man die Ausführungseinheiten um 50-100% hoch, den Takt und somit die Spannung nochmals massiv runter und spezifiziert die TDP auf ~250W, kommt zwar erstmal nicht wirklich viel Mehrleistung bei rum, dafür könnte aber der Turbo für den Gamer in Verbindung mit dem Powerregler durchaus die Performance gut nach oben drücken. Ausgehend von 250W wären 30% dann eine Leistungsaufnahme von bis 325W. Und somit gute 62,5% mehr Luft, ausgehend vom GK104.
Unter "normalen" Umständen hätte ich gesagt, das Teil bekommt nie im Leben mehr wie 50% Ausführungseinheiten zum GK104 und muss dazu noch massiv am Takt Federn lassen. In Verbindung mit dem Turbofeature könnte das Teil aber ein wirklich "Mördergerät" werden...
OC technisch würde ich gar behaupten, geht deutlich mehr wie beim GK104, sofern man die Spannung und somit das Turboverhalten für sich beeinflussen kann.
HighEnd wird zwar mit größter Warscheinlichkeit immernoch nicht effizienter arbeiten, als die Performance GK104, aber selbst wenn da 40-50% Mehrleistung im +30% Powerregler rum kommen, wäre das schonmal ein massiver Schritt in die richtige Richtung.
 
ich denke gk110 wird ineffizienter wie gk104,da halt ausführungseinheiten drin sind die beim gk104 fehlen weils ne gamer karte ist.

heisst aber nicht das die karte nicht genug power haben wird ;).
 
Ich könnte mir sogar vorstellen, NV fährt nen extrem niedrigen GPU Takt beim GK110.
Das Turbo Feature scheint ja gut zu funktionieren.

Dreht man die Ausführungseinheiten um 50-100% hoch, den Takt und somit die Spannung nochmals massiv runter und spezifiziert die TDP auf ~250W, kommt zwar erstmal nicht wirklich viel Mehrleistung bei rum, dafür könnte aber der Turbo für den Gamer in Verbindung mit dem Powerregler durchaus die Performance gut nach oben drücken. Ausgehend von 250W wären 30% dann eine Leistungsaufnahme von bis 325W. Und somit gute 62,5% mehr Luft, ausgehend vom GK104.
Unter "normalen" Umständen hätte ich gesagt, das Teil bekommt nie im Leben mehr wie 50% Ausführungseinheiten zum GK104 und muss dazu noch massiv am Takt Federn lassen. In Verbindung mit dem Turbofeature könnte das Teil aber ein wirklich "Mördergerät" werden...
OC technisch würde ich gar behaupten, geht deutlich mehr wie beim GK104, sofern man die Spannung und somit das Turboverhalten für sich beeinflussen kann.
HighEnd wird zwar mit größter Warscheinlichkeit immernoch nicht effizienter arbeiten, als die Performance GK104, aber selbst wenn da 40-50% Mehrleistung im +30% Powerregler rum kommen, wäre das schonmal ein massiver Schritt in die richtige Richtung.

Wenn man mal drüber nachdenkt das der nächste Prozess sogar bis 2014 auf sich warten lassen könnte, wäre es nichtmal abwegig das erstmal nen teildeaktivierter GK110 kommt (was positiver Weise gleich die Yields ordentlich erhöht), der vielleicht ~30% schneller ist wie GK104 und man dann nen halbes Jahr später nochmal nachlegt und einen Chip bringen kann der vielleicht noch hier und da optimiert wird und nochmal 15-20% drauf legt. Nen halbes Jahr später kann dann Maxwell kommen im neuen Prozess.

Einen kompletten Chip bringt man dann nur als Tesla auf de Markt, damit die Leute dort zufrieden sind. Dort geht es auch meist mehr um Quantität als um Qualität. Sprich, jeder würde sich über schlechte Taktbarkeit der Chips auf dem Desktop beschweren, bei HPC ist das nebensächlich.

In Zugzwang ist man auch nicht da man für den Desktop erstmal besser da steht als AMD und jene ebenfalls warten müssen bis nen neuer Node ansteht.
 
@Chemistry: So krass gewendet hat sich das Verhältnis auch nicht, zur Zeit von HD5870 war AMD Nvidia absolut überlegen, seit der GTX480 ist die Performance nie so weit auseinander und je nach Preissegment ist mal der eine vorne, mal der andere.

Und bei den Transistoren vergleichst du die falschen: GK104 hat gegenüber GF114 82% mehr Tranistoren (3,54Mrd vs 1,95Mrd), was natürlich angesichts der Verdopplung der TMUs bzw Vervierfachung der ALUs (bei gleichzeitiger Vereinfachung!) zzgl. anderer Dinge (PCIe3.0, DX11.1, VP5, NVENC, Turbo) immernoch beachtlich ist.

Beim GK110 schwirrt hier die Zahl 6Mrd herum, was bei 2304 ALUs bei einer angenommenen GF110-Basis (3,5Mrd) noch krasser wär (72% mehr), da noch mehr hinzukäme (ein zusätzliches SMX, beim GF110 gegenüber den anderen Fermis fehlende Verbesserungen z.B. bei HDMI-Audio).

Ich glaube aber auch, dass dem GK110 durch die Kühlung und TDP eher Grenzen hinsichtlich des Taktes gesetzt werden als dem GK104, mit 1GHZ dürfen wir da nicht rechnen, eher wieder so mit ~800MHz.

Zu den anderen Kepler möchte ich nach den Infos des GK107 mal orakeln:
Wenn der GK107 nur 384 ALUs und ein 128 Bit SI hat, also nur ein GPC mit 2 SMX, dann ist er der Nachfolger des GF108 (einen GF118 gab es ja nie) auf der GT430, GT440 und diversen OEM-Karten. Das erklärt dann auch das kleine PCB.

Wenn er die Struktur des GF104 beibehält, hat er so nämlich bei 384 ALUs 32 TMUs und bei einem 128 Bit SI 16 ROPs, damit ist er quasi ein verdoppelter GF108 (so wie der GF104 ein verdoppelter GF114 ist) oder ein GF106 mit kleinerem SI und neuem Shadermodell. Die ALUs muss man nämlich im Vergleich zur GF100-Generation halbieren, da ja der verdoppelte Shaderclock weggefallen ist.

Performance dürfte dann so ungefähr zwischen GeForce GTS450 und GTX550Ti liegen, da die Karte wohl höher takten wird.

Vom GK106 erwarte ich daher genau den doppelten Ausbau an ALUs und TMUs mit den ROPs und dem SI des GF106/116, also 768 ALUs, 64 TMUs in 2 GPC/4 SMX und 24 ROPs mit 192Bit SI, damit sollte er zwischen GTX460 V2, GTX560 und GTX560 TI liegen.
EDIT: Da hat sich jemand das gleiche wie ich gedacht.

Wenn Nvidia nicht noch einen GK105 mit 3 GPC/6 SMX ohne direkten Vorgänger entwickelt bzw. der GF106 doch eher diesen Ausbau hat oder das Marktsegment zwischen GTX560Ti und GTX680 bis zur GK11x-Generation unbesetzt gelassen wird, werden wir also sicherlich noch kleinere Ableger des GK104 erleben mit 6-7 SMX.

Inwieweit ein teildeaktivierter GK110 sinnvoll ist haben wir ja bei GF100/110 gesehen, also bis zum Niveau der GTX470/GTX560TI-448 herunter ist er immernoch schneller als der GF114, da er dann noch mehr Speicherbandbreite, mehr Pixelfüllrate, ein bischen mehr Shaderperformance, aber deutlich weniger Texturfüllrate hat. Wie es mit der GTX560Ti OEM, quasi eine GTX465 mit dem SI und den ROPs der GTX570, aussieht, weiss ich nicht, die GTX465 zeigt aber deutlich, wann der Highendchip zu langsam wird: Wenn er den Taktnachteil nichtmehr mit mehr ROPs ausgleichen kann.
 
Zuletzt bearbeitet:
@Tigerfox, GF110 als Basis zu nehmen, macht da aber weniger Sinn ;)
Nimm lieber GK104 als Basis, schließlich ist die Architektur vergleichbar.

Das wären bei besagten ~6Mrd. Transistoren ca. 70% mehr als der GK104 bietet. 50% mehr Ausführungseinheiten (ALUs, TMUs, ROPs, usw.) passen da definitiv rein. Interessant könnten Caches werden. Cache kostet enorm Platz auf dem DIE. Siehe aktuelle CPUs. Obwohl da vergleichsweise viel Cache drauf ist. Könnte also durchaus hinkommen. Leistungstechnsich rechne ich dann mit ca. 20-30% im Schnitt zum GK104. Mehr wirds nicht werden.
In Extremsettings natürlich mehr, je nachdem, wann der GK104 wegbricht.
 
also sehe ich das richtig, dass du dem GK110 insofern das mit dem Powerregler nicht so klappt wie du dir das vorstellst (es also so bleibt wie beim GK104 jetzt) mit lediglich 10-20% Leistungsplus (für den Gamer) veranschlagst oder was meinst du?
 
Tja, ich bleibe aber dabei, dass der GK110 auf dem GF110 basiert und nicht auf dem GK104. Eine einfache Vergrößerung des GK104 um 50% kann ich mir nciht so gut vorstellen, weil der 1. unnötig groß würde und 2. der GK104 noch diverse Nachteile vom GF114 gegenüber dem GF110 geerbt hat.

Aber wir werden es ja sehen. der GK110 ist sowieso außerhalb meines Preisbereichs, mich interessiert mehr, womit Nvidia die 7800er kontert.
 
Sagt wer? Ich behaupte das Gegenteil! Und jetzt? ;)

Der GK107 verdeutlicht doch, dass Nvidia bei Kepler einfach die SM in den alten Chips doppelt so groß macht und die ALUs auf den neuen, einheitlichen Takt anpasst. Also bleiben ROPs und SI gleich, ALUs x4 und TMUs x2.

Warum sollte jetzt beim GK110 der GK104 veranderthalbfacht werden, statt einfach diese Änderungen auf den GF110 anzuwenden, wo man ja schon einen Chip mit 48 ROPs und 384Bit SI hat. Wenn der GF110 schon bei gleicher Anzahl TMUs, weniger Takt, aber mehr Shadern und mehr ROPs soviel schneller als der GF114 ist, warum sollte man dann beim GK110 von diesem Prinzip abweichen?
 
also sehe ich das richtig, dass du dem GK110 insofern das mit dem Powerregler nicht so klappt wie du dir das vorstellst (es also so bleibt wie beim GK104 jetzt) mit lediglich 10-20% Leistungsplus (für den Gamer) veranschlagst oder was meinst du?

Nein, 20-30% ;)

Wie gesagt, schau dir das ganze an... Spekulativ schwirren +50% ALUs, TMUs, ROPs, usw. durchs Netz. Ail im 3DCenter spricht (bzw. sprach schon vor Bekanntgabe der GK104 Taktraten) von Taktraten deutlich unter GK104! Das sind für mich 700MHz, vllt auch 750-800MHz. Aber viel mehr wirds nicht. Sprich von den +50% Ausführungseinheiten (die nicht 1:1 mit der Leistung skalieren) bei 20-30% weniger Takt können nicht mehr wie 20-30% mehr Leistung in Games bei rumkommen.

Anders kann es natürlich ausschauen, wenn man Einheitentechnisch noch weiter hoch geht. Ne verdopplung zum Beispiel. Glaube ich ehrlich gesagt aber nicht. Ne komplette Verdopplung + größere Caches usw. würden wohl nicht in die spekulierten 6Mrd. Transistoren passen. Obgleich die spekulierten 500-550mm² wohl sogar bisschen groß klingen für "nur" +50% Ausführungseinheiten :fresse: Womöglich wird das gute Stück blos was um die 430-470mm² groß.


@Tigerfox
wenn du rein nach der Anordnung der ALUs gehst, dann mag das vllt sein. Nur was hat die Anordnung der ALUs mit der Architektur zu tun!? GK110 ist genau so Kepler wie GK104. Misst sich also daran.
Beim Fermi hat man zuerst den GF100 released und dann eine abgespeckte Version als Performancekarte mit GF104 gebracht. Heute ist es genau andersrum, GK104 ist als erstes draußen. Wie GK110 aber seine ALUs angeordnet hat, kann so oder so sein, kann aber auch ganz anders sein.

Was mir aber aufgefallen ist. GPGPU Anwendungen skalieren teilweise ziemlich gut mit den ALUs, aber teils massiv schlecht mit dem GPU Takt.
Das heist, der Schritt, den NV ohne HotClocks geht, geht in der Sicht durchaus in die richtige Richtung. Dem Gamer ists ziemlich egal, da geht sowohl der Takt als auch die Einheitenanzahl recht brauchbar mit der Leistung. Sogar minimal Vorteil für den Takt würd ich meinen.
Und es ist nunmal kein doppelter GF114, weil es vier mal so viele ALUs sind. ;) Da kann man nicht einfach sagen, das basiert darauf, weil die ALUs vorher mit HotClock betrieben wurden und heute eben doppelt ausgelegt sind.
Da könnte man auch sagen, alles ist nur G80, weil es seit G80 eben SuperSkalare Einheiten gibt, welche irgendwie rechnerisch mit Sicherheit auch bis Kepler passend wären ;)
 
Zuletzt bearbeitet:
Sagt wer? Ich behaupte das Gegenteil! Und jetzt? ;)

Der GK107 verdeutlicht doch, dass Nvidia bei Kepler einfach die SM in den alten Chips doppelt so groß macht und die ALUs auf den neuen, einheitlichen Takt anpasst. Also bleiben ROPs und SI gleich, ALUs x4 und TMUs x2.

Warum sollte jetzt beim GK110 der GK104 veranderthalbfacht werden, statt einfach diese Änderungen auf den GF110 anzuwenden, wo man ja schon einen Chip mit 48 ROPs und 384Bit SI hat. Wenn der GF110 schon bei gleicher Anzahl TMUs, weniger Takt, aber mehr Shadern und mehr ROPs soviel schneller als der GF114 ist, warum sollte man dann beim GK110 von diesem Prinzip abweichen?

Wenn ich das auf GF110 anwende hab ich doch nen neues Design?!

Wenn ich mir natürlich nur nen paar Zahlen angucke werden die Werte nacher dem GF110 ähnlicher sein, nur das auf nen SMX mehr ALUs kommen als bei nem SM. Außerdem sieht nen GPC nun anders aus und ich lasse außen vor das NV auch nen bisschen was an den Caches usw geändert hat...


Nein, 20-30% ;)

Wie gesagt, schau dir das ganze an... Spekulativ schwirren +50% ALUs, TMUs, ROPs, usw. durchs Netz. Ail im 3DCenter spricht (bzw. sprach schon vor Bekanntgabe der GK104 Taktraten) von Taktraten deutlich unter GK104! Das sind für mich 700MHz, vllt auch 750-800MHz. Aber viel mehr wirds nicht. Sprich von den +50% Ausführungseinheiten (die nicht 1:1 mit der Leistung skalieren) bei 20-30% weniger Takt können nicht mehr wie 20-30% mehr Leistung in Games bei rumkommen.

Anders kann es natürlich ausschauen, wenn man Einheitentechnisch noch weiter hoch geht. Ne verdopplung zum Beispiel. Glaube ich ehrlich gesagt aber nicht. Ne komplette Verdopplung + größere Caches usw. würden wohl nicht in die spekulierten 6Mrd. Transistoren passen. Obgleich die spekulierten 500-550mm² wohl sogar bisschen groß klingen für "nur" +50% Ausführungseinheiten :fresse: Womöglich wird das gute Stück blos was um die 430-470mm² groß.


@Tigerfox
wenn du rein nach der Anordnung der ALUs gehst, dann mag das vllt sein. Nur was hat die Anordnung der ALUs mit der Architektur zu tun!? GK110 ist genau so Kepler wie GK104. Misst sich also daran.
Beim Fermi hat man zuerst den GF100 released und dann eine abgespeckte Version als Performancekarte mit GF104 gebracht. Heute ist es genau andersrum, GK104 ist als erstes draußen. Wie GK110 aber seine ALUs angeordnet hat, kann so oder so sein, kann aber auch ganz anders sein.

Was mir aber aufgefallen ist. GPGPU Anwendungen skalieren teilweise ziemlich gut mit den ALUs, aber teils massiv schlecht mit dem GPU Takt.
Das heist, der Schritt, den NV ohne HotClocks geht, geht in der Sicht durchaus in die richtige Richtung. Dem Gamer ists ziemlich egal, da geht sowohl der Takt als auch die Einheitenanzahl recht brauchbar mit der Leistung. Sogar minimal Vorteil für den Takt würd ich meinen.
Und es ist nunmal kein doppelter GF114, weil es vier mal so viele ALUs sind. ;) Da kann man nicht einfach sagen, das basiert darauf, weil die ALUs vorher mit HotClock betrieben wurden und heute eben doppelt ausgelegt sind.
Da könnte man auch sagen, alles ist nur G80, weil es seit G80 eben SuperSkalare Einheiten gibt, welche irgendwie rechnerisch mit Sicherheit auch bis Kepler passend wären ;)


Fraglich ist natürlich wie groß das Handycap bei weniger TMUs zu ALUs in Spielen wäre.
 
Fraglich ist natürlich wie groß das Handycap bei weniger TMUs zu ALUs in Spielen wäre.

GF104/GF114 hat zumindest im Vergleich zu GF100/110 in Filterlastigen Games teils deutlich Boden gut gemacht, bzw. ist eben nicht so massiv weggebrochen.
Wie gesagt, interesant ist, wie das ganze mit dem Takt skaliert. Der Basistakt von GK104 ist ja ziemlich hoch. Ein langsam getakteter GK110 könnte diesen Vorteil eben verlieren.
 
hmm, bei mickrigen 20% müsste man sich das nochmal anschauen wie es allgemein sich in Games auswirkt, explizit bei viel Texturen und aa, sowie ein Vergleich zu GK104 wann dieser da einbricht.
Desweiteren spielt die Ramgröße zu Release ja auch noch ne Rolle, wobei ich mir nicht unbedingt vorstellen mag das dieser zu Anfang auch mit nur 2GB daher kommt.
 
@fdsonne. Also GK110 hat nach meiner Vorraussage mindestens soviel mit GF110 zu tun wie GF114 mit GK104. Ist jetzt die Frage, ob man den Chip dann näher im Verhältnis zu GK104 als Kepler-Ableger mit den gleichen Änderungen oder näher im Verhältnis zu bis auf diese Änderungen identischen GF110 sieht.

Und die ALUs sind ja eben nicht einfach vervierfacht worden, es sind andere ALUs, die nicht auf den doppelten Takt ausgelegt sind, dafür aber soviel weniger Chipfläche benötigen, dass doppelt so viele untergebracht wurden. Bis auf diese bedeutende Veränderung wurde bei Kepler einfach der Inhalt eines SMX gegenüber Fermi verdoppelt. Das ist im ähnlichen Verhältnis zu sehen wie G92 gegenüber G200, da wurde auch nur das Verhältnis von TMUs zu ALUs von 1:2 auf 1:3 erhöht (24 ALUs und 8 TMUs pro SM statt 16 ALUs und 8 TMUs) und 10 statt 8 SMs sowie doppelt soviele ROPs und damit ein doppelt so dickes SI verbaut, außer ein paar Detailverbesserungen wie dem Cahce bei den ALUs war da sonst nicht viel.
Es ist keinesfalls so eine krasse Änderung wie G200 gegenüber GF100.

Hier und hier sieht man recht gut, wie wenig sich beim GK104 gegenüber dem GF104 an einem SM verändert hat.
 
NV stellt sich mit dem hochtaktenden GK104 in meinen Augen selbst Steine in den Weg. Wohl auch ein Grund, warum GK110 erst später kommt... Somit bleibt mehr Luft zum optimieren.
 
die sie sicherlich auch nötig haben, denn:

Die Karte wird ohnehin schon einen VaporChamber benötigen. Das OC mit der GK104 Karte gestaltet sich ja schon schwierig dank der Hitzeblockade in 2 Gängen bei 70°C und 80°C. Wo müsste dann die Tempgrenze beim Dicken liegen dass das funzt?? :( ??
Worst Case wäre ein weglassen des OC Features bei den dicken Brummern, dann dafür aber eine Zwischenstufe an Takt. Kann ich mir ehrlich gesagt aber nicht vorstellen. Jedenfalls werden die Karten alles andere als leise werden.
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh