Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: this_feature_currently_requires_accessing_site_using_safari
Ich hab mich nicht schuldig gemacht^^
mfg Nakai
Kann man die genauen Vorgaben/Regeln/Sanktionen dieser NDA eigentlich irgendwo nachlesen? Würde mich doch mal interessieren, was einem da eigtl wofür droht.
Ich kann meinen Neid gradeso zügeln Im Gegensatz zu einigen G80 besitzern die hier nur Negatives schreiben um ihren Kauf zu rechtfertigen...
Sorry, mich nervt das einfach. Es gibt echt Leute die aus jeder News das maximal Negative interpretieren um sich hier zu profilieren.
sorry nakai... hatte das glaub ich vor ein paar tagen mal gepostet.
hab gedacht, das ich das (besonderst das mit den sp's) mal bei dir gelesen hab. nun gut sind es halt 8vec16 :>
mfg
p.s. die dieshots interessieren mich nicht wirklich, mit den bisher erschienen speks muss er mehr transis besitzen als der g80...
*achtung* nu kommt pwnd by nakai
von mir in einem anderen Forum schrieb:Zuerst nehmen wir uns die ALU zu herzen, das Herzstück eines jeden Microprozessor. Eine ALU kann Befehle verarbeiten, aber auch nur Befehle die für die ALU möglich sind.
Hier muss man zwischen der Breite und der Art der ALU unterscheiden. Eine ALU kann viele Befehle durchführen, die wichtigsten für die Grafikberechnung sind MUL, ADD und SUB. MUL entspricht der Multiplikation, ADD der Addition und SUB der Subnegation.(und Neg wie Negation)
(Eine ALU kann eigentlich noch viel mehr, jedoch sind die anderen Befehle für den Pixelprozessor uninteressant)
MUL und ADD kann verbunden werden, dadurch entsteht ein MADD. Ein MADD kann eine Multiplikation und eine Addition durchführen, ähnlich der Einheiten aus der sie besteht.
Nun zur Breite. Eine ALU kann bestimmt breit sein, eine ALU mit einer Breite von 1 also sozusagen nur eine ALU nennt man Scalar-ALU.
Eine ALU die eine bestimmte Breite hat außer 1 nennt man Vektor-ALU, kurz VecX-ALU wobei dieses X für die Breite der ALU steht.
(Also eine Breite der ALU die aus 2 Scalaren ALUs besteht ist eine Vec2 ALU)
Nun kombinieren wir die Breite mit der Art der ALU.
Nehmen wir eine MUL-ALU, die 4mal so breit ist wie eine Scalare-MUL-ALU, diese wird dann einfach MUL4 genannt. Dies ist eine Abkürzung und wird nicht immer so genannt. Eine ADD-ALU, die 4mal so breit ist wie eine Scalare-ADD-ALU, wird ADD4 genannt. Eine 4fache MADD-ALU demzufolge MADD4. Ein MADD-ALU wird auch als eine 1D-ALU (Eindimensionale ALU, falls sie eine Breite von einer scalaren ALU hat) oder als 4D (Vierdimensional, falls sie eine Breite von 4 scalaren ALUs hat). Dies ist nur ein Beispiel, es gibt auch 5D, 2D, 3D oder X D (X steht für irgendeine Zahl) oder wie man es auch nennen kann Vec2, Vec3, Vec4 usw.
Was hilft das uns nun? Damit kann man nicht nur die maximale Shaderleistung berechnen sondern auch die Architekur aufsplitten. Was ist ein FLOP?
Häufig wird als FLOP eine Gleitkommazahlenoperation (floating-point operation) bezeichnet, wodurch vereinzelt auch die Variante FLOP/s auftaucht, welche das gleiche bedeutet wie FLOPS, also Flop pro Sekunde. Also FLOPS sind sozusagen die aritmethische Rohleistung eines Pixelprozessors. Ein ADD und ein MUL sind jeweils 1 FLOP wert, eine MADD also 2 FLOPS. Durch die Breite der ALUs lassen sich die FLOPS demzufolge erhöhen.
So hat eine MADD2-ALU demzufolge 4 FLOPS, eine MADD3-ALU 6 Flops usw...
Nun zu ein paar Beispielen:
1. Der NV40 alá Geforce 6800ULTRA: Diese Grafikkarte ist mit 400Mhz Chiptakt getaktet und hat 16 Pixelpipelines mit 2 Pixelprozessoren.
Der erste Pixelprozessor ist vor der TMU der andere nach der TMU. Der erste ist nur eine MUL4-ALU also eine Vec4-MUL-ALU, der zweite eine MADD4-ALU.
Daher hat der NV40 pro Pixelpipeline 12 FLOPS. Durch Berechnung lässt sich leicht die Pixelshaderleistung berechnen.
12 FLOPS x 16 Pixelpipelines x 0,4 Ghz Takt = 76,8 Gflops
2. Der R420 alá Radeon X800XT: Diese Grafikkarte mit 500Mhz getaktet und hat 16 Pixelpipelines mit einem Pixelprozessor. Doch dieser Prozessor hat es in sich. Er besteht aus zwei ALUs, eine Scalare und eine Vec3-ALU, die zudem noch mit weiteren befehlen verbessert wurden. Jede ALU ist MADD+ADD-fähig. Wieviel FLOPS hat dann ein Pixelprozessor? Erst die Scalar-ALU. Diese hat wegen ihrem MADD 2 FLOPS und durch das ADD nochmal 1 FLOP. Nun zu Vec3-ALU, diese hat durch ihre Breite und dem MADD und ADD 6 FLOPS(MADD) und 3 FLOPS (ADD), also insgesamt 9 FLOPs. Nun kann man diese beiden FLOP-Zahlen addieren und man kommt auf 12 FLOPS wie bei der Geforce 6800ULTRA. Das heißt nicht das beide gleichstark sind, der NV40 ist besser für MUL-Berechnungen der R420 für ADD-Berechnunge, weiterhin ist der ATI-Chip durch seine Breite noch etwas besser skalierbar.
Die Pixelshaderleistung:
12 FLOPS x 16 Pixelpipelines x 0,5 Ghz Chiptakt = 96 Gflops
3. Der G71 alá Geforce 7900GTX: Diese Grafikkarte ist mit 650Mhz getaktet und hat 24 Pixelpipelines mit zwei Pixelprozessoren, ähnlich dem NV40. Dennoch ist die ALU vor der TMU durch ein ADD erweitert worden, was nochmal extra 4 FLOPS der gesamten Architekur beschert. Also sind es 2 MADD4-ALUs mit je 8 FLOPS. Also insgesamt 16 FLOPS.
16 FLOPS x 24 Pixelpipelines x 0,65 Ghz Chiptakt = 249,6 GFLOPS
4. Der R580 alá Radeon X1900XTX: Diese Grafikkarte taktet wie Geforce 7900GTX mit 650Mhz hat aber nur 16 Pixelpipelines aber dafür insgesamt 48 Shaderprozessoren!!! Jede dieser Shaderprozessoren ist genauso leistungsfähig wie die Shaderprozessoren auf dem R420 und auf dem R300, also 12 FLOPS.
12 FLOPS x 3 Shader pro Pipeline x 16 Pixelpipelines x 0,65 Ghz Chiptakt = 374,4 GFLOPS für die Pixelberechnungen.
5. Der G80 alá Geforce 8800GTX: Der erste Unified-Shader-Chip mit 128 Pixelprozessoren, welche in Vec16-Shadern angeordnet sind. Der G80 ist in 8 TCPs eingeteilt, in jedem TCP ist eine Vec16-MADD-ALU und eine Vec16-MUL-ALU. (es ist nicht ersichtlich woher diese Vec16-MUL-ALU herkommt, anscheinend defekt!)
Also das wären pro MADD16 32 FLOPs und pro MUL16 16 FLOPS, also 48 FLOPS pro TCP, es sind 8 TCPs also 384 FLOPS. Die Shader sind mit 1,35Ghz getaktet, also:
128 Pixelprozessor x 3 FLOPS für MADD+MUL x 1,35 Ghz = 518,4 GFLOPS
Hab ich selber geschrieben in einem anderen Forum, das ich nicht näher beschreiben will, ich würde mich sonst lächerlich machen.^^
Und ein A15er zerschlägt jede noch so hoch getaktete G81.
Wenn man ganz fest an die Fake - Zahlen glaubt.
Wer annimmt, das irgendwas mit 1500 MHz läuft, egal ob bei Nvidia oder ATi, der wird enttäuscht werden. Der Schritt geht immer mehr in Richtung breiterer Architektur, die pro Takt eine höhere Leistung erreicht (siehe r520 vs r580).
Oder hat hier schon wer etwas von den Midrange - Modelle und ihrer Taktung gehört? Ironischer Weise gibt es hier keine so astronomische Zahlen...
Und wer nun kommt, "aber Nvidia hat 1350MHz bei den Recheneinheiten", der muss auch sehen, dass diese weniger Komplex sind. Der hohe Takt wird benötigt, um eine ausreichende Leistung zu realisieren. Der Takt für die ROPs bewegt sich dagegen bei 575MHz, niedriger als bei den vorigen Generationen.
So wie ich das mal gelesen habe ca. 720 Millionendickes dankeschön an nakai
... aber ob der r600 nun an die 800mio oder mehr transis hat weiß ich trotzdem noch net,... oder lässt es sich noch nicht genau abschätzen?
mfg
[/color]
Dafür sinds mehr^^
Pwnd würd ich das nicht nenne.^^ Wenn ich das irgendwie falsch erklärt habe, tut mir das leid.
Also nochmal schön langsam:
Hab ich selber geschrieben in einem anderen Forum, das ich nicht näher beschreiben will, ich würde mich sonst lächerlich machen.^^
mfg Nakai
Was?
Deine GFlops Zahl beim G80 stimmt nicht. Die "Mul" - Einheit (oder whatever) wird für andere Dinge verwendet und kann deswegen nicht mit eingerechnet werden. Und ich gehe fest davon aus, dass sie auch in Zukunft nicht "aktiviert" wird.
Hmm stimmt meine rechnung dann das der R600@750Mhz über 700+ Gflops hat
So wie ich das mal gelesen habe ca. 720 Millionen
Nun ja:
128 x 3 x 1,35 = 518,4 Gflops
Die MUL müsste dann 128 x 1 x 1,35 = 172,8 Gflops liefern.
Leider ist das Thema MUL im G80 wirklich sehr tragisch.
Ich denke auch, dass die MUL nicht mehr benutzt wird, was ich schade finde.
Außerdem war das auf die ROPs ausgelegt, das "dafür sinds mehr".
Sie liefert zur Zeit garnichts, deswegen sind es auch nur 345,6 GFlops.
Die ganze MUL - Geschichte kam wohl nur wegen der Marketingabteilung rein, da die unbedingt mehr als 500 GFlops haben wollten.
Aber wenn der G80 nur 345,6GFlops hat warum ist er soviel stärker als die X1950XTX??
Wenn man ganz fest an die Fake - Zahlen glaubt.
Wer annimmt, das irgendwas mit 1500 MHz läuft, egal ob bei Nvidia oder ATi, der wird enttäuscht werden. Der Schritt geht immer mehr in Richtung breiterer Architektur, die pro Takt eine höhere Leistung erreicht (siehe r520 vs r580).
Oder hat hier schon wer etwas von den Midrange - Modelle und ihrer Taktung gehört? Ironischer Weise gibt es hier keine so astronomische Zahlen...
Und wer nun kommt, "aber Nvidia hat 1350MHz bei den Recheneinheiten", der muss auch sehen, dass diese weniger Komplex sind. Der hohe Takt wird benötigt, um eine ausreichende Leistung zu realisieren. Der Takt für die ROPs bewegt sich dagegen bei 575MHz, niedriger als bei den vorigen Generationen.
Das ist das Gleiche mit dem Shader vor der TMU beim G70/71 und NV40.
Die wird eigentlich zur Texturkoordinatenberechnung verwendet.
(kann man eigentlich nicht zur Shaderleistung hinzuaddieren)
Traurig, die Pipeline stallt deswegen oft, vorallem bei AF. Naja ATI hat gleich richtig "fette" TMUs im R3x0, R4x0 und R5x0 verbaut.
Eigentlich schon, da die Shaderleistung des G70 an die des r580 in einigen Fällen heranreicht.
Sie sind nicht "fett", sondern einfach von den Recheneinheiten getrennt.
Ich habe ernsthafte Zweifel, dass es sich um 720Mill Transis handelt.
ATI war immer schlechter wenn es um die Transistorpackung ging, weiterhin macht der 80Nm einen Strich durch die Rechnung, insgesamt ist der Die des R600 kleiner als der Die des G80.
Der R600 ist im 80Nm gefertigt, was die Die-Size um etwa 18% verkleinert.
Der R600 ist aber mehr als 18% kleiner als der G80 hinzukommend mit der schlechten Packdichte von ATI würde ich weniger als 720Mill schätzen.
Ich kann mich aber auch irren.
mfg Nakai