ATI R600 [Spekulations Thread] (Part 3)

Stegan · 29.01.2007

NDA ??

Nakai · 29.01.2007

Stegan schrieb:
NDA ??

Ich hab mich nicht schuldig gemacht^^

mfg Nakai

Lord · 29.01.2007

Kann man die genauen Vorgaben/Regeln/Sanktionen dieser NDA eigentlich irgendwo nachlesen? Würde mich doch mal interessieren, was einem da eigtl wofür droht.

Stegan · 29.01.2007

Nakai schrieb:
Ich hab mich nicht schuldig gemacht^^

mfg Nakai

Naja war ja auch nicht so gedacht, mein post!

Wollt auf diese weise nur prüfen, wie du dazu stehst! Also ob du das evtl besätigen (auf deine weise :fresse:

) würdest!

Gruß

demon-chan · 29.01.2007

Lord schrieb:
Kann man die genauen Vorgaben/Regeln/Sanktionen dieser NDA eigentlich irgendwo nachlesen? Würde mich doch mal interessieren, was einem da eigtl wofür droht.

vermutlich kündigung und klage wegen verrat von firmengeheimnissen

OldBoy65 · 29.01.2007

Kommt die Karte wirklich erst im März?

Hmm das dauert alles viel zu lange, die x1900xtx war vor einem Jahr zu diesem Zeitpunkt schon erhältlich....

Rauwman · 29.01.2007

Für mich ist aber der einzige Grund warum ATI noch nicht gesagt hat was uns bei R600 ansteht, der dass sie keine leeren Versprechungen aufgeben wollen. Evt ist ja noch der ein odere andre Bug zu vermerken. Ansonsten ist es doch nur dumm es nicht zu verraten da manche potenzielle Kunden aus lauter Gier nach geiler HW zum g80 greifen.

Mfg

noize · 29.01.2007

Mondrial schrieb:
Ich kann meinen Neid gradeso zügeln Im Gegensatz zu einigen G80 besitzern die hier nur Negatives schreiben um ihren Kauf zu rechtfertigen...

Sorry, mich nervt das einfach. Es gibt echt Leute die aus jeder News das maximal Negative interpretieren um sich hier zu profilieren.

mag ja sein, kann das ja auch verstehen (irgendwie^^) aber die grenze wo sich teilweise hier user angegriffen fühlen, wegen irgend einem falschen satz oder behauptung, sinkt hier von tag zu tag. ich seh bzw. lese das als noch relativ neutraler betrachter und es geht mir aufn keks

sorry nakai... hatte das glaub ich vor ein paar tagen mal gepostet.
hab gedacht, das ich das (besonderst das mit den sp's) mal bei dir gelesen hab. nun gut sind es halt 8vec16 :>

mfg

p.s. die dieshots interessieren mich nicht wirklich, mit den bisher erschienen speks muss er mehr transis besitzen als der g80...

*achtung* nu kommt pwnd by nakai

Nakai · 29.01.2007

epY schrieb:
sorry nakai... hatte das glaub ich vor ein paar tagen mal gepostet.
hab gedacht, das ich das (besonderst das mit den sp's) mal bei dir gelesen hab. nun gut sind es halt 8vec16 :>

mfg

p.s. die dieshots interessieren mich nicht wirklich, mit den bisher erschienen speks muss er mehr transis besitzen als der g80...

*achtung* nu kommt pwnd by nakai

Pwnd würd ich das nicht nenne.^^ Wenn ich das irgendwie falsch erklärt habe, tut mir das leid. :fresse:

Also nochmal schön langsam:

von mir in einem anderen Forum schrieb:
Zuerst nehmen wir uns die ALU zu herzen, das Herzstück eines jeden Microprozessor. Eine ALU kann Befehle verarbeiten, aber auch nur Befehle die für die ALU möglich sind.
Hier muss man zwischen der Breite und der Art der ALU unterscheiden. Eine ALU kann viele Befehle durchführen, die wichtigsten für die Grafikberechnung sind MUL, ADD und SUB. MUL entspricht der Multiplikation, ADD der Addition und SUB der Subnegation.(und Neg wie Negation)
(Eine ALU kann eigentlich noch viel mehr, jedoch sind die anderen Befehle für den Pixelprozessor uninteressant)
MUL und ADD kann verbunden werden, dadurch entsteht ein MADD. Ein MADD kann eine Multiplikation und eine Addition durchführen, ähnlich der Einheiten aus der sie besteht.
Nun zur Breite. Eine ALU kann bestimmt breit sein, eine ALU mit einer Breite von 1 also sozusagen nur eine ALU nennt man Scalar-ALU.
Eine ALU die eine bestimmte Breite hat außer 1 nennt man Vektor-ALU, kurz VecX-ALU wobei dieses X für die Breite der ALU steht.
(Also eine Breite der ALU die aus 2 Scalaren ALUs besteht ist eine Vec2 ALU)
Nun kombinieren wir die Breite mit der Art der ALU.
Nehmen wir eine MUL-ALU, die 4mal so breit ist wie eine Scalare-MUL-ALU, diese wird dann einfach MUL4 genannt. Dies ist eine Abkürzung und wird nicht immer so genannt. Eine ADD-ALU, die 4mal so breit ist wie eine Scalare-ADD-ALU, wird ADD4 genannt. Eine 4fache MADD-ALU demzufolge MADD4. Ein MADD-ALU wird auch als eine 1D-ALU (Eindimensionale ALU, falls sie eine Breite von einer scalaren ALU hat) oder als 4D (Vierdimensional, falls sie eine Breite von 4 scalaren ALUs hat). Dies ist nur ein Beispiel, es gibt auch 5D, 2D, 3D oder X D (X steht für irgendeine Zahl) oder wie man es auch nennen kann Vec2, Vec3, Vec4 usw.

Was hilft das uns nun? Damit kann man nicht nur die maximale Shaderleistung berechnen sondern auch die Architekur aufsplitten. Was ist ein FLOP?
Häufig wird als FLOP eine Gleitkommazahlenoperation (floating-point operation) bezeichnet, wodurch vereinzelt auch die Variante FLOP/s auftaucht, welche das gleiche bedeutet wie FLOPS, also Flop pro Sekunde. Also FLOPS sind sozusagen die aritmethische Rohleistung eines Pixelprozessors. Ein ADD und ein MUL sind jeweils 1 FLOP wert, eine MADD also 2 FLOPS. Durch die Breite der ALUs lassen sich die FLOPS demzufolge erhöhen.
So hat eine MADD2-ALU demzufolge 4 FLOPS, eine MADD3-ALU 6 Flops usw...

Nun zu ein paar Beispielen:

1. Der NV40 alá Geforce 6800ULTRA: Diese Grafikkarte ist mit 400Mhz Chiptakt getaktet und hat 16 Pixelpipelines mit 2 Pixelprozessoren.
Der erste Pixelprozessor ist vor der TMU der andere nach der TMU. Der erste ist nur eine MUL4-ALU also eine Vec4-MUL-ALU, der zweite eine MADD4-ALU.
Daher hat der NV40 pro Pixelpipeline 12 FLOPS. Durch Berechnung lässt sich leicht die Pixelshaderleistung berechnen.

12 FLOPS x 16 Pixelpipelines x 0,4 Ghz Takt = 76,8 Gflops

2. Der R420 alá Radeon X800XT: Diese Grafikkarte mit 500Mhz getaktet und hat 16 Pixelpipelines mit einem Pixelprozessor. Doch dieser Prozessor hat es in sich. Er besteht aus zwei ALUs, eine Scalare und eine Vec3-ALU, die zudem noch mit weiteren befehlen verbessert wurden. Jede ALU ist MADD+ADD-fähig. Wieviel FLOPS hat dann ein Pixelprozessor? Erst die Scalar-ALU. Diese hat wegen ihrem MADD 2 FLOPS und durch das ADD nochmal 1 FLOP. Nun zu Vec3-ALU, diese hat durch ihre Breite und dem MADD und ADD 6 FLOPS(MADD) und 3 FLOPS (ADD), also insgesamt 9 FLOPs. Nun kann man diese beiden FLOP-Zahlen addieren und man kommt auf 12 FLOPS wie bei der Geforce 6800ULTRA. Das heißt nicht das beide gleichstark sind, der NV40 ist besser für MUL-Berechnungen der R420 für ADD-Berechnunge, weiterhin ist der ATI-Chip durch seine Breite noch etwas besser skalierbar.
Die Pixelshaderleistung:

12 FLOPS x 16 Pixelpipelines x 0,5 Ghz Chiptakt = 96 Gflops

3. Der G71 alá Geforce 7900GTX: Diese Grafikkarte ist mit 650Mhz getaktet und hat 24 Pixelpipelines mit zwei Pixelprozessoren, ähnlich dem NV40. Dennoch ist die ALU vor der TMU durch ein ADD erweitert worden, was nochmal extra 4 FLOPS der gesamten Architekur beschert. Also sind es 2 MADD4-ALUs mit je 8 FLOPS. Also insgesamt 16 FLOPS.

16 FLOPS x 24 Pixelpipelines x 0,65 Ghz Chiptakt = 249,6 GFLOPS

4. Der R580 alá Radeon X1900XTX: Diese Grafikkarte taktet wie Geforce 7900GTX mit 650Mhz hat aber nur 16 Pixelpipelines aber dafür insgesamt 48 Shaderprozessoren!!! Jede dieser Shaderprozessoren ist genauso leistungsfähig wie die Shaderprozessoren auf dem R420 und auf dem R300, also 12 FLOPS.

12 FLOPS x 3 Shader pro Pipeline x 16 Pixelpipelines x 0,65 Ghz Chiptakt = 374,4 GFLOPS für die Pixelberechnungen.

5. Der G80 alá Geforce 8800GTX: Der erste Unified-Shader-Chip mit 128 Pixelprozessoren, welche in Vec16-Shadern angeordnet sind. Der G80 ist in 8 TCPs eingeteilt, in jedem TCP ist eine Vec16-MADD-ALU und eine Vec16-MUL-ALU. (es ist nicht ersichtlich woher diese Vec16-MUL-ALU herkommt, anscheinend defekt!)
Also das wären pro MADD16 32 FLOPs und pro MUL16 16 FLOPS, also 48 FLOPS pro TCP, es sind 8 TCPs also 384 FLOPS. Die Shader sind mit 1,35Ghz getaktet, also:

128 Pixelprozessor x 3 FLOPS für MADD+MUL x 1,35 Ghz = 518,4 GFLOPS

Hab ich selber geschrieben in einem anderen Forum, das ich nicht näher beschreiben will, ich würde mich sonst lächerlich machen.^^ :hmm:

mfg Nakai

demon-chan · 29.01.2007

Nakai schrieb:
Hab ich selber geschrieben in einem anderen Forum, das ich nicht näher beschreiben will, ich würde mich sonst lächerlich machen.^^

schwer rauszufinden, wo du das geschrieben hast, ist es ja nicht :shot:

aber netter schildkröten-avatar.

*Sry 4 off topic, musste sein ^^*

(btw, die kleine grafikkarten-geschichtsstunde liest sich sehr interessant!)

LovesuckZ · 29.01.2007

w0mbat schrieb:
Und ein A15er zerschlägt jede noch so hoch getaktete G81.

Wenn man ganz fest an die Fake - Zahlen glaubt.
Wer annimmt, das irgendwas mit 1500 MHz läuft, egal ob bei Nvidia oder ATi, der wird enttäuscht werden. Der Schritt geht immer mehr in Richtung breiterer Architektur, die pro Takt eine höhere Leistung erreicht (siehe r520 vs r580).
Oder hat hier schon wer etwas von den Midrange - Modelle und ihrer Taktung gehört? Ironischer Weise gibt es hier keine so astronomische Zahlen...
Und wer nun kommt, "aber Nvidia hat 1350MHz bei den Recheneinheiten", der muss auch sehen, dass diese weniger Komplex sind. Der hohe Takt wird benötigt, um eine ausreichende Leistung zu realisieren. Der Takt für die ROPs bewegt sich dagegen bei 575MHz, niedriger als bei den vorigen Generationen.

Nakai · 29.01.2007

LOL rausgekriegt wa?^^ :shot:

mfg Nakai
Hinzugefügter Post:

LovesuckZ schrieb:
Wenn man ganz fest an die Fake - Zahlen glaubt.
Wer annimmt, das irgendwas mit 1500 MHz läuft, egal ob bei Nvidia oder ATi, der wird enttäuscht werden. Der Schritt geht immer mehr in Richtung breiterer Architektur, die pro Takt eine höhere Leistung erreicht (siehe r520 vs r580).
Oder hat hier schon wer etwas von den Midrange - Modelle und ihrer Taktung gehört? Ironischer Weise gibt es hier keine so astronomische Zahlen...
Und wer nun kommt, "aber Nvidia hat 1350MHz bei den Recheneinheiten", der muss auch sehen, dass diese weniger Komplex sind. Der hohe Takt wird benötigt, um eine ausreichende Leistung zu realisieren. Der Takt für die ROPs bewegt sich dagegen bei 575MHz, niedriger als bei den vorigen Generationen.

Dafür sinds mehr^^

Rauwman · 29.01.2007

Ja war echt verdammt schwer

noize · 29.01.2007

dickes dankeschön an nakai

... aber ob der r600 nun an die 800mio oder mehr transis hat weiß ich trotzdem noch net,... oder lässt es sich noch nicht genau abschätzen?

mfg

Nakai · 29.01.2007

Hier ist gleich der ganze Thread!^^

:drool:

mfg Nakai

PatLebeau · 29.01.2007

epY schrieb:
dickes dankeschön an nakai

... aber ob der r600 nun an die 800mio oder mehr transis hat weiß ich trotzdem noch net,... oder lässt es sich noch nicht genau abschätzen?

mfg

So wie ich das mal gelesen habe ca. 720 Millionen

LovesuckZ · 29.01.2007

Nakai schrieb:
[/color]
Dafür sinds mehr^^

Was?

Deine GFlops Zahl beim G80 stimmt nicht. Die "Mul" - Einheit (oder whatever) wird für andere Dinge verwendet und kann deswegen nicht mit eingerechnet werden. Und ich gehe fest davon aus, dass sie auch in Zukunft nicht "aktiviert" wird.

Powerplay · 29.01.2007

Nakai schrieb:
Pwnd würd ich das nicht nenne.^^ Wenn ich das irgendwie falsch erklärt habe, tut mir das leid.

Also nochmal schön langsam:

Hab ich selber geschrieben in einem anderen Forum, das ich nicht näher beschreiben will, ich würde mich sonst lächerlich machen.^^

mfg Nakai

Hmm stimmt meine rechnung dann das der R600@750Mhz über 700+ Gflops hat :eek:

Nakai · 29.01.2007

LovesuckZ schrieb:
Was?
Deine GFlops Zahl beim G80 stimmt nicht. Die "Mul" - Einheit (oder whatever) wird für andere Dinge verwendet und kann deswegen nicht mit eingerechnet werden. Und ich gehe fest davon aus, dass sie auch in Zukunft nicht "aktiviert" wird.

Nun ja:
128 x 3 x 1,35 = 518,4 Gflops

Die MUL müsste dann 128 x 1 x 1,35 = 172,8 Gflops liefern.

Leider ist das Thema MUL im G80 wirklich sehr tragisch.

Ich denke auch, dass die MUL nicht mehr benutzt wird, was ich schade finde.

Außerdem war das auf die ROPs ausgelegt, das "dafür sinds mehr".

mfg Nakai
Hinzugefügter Post:

Hmm stimmt meine rechnung dann das der R600@750Mhz über 700+ Gflops hat

Kommt drauf an, was die Einheiten können. :hwluxx:

mfg Nakai

noize · 29.01.2007

PatLebeau schrieb:
So wie ich das mal gelesen habe ca. 720 Millionen

wenn das stimmt, dann würde ich das schon fast als meisterleistung abstempeln.

Nakai · 29.01.2007

Ich habe ernsthafte Zweifel, dass es sich um 720Mill Transis handelt.
ATI war immer schlechter wenn es um die Transistorpackung ging, weiterhin macht der 80Nm einen Strich durch die Rechnung, insgesamt ist der Die des R600 kleiner als der Die des G80.
Der R600 ist im 80Nm gefertigt, was die Die-Size um etwa 18% verkleinert.
Der R600 ist aber mehr als 18% kleiner als der G80 hinzukommend mit der schlechten Packdichte von ATI würde ich weniger als 720Mill schätzen.

Ich kann mich aber auch irren.

mfg Nakai

LovesuckZ · 29.01.2007

Nakai schrieb:
Nun ja:
128 x 3 x 1,35 = 518,4 Gflops
Die MUL müsste dann 128 x 1 x 1,35 = 172,8 Gflops liefern.
Leider ist das Thema MUL im G80 wirklich sehr tragisch.
Ich denke auch, dass die MUL nicht mehr benutzt wird, was ich schade finde.

Sie liefert zur Zeit garnichts, deswegen sind es auch nur 345,6 GFlops.
Die ganze MUL - Geschichte kam wohl nur wegen der Marketingabteilung rein, da die unbedingt mehr als 500 GFlops haben wollten.

Außerdem war das auf die ROPs ausgelegt, das "dafür sinds mehr".

Ahso.

Nakai · 29.01.2007

LovesuckZ schrieb:
Sie liefert zur Zeit garnichts, deswegen sind es auch nur 345,6 GFlops.
Die ganze MUL - Geschichte kam wohl nur wegen der Marketingabteilung rein, da die unbedingt mehr als 500 GFlops haben wollten.

Das ist das Gleiche mit dem Shader vor der TMU beim G70/71 und NV40.
Die wird eigentlich zur Texturkoordinatenberechnung verwendet.
(kann man eigentlich nicht zur Shaderleistung hinzuaddieren)
Traurig, die Pipeline stallt deswegen oft, vorallem bei AF. Naja ATI hat gleich richtig "fette" TMUs im R3x0, R4x0 und R5x0 verbaut.

mfg Nakai

Powerplay · 29.01.2007

Aber wenn der G80 nur 345,6GFlops hat warum ist er soviel stärker als die X1950XTX??

Nakai · 29.01.2007

Powerplay schrieb:
Aber wenn der G80 nur 345,6GFlops hat warum ist er soviel stärker als die X1950XTX??

Stichwort Granularität. Die 8 Vec16 Einheiten sind unheimlich flexibel, nahezu jede Einheit kann aufgesplittet werden. Weiterhin immense Texelfüllrate.

mfg Nakai

Powerplay · 29.01.2007

Wenn die MUL in der GTX doch zum tragen kommen wäre die GTX wirklich der hammer oder??

w0mbat · 29.01.2007

LovesuckZ schrieb:
Wenn man ganz fest an die Fake - Zahlen glaubt.
Wer annimmt, das irgendwas mit 1500 MHz läuft, egal ob bei Nvidia oder ATi, der wird enttäuscht werden. Der Schritt geht immer mehr in Richtung breiterer Architektur, die pro Takt eine höhere Leistung erreicht (siehe r520 vs r580).
Oder hat hier schon wer etwas von den Midrange - Modelle und ihrer Taktung gehört? Ironischer Weise gibt es hier keine so astronomische Zahlen...
Und wer nun kommt, "aber Nvidia hat 1350MHz bei den Recheneinheiten", der muss auch sehen, dass diese weniger Komplex sind. Der hohe Takt wird benötigt, um eine ausreichende Leistung zu realisieren. Der Takt für die ROPs bewegt sich dagegen bei 575MHz, niedriger als bei den vorigen Generationen.

Ich habe nie etwas von 1,5GHz bei der A15er gesagt.

LovesuckZ · 29.01.2007

Nakai schrieb:
Das ist das Gleiche mit dem Shader vor der TMU beim G70/71 und NV40.
Die wird eigentlich zur Texturkoordinatenberechnung verwendet.
(kann man eigentlich nicht zur Shaderleistung hinzuaddieren)

Eigentlich schon, da die Shaderleistung des G70 an die des r580 in einigen Fällen heranreicht.

Traurig, die Pipeline stallt deswegen oft, vorallem bei AF. Naja ATI hat gleich richtig "fette" TMUs im R3x0, R4x0 und R5x0 verbaut.

Sie sind nicht "fett", sondern einfach von den Recheneinheiten getrennt.

Powerplay · 29.01.2007

LovesuckZ schrieb:
Eigentlich schon, da die Shaderleistung des G70 an die des r580 in einigen Fällen heranreicht.

Sie sind nicht "fett", sondern einfach von den Recheneinheiten getrennt.

Aber bei oblivion wo es stark auf shader drauf an kommt macht der G71 nix im vergleich zur ATI

noize · 29.01.2007

Nakai schrieb:
Ich habe ernsthafte Zweifel, dass es sich um 720Mill Transis handelt.
ATI war immer schlechter wenn es um die Transistorpackung ging, weiterhin macht der 80Nm einen Strich durch die Rechnung, insgesamt ist der Die des R600 kleiner als der Die des G80.
Der R600 ist im 80Nm gefertigt, was die Die-Size um etwa 18% verkleinert.
Der R600 ist aber mehr als 18% kleiner als der G80 hinzukommend mit der schlechten Packdichte von ATI würde ich weniger als 720Mill schätzen.

Ich kann mich aber auch irren.

mfg Nakai

hm.. wäre es den nicht möglich das amd/ati dann nicht einfach mehr layer benutzt? könnte mir das so vorstellen wie bei nv. g70 302mio. 110nm ; g71 278mio. 90nm + zusätzliche layer = extrem kleiner die

mfg

ATI R600 [Spekulations Thread] (Part 3)

Redakteur

Neuling

Semiprofi

Redakteur

Semiprofi

Neuling

Enthusiast

Enthusiast

Neuling

Semiprofi

Neuling

Neuling

Enthusiast

Enthusiast

Neuling

Semiprofi

Neuling

Legende

Neuling

Enthusiast

Neuling

Neuling

Neuling

Legende

Neuling

Legende

Enthusiast

Neuling

Legende

Enthusiast