Also noch einmal. Du nimmst Anwendung x, welche mit einem Mix aus FP32 und INT32 läuft. Warum sollte x nun schneller laufen, wenn du bei Ampere die Hybrid-ALUs zwingen würdest nur in FP32 zu rechnen?
Also nochmal. Wenn eine Anwendung mit FP32 und INT32 1:1 perfekt läuft wird sie mit Ampere auch NICHT schneller. Abgesehen davon, das Ampere allgemein mehr Shader hat. Ich habe nicht behauptet, das "irgendwas" schneller läuft. Keine Ahnung woher du das hast?
Du kannst doch stattdessen INT32 parallel(!) zu den FP32-ALUs laufen lassen. Das würde zwar die FP32-Leistung vielleicht etwas runter ziehen, da ein paar weniger ALUs für eben FP32-Berechnungen zur Verfügung stehen, aber insgesamt gesehen sollte x je nachdem wie wieviel INT32 gefordert wird um y% besser laufen als rein mit FP32.
Es braucht aber nicht jedes Programm 1:1 INT32 und FP32. Bis zu Turing war FP32 zu INT32 aber 1:1. Bei dem Bild das ich aktuell sehe waren dabei jedoch viele INT32-
ONLY Shader unterfordert, weil man sie eben schlicht nicht brauchte.
Was aber eben NICHT zutrifft ist, das Ampere jetzt wegen doppelt sovielen Shadern die FP32 rechnen
KÖNNTEN doppelt so schnell wäre, weil man eben TROTZDEM noch INT32 braucht und die variablen Shader dann eben NICHT alle FP32 rechnen können.
Keine Ahnung was du hier zusammenfantasierst, aber nur weil Ampere theoretisch doppelt soviele FP32-Shader hat, wenn man
ÜBERHAUPT KEINE INT32 Shader bräuchte, wird in der Praxis halt nie zutreffen. Das Ampere schneller ist, habe ich nie bezweifelt, ganz im Gegenteil. Das Ampere wegen der flexiblen Shader je nach Anwendungsfall schneller sein wird, habe ich bestätigt, aber eben trotzdem nicht DOPPELT so schnell, was ja auch die DF-Tests bereits gezeigt haben.
Jetzt allmählich kapiert, was ich jetzt schon 5mal geschrieben habe? Wenn nicht, geb ich auf, ein 6tes mal umformulieren wird dann wohl auch nicht mehr helfen.