Blackwell Smalltalk Thread (RTX 5000er Reihe)

  • Ersteller Gelöschtes Mitglied 102156
  • Erstellt am
Es stimmt sicherlich, dass die reine Rasterleistung bei modernen Spielen zunehmend uninteressanter wird. Wir hatten mit Indy jetzt sogar schon ein Spiel, dass ohne Raytracing gar nicht mehr läuft. Das wird Schule machen. Genauso wie offensichtlich sein dürfte, dass in Frame Generation die Zukunft liegt. Kann aber auch verstehen, wenn man bei 30% ins Grübeln kommt...
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Damals gab es auch Sprünge von 130nm auf 90nm und so Späße..😉
Klar, darf man eben nicht vergessen.
Der Übergang von 130 -> 90 führte zu einer Packungsdichteverbesserung von etwa dem 2-fachen. Damals war die Fertigungstechnologie weniger komplex und die Reduktion viel einfacher. Man konnte durch kleinere Strukturen automatisch deutliche Verbesserungen erzielen, da die Reduktion der Gate-Längen direkte Verbesserungen in Geschwindigkeit, Leistungsaufnahme und Kapazität ermöglichte.
Der Sprung von 7 nm auf 5 nm bietet etwa eine Packungsdichteverbesserung von dem etwa 1,8-fachen. Die Fortschritte sind aber weniger linear und stärker durch physikalische Grenzen eingeschränkt.
 
Klar, darf man eben nicht vergessen.
Der Übergang von 130 -> 90 führte zu einer Packungsdichteverbesserung von etwa dem 2-fachen. Damals war die Fertigungstechnologie weniger komplex und die Reduktion viel einfacher. Man konnte durch kleinere Strukturen automatisch deutliche Verbesserungen erzielen, da die Reduktion der Gate-Längen direkte Verbesserungen in Geschwindigkeit, Leistungsaufnahme und Kapazität ermöglichte.
Der Sprung von 7 nm auf 5 nm bietet etwa eine Packungsdichteverbesserung von dem etwa 1,8-fachen. Die Fortschritte sind aber weniger linear und stärker durch physikalische Grenzen eingeschränkt.
Wieso 7nm auf 5nm?
Es gab doch 8nm auf 4nm von Ampere auf Ada und nun mehr oder weniger keine Veränderung?
 
Es stimmt sicherlich, dass die reine Rasterleistung bei modernen Spielen zunehmend uninteressanter wird. Wir hatten mit Indy jetzt sogar schon ein Spiel, dass ohne Raytracing gar nicht mehr läuft. Das wird Schule machen. Genauso wie offensichtlich sein dürfte, dass in Frame Generation die Zukunft liegt. Kann aber auch verstehen, wenn man bei 30% ins Grübeln kommt...

Naja wenn Path Tracing nicht mehr abschaltbar ist in Spielen, dann wirds schwierig.
Sonst können da selbst die RTX 3000er und AMD Karten noch gut parat kommen bisher.
Schaltet man PT ein dann brechen die Frames weg und man versucht mit DLSS und FG da gegen zu halten.
Resultat sind dann bessere Beleuchtung und Reflexionen zum leid der Texturqualität.
Da ist eben selbst eine 4090 einfach viel zu schwach. Da bin ich selber mal gespannt wie da Blackwell auch ohne Frame generation abschneidet.
Einfach mal die Rohe Leistung in 4K DLAA @ Path Tracing betrachten zwischen 4090 und 5090.
Das ist für mich überhaupt noch das einzig interessante an Blackwell für mich.

Da wird sich wirklich zeigen ob die Karte was taugt oder man nur aufhübscht mit MFG, damit die Balken länger wirken.
Wenn Path Tracing bei Blackwell auch die FPS so einbrechen lässt wie es bei der 4090 der Fall ist, dann sollte man auf die 6090 warten.
Leute mit alten Karten vor 4000er Serie ist selbstverständlich was anderes. Da lohnt es sich so oder so.
 
Zuletzt bearbeitet:
  • Danke
Reaktionen: A6
Wenn Path Tracing bei Blackwell auch die FPS so einbrechen lässt wie es bei der 4090 der Fall ist,
Davon kannst du ausgehen, es bleiben halt 20-30% mehr FPS übrig als mit der 4090, mehr wird sich da nicht tun, ist ja keine komplett neue Architektur oder so…. Da würde ich jetzt nun keine Wunder erwarten sondern hart realistisch bleiben.
 
Irgendwie fühlt sich die Backwell Gen. sogar im Vergleich noch schwächer als die AMPERE gen.
sad.gif

Also, ADA Umsteiger und nun Besitzer können sich wirklich Glücklich schätzen. ADA ist die Generation, die am Längsten überleben wird.
Ich würde mich nicht wundern wenn die 4090 noch in 3 jahren nahe 1000€ auf dem Gebrauch Markt bringen wird! Die Karte ist einfach ein Beast!
Und noch kommt dazu, dass die nächste Gen. wieder eine "ADA" Gen. werden könnte...

Somit hätten wir wirklich mit Ampere und Backwell Mähhhh Generationen und dazwischen Wow-Generationen... Wirklich komische Situation!
Und ratet mal auf welcher Generationentrip ich aus bin? Ja, als 3090 Besitzer....
 
Deswegen hatte ich ja mal die KFA2 genommen, da kann man die Spannung einfach auf 1,25V hochschrauben mit der Software. :-)
Das war natürlich nur Spass. Mach schon seit über 10 Jahren kein ocing mehr. Bei mir läuft alles nur Stock ohne irgendwelche Vergewaltigungen. 😉
 
Somit hätten wir wirklich mit Ampere und Backwell Mähhhh Generationen und dazwischen Wow-Generationen... Wirklich komische Situation!
Und ratet mal auf welcher Generationentrip ich aus bin? Ja, als 3090 Besitzer....

Würde ich so pauschal nicht sagen. Wenn Blackwell mit Muti-Frame Generation bei den großen AAA Spielen der nächsten Jahre (z.B. Doom Dark Ages, Witcher 4, GTA 6, ect) so abliefert wie sich das in Cyberpunk 2077 andeutet dann könnte das die absolute Halleluja Generation werden mit nie dagewesenem Leistungssprung. Für ältere, oder weniger anspruchsvolle Games wird die Raster-Leistung (4090 +30%) wohl reichen.
 
so kann es natürlich auch kommen.
Diese Multi Frame Generation muss dann aber sehr, sehr gut funktionieren.

Man kriegt als als 3090 Besitzer folgendes?:

100 x 1,70 (Ampere --> Ada) x 1,30 (Ada --> Backwell) = 220%

Im ernst? Man hat dann quasi ein SLI? mein Gehirn hat irgendwie immer mit min. 250-300% gerechnet :) Blödes Gehirn - muss auf AI umsteigen.
 
Zuletzt bearbeitet:
Wieso 7nm auf 5nm?
Es gab doch 8nm auf 4nm von Ampere auf Ada und nun mehr oder weniger keine Veränderung?
4N ≠ N4.
ADA war 5nm, Blackwell ist 4nm.

Wikipedia zu ADA:
„Die Grafikprozessoren werden bei TSMC im 4N-Fertigungsprozess hergestellt, wobei es sich um einen für Nvidia angepassten 5-nm-Prozess handelt.“
Sehe Ich hier immer wieder, dass Leute behaupten es sei die gleiche node, das ist aber quatsch. Es stimmt, der Sprung ist wesentlich kleiner als von Samsungs 8nm auf tsmc 5nm. Aber einen Sprung gibt es schon.
Die ampere a100 sind in tsmc 7nm gefertigt. Nur die Konsumenten haben Samsung bekommen.
 
Der DDR7 Speicher wird ja auch in einem neuen Prozess bei Samsung hergestellt. Also von der Seite ist auch kein Stillstand.
 
Nach dem ich diese Seite aufmerksam gelesen habe, denke ich der Blackwell könnte uns bei dem Verbrauch extrem überraschen! Empfehle jedem diese Seite vor allem den Bereich um Powermanagement Verbesserungen genau anzuschauen!

Beitrag automatisch zusammengeführt:

Der DDR7 Speicher wird ja auch in einem neuen Prozess bei Samsung hergestellt. Also von der Seite ist auch kein Stillstand.
GDDR7 hat 3-Schaltzustände vs. 4 bei GDDR6 - somit ist der Signal störungsunanfälliger!
Beitrag automatisch zusammengeführt:

Ich ändere gerade meine Meinung vom Backwell nach dem lesen des Techpowerup Artikels!
Ich denke, die Mehrheit unterschätzt gerade die neue Fähigkeiten der neuen Systeme von Backwell.
Und noch was: es könnte sein, dass ein Paar Sachen zwar auch von ADA unterstützt werden aber erst bei Backwell brauchbar laufen werden!
 
Zuletzt bearbeitet:
Welche Meinung? Einfach die finalen Reviews abwarten. :lol:

Bei mir ändert sich gar nichts. Ich nehme derlei Previews neutral auf und warte ab. Und solange ist Blackwell weder ein Must buy noch ein Fail.

Genau wie bei der 4090 kann es durchaus sein, dass die 5090 hier wirklich sparsam (im Verhältnis zu den Erwartungen hier im Forum und anderswo) zuwerke geht. Die 4090 Kühler der Boardpartner waren auch überdimensioniert.

Aber aktuell schlagen bei mir die Emotionenen weder in die eine noch die andere Richtung aus.
 
Wieso 7nm auf 5nm?
Es gab doch 8nm auf 4nm von Ampere auf Ada und nun mehr oder weniger keine Veränderung?
Waren nur hypothetische Beispiele.
Das sind in Real sowieso weder echte 8nm oder 4nm. Sondern Marketingbegriffe.
 
Das war natürlich nur Spass. Mach schon seit über 10 Jahren kein ocing mehr. Bei mir läuft alles nur Stock ohne irgendwelche Vergewaltigungen. 😉
Ja weiss ich doch, ich muss ja das alte Ding manchmal foltern. ☢️🔥💥 Hat sich aber auch langsam erledigt, die Wärmeleitpastete gibt gerade auf und bevor ich die auseinanderbaue, kommt ne andere rein. Bin ja auch hart auf die ganzen Tests gespannt. Wegen dem Stromverbrauch mache ich mir Sorgen, glaube so sparsam wie jetzt wird das nicht mehr, war schon echt sehr effizient. Die 5070Ti zieht sich ja auch schon wieder 300W rein, klar gegen eine 5090 ist das ja noch sparsam, 575W alter Schwede. Knusbrig knusbrig. Mal schauen wie das dann so im Idle aussieht.
 
Zuletzt bearbeitet:
Nüchtern betrachtet ist aktuell nicht mehr als 4nm möglich, zudem wollte Nvidia auch die Synergien der professionellen Serie nutzen. Jensen sagte nicht umsonst "AI is coming home to GeForce". Wenn überhaupt, wird es zuerst in den professionellen KI-Chips Strukturverbesserungen geben. --> dadurch mehr Rohleistung.
Für Gaming entwickelt Nvidia allerdings keine extra neue Architektur mehr, sondern passt die Bedürfnisse an die aktuelle KI-Architektur an.

Blackwell ist daher die Generation, die das KI-Rendering nun vollständig etablieren wird und noch zusätzlich über eine verbesserte RT Leistung verfügt.

Den Marketing Artikel von TPU durch KI auf die wichtigsten Infos zusammengefasst :)

Hauptmerkmale der Blackwell-Architektur:
  • Optimierung für neuronale Netzwerke: Die Architektur ist speziell für neuronale Algorithmen ausgelegt, was den Speicherbedarf reduziert und die gleichzeitige Ausführung mehrerer Aufgaben ermöglicht.
  • Quality of Service: Blackwell gewährleistet eine effiziente Handhabung moderner, asynchroner Workloads wie Physiksimulationen, KI-Aufgaben und Rendering, um eine ausgewogene Performance sicherzustellen.
  • Energieeffizienz: Mit Fokus auf reduzierten Energieverbrauch ist die Architektur sowohl für Hochleistungs-Desktops als auch für energieeffiziente Laptops geeignet.
Technologische Neuerungen:
  • Fünfte Generation der Tensor Cores: Optimiert für neuronales Rendering, unterstützen sie das INT4-Format, was den Durchsatz erhöht und den Speicherbedarf halbiert.
  • Vierte Generation der RT Cores: Verbesserte Verarbeitung großer und komplexer Geometrien für effizienteres Raytracing.
  • AI Management Processor (AMP): Koordiniert KI-Aufgaben parallel zum Grafik-Rendering für reibungslose Abläufe bei komplexen Workloads.
  • Verbesserte Shader Multiprozessoren (SM): Erhöhte Bandbreite und Durchsatz für neuronale Shader, insbesondere bei Aufgaben des Deep Learnings.
  • GDDR7-Speicher: Neuer Industriestandard mit doppelter Geschwindigkeit im Vergleich zu GDDR6 und halbiertem Energieverbrauch pro übertragenem Bit.
Zusätzlich bietet die Blackwell-Architektur eine Verdopplung der INT32-Bandbreite und -Durchsatzes, indem alle Shader-Kerne sowohl INT32 als auch FP32 ausführen können. Die Tensor Cores sind über die neue DirectX Cooperative Vectors API direkt von den Shadern aus zugänglich. Verbesserungen bei der Shader Execution Reordering (SER) steigern die Effizienz weiter.

Einführung von DLSS 4:
  • Transformer-basierte Modelle: DLSS 4 setzt erstmals auf Transformer-Modelle anstelle traditioneller Convolutional Neural Networks (CNNs). Diese nutzen Aufmerksamkeitsmechanismen, um relevante Bildbereiche gezielt zu optimieren, was besonders in komplexen Szenen zu einer verbesserten Darstellung führt.
  • Erhöhte Rechenleistung: Die neue Version nutzt die vierfache Rechenkapazität früherer DLSS-Modelle, was eine bessere Balance zwischen Bildqualität, Flüssigkeit und Reaktionsfähigkeit ermöglicht.
  • Verbesserte Detailtreue: Durch die neuen Modelle werden feine Details, wie beispielsweise die Struktur einer Tasche, präziser wiedergegeben. Dies führt zu einer insgesamt höheren visuellen Qualität.
  • Reduzierte Artefakte: DLSS 4 minimiert visuelle Störungen wie Flimmern oder Geisterbilder, insbesondere bei sich schnell bewegenden Objekten, was zu einer stabileren und klareren Darstellung führt.

Lebendige Spielwelten (Nvidia ACE)
NVIDIA strebt an, Spielwelten zu entwickeln, die sich kontinuierlich basierend auf den Aktionen der Spieler und der KI-gesteuerten Charaktere weiterentwickeln. Dabei sollen digitale Menschen entstehen, die nicht perfekte Abbilder realer Spieler sind, sondern dynamische Charaktere darstellen, die Fehler machen und zur Unvorhersehbarkeit der Spielwelt beitragen.

Nachbildung menschlicher Entscheidungsfindung:
Um authentische und flüssige Interaktionen zu ermöglichen, analysiert NVIDIA den menschlichen Entscheidungsprozess, der in drei Hauptphasen unterteilt wird:

  1. Wahrnehmung: Die Fähigkeit, die Umgebung zu erkennen und zu verstehen.
  2. Kognition: Die Verarbeitung der wahrgenommenen Informationen und das Treffen von Entscheidungen.
  3. Aktion: Die Umsetzung der Entscheidungen in Handlungen.
Fortschrittliche Wahrnehmungsmodelle:
NVIDIA entwickelt fortschrittliche Modelle für die auditive und visuelle Wahrnehmung, die es KI-Agenten ermöglichen, die Spielwelt effektiver zu verstehen und menschlicher zu reagieren.

KI-basierte Systeme zur Spielerinteraktion:
Um die Interaktion zwischen Spielern und KI-Charakteren zu verbessern, hat NVIDIA mehrere KI-basierte Systeme entwickelt, die menschliche Entscheidungsfindung und emotionale Tiefe in die Charaktere einbringen.

Zielsetzung:
NVIDIAs Ziel ist es, KI-gesteuerte Charaktere zu schaffen, die über funktionale NPCs hinausgehen. Durch die Integration menschlicher Entscheidungsprozesse, emotionaler Tiefe und fortschrittlicher Animationen sollen immersivere, unvorhersehbare und emotional ansprechende Spielwelten entstehen, die neue Maßstäbe für die Interaktion zwischen Spielern und KI setzen.


KI in der Softwareentwicklung:
  • Traditionelle Entwicklung: Bisher wurde Software manuell von Entwicklern geschrieben und vom Prozessor ausgeführt. Dieses statische Modell stößt bei komplexen Aufgaben an seine Grenzen.
  • KI-basierte Entwicklung: Durch maschinelles Lernen werden neuronale Netzwerke mit großen Datenmengen trainiert, die auf GPUs laufen. Dies ermöglicht eine flexiblere und skalierbarere Problemlösung.
NVIDIA Inference Models (NIM):
  • Definition: NIM sind vorgefertigte, optimierte KI-Modelle, die auf RTX-GPUs laufen. Sie werden als Container bereitgestellt, was die Integration in verschiedene Anwendungen erleichtert.
  • Verfügbarkeit: Die ersten NIM-Mikrodienste sollen im Februar erscheinen und kostenlos mit flexiblen Lizenzen verfügbar sein, um Entwicklern die Nutzung und Anpassung zu ermöglichen.
Unterstützung von KI-Tools:
  • No-Code/Low-Code-Lösungen: NVIDIA unterstützt Tools wie Crew.AI, ComfyUI und Flow Wise.AI, die den Einstieg in die KI-Entwicklung erleichtern und mit NIM-Mikrodiensten kompatibel sind.
Integration in Windows:
  • Windows Subsystem for Linux (WSL): Traditionell lief KI-Entwicklung unter Linux. Durch WSL können diese Prozesse nun nahtlos in Windows integriert werden, was die Entwicklung auf RTX-AI-PCs erleichtert.
 
Zuletzt bearbeitet:
Klar, darf man eben nicht vergessen.
Der Übergang von 130 -> 90 führte zu einer Packungsdichteverbesserung von etwa dem 2-fachen. Damals war die Fertigungstechnologie weniger komplex und die Reduktion viel einfacher. Man konnte durch kleinere Strukturen automatisch deutliche Verbesserungen erzielen, da die Reduktion der Gate-Längen direkte Verbesserungen in Geschwindigkeit, Leistungsaufnahme und Kapazität ermöglichte.
Der Sprung von 7 nm auf 5 nm bietet etwa eine Packungsdichteverbesserung von dem etwa 1,8-fachen. Die Fortschritte sind aber weniger linear und stärker durch physikalische Grenzen eingeschränkt.
Wird Zeit für GaAs oder so was, wahrscheinlich unbezahlbar. :oops:
 
Aber wie mit der 20XX Generation wird hier AI erstmals ernsthaft etabliert. Richtig anziehen wird das wohl erst mit der 60XX oder 70XX. Weil die 5090 ist nicht das Maß. Die Masse kauft 5070 und drunter. Wenn überhaupt bei den Preisen. 🤷‍♂️
 
@EleCtricStream danke für diese super Zusammenfassung.

Und genau deswegen gehe ich davon aus, dass wir in Sachen KI und Upscaling (DLSS; MFP etc.) komplett neue Maßstäbe sehen werden und das mit DLSS 4 dann hoffentlich auch deutlich besser umgesetzt und tatsächlich in Gänze einfach brauchbar wird.
 
Genau der Punkt: diese Qualitätssteigerung bei DLSS4 kann zwar auch ADA aber wahrscheinlich nicht so schnell und nicht mit dem Qualitätsgrad. Denn, nur Blackwell verfügt diese Engine, die in komplexen Szenen die Bereiche mit komplexen Geometrie richtig erkennen kann.

Somit wird die Bildqualität bei DLSS NUR bei Blackwell besser sein. Bei ADA weniger.
 
Genau der Punkt: diese Qualitätssteigerung bei DLSS4 kann zwar auch ADA aber wahrscheinlich nicht so schnell und nicht mit dem Qualitätsgrad. Denn, nur Blackwell verfügt diese Engine, die in komplexen Szenen die Bereiche mit komplexen Geometrie richtig erkennen kann.

Somit wird die Bildqualität bei DLSS NUR bei Blackwell besser sein. Bei ADA weniger.
Vermutlich wird sich durch Blackwell eine DLSS-Stufe mehr erkauft werden können...

DLSS-Q statt DLSS-Ausgewogen
MFG statt nur FG...

Also hast du am Ende des Tages bei Blackwell:

DLSS-Q als Baseline + MFG

Währenddessen wird bei ADA
eher DLSS-Ausgewogen + FG das Mittel der Wahl sein.

Im Extremfall mit DLAA + Pathtracing etc.
Wenn das Spiel so an den 50 FPS mit DLAA bei Blackwell hängt,
dann schafft eine 4090 ca. 35 FPS, die mit FG im Idealfall auf ca. 65 FPSusht werden könnten. Das wird sich allerdings nicht so gut anfühlen.

Blackwell hat dann durch MFG und die 50er Baseline eventuell 180 FPS, und das wird sich mit Sicherheit etwas besser anfühlen bzw. performen.
 
Voll auf Ai gesetzt keine arch Verbesserung teils Verschlechterung und in hardware verbautes dlss. Mir tut der reviewer leid der das Auseinandernehmen muss damit vergleichbar bleibt.
Spiel an, benchmark durch geht schlicht nicht. Da sich das Automatische upscaling nicht abstellen lässt das nebenbei zusätzlich zu dlss läuft
Darum kommt jensen ja auf 8 fache pixel mit dlss4, doppelt ist die norm also halbe Auflösung per default darauf kommt FG
ich sehe klar das amd rx9070xt die Empfehlung wird die nächsten 2 Jahre da dort keine fake Optimierungen aktiv sein können.
 
@Kriegsgeier
Du glaubst doch nicht das er das jetzt alles übersetzt hat? Im KI-Zeitalter sind wir schon längst angekommen. Kannst ja mal nach Kling AI oder Hunyuan Video gucken bei YT. Und das ist nur das was wir schon nutzen können. Will garnicht wissen was noch in den Schubladen liegt.

5000er Serie ist KI-Serie. Ob das gut oder schlecht ist, oder beides, wird sich zeigen.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh