Nüchtern betrachtet ist aktuell nicht mehr als 4nm möglich, zudem wollte Nvidia auch die Synergien der professionellen Serie nutzen. Jensen sagte nicht umsonst "AI is coming home to GeForce". Wenn überhaupt, wird es zuerst in den professionellen KI-Chips Strukturverbesserungen geben. --> dadurch mehr Rohleistung.
Für Gaming entwickelt Nvidia allerdings keine extra neue Architektur mehr, sondern passt die Bedürfnisse an die aktuelle KI-Architektur an.
Blackwell ist daher die Generation, die das KI-Rendering nun vollständig etablieren wird und noch zusätzlich über eine verbesserte RT Leistung verfügt.
Den Marketing Artikel von TPU durch KI auf die wichtigsten Infos zusammengefasst
In this article we cover everything NVIDIA revealed about the GeForce RTX 50 Series: the new graphics card models and their pricing, Blackwell architecture, DLSS 4 updates, Neural Rendering, Reflex 2 for faster headshots, improved AI performance and creator-focused tools.
www.techpowerup.com
Hauptmerkmale der Blackwell-Architektur:
- Optimierung für neuronale Netzwerke: Die Architektur ist speziell für neuronale Algorithmen ausgelegt, was den Speicherbedarf reduziert und die gleichzeitige Ausführung mehrerer Aufgaben ermöglicht.
- Quality of Service: Blackwell gewährleistet eine effiziente Handhabung moderner, asynchroner Workloads wie Physiksimulationen, KI-Aufgaben und Rendering, um eine ausgewogene Performance sicherzustellen.
- Energieeffizienz: Mit Fokus auf reduzierten Energieverbrauch ist die Architektur sowohl für Hochleistungs-Desktops als auch für energieeffiziente Laptops geeignet.
Technologische Neuerungen:
- Fünfte Generation der Tensor Cores: Optimiert für neuronales Rendering, unterstützen sie das INT4-Format, was den Durchsatz erhöht und den Speicherbedarf halbiert.
- Vierte Generation der RT Cores: Verbesserte Verarbeitung großer und komplexer Geometrien für effizienteres Raytracing.
- AI Management Processor (AMP): Koordiniert KI-Aufgaben parallel zum Grafik-Rendering für reibungslose Abläufe bei komplexen Workloads.
- Verbesserte Shader Multiprozessoren (SM): Erhöhte Bandbreite und Durchsatz für neuronale Shader, insbesondere bei Aufgaben des Deep Learnings.
- GDDR7-Speicher: Neuer Industriestandard mit doppelter Geschwindigkeit im Vergleich zu GDDR6 und halbiertem Energieverbrauch pro übertragenem Bit.
Zusätzlich bietet die Blackwell-Architektur eine Verdopplung der INT32-Bandbreite und -Durchsatzes, indem alle Shader-Kerne sowohl INT32 als auch FP32 ausführen können. Die Tensor Cores sind über die neue DirectX Cooperative Vectors API direkt von den Shadern aus zugänglich. Verbesserungen bei der Shader Execution Reordering (SER) steigern die Effizienz weiter.
Einführung von DLSS 4:
- Transformer-basierte Modelle: DLSS 4 setzt erstmals auf Transformer-Modelle anstelle traditioneller Convolutional Neural Networks (CNNs). Diese nutzen Aufmerksamkeitsmechanismen, um relevante Bildbereiche gezielt zu optimieren, was besonders in komplexen Szenen zu einer verbesserten Darstellung führt.
- Erhöhte Rechenleistung: Die neue Version nutzt die vierfache Rechenkapazität früherer DLSS-Modelle, was eine bessere Balance zwischen Bildqualität, Flüssigkeit und Reaktionsfähigkeit ermöglicht.
- Verbesserte Detailtreue: Durch die neuen Modelle werden feine Details, wie beispielsweise die Struktur einer Tasche, präziser wiedergegeben. Dies führt zu einer insgesamt höheren visuellen Qualität.
- Reduzierte Artefakte: DLSS 4 minimiert visuelle Störungen wie Flimmern oder Geisterbilder, insbesondere bei sich schnell bewegenden Objekten, was zu einer stabileren und klareren Darstellung führt.
Lebendige Spielwelten (Nvidia ACE)
NVIDIA strebt an, Spielwelten zu entwickeln, die sich kontinuierlich basierend auf den Aktionen der Spieler und der KI-gesteuerten Charaktere weiterentwickeln. Dabei sollen digitale Menschen entstehen, die nicht perfekte Abbilder realer Spieler sind, sondern dynamische Charaktere darstellen, die Fehler machen und zur Unvorhersehbarkeit der Spielwelt beitragen.
Nachbildung menschlicher Entscheidungsfindung:
Um authentische und flüssige Interaktionen zu ermöglichen, analysiert NVIDIA den menschlichen Entscheidungsprozess, der in drei Hauptphasen unterteilt wird:
- Wahrnehmung: Die Fähigkeit, die Umgebung zu erkennen und zu verstehen.
- Kognition: Die Verarbeitung der wahrgenommenen Informationen und das Treffen von Entscheidungen.
- Aktion: Die Umsetzung der Entscheidungen in Handlungen.
Fortschrittliche Wahrnehmungsmodelle:
NVIDIA entwickelt fortschrittliche Modelle für die auditive und visuelle Wahrnehmung, die es KI-Agenten ermöglichen, die Spielwelt effektiver zu verstehen und menschlicher zu reagieren.
KI-basierte Systeme zur Spielerinteraktion:
Um die Interaktion zwischen Spielern und KI-Charakteren zu verbessern, hat NVIDIA mehrere KI-basierte Systeme entwickelt, die menschliche Entscheidungsfindung und emotionale Tiefe in die Charaktere einbringen.
Zielsetzung:
NVIDIAs Ziel ist es, KI-gesteuerte Charaktere zu schaffen, die über funktionale NPCs hinausgehen. Durch die Integration menschlicher Entscheidungsprozesse, emotionaler Tiefe und fortschrittlicher Animationen sollen immersivere, unvorhersehbare und emotional ansprechende Spielwelten entstehen, die neue Maßstäbe für die Interaktion zwischen Spielern und KI setzen.
KI in der Softwareentwicklung:
- Traditionelle Entwicklung: Bisher wurde Software manuell von Entwicklern geschrieben und vom Prozessor ausgeführt. Dieses statische Modell stößt bei komplexen Aufgaben an seine Grenzen.
- KI-basierte Entwicklung: Durch maschinelles Lernen werden neuronale Netzwerke mit großen Datenmengen trainiert, die auf GPUs laufen. Dies ermöglicht eine flexiblere und skalierbarere Problemlösung.
NVIDIA Inference Models (NIM):
- Definition: NIM sind vorgefertigte, optimierte KI-Modelle, die auf RTX-GPUs laufen. Sie werden als Container bereitgestellt, was die Integration in verschiedene Anwendungen erleichtert.
- Verfügbarkeit: Die ersten NIM-Mikrodienste sollen im Februar erscheinen und kostenlos mit flexiblen Lizenzen verfügbar sein, um Entwicklern die Nutzung und Anpassung zu ermöglichen.
Unterstützung von KI-Tools:
- No-Code/Low-Code-Lösungen: NVIDIA unterstützt Tools wie Crew.AI, ComfyUI und Flow Wise.AI, die den Einstieg in die KI-Entwicklung erleichtern und mit NIM-Mikrodiensten kompatibel sind.
Integration in Windows:
- Windows Subsystem for Linux (WSL): Traditionell lief KI-Entwicklung unter Linux. Durch WSL können diese Prozesse nun nahtlos in Windows integriert werden, was die Entwicklung auf RTX-AI-PCs erleichtert.