Cyperpunk 2077 nutzt SMT für AMD-Prozessoren nicht

Steht in den Patchnotes.
Die Ausnutzung der Kerne bei meinem 3800X ist jetzt wieder genau wie vor dem Hex Fix.:cautious: Und der Fix ist nicht mehr nutzbar, weil die entsprechende Zeichenfolge nicht mehr vorhanden ist.
Im CPU Limit hatte der Fix bei mir durchaus was gebracht. Die Auslastung der Graka wurde deutlich erhöht und es waren etwa 3 FPS mehr avg und P1.
Im GPU Limit waren es aber nur zwischen 2 und 3 FPS im P1. Nach dem Patch habe ich wieder 3 FPS weniger bei den P1.
Also fahre ich besser kein Update, da es jetzt ja läuft
Den Eintrag für Hex-Edit gibt es auch bei meiner Exe nicht mehr. Und der Prozessor nutzt geschmeidig nur die physischen Kerne und kein SMT.:cry:
Schade drum, irgendwie versaut es mir das ganze Game.

Das Byte liegt jetzt bei Offset 0x2a4ab2b (GOG Version 1.05, SHA1 14339b3c07c2ed32ab9a3ec446ebdc2668e52988)

Die Zeichenfolge lautet damit:

75 2d 33 c9 b8 01 00 00 00 0f a2 8b c8 c1 f9 08

Die 75 durch eb zu ersetzten sollte weiterhin den gleichen Effekt (AMD CPUs werden wie nicht-AMD/intel behandelt) haben. Ob dieser Codepfad auf Systemen mit > 6 Kernen überhaupt gewählt wird, ist eine andere Sache. Das müsste sich mal jemand genauer ansehen.

Ein spezifischerer Patch, um auf AMD CPUs mit 8(+) Kernen, oder einfach immer die logische Kernanzahl zu verwenden, wäre natürlich besser.

Ob das ganze wirklich einen Mehrwert darstellt sei jetzt mal dahingestellt.


Edit: Ok, ich hab mir das ganze nochmal angesehen. Die neue Logik lautet in etwa folgendermaßen:
Code:
threads := logisch
WENN hersteller = AMD
    WENN familie UNGLEICH 15h
        WENN physisch > 6
            threads := physisch

Byte 0x2a4ab2b durch eb zu ersetzen (lässt den hersteller = AMD Zweig aus) sollte also den gewünschten Effekt haben. Ansonsten kann man auch die Grenze verschieben, indem man Byte in 0x2a4ab54 den entsprechenden Wert (in hex; max 0x7F/127) einträgt.

Beispiel > 6 zu > 8 Kerne:
83 7c 24 48 06 0f 47 7c 24 48 48 8b 5c 24 50 8b durch
83 7c 24 48 08 0f 47 7c 24 48 48 8b 5c 24 50 8b ersetzen.
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ich denke den Unterschied merkt man nicht, habe selbst nur den 3900x und habe nichts gemerkt. Was man aber merkt/beobachten kann, ist dass immer die physikalischen Threads angesprochen werden und nicht die virtuellen. Ich denke deshalb der Hintergrund warum man der Meinung war da ein Profil zu fahren für 8 Kerne+ oder <8 Kerne.
Ich denke das Spiel ist für 8 Threads(Kerne) optimiert und da sind "echte" physikalische einfach stärker/schneller als virtuelle Threads.
 
Was ich jetzt noch nicht verstanden habe. Braucht z.B. ein 5900x oder 5950x nicht diesen SMT Mod bzw. den Patch?
 
Nein, die 59xx haben wohl noch nie von dem SMT Fix profitiert. Installier nur den Patch!
 
Ok die haben davon nicht profitiert aber haben die trotzdem einen Nachteil oder waren die einfach davon nie betroffen?
 
Es ist viel einfacher zb. mit Process Lasso einfach 6, 8 oder 10 echte Kerne mit Hoher Prio zu erzwingen, statt sinnlos threads switchen zu lassen oder stupide HEX Werte zu editieren!

Bei meinen 12 Kerner - 24 Threader sind die ersten 4 Threads ergo 2 Kerne + SMT für das System und jeglichen kram manuell, dann gebe ich zb. bei CB2077 10 echte Kerne, "gerade Threads", läuft total flutschig, probiert es einfach aus, da muss man keine Wissenschaft oder Religion drauß machen.

 
Durch den Patch muss man als Spieler gar nichts mehr machen.
Kein Hexedit, kein Erzwingen von Zeug, nichts.

Einfach starten und spielen.
Jeglicher Gewinn durch einen "fix" oder "mod" ist nun reine Einbildung und führt eher zu Leistungsverlust.
Gleich wie dem "Memoryunlock" mod auf Nexusmods. Was haben die Leute geschworen wie toll das Ding ist. Magie sagten sie,... nur wurde die Datei vom Spiel gar nicht benutzt. ;-)
 
Es ist viel einfacher zb. mit Process Lasso einfach 6, 8 oder 10 echte Kerne mit Hoher Prio zu erzwingen, statt sinnlos threads switchen zu lassen oder stupide HEX Werte zu editieren!

Bei meinen 12 Kerner - 24 Threader sind die ersten 4 Threads ergo 2 Kerne + SMT für das System und jeglichen kram manuell, dann gebe ich zb. bei CB2077 10 echte Kerne, "gerade Threads", läuft total flutschig, probiert es einfach aus, da muss man keine Wissenschaft oder Religion drauß machen.
Solange man nicht auch einen anderen CPU Vendor spoofed (wüsste nicht, wie*) wird CP77 auf den entsprechenden AMD Systemen trotzdem nicht mehr Threads erzeugen, als echte Kerne vorhanden sind. Es geht ja hier explizit darum, mehr Threads als echte Kerne zu haben, um von SMT zu profitieren.

Dass das bei Systemen mit mehr als 6 Kernen zu einem objektiven Leitsungsplus führt, darf man bezweifeln. Vermutlich ist das eher "Mess"-Toleranzen und Placebo-Effekt zuzusprechen. Es gibt ja auch genug Leute, die von Performance-Unterschieden bei verschiedenen Mod-Varianten oder besserer CPU-Auslastung auf intel Systemen sprechen sprechen.

* Außer alle cpuid Aufrufe live zu patchen.
 
@YCbCr

Fakt ist das echte KERNE immer unechten bzw. Threads vorzuziehen sind, auch ein erzwingen von somit Threads bringt viel mehr als das Windows sinnlos 24 hin und her Threads switchen lässt!

Probiert es aus Process Lasso funktioniert wunderbar ohne Einschränkung ob Free Lizens oder Pro, außer das es nach paar Tagen nerft.

Es merkt sich auch für jedes Prog oder Spiel die Starteinstellungen, wieviele und welche Threads, Prio Hoch usw. einmal eingestellt und ruhe ist.

Ich habe nun X spiele so schlicht verbessern können in der Auslastung und Leistung die ich am Ende zb. bei min. oder AVG FPS sehen kann.

Grundsätzlich sollte man die ersten beiden oder vier Threads nicht verwenden und diese rein für das System lassen, da grundsätzlich eben das System die ersten Kerne bevorzugt, oder man erzwingt sie.

So kann man sich abhängig davon wieviele echte Kerne man hat die Ressourcen der echten Kerne nur für die entsprechende Anwendung vollumfänglich reservieren, in meinem Fall immer 10 Kerne kein SMT für Spiele und die ersten beiden 0, 2 sowie SMT/HT 1, 3 überlasse ich Windows und Kleinkram.

Wenn ich weiß, Spiel XY kann nur mit max. 4 Threads umgehen, erzwinge ich dem Spiel 4 echte Kerne und gut ist, da kommt sich nix in die quere.

Sinnvoll auch bei mehreren CCX wie bei AMD, das man das auf einen legt, dann müssen auch nicht die DIE's switchen mit dem IO.
 
@YCbCr

Fakt ist das echte KERNE immer unechten bzw. Threads vorzuziehen sind, auch ein erzwingen von somit Threads bringt viel mehr als das Windows sinnlos 24 hin und her Threads switchen lässt!
Habe nie etwas anderes behauptet. Mehrere Threads auf dem gleichen logischen Prozessor(kern) auszuführen, wenn noch "echte" verfügbar sind, würde auch wenig Sinn machen. Fakt ist aber auch, dass auch in einem superskalaren Kerndesign mit out of order execution oft nicht alle Ressourcen ausgelastet sind. Ob und wann SMT allgemein Sinn macht, ist aber auch komplett off-topic hier.

Hier geht es darum, dass SMT in CP2077 auf gewissen (AMD Ryzen) CPUs mit "weniger" echten Kernen einen merklichen Leistungszuwachs bringt, das Spiel sich aber (vor Version 1.05) für diese CPUs beim ermitteln der "optimalen" Anzahl an Threads explizit an der Anzahl der physischen Kerne orientiert.
 
Je nach Quelle und Auslastung, bringt im optimalen Fall ein SMT Thread / Hyper-Thread ~20% Mehr Performance pro Kern.

Ein Quadcore der mit SMT/HT läuft, also 8 Threads entspricht ungefähr im sehr günstigsten Fall so wie 5 echte Kerne/nackte Threads ohne SMT/HT.

Da man im Fix von Verbesserungen bei Prozessoren von 6 oder weniger Kernen gesprochen hat, in dem SMT ausgenutzt wird entspräche das der optimierten Auslastung. 4cores + SMT ~ 5 Cores,
6 Cores +SMT ~7 Cores.

Wobei man bei Messungen feststellen würde das bei 4 Cores +SMT, die zusätzlichen Threads +25-30% mehr Performance bringen würden, während bei 6 Cores +SMT das wohl eher 15-20% pro zusätzlichen Thread bringt.

Ab 8 Cores ist es Banane.
 
Also ich hab das Update installiert und auf meinem 3100 läuft es gut. Die Auslastung ist ausgeglichen und ich hatte keine Ruckler mehr.
 
Naja da würd ich zwischen Intel und AMD unterscheiden mit SMT. AMD setzt das deutlich stärker um
 

Anhänge

  • mpg_OC_4500.jpg
    mpg_OC_4500.jpg
    626,5 KB · Aufrufe: 89
  • 4500_1.325v_SMT_OFF.jpg
    4500_1.325v_SMT_OFF.jpg
    510,1 KB · Aufrufe: 86
Naja da würd ich zwischen Intel und AMD unterscheiden mit SMT. AMD setzt das deutlich stärker um
Wie definierst Du "deutlich stärker"?

Beide setzen das ja identisch um, indem sie einen Kern quasi virtuell zweiteilen.
Da ist jetzt nicht die mörder Wissenschaft dahinter mit 20 Punkten, die man besser oder schlechter machen kann.

Sie können bestenfalls das Loadbalancing aggressiver / weniger aggressiv einstellen,... was MC Leistung bringt und SC senkt vermutlich. Also beides nicht unbedingt "gut" und "schlecht", sondern lediglich "anders".
Ich merke bei meinem AMD Chip schon, dass der Fokus SEHR stark auf MC liegt und die CPU auch extrem Agro mit dem Strom umgeht im Vergleich zu meinem alten 9900K.
Single core ist sehr gut jetzt, aber nicht sehr verlässlich,... etwas schwer zu beschreiben. Es schwankt einfach massiv, wie viel SingleCore Leistung hergeht. Im Spike / Benchmark immer gleich, ja... aber nicht in Games. Da schwankt das enorm.

Beim 9900K war die Leistung steif wie ein Brett, immer gleich und der Stromverbrauch (und damit die nötige Kühlung) auch extrem stabil und konstant.
Beim 5950X schwankt das wie ein besoffener Autofahrer. Mal ist die Leistung total geil, dann bricht sie kurz voll ein... meist ist die CPU bei 52 Grad, schießt dann aber (ohne spürbaren Grund) auf einmal auf 70 Grad hoch.

AMD geht also in meinem subjektiven Empfinden deutlich aggressiver mit der CPU um, erreicht dadurch höhere Spitzenleistung.
Intel geht bedachter und weniger Spikeartig mit Strom und Leistung um, was zu einem sehr konstanten und flüssigen Ergebnis führt, aber in der Spitze weniger Leistung liefert.

Beide Ansätze haben ihre klaren Vorteile.
Da würde ich jetzt zu keinem "deutlich stärker" sagen.
 
Meines Wissens hat das mit der 7nm Fertigung zu tun. Dadurch sind die Leckströme wohl höher und es kommt zu diesen Spitzen.
 
Meines Wissens hat das mit der 7nm Fertigung zu tun. Dadurch sind die Leckströme wohl höher und es kommt zu diesen Spitzen.
Naja noch geht das, aber wie weit will man das treiben?
Was ist mit dem Nachfolger? Ohne den Takt zu steigern wird es keine großen Sprünge geben. Takt steigern wird noch heißer.
Dabei ist das fast egal was für eine Kühlung verbaut ist, solange das nicht sub-ambient/sub-zero ist. Und das ist ja auch keine Lösung für normale Menschen, alles was sub-ambient ist, braucht extra Strom. Sub-zero reden wir gar nicht, ist nicht praktikabel in keinster Weise.

AMD muss hier die Probleme angehen, damit die CPU ihre maximale Temperatur nie erreicht, wenn die Kühlung passt, auch mit dem PBO, wenns nur bei 200MHz bleibt.
Was nicht der Fall ist, die CPUs knallen in eine Wand von 90°C auch mit einer Custom WaKü die auf 500Watt und mehr Kühlleistung ausgelegt ist und definitiv ordentlich anliegt. Mit guter WLP usw.
Das macht OC ohne exotische Kühlung unmöglich, auch alle Lüftersteuerungen kriegen Probleme mit 75°C unter einfacher Last und dauerhaft 90°C wenn man arbeitet.
 
Hab den Patch installiert und nun ist das Spiel verbugt.
Hatte vor dem Patch 50 bis 60 FPS und nun, egal in welcher grafikeinstellung, max 16fps und die Grafikkarte nutzt maximal 30% ihrer Leistung.
Hab ne 3080 und nen ryzen 1700.

Hoffe die bekommen das noch hin
 
Vielleicht ist beim Update was schief gelaufen. Hast du mal Installation verwalten - überprüfen/reparieren versucht?
 
Vielleicht ist beim Update was schief gelaufen. Hast du mal Installation verwalten - überprüfen/reparieren versucht?
Ist eine Idee. Mach ich gleich mal
Beitrag automatisch zusammengeführt:

hat auch nicht funktioniert. CPU weiterhin bei 46% und GPU bei max 35% und um die 12 bis 16 fps. Das spielt sieht außerdem verdammt mies aus und egal welche einstellung ich fahre (1080p low detail) mehr als 18 fps bekomm ich nicht. limiter ist nicht drin. Nur neuster grafikkartentreiber
 
Zuletzt bearbeitet:
Das klingt nach V-Sync in dem Fall.
Cyberpunk hat V-Sync Einstellungen bis runter zu 15fps oder so,... also 60 -> 30 -> 15 (Jeder Frame, jeder zweite Frame, jeder vierte Frame).

Wenn dann sehr kurzfristig mehr Leistung abgefragt wird, droppen die FPS halt unter diese Werte, weil die GPU nicht schnell genug hochfahren kann, obwohl sie nicht ausgelastet ist eigentlich.
 
Das klingt nach V-Sync in dem Fall.
Cyberpunk hat V-Sync Einstellungen bis runter zu 15fps oder so,... also 60 -> 30 -> 15 (Jeder Frame, jeder zweite Frame, jeder vierte Frame).

Wenn dann sehr kurzfristig mehr Leistung abgefragt wird, droppen die FPS halt unter diese Werte, weil die GPU nicht schnell genug hochfahren kann, obwohl sie nicht ausgelastet ist eigentlich.
hab ich auch schon gedacht und habe es unter Video aus und eingeschaltet, aber keine Veränderung. Auch im Grafiktreiber ist VSync aus
 
Warum die Umstände, wenn das Game und demnächst eh weg von Fenster ist!
Die Anklage gegen das Team läuft schon.
Die Investoren sind denen am arsch
 
Dem Spiel passiert nix, es ist richtig gut, die Bewertungen auf relevanten Plattformen sehen auch gut aus (gerade Steam, etwas was wirklich relevant ist, nicht so was wie Metacritic - da schreiben wirklich Spieler die das Spiel haben). Die Anklage ist egal, es wird sowieso alles und jeder in der IT&Gaming-Welt verklagt, wenn man groß genug ist.
Und die Investoren beruhigen sich auch.
 
Verstehe den Trubel auch nicht.
15mio Verkäufe sind nun echt kein schlechter Start für Investoren.
Und die Bugs sind auch größtenteils kosmetischer Natur, die kaum auffallen.

Wenn man das Spiel natürlich selber nicht hat und sich nur auf YouTube ne Compilation aus Bugs anschaut, dann kann man natürlich den falschen Eindruck bekommen. ;-)
 
Beste was ich gesehen habe, jemand hat sein Geld zurückgefordert und beschwert sich, dass er jetzt nicht mehr spielen kann :d
 
Joah.
Gibt auch Leute in Foren, die meinen das Spiel wäre unspielbar, weil es keine optische Vorschau bei Items gibt,... oder weil die billigen Autos schwer zu fahren sind, bei 100 Sachen in der Innenstadt.

Allgemein fehlen durchaus ein paar Dinge, die ich erwartet hatte. Das mag schon sein, wird aber sicher nachgereicht. Es handelt sich da um Kleine Details, die ich sogar von nem Indie erwarten würde (Itemvorschau z.B.!). Auf der anderen Seite sind da Details drin, die ich so noch in keinem Spiel gesehen habe. Die Welt fühlt sich lebendig an und ich habe heute, nach 130h, das erste Mal zwei identische NPCs auf der Straße bemerkt. Da ich die Menge auf MAX habe, empfinde ich das durchaus als solide Leistung!

Also es könnte besser sein, es könnte kompletter sein,... aber das was es IST, ist immer noch besser, als 99% aller anderen RPGs.
Von dem her schwingt zwar etwas Ernüchterung mit, aber dass der Hype nie bedient werden konnte, war mir (für mich ganz persönlich) klar. Was ich nun aber spielen kann, ist trotzdem ein fantastisches Spiel, dass von der Story nicht ganz mit Witcher 3 mithalten kann, von der Spielwelt her aber besser / glaubwürdiger ist.

Bin gespannt wie es nach 2-3 größeren Patches und nach all den kostenlosen DLCs dann aussieht.
Auf der Map sind durchaus schon 2-3 Stellen für Expansionen auch aufgefallen und die Geschichten geben auch noch einiges her.
 
Das Byte liegt jetzt bei Offset 0x2a4ab2b (GOG Version 1.05, SHA1 14339b3c07c2ed32ab9a3ec446ebdc2668e52988)

Die Zeichenfolge lautet damit:

75 2d 33 c9 b8 01 00 00 00 0f a2 8b c8 c1 f9 08

Danke, ich habe es probiert und es werden dann auf jeden Fall alle 16 Threads genutzt. In 1080p und Max-Settings hat es ca. 10% Mehrleistung in bestimmten Szenen gebracht (z.B. wo man Jackie am Imbiss trifft). Da ich das Spiel noch nicht groß gespielt habe kann ich nicht sagen, wie es sich außerhalb der Stadt verhält bzw. wenn die NPCs in Aktion treten. Ich werde den Hex-Edit wohl laufen lassen, schaden scheint es ja auch nicht.
 
Gilt das den auch noch für den neuesten Patch oder is das noch Stand 1.05?
Die Cyberpunk.exe scheint nämlich wieder geändert.
 
Bei meinen 12 Kerner - 24 Threader sind die ersten 4 Threads ergo 2 Kerne + SMT für das System und jeglichen kram manuell, dann gebe ich zb. bei CB2077 10 echte Kerne, "gerade Threads", läuft total flutschig, probiert es einfach aus, da muss man keine Wissenschaft oder Religion drauß machen.

Ist es nicht eher sinnvoller, dem Spiel die guten Kerne zuzuweisen (höherer Takt) und windows die schlechten?
Bei Ryzen ist meiner Erfahrung nach CCD 0 (CCX0 CCX1) was sich am höchsten takten lässt. Die restlichen CCD 1 (CCX0 CCX1) sind um einiges schlechter (Ryzen Master lügt in dem Fall mit seinen Sternen).
Das kann man ganz einfach mit dem PCCX Tool testen. Bei allcore OC geht es bei mir max auf 4.1Ghz. Wenn ich die CCX einzeln Takte/OV gehen bei mir die ersten Kerne locker auf 4.5/4.6Ghz während die letzten gerade mal 4.1Ghz schaffen. Das sind auch diejenigen, die allcore CPU OC komplett ausbremsen.
Es lohnt sich bei Ryzen die Kerne einzeln zu übertakten, wenn man die Zeit und Lust dazu hat
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh