Wer von euch hat einen amd 2990wx?

AliManali · 03.02.2020

Latiose schrieb:
Ja den wird kaum einer diese CPU haben, darum kann dies ja auch keiner für mich testen.

Latiose schrieb:
wollte nur wissen ob denn bei 2 parellel umzuwandeln

Pro7 oder RTL? ne beide gleichzeitig. Macht ja Sinn. Ich würd das Geld mal in die ör stecken, da gibts wenigstens gute Hitler Dokus.

Latiose · 03.02.2020

bschicht86 schrieb:
Ich wollte nicht, dass du enttäuscht wirst, weil die Ryzen 3000 gegenüber Ryzen 2000 einen ordentlichen Leistungs- (bzw. IPC-)Sprung hinlegen.

Ja ich weis von 2950x zu 3950x sind es wie ich es ausgerechnet hatte 27,5 % mehrleistung.Alleine nur durch die IPC Sprung Leistung und so.

Beitrag automatisch zusammengeführt: 03.02.2020

AliManali schrieb:
Pro7 oder RTL? ne beide gleichzeitig. Macht ja Sinn. Ich würd das Geld mal in die ör stecken, da gibts wenigstens gute Hitler Dokus.

ne Das interessiert mich nicht,sowas ist doch langweilig.

Kullberg · 03.02.2020

Bmi2 ist ein Instruktionssatz für Bit Manipulationen. Bei AMD sollte man den meiden, weil er extrem lahm ist.
Ryzen Schach Performance
Das Problem besteht auch bei Zen 2

Latiose · 03.02.2020

Na bei den Kommentaren soll es laut Bios sowie chipsatz update ja das Problem gelöst worden sein,aber ob es wirklich 100 % gelöst worden ist,ist halt ne andere Frage.

Kullberg · 03.02.2020

Da hast Du aber den Thread nicht gelesen. Das hat überhaupt nichts mit BIOS, SMT und Chipsatz zu tun. Es liegt beim Schach daran, dass die PEXT Instruktion extrem langsam ist.
Der entscheidende Post

Phantomias88 · 04.02.2020

Kullberg schrieb:
Bmi2 ist ein Instruktionssatz für Bit Manipulationen. Bei AMD sollte man den meiden, weil er extrem lahm ist.
Ryzen Schach Performance
Das Problem besteht auch bei Zen 2

Hi, laut https://www.chessprogramming.org/AMD
soll man keine PEXT bitboard nutzen, sondern magic bitboards beim compilieren.

Es liegt also am Algorithmus, wie so oft.

Latiose schrieb:
Was ist denn bmi2? FMA3 ist ja so ne Unterstützer Einheit von avx. Allerdings beide sind bei mir ja ausgegraut.

Nein FMA3 ist ein Gemeinsamer Befehlssatz von Intel, AMD und den GPUs (nvidia & AMD)
Dieser ist aber nochmal etwas anspruchsvoller bei der Wärmeentwicklung als AVX1 & AVX2.

Bei Kitguru sieht es für die Ryzen 3000 ganz gut aus: https://www.kitguru.net/components/cpu/luke-hill/amd-ryzen-threadripper-3960x-3970x-cpu-review/6/
Das ist aber immer noch kein aktueller Encoder für X264 (1080p & 1440p) und X265 (2160P).
Diese sollten auch eine bessere Kern Unterstützung mit bringen, sind aber nur als Text Adventure zur Zeit erhältlich.

Latiose · 04.02.2020

Phantomias88 schrieb:
Hi, laut https://www.chessprogramming.org/AMD
soll man keine PEXT bitboard nutzen, sondern magic bitboards beim compilieren.

Es liegt also am Algorithmus, wie so oft.

Nein FMA3 ist ein Gemeinsamer Befehlssatz von Intel, AMD und den GPUs (nvidia & AMD)
Dieser ist aber nochmal etwas anspruchsvoller bei der Wärmeentwicklung als AVX1 & AVX2.

Bei Kitguru sieht es für die Ryzen 3000 ganz gut aus: https://www.kitguru.net/components/cpu/luke-hill/amd-ryzen-threadripper-3960x-3970x-cpu-review/6/
Das ist aber immer noch kein aktueller Encoder für X264 (1080p & 1440p) und X265 (2160P).
Diese sollten auch eine bessere Kern Unterstützung mit bringen, sind aber nur als Text Adventure zur Zeit erhältlich.

Aha, davon merke ich allerdings nix und Holzmann cpu war auch nicht heiß gewesen. Also ohne avx ist die CPU ja eh schon Kühler weil ja somit ja ohnehin nicht die ganze CPU ganz ausgelastet wird. Ja denke mal das fm3 die Geschwindigkeit im Gegensatz zu avx auch die kleinen Aufnahmen beschleunigt. Avx bringt ja nur was ab 720p und höher. Das ist mir schon aufgefallen. Wie es denn dann bei fma3 aussieht kann ich ja nicht wirklich dazu sagen.

Kullberg · 04.02.2020

Wenn man den lahmen PEXT Befehl meidet, ist es bei AMD besser. Natürlich liegt das nicht am Algorithmus, sondern daran, wie AMD das implementiert hat. Bei Intel kann und sollte man ihn nutzen, da der Code dann geringfügig schneller ist.

Phantomias88 · 04.02.2020

@Kullberg
Woher nimmst du die Erkenntnis, dass es an der Implementation liegt?

Hier nochmal ausführlicher, allerdings verstehen das auch nur echte Programmierer(innen):
www.talkchess.com/forum3/viewtopic.php?f=7&t=72538#p821900

The current state-of-the-art seems to be PEXT/PDEP based magic bitboard techniques, which seem to get the answer in as little as ~5 operations. Can we do better? Maybe... but only if we parallelize the operation and try to use pext / pdep to perform the rook, queen, and bishop attacks simultaneously.

Latiose · 04.02.2020

Kullberg schrieb:
Wenn man den lahmen PEXT Befehl meidet, ist es bei AMD besser. Natürlich liegt das nicht am Algorithmus, sondern daran, wie AMD das implementiert hat. Bei Intel kann und sollte man ihn nutzen, da der Code dann geringfügig schneller ist.

Was heißt denn geringfähig. Interessant zu wissen, dann muss der test ja mit dem and 3950x ja wiederholt werden, denn diese Einheit habe ich ja nicht abgeschaltet. Es war also fma3 unter amd nicht abgeschaltet. Das heißt der Zieht ja meiner CPU noch weiter davon. Nicht schlecht, was man so aus einem 16 Kerner da alles rausholen kann.

Phantomias88 · 04.02.2020

@Latiose
AVX, FMA3 und BMI2 werden nur von den neuen X264 unterstüzt, gerade weil sie noch bei der Evaluation sind.
Handbreak nutzt die älteren SSE SIMD Befehle, daher wird die CPU auch nicht so warm.

Bei dem Link oben von KitGuru ist der kleinste Threadripper 3960X fast 40% schneller als ein 3950X:

Latiose · 04.02.2020

Phantomias88 schrieb:
@Latiose
AVX, FMA3 und BMI2 werden nur von den neuen X264 unterstüzt, gerade weil sie noch bei der Evaluation sind.
Handbreak nutzt die älteren SSE SIMD Befehle, daher wird die CPU auch nicht so warm.

Bei dem Link oben von KitGuru ist der kleinste Threadripper 3960X fast 40% schneller als ein 3950X:

Ok dann habe ich schon das neuere H264. Bei mir wird fma3, bmi1 und bmi2 unterstützt. Wird die CPU von Intel etwa dann auch wärmer mit diesen befehlsätzen?
Nun weiß ich ja das ich den 3950x beim Holzmann Noch einmal testen muss ohne fma3, bmi1 oder 2. Dann wird da gewiss noch mehr Leistung sein und dann zieht der den i9 9980xe ja noch weiter davon. Dann kann man ihn ja sogar auf 3,8 GHz herunter setzen und wäre ja noch immer schneller, interessant.

Kullberg · 04.02.2020

Phantomias88 schrieb:
@Kullberg
Woher nimmst du die Erkenntnis, dass es an der Implementation liegt?

Hab ich doch oben schon geschrieben - hier nochmal: Link
Da ist zu lesen, dass Skylake 1 Taktzyklus für die PEXT Instruktion braucht und AMD 18.

Bei Intel ist ein Schach Programm mit PEXT ~ 0,5 - 1% schneller als eins ohne.
Bei AMD ist ein Schach Programm mit PEXT uber 30% langsamer als eins ohne.

Phantomias88 · 04.02.2020

Ja, das habe ich gelesen. Nur was soll einem Entwickler das nun sagen?
Welcher Compiler, welche Version der .exe ?
Selbst gebaut oder bauen (compiliert) lassen? Welche Flags wurden genutzt?

Eine andere Architektur, reagiert auch anders auf den selben Algorithmus.
Daher macht es auch Sinn, neue Algos zu testen.

Latiose · 06.02.2020

Also ich habe das nun bei AMD ausprobiert. Irgendwie enttäuschend. Habe wie hier geschrieben wurde fma3 und bmi2 in der Software abgeschaltet. Und siehe da nur 2 Sekunden wurde es schneller und temp war gleich. Dachte das dies so stark die Hitze erhöhen würde. Die temps bewegten sich allerdings zwischen 74 und 76 Grad beim 3950x. Irgendwie finde ich das echt nicht gut. Habe mit mehr erwartet. Es scheint sich also hier kaum amd auszubremsen. Im umkehrechluss heißt es das es bei Intel wohl auch kaum da was beschleunigt. Also avx habe ich ja eh schon deaktiviert in der Software. Nun teste ich das ganze mal bei Intel mit dem Thema fma3 und bmi2. Erwarte nix aber bin dennoch auf das Ergebnis gespannt. Denn je weniger Einheiten benutzt werden desto mehr Einheiten an Transistoren können die anderen Einheiten nutzen. Somit eine win win situation. Vielleicht sinkt ja auch da wenigstens die Temperaturen,wer weiß.
Nicht das ich es brächte, aber dann hätte ich vielleicht noch ein takt plus am Ende, wer weiß.

Phantomias88 · 06.02.2020

@Latiose
Lass das doch die Entwickler machen, wir wissen darüber eh zu wenig.
Fakt ist, dass ein Programm welches auf einem Intel System Entwickelt und compiliert wird, nicht genau so gut auf dem AMD System laufen wird. (Andere Architektur)
Daher gibt es auch zig .exe auf der VLC Seite: https://artifacts.videolan.org/x264/

Die kann man aber Leider nicht bei Handbreak einbinden, man muss es im CMD machen mit Texteingabe.

Das Abschalten ist an sich völlig unnötig, da die neuen Befehlssätze teils den doppelten Durchsatz erreichen.
Sollte es nicht das doppelte sein, werden auch keine neuen Befehlssätze genutzt.

Latiose · 06.02.2020

Was das doppelte, es sind ja noch nicht mal eine halbe Steigerung oder ein Viertel mehr Leistung. Sprich, es waren nur 2 % mehr leistung gewesen das ist ja echt nicht die Welt. Darum kann man sagen das diese Software bei den befehlsätzen eher wohl auf dem Stand von 2011 sind da ja der 2500k ja diese auch nicht kann. Unglaublich. Werden neue CPUs dann überhaupt noch schneller wenn keine der neueren befehlsätze mehr unterstüzt werden. Vielleicht nur noch durch noch mehr Transistoren. Ich wage nun zu bezweifeln das der 32 Kerner trotz smt abschlatung überhaupt so schnell sein kann wie ein gestützte 16 Kerner. Also sprich der 32 Kerner aus der 3970 der ja auch 32 kerne hat. Das der dann schneller ist. Gestern habe ich jedenfalls von den 16 Kerner mit smt 4 logische bei der Software abgeschaltet und war genauso schnell gewesen. Erst als ich auch noch die virtuellen Kerne abgeschaltet hatte, sank es schon um einiges aber auch nicht die Welt.

Phantomias88 · 06.02.2020

@Latiose
Wenn es nur ein paar % sind, dann werden die AVX FM3 bei AMD noch nicht genutzt.
Es dauert einfach seine Zeit bis das Implementiert ist, da man sehr viel Testen muss und Vergleichen.

Bezüglich Intel vs AMD habe ich ein Beispiel:

Linpack kennt nehme ich mal an jeder, das ist schon sehr alt und wurde nur für Intel weiter optimiert.
Mein FX erreicht dort ~74 GFLOPS : https://abload.de/img/linx4ghz_smallsnohe.jpg
Das selbe mit einem Optimierten Linpack für AMD (AIDA64) : https://abload.de/img/neu_aida64_benchnnj1b.png
244GFLOPS das ist das 3-Fache, nur weil der Code hoch Optimiert wurde für den FX.

Latiose · 06.02.2020

wow ok,das ist warlich beeindruckend.Naja es gibt nur noch 2-3 weitere Versionen.Die sind allerdings nur minimal schneller.Also da wurde auch nicht stark optimiert.Also kann man sagen das Xmedia Recode tod ist,warum weil letzte optimierung von anfang letztem Jahr ist.Macht aber nix,es scheint halt nicht jeder software von allen future gleich zu profitieren.Also wenn es nicht unbedingt nötig ist,dann halt eben nicht.Das weis ich ja auch das neuere CPUs auch nicht mehr recht viel wirklich mehr leisten können.

besterino · 02.03.2020

Wenn Interesse besteht, kann ich das Ganze mal auf einem 3960X testen... hab' allerdings nicht die Zeit / Lust, da X Durchläufe mit verschiedenen Settings zu machen...

Falls gewünscht, am besten per PN anstupsen, schaue hier nicht so oft ins Unterforum.

besterino · 04.03.2020

@Latiose: Tolle Wurst - dein letzter Screenshot ist der wichtigste, den man als erstes einstellen muss...

Paar Settings konnte ich nicht exakt wie vorgegeben setzen - vermute mal andere Programmversion. Bei der Videogröße war ich mir jetzt auch nicht sicher, ob du 4:3 oder Original Seitenverhältnis wolltest.
Hab dann 4:3 genommen.

Das 188er File brauchte 1:36.
Das 199er File brauchte 1:34.
Das 463er File brauchte 1:23.

Die Kerne langweilen sich allerdings und gehen selten über 50% Last, Maximum auf einem Kern war mal 65%.

Latiose · 04.03.2020

äh nicht einzeln sondern 188 und 199 gleichzeitig und auch 188 mit 463 zusammen.Ich zeige dor wie ich das eigentlich gemeint hatte.

besterino · 04.03.2020

Blübbs...

Na denn - hier erstmal zwei zusammen:

Latiose · 04.03.2020

🤦‍♂️ Nein so war das nicht gemeint. Nicht alle drei gleichzeitig. Ist zwar auch ne Möglichkeit die CPU voll auszulasten. Gemeint war 2 von 3 gleichzeitig. 3 ist also zu viel des Guten.

besterino · 04.03.2020

CPU langweilt sich immer noch:

188+199:

188+463

Das Tool ist m.E. mal überhaupt nicht optimiert auf viele Kerne.

Latiose · 04.03.2020

Also du hast die selbe Version genommen wie ich dir mitgesendet hatte?
Du hast auch bmi2 sowie fma3 abgeschaltet? Und darum schrieb ich ja auch ohne smt. Denn da stieg die Umwandlung an Leistung. Also bmi2 sowie fma3 bremste bei der Umwandlung wenn da der Haken gesetz ist.

besterino · 04.03.2020

Haken bei bmi2 und fma3 raus und ansonsten alles wie vorgegeben. SMT war an.

Latiose · 04.03.2020

OK dann nur noch das ganze ohne smt. Bin gespannt. Also der 2970wx gewann so 30 Sekunden an boost. Bin gespannt ob diese CPU auch soviel boost kriegen wird.

Wer von euch hat einen amd 2990wx?

cpt sunday flyer

Experte

Computer Schach Freak

Experte

Computer Schach Freak

Banned

Experte

Computer Schach Freak

Banned

Experte

Banned

Experte

Computer Schach Freak

Banned

Experte

Banned

Experte

Banned

Experte

Legende

Legende

Experte

Anhänge

Legende

Experte

Legende

Experte

Legende

Experte

Ähnliche Themen