Ich glaube eher, es geht fdsonne um das grundsätzliche Problem vom neuen TR, dass es aufgrund der Speicheranbindung bei Anwendungen zu großen Performanceeinbußen kommen kann.
Ich hätte mir von AMD eher gewünscht, dass jeder DIE einen Speicherkanal hätte bekommen. Das wäre das mMn rundere Produkt gewesen. Es lässt hier und dort ein paar Prozent liegen bei Software, die stark über Bandbreite skaliert aber absolut gar nichts mit NUMA anfangen kann. Unter Teillast bis Vollast hingegen würde das sogut wie keinen Unterschied machen. Das was jetzt auf den beiden Compute DIEs läuft und die Daten über die Fabric holt, hätte das dann im anderen Aufbau auch getan, wenn der local Memory nicht mehr hätte gereicht.
Finde ich auch recht cheesy und da ist die Kritik von fdsonne vollkommen gerechtfertigt.
Das im Scheduler zu drehe ist ja nur das eine... Der Scheduler kann das halt für Last <50%, indem er, wie bspw. bei SMT schon gesehen, einfach die Last erst dann auf die Compute Nodes legt, wenn explizit gefordert oder es gar keine anderen Ressourcen mehr gibt. Das heist unterm Strich dann, der Prozessor skaliert bis 16C wie eben der 2950X auch - und darüber dann je nach Software mal gut, mal nicht gut.
Würde man aber, wie oben erwähnt, die Anbindung ändern auf 1CH per DIE, dann wäre es wurst egal wo die Threads laufen. Jeder hätte seine Anbindung, schmal aber vorhanden. Und es würde funktionieren.
Man darf sich da aber auch nix vormachen. Damit AMD das hätte einbauen können hätten sie für den 2970/2990WX den Träger umvertraten müssen. Also nicht mehr 1:1 die gleichen CPUs vom Band laufen lassen, sondern welche mit Anbindung 4x1 und welche mit 2x2. Aufwand für ne Niesche, der in einem ähnlich schlechten Verhältnis stehen würde wie der Wunsch, dass Intel eine Sonderedition ala 8086k verlötet -> sowas ist wirtschaftlich nicht drin.
MMn ist das Anbindungsproblem einfach nur das Resultat daraus, dass man sich irgendwann nach der Entscheidung pro 16C Threadripper auf 32C geeinigt hat. Das war sicher so nie im Plan. Denn wäre es im Plan, hätte man 1:1 nen Teildeaktiveren Epyc 1P Sockel, Träger unter der CPU, Anbindungslayout bei den Boards usw. nehmen können. -> stattdessen gabs ne eigene Linie, eigene Produkte usw. Der 16C ist damit leicht im Vorteil, >16C aber im Nachteil
Gute Frage. Per SetProcessAffinityMask kann ich anscheinend leicht ein Programm an die ersten 16 logischen Kerne binden, also auf DIE/NODE 0. Eigentlich müsste dann doch Windows alle anderen Sachen auf die restlichen Kerne verteilen. Sollte das Windows nicht geregelt kriegen, muss man hier halt auch wieder "Hand" anlegen und z.B. den Encoder an die restlichen 48 logischen Kerne binden.
Windows kann das schon - aber im Moment geht der Threadscheduler davon aus, dass bei 4x NUMA Nodes auch 4x Speicher vorhanden ist. Denn das ist bis dato bei ALLEN CPUs der Fall, die NUMA mit der Nodeanzahl 2 oder mehr nutzen, es sei denn, es ist falsch konfiguriert. Der "Sinn" dahinter ist auch einfach erklärt. Als Entwickler möchtest du, dass der Scheduler die Threads auf einem Node hält, weil dort die Daten liegen (Caches/RAM, ggf. sogar Storage -> PCIe) - als Entwickler wirst du auch, wenn du NUMA aware programmierst, diese Umstände berücksichten. Bspw. dass deine Software dann einfach bei mehr Nodes einfach "mehr" Aufgaben verteilt. Rendering, Encoding usw. können das idR gut abdecken. Oder im Serverumfeld. Da gibts viele kleine Tasks, oft unabhängig von einander, das Skaliert dann sehr schön.
Hier aber hat es eben zwei Nodes ohne RAM. Sobald Threads auf den Compute Nodes laufen, laufen die Speicherzugriffe über die IF. Das ist das, was jeder Entwickler verhindert sehen will, weil es ein Performancekiller ist. Auch bei der im Vergleich wirklich schnellen IF von AMD (ggü. alten Intel QPI Umsetzungen oder HTT bei AMD damals noch)
Deswegen sagte ich ja oben auch schonmal, nicht der UMA Mode ist die Basis, sondern normal ist eigentlich der NUMA Mode mit Software, die das auch kennt die Basis. Dort ist dann auch niemals ein UMA Konstrukt schneller - weil es immer nur Nachteile/Kompromisse bereitstellen kann, ggü. dem, wie der Entwickler das nativ beachtet.
Die Herausforderung für AMD dürfte hier eher werden, dass eben die Leute, die so nen Prozessor kaufen mehr als nur eine Aufgabe damit machen. Um so höher die Last, desto bescheidener funktioniert das mit der Zuordnung von "außen". Egal ob das nun via Tool oder via Taskmanager gepinnt wird.
Ihr könntet ja mal testen, was es bringt, die Spiele an einen DIE per SetProcessAffinityMask zu binden. Vielleicht kann man sich damit den GameMode/Neustart sparen.
Ich gehe davon aus, dass es exakt so läuft wie mit bisherigen Multi-NUMA Node Systemen. Pin die Threads und das läuft wie es soll... Aber dann zieht halt auch bisschen das Argument, was mir her permanent an die Birne geworfen wird -> das Teil ist primär nicht zum Spielen gebaut. Denn legst du mehr als nur die Spielelast an - belastest also noch den Rest in Teilen oder sogar voll - wirst du Probleme haben die Leistung auch umzusetzen. Mit Prioritäten kann man das Spiel in den Fokus holen, damit die FPS wenigstens stabil bleiben. Aber dann schwankt ggf. halt die Leistung der Backgroundtasks bis dahin, dass es einfach nicht schneller ist als bei nur halber Nutzung -> im Worst Case also bis zu 900$ für den Wind...
VMs fehlen auch noch, zumindest wenn man sehr viele davon einsetzt.
Mit 128GB real zu bestückenden RAM? Mag für den ein oder anderen hier viel sein - aber im Hypervisorumfeld ist das nix... Da gehts ab 384-512GB eher so los. Bis rauf in den TB Bereich - je nach Anforderungen. Manche Hoster oder Kunden brauchen mehr CPU-, andere mehr Storage- und wieder andere mehr RAM Menge/Power. Und gerade die halbseitige Anbindung des RAMs sowie die vielen NUMA Nodes schränken das VM Geschäft schon arg ein...
Ich dir auch.
Wer für den WX nichts sinnvolles auf der Platte hat, der will auch keinen 7980XE.
Warum bringt hier alle Nase lang irgendwas mit Intel? Intel hat doch hier nichts verloren - es war auch nie Punkt der Kritik hier AMD oder Intel als Hersteller zu kritisieren, sondern die Kritik zielt auf die Umsetzung des WX. Keine Ahnung was dieses - "
ja aber die anderen machen es auch nicht besser" immer soll...
Da scheint man hier bei vielen einfach nur nen Wunden Punkt zu treffen so wie das hier immer angeht. Es könnte so nüchtern entspannt sein. Was habt ihr bitte davon? Ich versteh es einfach nicht... 99% der Leute hier kaufen das Teil sowieso nicht. Warum nur muss das immer diese Richtung annehmen? Entweder man ist für oder gegen den Hersteller - was anderes kennt ihr nicht... Traurig, echt traurig sowas...
WX ist für Leute, die perfekterweise Epyc-Platform gebrauchen könnten, sich das aber nicht leisten möchten. Alle anderen werden problemlos mit den X auskommen.
Wer AMD einfach nur nicht mag, wird sich dann dafür was von Intel holen. Bald mit einem viel besserem P/L. Dank AMD.
Verweigere dich nicht fortlaufend der Realität.
Wer behauptet was von AMD nicht mögen? Muss man einen Hersteller mögen? Dieser subjektive Unsinn ist doch hier völlig fehl am Platz.
Ach und Thema Realität, den gebe ich gern zurück. Die Realität ist nicht, dass der Hersteller vorschreibt, wie man den Prozessor einzusetzen hat. Im Gegensatz zu dir oder dem ein oder anderen hier lass ich mir das nicht gefallen. Aber bei euch gehts scheinbar nicht ohne Markenverbundenheit. Keine Ahnung - ist mir zu hoch das zu verstehen. Bin ich vllt auch zu alt für... Warum muss es immer auf AMD gut oder scheiße rauslaufen? Oder Intel gut oder scheiße?
Auch AMD darf mal ein Produkt verhauen. Wie auch Intel oder NV oder wer auch immer... Das schlimme daran ist, dass immer die Fans dann dieses Zeug derart bis aufs Blut verteidigen müssen ohne einfach mal einzusehen, dass die Umsetzung nicht der Bringer ist oder war. Hier ganz konkret, es wäre besser gegangen. Es gibt sogar Tests dazu, und witzigerweise kann es JEDER! von euch selbst testen. Aber das macht ihr ja dann nicht - Augen zu und durch. Lieber nicht hinsehen und irgendwas behaupten. Solange die Front hält, halten wir zum Hersteller... DAS ist ne echt komische Realität in der ihr da verweilt. Ob AMD das auf lange Sicht hilft? Wir werden es sehen... Abseits der privaten Community sind die Leute deutlich nüchterner und weniger verblendet.