[Kaufberatung] Upgrade Numerik Workstation 1000€

Verata

Enthusiast
Thread Starter
Mitglied seit
25.09.2009
Beiträge
233
Ich darf 1000€ in meinen Büro-PC stecken und würde mir gerne euren Rat dazu einholen, was ich idealerweise tun sollte. Um Geld für nicht Performance relevante Komponenten zu sparen, will ich meinen alten PC aufrüsten, statt einen neuen zu kaufen. Ich werde mit dem PC vorrangig Numerik-Software entwickeln. Gearbeitet wird unter Windows 10 und Ubuntu. Wichtig ist mir die Performance bei:
1. Lösung linearer Gleichungssystem mit Konjugierte Gradienten Verfahren, Super LU und Mehrgitterverfahren
2. Explizite Integration gewöhnlicher Differentialgleichungen
3. Lineare Algebra (Matrizenrechnung, Eigenwerte)
4. Zugriffszeiten auf Massenspeicher

Daneben muss ich vor allem folgende Programme nutzen:
1. FEM Software (vorwiegend Ansys)
2. Matlab
3. CAD Software (eher untergeordnet)

Unterm Strich haben diese Anwendungen folgende Haupteigenschaften:
1. Hyperthreading bringt nichts
2. Hohe Parallelisierbarkeit mit geteiltem Speicher
3. Schlechte Eignung für GPU Computing
4. Bis zu ca. 25 Gb Speicherbedarf bei realistischen Problemgrößen

Meine aktuellen Ideen sind diese beiden Varianten:
AMD
Intel

Welche Verbesserungsvorschläge oder Ideen habt ihr?
Vielen Dank für euren Rat.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Bei ner Worlstation wäre es wohl am Schlausten wenn du nicht auf ein Bastel Pc setzt.
Es sei den du kannst das Gerät wieder zu laufen bringen wenn das System steht.
 
Ist ein Upgrade auf mehr Ram beim Threadripper später eine Option? Falls nein, würde ich unbedingt 4x8gb statt 2x16gb Ram nehmen. Der Threadripper hat Quadchannel und kann die 4 Module deshalb besser nutzen. Ansonsten vermute ich, das der Threadripper für deine Anwendung mehr Leistung hat als der 9700K. Was den Kühler angeht würde ich noch ein paar Euro mehr in die Hand nehmen und was besseres verbauen. Es ist ja abzusehen das die Cpu häufiger über längere Zeiträume Vollast sieht ;)

Welche Hardware verwendest du denn aktuell? Nur um das mal besser einschätzen zu können...

Und abschließend sei gesagt, das ich für eine Workstation (fast) immer auf einen Komplettpc eines renomierten Herstellers setzen würde. Einfach wegen Support und Austausch bei Defekt.

EDIT:
Ah, fast vergessen: Was ist mit ECC Ram wegen Fehlerkorrektur?
 
Zuletzt bearbeitet:
Ein Komplett PC kommt aus meiner Sicht eher nicht in Frage, da ich da die erforderliche Leistung kaum im Budget realisieren kann. Ich hoffe mittelfristig ein RAM Upgrade zu bekommen. Deshalb hatte ich mich für die 16Gb Module entschieden.
Momentan lebe ich mit einem Q9400 (4x 2,7 Ghz) und 8 Gb RAM. ECC brauche ich eigentlich nicht, da alle Algorithmen mit denen man in dem Bereich arbeitetet Fehler tolerieren bzw. erkennen. Welchen Kühler würdest du denn nehmen?
 
Uff, der Q9400 ist ja schon mehrfach überholt. Aktuelle Vierkerner sind geschätzt gut doppelt so schnell. Man überlege mal, was nun bei einem Threadripper mit 12 oder einem 9700K mit 8 Kernen an Leistung zusammenkommt ;)
 
ECC brauche ich eigentlich nicht, da alle Algorithmen mit denen man in dem Bereich arbeitetet Fehler tolerieren bzw. erkennen.

FEM im Business Bereich ohne ECC, sicher? Auch wenn der Algorithmus Speicherfehler toleriert bzw. erkennt kann er die nicht einfach glattbügeln. Wird dann eher darauf hinauslaufen, dass der ganze Workload für die Katz war und man wieder von vorne anfängt, ohne zu wissen ob der Fehler nach ein paar Stunden wieder auftritt. Ist das sinnvoll? Wenn Du bis jetzt mit nem Q9400 gearbeitet hast kommt vlt. auch eine gebrauchte Workstation in Frage?
 
Also ich würde dir zur Intel Konfiguration raten, allerdings würde ich dir dort ein anderes Mainboard ans Herz legen.

In Abaqus habe ich folgende Erfahrungen gemacht:
Bei expliziter Zeitdiskretisierung und domain level parallelization (Modell wird in kleine Teilmodelle zerteilt und die Teilmodelle werden gelöst) wäre der Threadripper (in meinem Fall war es ein EPYC 7601 vs E5-2699v4 auf 8 Kernen) schneller.
Bei impliziter Zeitdiskretisierung und thread-based parallelization wäre er wohl langsamer, da in diesem Fall vermutlich das CCX Design und die höheren Latenzen stärker weh tun, da mehr Kommunikation zwischen den Threads erforderlich ist.

Ich gehe davon aus Ansys wird sich ähnlich Verhalten wie Abaqus

@mawel i.d.R. werden von der Software die Inkremente auf Konvergenz geprüft. D.h. es wird geschaut in wie fern Erhaltungsgleichungen erfüllt sind und nur wenn diese in gewissen Toleranzen stimmen wird die Lösung akzeptiert. --> Im Zweifel wird deshalb eben das Inkrement bzw. Iteration wiederholt. Habe Rechner sowohl mit ECC als auch ohne am Laufen und noch nie ein Problem bzw. unphysikalisches Verhalten beobachtet, das auf ein Bitflip zurückzuführen war.
 
Guten Morgen,
ich hatte gestern leider keine Zeit mehr ins Forum zu schauen. Vielen Dank für eure Denkanstöße.
@ mawel: Wenn mal eine Rechnung stirbt ist das für mich nicht so dramatisch. Ich rechne eher große Parameterstudien kleine Probleme mit Rechenzeiten von jeweils maximal einer Stunde. Wenn da mehrere an Speicherfehlern scheitern wechsel ich auf einen Rechenserver und werfe Memtest an. Das ist daher kein großes Problem. Klar, welche Lizenzen wir haben weiß ich, aber danke für den Hinweis.
@ Gewuerzwiesel: Ja, Ansys ist da ähnlich steinzeitlich. In ANsys limitiert am Ende fast immer die Schreibgeschwindigkeit der Festplatte oder zu wenig RAM. Bei unseren großen Rechenservern (Intel 24 Kerne) kann man sehr schön beobachten, das der Overhead der Parallelisierung schnell so groß wird, das mehr Kerne keine Vorteile mehr bringen. Die vielen Kerne brauche ich vor allem für meine selbst entwickelte Software, die viel stärker parallelisierbar ist. Hier könnte ich prinzipiell hunderte Threads effizient nutzen. Daher brauche ich den Rechner an der Stelle zum Entwickeln. Große Rechnungen gehen dann in Cluster. Daher glaube ich mit dem Threadripper besser dran zu sein. Siehst du das auch so?
 
Ich kann deine speziellen Anforderungen aufgrund den Beschreibungen leider nur zum Teil nachvollziehen. Fakt ist aber, dass der 1920X für parallele Anwendungen aktuell preislich ungeschlagen auf weiter Flur liegt.

Zwei eklatante Dinge:

1. Der Enermax Kühler passt nicht auf den Threadripper Sockel, ist allgemein auch zu klein.
2. X399 hat keine integrierte Grafik, d. h. du brauchst zwingend eine GPU zusätzlich. Hier tut es natürlich das billigste ohne Load auf dieser.

Beide Punkten lassen sich mit überschaubarem Aufwand beheben, sprengen dann aber das Budget minimal.
 
@ Gewuerzwiesel: Ja, Ansys ist da ähnlich steinzeitlich. In ANsys limitiert am Ende fast immer die Schreibgeschwindigkeit der Festplatte oder zu wenig RAM. Bei unseren großen Rechenservern (Intel 24 Kerne) kann man sehr schön beobachten, das der Overhead der Parallelisierung schnell so groß wird, das mehr Kerne keine Vorteile mehr bringen. Die vielen Kerne brauche ich vor allem für meine selbst entwickelte Software, die viel stärker parallelisierbar ist. Hier könnte ich prinzipiell hunderte Threads effizient nutzen. Daher brauche ich den Rechner an der Stelle zum Entwickeln. Große Rechnungen gehen dann in Cluster. Daher glaube ich mit dem Threadripper besser dran zu sein. Siehst du das auch so?

Hängt wie erwähnt davon ab ob du die Parallelisierung thread based oder process based implementiert hast. Bei ersterem wird der Threadripper das Nachsehen haben, bei letzterem vermutlich schneller sein unter der Voraussetzung, dass natürlich alle verfügbaren Kerne genutzt werden. Ich gehe mal davon aus du hast es mit MPI also sprich process based aufgesetzt. In dem Fall wäre der Threadripper doch eine Option.

Aber grundsätzlich: Eine Limitierung die durch RAM verursacht wird führt zwangsweise dazu, dass die Software auf die Platte auslagert und dann spielt auch die eine Rolle.
Ansonsten habe bisher nur einen speziellen Fall gehabt in dem die Festplatte eine Rolle gespielt hatte (Explizit und extrem viele Outputs angefordert). In Abaqus ist das .msg-File extrem hilfreich um sowas rauszufinden, dort werden nämlich die Zeiten protokolliert welche die jeweiligen Abschnitte brauchen. Ich gehe davon aus, dass Ansys sowas ähnliches hat. In deiner Software kannst du es ja ohnehin selbst tracken.
 
@Ungeduldiger: Mit dem Kühler hast du Recht, der ist ja mutmaßlich auch etwas klein. Grafikkarte wird als meinem aktuellen PC ausgeschlachtet.
@Gewuerzwiesel: Ja, der Solveroutput in Ansys enthält diese Infos auch. Dort wird auch die für die schnellste Lösungsstrategie benötigte Menge Arbeitsspeicher angegeben. Ich werde mir dann mal Gedanken machen, wie ich parallelisieren will und darauf meine Entscheidung für eine CPU aufbauen. Im Moment sieht es eher nach Threads aus. Vielen Dank für die Infos.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh