Single Core Aufgaben

MDot GPunkt

Neuling
Thread Starter
Mitglied seit
02.10.2016
Beiträge
4
Welches ist der aktuell schnellste Prozessor für Single-Core-Aufgaben?
Im Moment rechnet ein i7 2600K unsere Simulationen mit einer Finite-Volumen-Methode (FVM).
Da der Prozessor 4 Kerne hat und die Simulation nicht parallel arbeiten kann, sind permanent nur 25 % Rechenleistung ausgenutzt.
Ein neuerer Prozessor, mit noch mehr Kernen, verschlimmert das Problem daher noch. Die Rechenzeit beträgt aktuell je Berechnung weit über 10 Tage.

Welcher neue Prozessor kommt für solche Single-Core-Aufgaben in Frage, Kosten sind zweitrangig.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Eigentlich wäre der Xeon E5-2602 v4 für dich/euch wohl der richtige... Aktuelle Technik und 5,1GHz... Allerdings keine Ahnung, ob man das Ding schon kaufen kann??
Es wurde vor geraumer Zeit von dem Teil mal berichtet. Möglicherweise war das aber nur ein Papiertieger??? Keine Ahnung...

Vorteil von so einem Ding wäre, es frisst auch ECC RAM, was, wenn ich Simulation lese, durchaus angebracht sein kann.

Ansonsten, der nächst kleinere wäre wohl der i7-6700k Skylake. Aktuellste Technik, recht hoher Takt.
Ggf. wäre ein Broadwell i7-5770C einen Blick wert -> weil dieser einen recht schnellen L4 Cache mitbringt -> was ggf. massiv die Berechnungen beschleunigen könnte.
Drunter gibts noch den i7-4790K mit 4,4GHz im Turbo, dafür aber "nur" Haswell Basis und somit schon effektiv zwei Generationen alt.


Schneller wirds nur mit OC ;) Ob das für dich/euch ein Thema wird, keine Ahnung... Es sei nur der Vollständigkeit halber erwähnt.

Ggü. einem 2600k im Standardtakt dürfte die Leistung bei den drei genannten i7 Modellen in etwa um ca. 20-30% steigen? So ganz grob über den Daumen zumindest.
Der Xeon dürfte nochmal vielleicht 10-20% drauf legen, sofern es das Teil überhaupt gibt.
 
Zuletzt bearbeitet:
Würde dir da auch erstmal zu oc raten. Am besten HT und zwei Kerne dazu deaktivieren für geringere Temperaturanstiege
 
HT sollte man in dem Fall glaub eher aus Leistungsgründen deaktivieren. Jedenfalls einen Versuch wert.

Btw. das erste mal dass ich von praxisnahe Problemstellungen höre, die grundsätzlich nicht paralellisierbar sein sollen.
 
Zuletzt bearbeitet:
Rein von der Single-core Performance her dürfte der 4790k (und zukünftig der 7700k) auch eine Alternative sein.
 
OC ist halt so eine Sache... Wer von euch hat schonmal ernsthaft OC Stabilität über 10 Tage Vollast getestet? Ich hab mich bis dato bei 5-7 Tagen zufrieden gegeben.
Es ist allerdings schon ein doch eklatanter Unterschied zwischen mal ein paar Stunden Zocken mit OC und einer Dauerhaften Belastung über mehrere Tage am Stück...
OC ist eigentlich hier eher bestenfalls als Randalternative gegeben. Lass da 10%, vielleicht 15% maximal drin sein, das wäre also der Bereich um die 4-4,2GHz. Zumal der max Turbo schon bei 3,8GHz liegt...
Das macht den Kohl nicht fett... Mit einem IPC stärkerem Modell und von Haus aus höheren Taktraten kommt er da eher ans Ziel. Und -> Geld spielt nur eine untergeordnete Rolle. Für genau solche Aufgaben hat Intel von Zeit zu Zeit solche speziellen Modelle im Programm -> wie seinerzeit den 4,4GHz Westmere für S1366 oder eben jetzt den 2602v4 mit 5,1GHz. Das Ding hält diesen Takt auch ohne wenn und aber! Die ganzen Selbstversuche mit OC sind dagegen eigentlich theoretisch nichtmal nen Test wert. Zumal 10+ Tage Zeit eingebüßt durch nen Rechenfehler wegen instabilem OC??? Ich weis ja nicht. Das sind fast 3% eines Jahres die einem da verloren gehen... Das klingt hier doch recht stark nach "Business" anstatt irgend einer Spielerei :wink:
 
Zuletzt bearbeitet:
Keine Ahnung wie wichtig die Berechnungen sind, aber wenn es auf präzise Ergebnisse ankommt, wäre ein Xeon und die passende Plattform mit ECC RAM schon mehr als angebracht und OC verbietet sich eigentlich ganz, weil die Fehlerwahrscheinlichkeit damit noch mehr ansteigt. Eine andere Möglichkeit die Auslastung der CPU zu verbessern wäre ja vielleicht mehrere Instanzen des Programms mit unterschiedlichen Simulationen parallel laufen zu lasse, ggf. innerhalb mehrere VMs, sollte nur je eine Instanz auf einem Rechner laufen können. Die einzelne Simulation dauert dann zwar länger, aber man ist mit mehreren Simulationen früher fertig als wenn man sie nacheinander ausführt.
 
Oh, danke. Dies sind wertvolle Aussagen.

Es handelt sich wie vermutet um eine Business-Anwendung. OC ist daher zu aufwendig, fehleranfällig und damit zu teuer (der Tagessatz für die Ingenieure, die diese Anwendungen und Rechentechnik am Laufen halten, liegt jenseits der 1000 €).

Diese Simulation ist nicht ohne weiteres zu parallelisieren, die Mathematik dafür (Lösungsalgorithmen der Differenzialgleichungen) gibt es einfach nicht.

Es ist gar nicht so leicht Infos über solche Systeme auszutauschen, da es in den Foren häufig nur um Spieleanwendungen geht und professionelle Anwender oftmals Workstations jenseits der 8000 € kaufen. Diese sind komischerweise auch nicht für solche Single-Core-Anwendungen ausgelegt. 20 Kerne nützen einfach nichts, da das System dann nur mit 5 % ausgelastet ist.

Fazit:
1. Wahl: Xeon E5-2602 v4Xeon E5-2602 v4 -> nicht bestellbar
2. Wahl: i7-7700k -> nicht bestellbar
3. Wahl: i7-6700k -> bestellbar

O.K. Welches Board und welcher Speicher sind denn jetzt für den 6700k die erste Wahl?
Oder gibt es einen Xeon-Prozessor, der den 6700k schlagen würde? Dann wäre ECC-Speicher möglich.
 
Zuletzt bearbeitet:
Der ist nicht besser, sondern nur preiswerter. Preis spielt untergeordnete Rolle.
 
Der Core i3 6320 ist eine sehr gute Empfehlung - den kann man mit ECC Speicher auf nem Xeon Board betreiben.
 
O.K. Welches Board und welcher Speicher sind denn jetzt für den 6700k die erste Wahl?
Oder gibt es einen Xeon-Prozessor, der den 6700k schlagen würde? Dann wäre ECC-Speicher möglich.

Der 7700k wird erst noch veröffentlicht. Der 6700k ist die aktuelle Generation...
Leider (für dienen Fall zumindest) ein Desktop Modell only. Das heist, kein ECC, es gibt auch kein Xeon Equivalent im Moment.

Die Empfehlung mit dem i3 unten wäre ggf. noch eine Option. Der i3 hat allerdings keinen Turbo und "nur" 3,9GHz, dazu nen kleineren Cache. Ggü. dem 6700k fehlen ihm also 300MHz in der SingleThread Power. Das sind grob über den Daumen 7-8%.
Deine Entscheidung, ob ECC in dem Fall wichtig ist oder nicht. Wenn ja, dann fallen die "k" Modelle alle samt raus und es bleiben einige der i3 und die Xeons über.

Der schnellste SingleThread-Performance Xeon dürfte wohl der:
Intel® Xeon® Processor E3-1280 v5 (8M Cache, 3.70 GHz) Specifications
sein...
4GHz im Turbo, macht ggü. dem Skylake 6700k ~5% Differenz. Dafür eben ECC Support -> läuft dann aber NUR auf entsprechenden Workstation/Server Mainboards mit Serverchipsätzen... Wenn du sowas willst -> würde ich entweder bei den Partnern für Server/Workstation Stangenware schauen -> HP, Dell, IBM/Lenovo, Fujitsu, ggf. Cisco und das Ding konfigurieren lassen. Vorteil -> du bekommst den Support gleich mit gekauft, wenn mal was sein sollte! Und die Hardware spielt definitiv zusammen.
Ansonsten, bei Eigenbau, schau dich vielleicht nach einem Board von SuperMicro um, passenden Speicher findest du auf deren Page unter den supporteten RAM Modulen. (ist nicht zwingend wichtig diese supporteten Module zu nutzen, schadet aber definitiv nicht). NT nach Wahl, ggf. ne SSD rein und PC drum rum ist ja eher Standard.

Was den 2602v4 oben angeht, das hatte ich nur so fix um Netz aufgeschnappt, keine Ahnung, ob solche CPUs überhaupt den Weg in den freien Handel finden. Ggf. müsste man mal bei den größeren Serverherstellern fragen, ob so ein Produkt überhaupt beschaffbar ist. Also nicht beim lokalen Distri, sondern eben HP, Dell, IBM/Lenovo, Fujitsu, ggf. Cisco als bekannte Größen. In den News zu diesem Prozessormodell steht nämlich was geschrieben, dass diese Ausführung für spezial Anwendungen gedacht ist und kein Modell von der Stange ;) Könnte also sein, das gibts schon, nur guckst du vielleicht an der falschen Stelle.

Ggf. direkt bei Intel anfragen???
 
Zuletzt bearbeitet:
Möglicherweise IST das auch eine Option... Müsste der TE ggf. einfach mal austesten. Je nach Software und Problemstellung könnte sehr hoher Takt schon massiv Punkte bringen. Muss aber nicht...
Ggf. ist auch der Skylake als aktuelle Intel Technik gar nicht schneller als bspw. der Haswell 4790k aufgrund des geringeren Taktes. Lässt sich von außen allerdings in diesem Fall nicht beurteilen, da es nicht um Standard für Jedermann nachprüfbare Workloads geht.
 
Ist dieser auch eine Alternative: E5-1630 v4
Wurde bisher noch nicht genannt, ist lieferbar. Hat aber einen komischen Sockel: 2011-3
 
Alternative schon, was halt für uns außenstehenden Unklar ist, wie skaliert deine/eure Software über die Technikverbesserungen der Prozessoren?

Der von dir genannte Xeon ist ein Quadcore auf Broadwell-E Basis. Als 1600er Modell SingleSockel only. -> aber das dürfte hier eher unwichtig sein. Der Sockel S2011-3 ist der Standard Sockel im Intel Serverumfeld bei den größeren Modellen...
Broadwell-E ist die aktuellste Technik, wenn es um die dickeren Server geht. Es ist die Vorgänger-Architektur von Skylake -> bspw. dem 6700k als Desktop Modell (i7) oder dem 1280v5 Xeon E3 als Einstiegsserver Modell.

Zwischen dem 1630v4 Xeon und dem 1280v5 Xeon liegen im Takt keine Unterschiede. Beide takten im für dich/euch relevaten SingleThread-Lastzustand mit flatten 4GHz. Der 1630v3 hat allerdings den potentiellen Vorteil von 2MB mehr L3 Cache und einem QuadChannel Speicherinterface auf DDR4 Basis.


Die alles entscheidende Frage ist aber, wie skaliert die Software? Wenn sie Cachelastig ist und viel und schneller Cache gefragt ist, dann punktet womöglich der 1630v4 vor dem 1280v5 trotz gleichem Takt! Warum? Weil eben mehr Bandbreite und mehr Cache... Allerdings -> und das wäre dann wieder die nächste Unbekannte, der Broadwell i7 (gibts auch als Xeon in Form der E3-12xx v4 Modelle) besitzt einen sehr schnellen und 128MB großen L4 Cache, was keine der anderen Modelle hier liefert... Wenn die Anwendung also Cachelastig ist, wird der kleine Broadwell dank L4 Cache wohl das Rennen machen!

Ansonsten, zwischen dem von dir genannten 1630v4 und dem oben genannten 1280v5 dürften ohne große Cache/Latenzabhängigkeiten nicht wirklich viele Unterschiede bestehen... Lass es 2, 3, 4, 5% sein... Irgendwie sowas. Mehr wirds nicht sein.
Der v5er E3 hat halt die etwas neuere Technik ;)


Wohl im Q1/2017 -> je nachdem, wie lange ihr noch warten könnt, kommt dann der Nachfolger von Skylake auf den Markt. Das Top Desktop Modell (ohne ECC Support allerdings!) wird mit 4,5GHz grob 5% mehr als der Vorgänger takten... Ob die pro Takt Leistung steigt, ist nicht ganz raus, nach damaligen Aussagen bleibt es gleich. Der wäre dann wohl der schnellste Vertreter. Kommt wieder ECC ins Spiel, müsste man schauen, was die dann sicher kommenden E3-12xx v6 Xeons in Sachen Takt schaffen werden. Sicher wirds mehr als bei den v5, ob es auch 4,5GHz werden ist allerdings offen! Dazu würde es warten bedeuten... Also wohl raus.
 
Diese Simulation ist nicht ohne weiteres zu parallelisieren, die Mathematik dafür (Lösungsalgorithmen der Differenzialgleichungen) gibt es einfach nicht.
Das ist wohl in schlechter Scherz? DGL Solver sind üblicherweise sehr gut parallelisierbar. Wahrscheinlich ist einfach das Softwarepaket veraltet und die Software müßte einfach mal richtig gewartet werden und auf den Stand der Technik gebracht werden.
 
Ich sehe hier auch ein Anwendungsgebiet für den 6700k, andere Alternativen bleiben nicht wirklich, ansonsten verzichtet man auf Cache, 2011 bzw. 2011-3 ist Quatsch für eine Singelthread Aufgabe.
Der 4790k ist natürlich auch interessant - aber warum auf eine DDR3 Plattform bauen?!?

Ich finde den Ansatz mit dem FX 9590 auch recht interessant, warum? Weil ich das Ding selber in der Hand hatte und abgesehen von allem Schlechten und Alten was man schon weiß - das Teil ist gar nicht sooo langsam - siehe WinRar-Test.
Tech-Review.de » Artikel » Reviews » AMD FX-9590 - Piledriver Neuauflage im TRV-Check

An deiner Stelle würde für dieses Anwendungsgebiet ALLES testen, denn der 6700k wird nicht soo viel mehr Dampf machen als der jetzige 2600k und was dabei herauskommen kann wenn man nicht testet sieht man hier:
https://www.youtube.com/watch?v=9mlloZT5ZyY

Such dir nen FX, such dir nen Haswell / Skylake, pack deinen Sandy daneben und probiere es aus, die Optimale Lösung kann dir hier keiner geben und einfach nen 6700k empfehlen der am Ende vielleicht nur 10% schneller ist, damit fühle ich mich auch nicht wohl.

Gruß Arne
 
Zuletzt bearbeitet:
Einen Softwareentwickler beschäftigen, der euch das Ganze umschreibt/neu entwickelt, so dass man es parallelisiert berechnen kann.
Kostet jetzt Geld, spart euch am Ende aber Monate an Rechenzeit

Gesendet von meinem A0001 mit der Hardwareluxx App
 
Joar bis Kaby Lake halten wir das noch aus, gell? Soll ja auch einen flotten 4-Kerner für Sockel 2066 geben. Der interessiert mich momentan am meisten.
 
Es kommen hier eigentlich nur 2 Prozessoren in Frage:
* 6700k
* 7700k (wenn er erscheint)

Die haben die höchste Singlethreadleistung und genau das ist ja gefragt.
HT kann man ja einfach im Bios ausschalten, falls nicht benötigt.
 
Hi MDot GPunkt!
Das ist ja mal eine interessante Problemstellung. Mal was anderes als die übliche "Ich G8M3R brauche ÜberComputer" bzw. "Rennt auf meinem alten i5/i7 noch die neueste Grafikkarte?" etc.

Viele Optionen wurden schon genannt. Ich kann auch nochmal bestätigen daß Übertakten für ein Produktivsystem ein No-Go ist. Der mittlerweile bei vielen Modellen eher kleine Gewinn ist es nicht wert daß man vielleicht die ein oder anderen Probleme bekommt und wertvolle Zeit und/oder Daten verloren gehen.

Leider kenne ich Dein Aufgabengebiet auch nicht genau. Vielleicht würde es helfen wenn Du das Programm nennen würdest mit dem Ihr arbeitet, es sei denn es ist eine Eigenlösung. So oder so ist immer ein ganz guter Tipp den/die Entwickler zu befragen was sie für Erfahrungswerte haben. Wie fdsonne schon schrieb kann es sein daß viel/schneller Cache hilft bzw. falls viel/große Daten im Arbeitsspeicher bearbeitet werden hilft natürlich auch der Cache sowie eine schnelle RAM Anbindung. Vielleicht nutzt das Programm auch neuere Instruktionen bzw. vielleicht gibt es optimierte Versionen eben mit aktuellen Compilern/Compiler Flags etc.
Vielleicht gibt es auch Möglichkeiten für GPU Computing? Keine Ahnung ob das technisch möglich ist, damit können solche Aufgaben jedoch schnell um ein vielfaches flotter bewältigt werden.

Zu den CPUs, hier würde ich auch z.B. einen Intel Xeon E3-1275 v5 mit DDR4 ECC RAM empfehlen da mit 4GHz Turbo und aktuellste Skylake Architektur bestimmt ziemlich schnell. Eventuell den Intel Xeon E3-1285 v4 welcher eine Generation älter ist (Broadwell), "nur" DDR3 ECC und nur 3,8GHz Turbo hat, allerdings eben L4 Cache welcher in einigen Fällen sehr viel bewirken kann.
Der Intel Xeon E5-1630 v4 bietet ebenfalls 4GHz Turbo Takt und DDR4 ECC RAM. Letzterer läuft dank dicken Sockel im Quad Channel Betrieb, falls Speicherbandbreite eine Rolle spielt könnte dies auch durchaus interessant sein.

Rein theoretisch/rechnerisch sollte ein Skylake oder Broadwell ca. 25-35% mehr pro Takt Leistung wie ein Sandy Bridge (2600K) bieten und ca. ~ 5% mehr Turbo Takt. Auch Speichertaktraten und eben Cache Größen und Arten spielen da bestimmt mit.
 
Wenn eine Simulation jetzt ca. 10 Tage dauert, wohin wollt ihr denn?
Vielleicht sollte man zunächst prüfen, ob sich mit dem Lösungsansatz und der Software überhaupt eine akzeptable Laufzeit erreichen lässt.
Wenn euch 7-8 anstelle von 10 Tagen nicht wirklich helfen könntet ihr es mit aktuell und in naher Zukunft verfügbaren CPUs schwer haben.

Hast du schon getestet, ob Speicherbandbreite und Latenz einen Einfluss auf die Laufzeit deiner Berechnungen haben?
 
Ist doch aber irrelevant @Fr@ddy, findest du nicht?
Gut 1/3tel Leistungseinsparung von einer betagten 2600k CPU auf was Top aktuelles, egal ob nun 6700k, nen v5 Xeon E3, nen v4 Xeon E3 oder den v4 Xeon E4, sind halt gut 1/3... Das macht aus 10 Tagen eben nur noch 6,6. Muss man nicht mitnehmen, kann man aber...


Zu den ganzen anderen Aussagen bzgl. OC und den Desktop Modellen -> ich glaube ihr habt das Problem nicht so ganz verstanden.
ECC sehe ich hier als sinnig an. Geht zwar jetzt offenbar auch ohne, muss aber nichts heisen. Damit fallen effektiv alle i7 Modelle raus, weil kein ECC...
Auch die Aussage von wegen, S2011-3 wäre ungeeignet ist völliger unsinn. Beim Thema Bandbreite und Cachegröße ist das nunmal die bessere Wahl ggü. dem S115x.

Ich würde deswegen vorschlagen, einfach mal die Empfehlungen sein lassen, wenn man nichts anderes kennt außer "Gaming". Denn das bringt den TE nicht weiter!
 
Ich würde an deiner Stelle auch erstmal OC probieren, dabei HT und alle Kerne bis auf einen deaktivieren.

Von meinem alten Westmere X5650 gab's damals auch eine Variante die ab Werk einen stark erhöhten Takt gefahren hat. Statt ~3 GHz knapp 5 GHz. Gleiche DIE, nur halt alle Kerne bis auf einen deaktiviert.

Oder halt die Software wechseln / ändern lassen ;)
 
Zuletzt bearbeitet:
Ich würde an deiner Stelle auch erstmal OC probieren, dabei HT und alle Kerne bis auf einen deaktivieren.
NEIN, eben gerade nicht... Hier geht es doch nicht um nen Spieltrieb von irgendwem, sondern um ein produktives System, was im Falle von Rechenfehlern mehrere hundert, vielleicht gar tausende Euro aus dem Fenster schmeißt. Das macht man einfach nicht.

Von meinem alten Westmere X5650 gab's damals auch eine Variante die ab Werk einen stark erhöhten Takt gefahren hat. Statt ~3 GHz knapp 5 GHz. Gleiche DIE, nur halt alle Kerne bis auf einen deaktiviert.
Nein, auch das stimmt nicht... Du meinst den Xeon X5698. Der bringt zwei aktive Cores samt SMT und 4,4GHz -> und keinen Turbo, soweit ich weis. Nix mit 5GHz und nix mit SingleCore.

Oder halt die Software wechseln / ändern lassen ;)

Auch das ist Unsinn. Wer soll das bezahlen? Dir sind gängige Stundenpreise für Programmierer bekannt?
Lasst doch bitte solchen Unsinn, wenn ihr NULL Erfahrung im Business habt... :wink:
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh