AMD Interlagos oder Zambesi für C4D Renderworkstation?

Läuft er auf DIE 1, geht er bei Speicherinterface 1 raus, läuft er auf DIE zwei, wird SI 2 genutzt.
Das kann man definitiv ausschließen, da das allozierte Feld während des gesamten Test an derselben Stelle verblieb. Man kann mittels der libnuma auch spezifizieren zu welchem Die (besser NUMA-Knoten) der Speicher lokal angefordert werden soll, und man muß explizit Speicher verschieben, wenn man will, daß er lokal zu bestimmten Cores ist, und er vorher auf einem anderen NUMA-Knoten lag.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn du probleme mit der Skallierung hast, kann das an vielem liegen, aber wohl zu 99% nicht am RAM Interface. Mal ganz davon ab, mehr Speicherbandbreite nutzt bei aktuellen CPUs nahezu gar nichts. Performancegewinn nahezu Null.

Hier haben wir gegenteilige Erfahrungen gemacht. In den Bladesystemen von Cisco werkelt ein eigener SpeicherController. Grund ist die Tatsache, das die Xeons den Speichertakt nach unten drücken wenn mehr als 3 bzw. mehr als 6 Ramriegel verbaut werden.
In den Cisco-Maschinen bleibt der Takt aber auch bei voller Belegung oben (1333), zusätzlich hat man den netten Nebeneffekt, dass 3x soviele Riegel reingehen.

In der Praxis haben wir das an der Installation von Windows Server Enterprise in VMs getestet und sind zwischen dem niedrigsten und dem höchsten Takt auf Performanceunterschiede zwischen 20 und 30 Prozent gekommen.

1066 MHz: 8:20min
800 MHz: 10:45min

Unsere Ingenieure haben auch schon bei Kunden einfach mal Speicherriegel rausgenommen, wenn die sich über schlechte Performance bei VMs beschwert haben. Durch weniger Riegel ging die Taktrate der Speicher hoch und das System fühlte sich spürbar flüssiger an. Freilich hat man dann möglicherweise das Problem, dass der RAM nicht mehr reicht. Das ist dann einer wichtigsten Gründe, warum Cisco-Blades sich immer besser verkaufen (dass die aktuell heftig rabattiert werden, sei nur am Rande erwähnt :coolblue:)

Backbone
 
Leute, es ging doch um Cinema 4D... Andere Anwendungen können freilich dort Performance einbüßen. Aber das steht doch so nicht zur Debatte!?
 
Bei den Opteron CPUs gibt es auch HT-Assist: HT Assist: What is it, and how does it help?
Also wenn es viele Threads sind, ist das eine feine Sache, ich glaube bei dem Cinebench 11 Benchmark Thread hat das einer schon mal getestet.

Schneller Speicher bringt nicht viel, aber mit steigender core Anzahl wird auch der Speicherbandbreiten bedarf steigen.

MfG
 
liebe leute, vielen dank für euere bemühungen mir zu helfen. leider muss ich gestehen, dass ich von all dem nicht wirklich viel verstanden habe.

ich warte auf die releases der sandy und interlagos. in der hoffnung, dass bis dahin ein weiterer wahnsinniger auf die idee gekommen ist, 32 oder 64 kerne in eine maschine zu stopfen! ich hoffe, es wird dann auch benchmarks dazu geben.

einen cinebench score von über 40+ wäre auf einer derartigen workstation schon schön.

Vielen DANK an alle, die sich an diesem Thema beteiligt haben!!!

Grüße yukomono ;)
 
40+ kannst du wohl getrost vergessen.
Aktuelle vier Sockel Magny-Cours Systeme erreichen um die 25 Punkte.
http://h2.abload.de/img/maxon5xnk.png

Viel schneller ist aktuell nur mit extremen finanziellen Aufwand.
Quad Sockel Nehalem EX könnte etwas mehr erzielen. Aber da legst du locker 10000-30000€ auf den Tisch, für ein System!!
 
Bei Xtremesystems [Unconfirmed] Sandy Bridge-EP [8C16T] benchmark results leaked bin ich auf unbestätigte benchmarks von einem 8 core Sandy EP gestoßen. 11.95 Punkte.
Wobei da auch mal 2.7GHz und mal 3.2GHz stehen. Wäre aber schon beachtlich für eine CPU.
Davon 2 auf ein Board und man hätte schonmal ne nette Renderkiste. Wäre zwar immernoch ein gutes Stück von den 40+ entfernt, aber damit wird man sich vermutlich abfinden müssen. Es sei denn die 4 Socket Bulldozer überraschen.
 
Das gleiche Bild bei deinen Tests kommt wohl daher, das eben nicht ein einziger Speichercontroller verwendet wird, sondern zwei.
Also die Lösung des Rätsel ist, daß ich bei meinen Tests zwei Felder verarbeitet habe, d.h. es werden Werte aus zwei Feldern gelesen und auch wieder geschrieben. Ich brauche das so für Matrizenverarbeitung. Da sieht man keinerlei Unterschied, außer man wechselt den Socket.

Liest und schreibt man nur auf ein Feld, dann sieht man einen Unterschied zwischen den beiden Hälften des Opteron 6100, d.h. man sieht den Effekt der beiden Speichercontroller. Aber man gewinnt nur 50% Geschwindigkeit, d.h. der Stream braucht nur noch 2/3 der Zeit, wenn die seperaten Felder von den beiden Speichercontroller getrennt angesprochen werden können und die Threads entsprechend verteilt sind.

---------- Beitrag hinzugefügt um 20:10 ---------- Vorheriger Beitrag war um 19:49 ----------

in der hoffnung, dass bis dahin ein weiterer wahnsinniger auf die idee gekommen ist, 32 oder 64 kerne in eine maschine zu stopfen!
Wenn das Geld keine Rolle spielt und man sich einen Server in den Nebenraum stellen kann. Es gibt Server für 8 Xeon E7, d.h. maximal 80 Kerne, max. 2TB RAM (mit 16GB Modulen).
 
Zuletzt bearbeitet:
vielleicht irre ich mich aber ich denke mit einer Z800 schon 25-27pkt im cinebench produziert zu haben
 
vielleicht irre ich mich aber ich denke mit einer Z800 schon 25-27pkt im cinebench produziert zu haben

In der Z800 Workstation tuckern im besten Fall zwei Hexacore Intels. Und diese CPUs erreichen mit ordentlichem OC mit 12 Cores + SMT um die 20-25 Punkte.
Default ohne OC (wie es bei Z800 Kisten ist) schafft man das definitiv nicht... Was aber sein kann, das ältere Cinebench Versionen andere Punkte zuteilen. Im Vergleich gings ja um die 11.5er Version.

Zum Vergleich:
http://www.hardwareluxx.de/community/f153/cinebench-11-5-benchmark-thread-bestenliste-689791.html
 
Also mich interessiert nocheinmal der Punkt mit einer Farm.

Welche Möglichkeiten bestehen, mit mehreren Render-Servern (Nodes?!) ein Bild zu Rendern?

Preislich bin ich ja wie hier im Thread schon oft erwähnt mir 2* Dualsockeln WESENTLICH günstiger als einem Quadsockel.
Nur wenn ich lediglich ein Bild rendere, hilft mir "Net Render" von Cinema 4D ja nichts, da es ja nur Bilder und keine ?Frames? (ich meine Bildteile) verteilt.
Und toll wäre eine Lösung, mit der ich trotzdem meine Macs für Cinema nutzen könnte. Auf den Nodes kann aber ein beliebiges System (Win 7, Linux) sein!

Über Ideen wäre ich wiedermal sehr dankbar :)
 
Hallo

mal was anderes, glaubt jemand daran das es in Zukunft möglich sein wird auf einem Dual G34 System mit 6200 Interlagos CPUs ein Win7/8 zu installieren.
Sind ja physikalisch, zum Anfassen, 2 Prozzis und nicht 4?
 
Nein, das wird nicht gehen und ist auch nicht gewollt von Microsoft... Da 4P eben nur mit Windows Server Standard und aufwärtz funktioniert. Wenn dann müsste AMD ihre CPUs anders anbieten und native acht Moduler bauen, was aber kostentechnisch wohl deutlich ineffizienter ist, als zwei vier Moduler zu nutzen.
 
Schade.


Habe hier noch ein paar Z400/Z800 rumstehen, werde die mal zum benchen installieren.
 
Z400/Z800 sind doch Intel Workstations von HP... Was hat das nun mit AMD CPUs zu tun?
 
So direkt nix, schafft aber gewissheit was die 20-25pkt angeht.
Würde gerne 2x 6200 Benchen aber die hab ich noch nicht zur Hand.
 
Die Bulldozer sind in Cinema 4D sehr schlecht, verglichen mit den Magny Cours... Was Architekturbedingt nicht nur daran liegt, das die Software noch nicht auf die CPU optimiert ist.
 
Eine Z800 mit 24x 3,07GHz und Quadro 5000 kommt auf:

OpenGL 71,22
CPU 14,88

irgendwie sehr ernüchternd
 
...meld' mich hier auch mal wieder kurz zu Wort :wink:

arbeite mit formZ als Modeler und Maxwell als Renderprogramm. Mit Cinema kenne ich mich nicht so gut aus obgleich ich jedes neu erworbene oder neu zusammen gestellte System auch mit Cinebench teste. Anbei ein paar Anhaltspunkte zur Leistungsbewertung und zu den Kosten der jeweiligen Systeme:

4x Opteron 8439 SE / TYAN S4992 (S4992WG2NR) / 16GB reg. ECC:

Cinebench 11.5: 17.82
Frybench (fryrender): 2m47s
Benchwell (Maxwell-Render): 3m09s

System selbst zusammengestellt (CPUs - ebay / Rest - div. Händler). Gesamtkosten ca. 3.5 TE.

Anmerkung: System lässt sich leicht auf 3.28 GHz übertakten - Cinebench 11.5: 21.92

http://www.hardwareluxx.de/community/14401853-post117.html

2x X5680 @ stock (3.33) / EVGA SR-2 / 24GB

Cinebench 11.5: 17.23
Frybench (fryrender): 2m10s
Benchwell (Maxwell-Render): 3m03s

System selbst zusammengestellt (CPUs - ebay / Rest - div. Händler) Gesamtkosten ca. 4 TE.

Anmerkung: System lässt sich leicht auf 4.20 GHz übertakten (und auch unter Last noch mit Luft kühlen) - Cinebench 11.5: 21.05 (uncore - 4000)

2600K @ 5.0 / Asus P8P67 / 4GB

Cinebench 11.5: 9.78
Frybench (fryrender): 3m47s
Benchwell (Maxwell-Render): 5m36s

System selbst zusammengestellt - Gesamtkosten ca. 1.2 TE.

Mit 8 TE kann man sich aber natürlich auch ein schnickes Apple oder HP Setup zusammenstellen :d ...
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh