Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: this_feature_currently_requires_accessing_site_using_safari
faking Shanghai versus Xeon benchmark results
There is only one small thing that AMD keeps on forgetting - if Intel takes AMD to court in a bid to invalidate AMD’s x 86 licenses, we wonder that will actually stand on AMD’s side of the bench? More and more people are leaving the company and the amount of skeletons they carry around is something that competition can easily scoop out.
Hej immer fair bleiben, vielleicht takten sie den 200b ja auch noch runterDer gleiche Typ schwafelt was von 50% weniger Stromaufnahme beim 55nm GT200b von Nvidia, der ja angeblich in ein paar Tagen kommen soll, gegenüber der 65nm Variante. Sehr wahrscheinlich wenn man sich den G92b anschaut.
Welche willst du denn? Entsprechende Bibliotheken sind beim ICC afaik sowieso dabei. Hat auf die Ergebnisse imo auch keinen grossen Einfluss. Speicherreservierung und -freigabe sollte zugunsten der Performance immer noch ausserhalb kritischer Sequenzen erfolgen. So "smart" werden die Programmierer wohl gewesen sein. Und glücklicherweise hat C bzw C++ immer noch keinen Garbage Collector.Da gehts schon los man kanns nicht 1:1 vergleichen, da ct zwar immerhin den neuesten Beta Compiler benützt, aber sonst nichts optimiert. Vor allem fehlen die SmartHeap Libraries.
Ähmm, du hast die nachfolgenden Sätze überhaupt nicht gelesen?Jo, dass Du jetzt langsam in astronomischen Größenordnungen daneben liegst.
Der 6Kerner kommt auch in 45nm .. schau mal mit wieviel Takt die Dunningtons bei Intel laufen ...
Nochmal, was genau verstehst du denn an den Worten grob und oberflächlich nicht? Die ganzen Ausführungen hättest du dir sparen können, weil sie nichts zum Kontext beitragen. Irgendwie ist dir das scheinbar erst am Ende deines Beitrages aufgefallen. Vorher eventuell erstmal die Beiträge komplett durchlesen? Übrigens, ich würde meine Rechnung nicht als worst-case für Intel bezeichnen. Ganz im Gegenteil. Da könnte man Shanghai noch deutlich besser machen. Ein worst-case Szenario für AMD könnte jedenfalls genauso hineininterpretiert werden. Denn wie gesagt, Speicher kann durchaus mehr als 10% ausmachen. Und auf Compiler sind wir auch noch nicht eingegangen. Da gibt es genug Spielraum verschiedener Switches. Würde mich jedenfalls nicht wundern, wenn c't sogar fast Switches für FP verwendet hätte. Turbo Modus war auch aktiv. Ob das bei den Xeons der Fall sein wird, ist ungewiss. Die kommende Fiorana Plattform von AMD soll ja auch nochmal einiges an Leistung freisetzen. Usw...So oder so hat ein 6Kerner ein andres Problem ... erhöhten Verwaltungsaufwand. Bei 6 Kernen bekommt jeder Kern weniger Zugriff auf den L3 + RAM Bandbreite. Der L3 wird nur per round-robin verwaltet und die beiden unganged Kanäle ... tja ... 1 Kanal für 3 Kerne, anstatt 2 ... das gibt keine ideale Skalierung wie Du sie gerne hättest. Du vergißt da also "ein paar" Parameter ...
Es geht um die konkreten Begleitumstände, nicht um den Vergleich ansich. c't hat Nehalem mit einem Desktop Setup für einen Server Benchmark getestet. Und das nicht mal spec konform. Daher ist das ganze relativ sinnfrei.Warum ein Vergleich der schnellsten CPUs der Hersteller plötzlich Schwachsinn ist (seit Intel wieder vorne liegt, früher war das ja nicht so) ist mir ehrlich gesagt schleierhaft.
Weil es erstens noch keinen 3,2 GHz Nehalem Xeon gibt und zweitens nächstes Jahr auch noch höher getaktete Shanghai Opterons kommen. Deshalb.Alle reden hier immer nur davon das man dieses mit jenem nicht vergleichen kann bzw soll. Du genauso. warum sollte man nur taktgleiche CPUs vergleichen?
DDR2 und DDR3 macht gar nicht mal so viel aus. Es geht darum, dass Intel bei Servern idR FB-DIMMs einsetzt und nicht unbuffered DDR3. Selbst registered RAM, wie bei AMD üblich und bei Intel mit DDR2/3 als Option, macht nochmal einen nicht zu unterschätzenden Unterschied zu dem c't Test.Bin da eigentlich auch auf Devil Ag Linie, der Vergleich ist absolut ok, einen K10.5 mit DDR3 gibts noch nicht, und einen Opteron mit DDR3 gibts noch länger nicht ... wieso sollte man das dann nicht vergleichen dürfen ...
Ich versteh die nicht im Zusammenhang mit dem schönen Wort "Berechnung" ...Nochmal, was genau verstehst du denn an den Worten grob und oberflächlich nicht?
Hmm vielleicht lag darin Dein Fehler / Mißverständnis, Intel setzt beim Nehalem 2P Server keine FBDs ein.DDR2 und DDR3 macht gar nicht mal so viel aus. Es geht darum, dass Intel bei Servern idR FB-DIMMs einsetzt und nicht unbuffered DDR3. Selbst registered RAM, wie bei AMD üblich und bei Intel mit DDR2/3 als Option, macht nochmal einen nicht zu unterschätzenden Unterschied zu dem c't Test.
Na dann bewerb Dich mal bei AMD ;-)Übrigens, ich würde meine Rechnung nicht als worst-case für Intel bezeichnen. Ganz im Gegenteil. Da könnte man Shanghai noch deutlich besser machen.
Daraus können wir ein lustiges Spielchen machen. Ich verstehe nicht, was du daran nicht verstehst. Jetzt du...Ich versteh die nicht im Zusammenhang mit dem schönen Wort "Berechnung" ...
Ok, eine Fehlerquelle weniger. Das ändert aber nichts an der grundlegenden Aussage, dass im Gegensatz zu Desktops bei Servern idR eben registered RAM zum Einsatz kommt. Oder ist dies beim Nehalem Xeon anders? Wäre zumindest vollkommen untypisch.Hmm vielleicht lag darin Dein Fehler / Mißverständnis, Intel setzt beim Nehalem 2P Server keine FBDs ein.
Das war logischerweise auf die Rechnung bezogen, nicht auf die Hardware.Na dann bewerb Dich mal bei AMD ;-)
Du mit deinen grundlegenden Aussagen immer ...Ok, eine Fehlerquelle weniger. Das ändert aber nichts an der grundlegenden Aussage, dass im Gegensatz zu Desktops bei Servern idR eben registered RAM zum Einsatz kommt. Oder ist dies beim Nehalem Xeon anders? Wäre zumindest vollkommen untypisch.
http://www.microquill.com/The problem: Compiler runtime libraries allow only one thread at a time to be active in the heap. So on SMP systems, when multiple threads make concurrent heap requests, all but one will be blocked by the heap manager, nullifying the benefit of the extra CPUs. Worse yet, each time a thread is blocked, the OS invokes a context switch. The result: adding processors results in a vicious cycle of context switching that can prevent your app from scaling.
Ich verstehe nicht, was daran "worst" für Intel sein soll. 64 Bit bietet zwar grundsätzlich mehr Performance Potenzial. Aber das spiegelt sich nicht in jeder Anwendung wieder. Man müsste erstmal klären, inwiefern sich 32 und 64 Bit spec unterscheiden. Und Beta Compiler ist eher ein Vorteil, weil dort idR bessere bzw umfangreichere Optimierungen vorhanden sind als in alten Versionen.Warum worst case ? Die c't hat mal schnell unter 32bit mit nem beta Compiler ohne weiteres Extra Tuning (Compilerflags ausgenommen) gebencht.
Das sagt nichts aus. Schau dir die Dell Ergebnisse an, die sind fast identisch. Als ausgeschöpft würde ich das noch lange nicht bezeichnen, zumal sich Unterbau und Software permanent weiterentwickeln. Intel muss den Unterbau überhaupt erstmal auf die Beine stellen.Die AMD Ergebnisse sind dagegen direkt von AMD
Och, mach dir mal keine Sorgen. Ich weiss vermutlich sogar noch 'ne Ecke besser, was Smart Heap Bibliotheken sind und wie sie funktionieren. Heap Verwaltung und die Notwendigkeit von Smart Heap Routinen ist vor allem dann wichtig, wenn du viel mit Containern arbeitest, Listen, Queues, Maps, etc. Specint/fp konzentriert sich hingegen auf Rechenleistung. Da bringt dir das vergleichsweise wenig. Ausser du verwendest eine Runtime, die reif für die Tonne ist.Oben schrieb ich z.B. schon von den Smartheap Libs. Wenn Du jetzt keine Ahnung davon bzw. deren Auswirkungen hast, dann kann ich das nicht ändern
Ach ja, ist es nicht schön, ein paar nichtssagende Werbeslogans in die Runde zu werfen? Hör zu, mal Klartext. Ich weiss mit Sicherheit einen winzig kleinen Tick besser als du über dieses Thema bescheid. Was dort steht, hat keinerlei Aussagekraft. Glaubst du, MicroQuill, wer immer das auch sein mag, sind die ersten, die sich dieser Problematik gestellt haben? Praktisch jeder moderne Compiler hat auch eine MT Runtime. Und wenn nicht Intel diese effizient implementiert, wer dann? Und jede ist letztendlich mehr oder weniger effizient. Dementsprechend greift man in bestimmten Fällen auf angepasste Lösungen zurück. Da lässt sich aber weder etwas pauschalisieren, noch konkretisieren, noch sonst irgendwas. Schau dir lieber mal ein paar Artikel auf CodeProject zu dem Thema an, wann wo Smart Heaps etwas bringen. Dort ist zumindest Substanz vorhanden. Ich habe zudem das Gefühl, du solltest dir zuerst mal anschauen, was Heap Speicher überhaupt ist und welchen Zweck er erfüllt.
"Bla bla ... ich weiss eigentlich gar nicht, wovon ich spreche". Hättest du genauso schreiben können. Das bringt es besser auf den Punkt. Lass erstmal erkennen, dass du weisst, was Smart Heaps sind und wofür sie verwendet werden. Dann können wir eventuell weiterdiskutieren. Ansonsten macht das wenig Sinn. Du interpretierst da viel zu viel rein.1. Smartheaps benützt man bei INT (steht auch schon oben), auch Intel benützt die bei eigenen Tests, so toll kann deren Compiler in dem Feld also nicht sein: http://www.spec.org/cpu2006/results/res2008q4/cpu2006-20080915-05343.html
c't testet ohne -> professionelle INT Werte werden höher ausfallen.
Heisst das also, INT läuft dann mit 64 Bit langsamer und FP hat keinen Vorteil durch Smart Heaps? Und wo steht, dass FP mit 64 Bit schneller ist? Sry, aber langsam machst du dich mit deinem scheinbar fehlendem Wissen und ohne Quellenangaben etwas unglaubwürdig.1. Smartheaps benützt man bei INT (steht auch schon oben), auch Intel benützt die bei eigenen Tests, so toll kann deren Compiler in dem Feld also nicht sein: http://www.spec.org/cpu2006/results/res2008q4/cpu2006-20080915-05343.html
c't testet ohne -> professionelle INT Werte werden höher ausfallen.
2. Bei FP testet man wg. höheren Ergebnissen mit 64bit.
c't testet ohne -> professionelle FP Werte werden höher ausfallen.
Guten Morgen:Übrigens, nur damit da das nicht vergisst, bei den AMD Tests kam ebenfalls keine spezielle Smart Heap Bibliothek zum Einsatz.
http://www.spec.org/cpu2006/results/res2008q4/cpu2006-20081024-05683.htmlOther Software: binutils 2.18
32-bit and 64-bit libhugetlbfs libraries
SmartHeap 8.1 32-bit Library for Linux
Gähn ... Du weisst was Benchmarks sind ? Anscheinend nicht ... aber macht ja nichts, ich erklärs Dir:Heisst das also, INT läuft dann mit 64 Bit langsamer und FP hat keinen Vorteil durch Smart Heaps? Und wo steht, dass FP mit 64 Bit schneller ist? Sry, aber langsam machst du dich mit deinem scheinbar fehlendem Wissen und ohne Quellenangaben etwas unglaubwürdig.
Da frage ich mich doch, was das unter x86-64 überhaupt für Auswirkungen hat. Oder anders gefragt, du beschwerst dich, dass c't ohne Smart Heap Bibliothek (wenn das denn überhaupt der Fall war) unter x86-32 Performance fehlt, die sie unter x86-64 sowieso nicht hätten?SmartHeap 8.1 32-bit Library for Linux
Und das die Wolfdale nocheinmal 20-30fps vorne liegen, hast du auch bemerkt Das kann man wohl in die Tonne werfen, min-fps Tests machen eigentlich nur in einer "x % unter 25fps" Form Sinn, alles andere schwankt einfach zu sehr von Durchlauf zu Durchlauf.
Ne, das gehört dazu, da scheint der FSB bei den Quads dicht zu machen.
Das lässt sich sofort widerlegen, denn einerseits würde dies maximal zu gleichen FPS von Dual- und Quadcore führen und zum anderen ist unsinnig, dass dann ein Q9450 nicht schneller als ein Q6600 ist - trotz mehr Cache und mehr FSB. Der QX9770 wiederum skaliert geradezu exponentiell. Nein, da wurden definitiv Schugrößen gemessen, oder kannst du dir die angesprochenen Punkte anders erklären?
Wo es aber abstruß wird:Als Speicher verwenden wir DDR3-SDRAM des Typs OCZ OCZ3P1600EB2GK. Die beiden 1-GB-Module des Dual-Channel-Kits sind für bis zu 200 (effektiv 1600) MHz Takt ausgelegt. Bei uns laufen die Speicherriegel mit einem Datentakt von 1066 MHz und CL5-Timings (5-5-5-16).
Geb Dir also Recht -> Blödsinn ³, einzigstes Fazit ist wohl, dass man den RAM / FSB synchron halten sollte (wobei ich eigentlich dachte, dass das nicht soviel ausmachen würde ... )Einzige Ausnahme: Steckt der Core 2 Extreme QX9770, er läuft ab Werk mit einem Front Side Bus von 400 MHz, in der Asus P5E3 Deluxe, lassen wir die OCZ-Module mit vollem Takt, aber reduzierten Zugriffszeiten arbeiten.
Wenn man die überflüssigen 50 Watt des Design-Unfalls und Umweltdisasters 790FX DQ6 abzieht, sehen die Verbrauchswerte des Phenom-Systems gar nicht mal übel aus. Nur gut das dieser Technik-Schrotthaufen mittlerweile aus dem Verkehr gezogen wird, vielleicht stecken sogar Umweltbehörden dahinter. Bleibt nur zu hoffen, das Gigabyte in Zukunft die Finger vom AMD-Entusiasten-Bereich lässt und die Menschheit mit solchen Erderwärmer verschont.
Das kann ja wirklich kein Zufall mehr sein, wieder und wieder kommt das mieseste und blamabelste AM2+ Board ever zum Einsatz, das Gigabyte 790FX DQ6. Beim S775-System wird "überraschenderweise" nicht auf Gigabyte vertraut, es kommt das sparsamste X38 von ASUS mit EPU zum Einsatz (aber immerhin macht dieses Board auch gleich dem i7 System schwer zu schaffen).
Wenn man die überflüssigen 50 Watt des Design-Unfalls und Umweltdisasters 790FX DQ6 abzieht, sehen die Verbrauchswerte des Phenom-Systems gar nicht mal übel aus. Nur gut das dieser Technik-Schrotthaufen mittlerweile aus dem Verkehr gezogen wird, vielleicht stecken sogar Umweltbehörden dahinter. Bleibt nur zu hoffen, das Gigabyte in Zukunft die Finger vom AMD-Entusiasten-Bereich lässt und die Menschheit mit solchen Erderwärmer verschont.