classic437
Neuling
- Mitglied seit
- 28.08.2009
- Beiträge
- 558
hört sich sehr gut an, was ihr da schreibt.
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: this_feature_currently_requires_accessing_site_using_safari
Wenn sie dir nichts bringen, darfst du auch gerne zu einem 2- oder 3-Modul Modell greifen.Was bringen mir die vielen Kerne/Threads, die die CPU verarbeiten kann, wenn sie im Endeffekt garnicht genutzt werden...
Schon mal was von Multitasking gehört? Man hat nicht immer nur eine Anwendungen laufen. Ich merke es bei mir besonders in einem Fall, wo mehr als ein Prozess am werkeln ist. Mein X2 läuft da schon am Limit und schreit nach mehr Kernen.Die meisten Programme, die man so nutzt, nutzten ja nur 2 cores, wenn überhaupt, und Spiele fangen gerade erst an von quadcore zu profitieren und selbst da hält es sich in Grenzen.
Dazu hab ich eine Verständnisfrage: Wie kann etwas simultan in L1 und L2 Cache geschrieben werden, wenn der L1 Cache nur 4, der L2 Cache aber 18 Takte Latenz hat? Muss dann nicht der L1 auf den L2 warten?
Und wie wird eigentlich verhindert, dass der Rechner abstürzt, wenn das Powergating einen Kern abschaltet? Normalerweise muss man Windows doch vor Systemstart sagen, auf wie vielen Prozessoren es laufen soll.
Latenzen beziehen sich üblicherweise auf Lesezugriffe, nicht auf Schreibzugriffe. Genau genommen heisst es im Dokument "load-to-use latency". Natürlich brauchen Schreibzugriffe auch eine gewisse Zeit. Ist hier aber nebensächlich. Die Vermeidung von Inkonsistenzen ist wieder ein anderes Thema, -> Kohärenz.Dazu hab ich eine Verständnisfrage: Wie kann etwas simultan in L1 und L2 Cache geschrieben werden, wenn der L1 Cache nur 4, der L2 Cache aber 18 Takte Latenz hat? Muss dann nicht der L1 auf den L2 warten?
Power-Gating ist keine Technik, wo einfach ein Schalter umgelegt wird und das war es dann. Da passiert auf Hardwareebene einiges. Im Gegensatz zu Clock-Gating, wo man praktisch taktweise steuern kann, kann das Aktivieren von Power-Gating schon mal mehrere hundert Takte dauern. Dem Betriebssystem wiederum ist es völlig egal, was die Hardware macht. Das Betriebssystem sagt doch nur "Prozessor A führe Instruktion X aus" oder "Prozessor B führe Instruktion Y" aus. Sollte ein Prozessor mal keine Instruktionen zur Ausführung erhalten, was vom Betriebssystem mit einer WAIT Instruktion oder ähnlichem signalisiert wird, ist das die Möglichkeit für den Prozessor, in einem Sparmodus zu wechseln. Entweder wird dann Takt und Spannung gesenkt (Clock-Gating) oder der Prozessor wird komplett stromlos geschaltet (Power-Gating).Und wie wird eigentlich verhindert, dass der Rechner abstürzt, wenn das Powergating einen Kern abschaltet? Normalerweise muss man Windows doch vor Systemstart sagen, auf wie vielen Prozessoren es laufen soll.
Ok Danke.
Ich rechne nun mit einer großen Steigerung der IPC ( > 25%) gegenüber K10.5.
Leibowitz ging auch auf die Vorwürfe wegen der Intel-Compiler ein und stellte fest, dass diese fremde Prozessoren klar benachteiligt hätten. Das dürfe in Zukunft nicht mehr geschehen und ist ebenfalls in der Anordnung geregelt. Diese legt auch fest, dass Intel weiterhin Lizenzen für die Entwicklung und den Verkauf von x86-Prozessoren durch AMD und VIA Technologies vergeben muss – auch wenn diese die x86-Prozessoren bei Auftragsfertigern wie Globalfoundries oder TSMC produzieren lassen.
Intel muss ferner insgesamt bis zu 10 Millionen US-Dollar an Firmen auszahlen, die ihre mit Intel-Compilern hergestellte Software neu übersetzen müssen, damit sie auch auf Nicht-Intel-Prozessoren so schnell wie möglich läuft. Strafzahlungen muss Intel allerdings nicht leisten. Intel akzeptiert die FTC-Vorgaben, erkennt aber kein Fehlverhalten an – eine solche Sprachregelung gab es auch bei der Einigung mit AMD (AMD Settlement).
ist denk ich ein fake
Auch gibt es bei x86 Compiler Tricks, wenn z.b. ein AMD Prozessor im System drin ist und der Intel Compiler das weiß, dann kann eine SSE Befehlserweiterung bei AMD x86 CPUs deaktiviert werden, dann ist Intel bei SSE Code schneller, es gibt bezüglich x86 Compiler viele Threads im Netz, einfach google benutzen, die Ingenieure bei AMD wissen das bestimmt auch, hier gibt es Simulationen für Integer oder SSE Code.
Es ist möglich das Bulldozer in Singlethread gegenüber Sandy Bridge trotz gleicher Anzahl logischer Prozessoren 10% langsamer ist
Nein, heisst es nicht. Auf welchem System kompiliert wird, ist doch völlig egal. Es zählt nur der dabei entstehende Code, nicht der Compiler. Und natürlich kann auch auf einem AMD System Code mit spezifischen Intel Pfaden erstellt werden. Wenn du willst kannst du auch auf Nicht-x86 Systemen Code für AMD oder Intel erstellen.Aber die meisten Programme werden wohl nicht auf dem selben System compiliert wo sie später auch ausgeführt werden. Das hieß ja, dass ein auf einem AMD compiliertes Programm dann später auch auf einem Intel langsamer ist, oder?
Ja, es gibt auch einen Compiler von AMD. Der nennt sich Open64. Das Problem ist nur, dass es bisher keinen richtigen Windows Port davon gibt. Mir ist zumindest keiner bekannt.Und gibt es von AMD eigentlich auch optimierte Compiler?
Ein Kompiler macht, was man Ihm sagt, es gibt z.B. auch sogenannte Cross Compiler, damit kannst Du auf z.B. einer x86 Maschine Quellcode in ein ARM Binary compilieren lassen. Klarerweise kann die x86 Compile-Maschine, damit aber 0 anfangen. Ist aber dem Compiler egal, der tut wie befohlen.Aber die meisten Programme werden wohl nicht auf dem selben System compiliert wo sie später auch ausgeführt werden. Das hieß ja, dass ein auf einem AMD compiliertes Programm dann später auch auf einem Intel langsamer ist, oder? Oder ist das nur eine Optimierung auf Intel? Und gibt es von AMD eigentlich auch optimierte Compiler?
AMD hat definitiv nicht die Manpower wie Intel, das sieht man unter anderem an der Qualität der ACML. Diese enthält wie auch Intels MKL "BLAS, LAPACK und FFT". Auf 61xx Opterons ist die MKL Single Threaded etwas schneller, Multithreaded gibt es einen gewaltigen Unterschied. Die MKL skaliert auf einem Opteron sehr viel besser als die ACML.Aber die meisten Programme werden wohl nicht auf dem selben System compiliert wo sie später auch ausgeführt werden. Das hieß ja, dass ein auf einem AMD compiliertes Programm dann später auch auf einem Intel langsamer ist, oder? Oder ist das nur eine Optimierung auf Intel? Und gibt es von AMD eigentlich auch optimierte Compiler?
Was beim Intel Compiler passierte war, dass Intel dem Compiler vorschrieb, eine Intelinside Abfrage in die erzeugten Programme einzubauen. Nur wenn ein Intel im System erkannt wurde, gabs guten SSE/2 Code, ansonsten wurde x87 Ersatzcode ausgeführt, der logischerweise langsamer war.
Ein Prozessortreiber ist etwas völlig anderes als zB ein Grafikkartentreiber. Damit kannst du nicht einfach etwas "abfangen". Ein Prozessortreiber kümmert sich maximal um Power-States und dergleichen. An der Ausführung des Codes lässt sich damit aber nichts ändern. Wie daysleeper83 schon schreibt, was CPUID zurückgibt ist fest im Prozessor verdrahtet. Ausserdem wäre es rechtlich problematisch, wenn AMD seine Prozessoren einfach "GenuineIntel" zurückgeben lassen würde. Man bräuchte schon entsprechende Funktionen, um den Hersteller-String zu ändern. Dann könnte das zumindest jeder auf eigene Gefahr nach Wunsch einstellen. Ist aber natürlich keine generelle und damit keine flächendeckende Lösung. Soweit bekannt haben AMD Prozessoren solche Funktionen auch nicht. Das kennt man bisher nur von VIA. Darüber hinaus würde das auch noch lange nicht ausreichen. Der Intel Compiler nutzt noch ganz andere Methoden, um Intel Prozessoren zu identifizieren.Warum hat man diese Abfrage nicht mittels Patch im Prozessortreiber abfangen können?
gibt es schon etwas zu den preisen?
150- 250 schätze ich mal.