Auf Larabees Spuren: Intel Xeon Phi

Don

[printed]-Redakteur, Tweety
Thread Starter
Mitglied seit
15.11.2002
Beiträge
27.137
<p><img style="float: left; margin: 10px;" src="images/stories/logos/intel3.jpg" alt="intel3" width="100" height="100" />Die heute veröffentlichte <a href="http://www.top500.org" target="_blank">Liste der Top 500 Supercomputer</a> weist auf Platz 150 auch einen solchen auf, der bei Intel selbst in den Laboren steht und als "<em>Discovery - Intel Cluster, Xeon E5-2670 8C 2.600GHz, Infiniband FDR, Intel MIC</em>" bezeichnet wird. Dahinter verbirgt sich eine Test-Plattform von Intel, auf der einer der Nachfolger des Projekts "Larabee" zum Einsatz kommt. Das nun von Intel offiziell vorgestellte Modell hört auf den Namen "Knights Corner", der eigentliche Produktname ist allerdings Xeon Phi.</p>
<p><img style="display: block; margin-left: auto; margin-right: auto;"...<p><a href="/index.php?option=com_content&view=article&id=22824&catid=38&Itemid=101" style="font-weight:bold;">... weiterlesen</a></p>
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
So ein Kärtchen könnte meinem 775-System nochmal ordentlich einheizen!^^ :fresse:
 
mhhh ob man sich mit so einer karte ein neues mainboard + cpu sparen kann ??? xDD
 
Wenn du so viel gespart hast um dir das Ding zu kaufen, dann ist das Mainboard + CPU quasi gratis xD
 
Ich glaube da ist ein Fehler unterlaufen. Da Steht das ein Super-Computer 1997 noch 9'298 Prozessoren und 72 Server-Einschübe benötigte, um eine Rechenleistung von 1 TeraFLOPS zu erreichen. Der Xeon Phi hatt 1 TeraFLOPS Rechenleistung und nur einen PCIe Anschluss.

lg Scandal
 
Ja das war natürlich falsch. In der Top-500-Liste werden für das aktuelle System 9800 Kerne angegeben, was da eigentlich auch hin sollte.
 
es ist wohl so, dass in 1997 die Nummer Eins der Supercomputer für 1 Teraflop Tausende von Prozessoren benötigte, die einen ganzen Raum füllten. Diese Leistung in doppelter Genauigkeit liefert heute Knights Corner alias Xeon Phi auf einem einzigen Chip.
Und was die Software-Anpassungen angeht, da macht es Intel den Programmierern einfach. Verrenkungen wie bei der Parallelprogrammierung von Grafikkarten sind bei Xeon Phi gerade nicht nötig. "The basis of the Intel MIC architecture is to leverage x86 legacy by creating a x86 compatible multiprocessor architecture that can utilise existing parallelization software tools. Programming tools include OpenMP, OpenCL, Intel Cilk Plus and specialised versions of Intel's Fortran, C++ and math libraries.
Design elements inherited from the Larrabee project include x86 ISA, 512-bit SIMD units, coherent L2 cache, and ultra-wide ring bus connecting processors and memory." (Wikipedia)
 
bei einer theoretischen Rechenleistung von einem TeraFLOP bei 64-Bit-Double-Precision-Berechnungen pro Karte.
Wo steht, dass es sich bei der Angabe um double-precision handelt? Wenn sie schon mit einem Rechner aus 1997 vergleichen, der wird wahrscheinlich auch dein 64 bit berechnet haben...
 
Der Xeon Phi hatt 1 TeraFLOPS Rechenleistung und nur einen PCIe Anschluss.
"That teraflop, by the way, is provided by the Knights Corner card plus the two Xeon E5 host CPUs, so the MIC chip itself is likely delivering something in the neighborhood of 700 to 800 gigaflops."
Quelle: HPC Wire

Wo steht, dass es sich bei der Angabe um double-precision handelt?
"Intel claims the chip will achieve greater than a teraflop of double-precision compute throughput in Linpack."
Quelle: Intel, via Tech Report

Waren wir einfach die ersten unabhängigen Tests ab :)
 
@semtexx

zufälligerweise war es 1997, als irgendeine Number One der Supercomputer 1 Teraflop erreichte, - mit einer Geräte-Anordnung, die einen ganzen Raum füllte
es hätte auch in 2000 oder 1989 sein können, aber es war in 1997, und deswegen reicht der Vergleich zurück ins Jahr 1997, ok?

Das soll nur zeigen, was die Entwicklung bei der Rechenleistung gebracht hat, jedenfalls bei Intel.
Intel reicht für 1 Teraflop in doppelter Genauigkeit ein einziger MIC-Chip.
Ob die 1 TFlop Rechenleistung der Number 1 in 1997 in single oder double precision war? Keine Ahnung, ist auch nicht so wichtig, falls nur single, ist das in der Zwischenzeit erreichte einfach umso beeindruckender. Ziemlich beeindruckend ist Xeon Phi aber allemal, schon deswegen, weil es keine Graka gibt die diese Leistung in double precision auch nur annähernd in einem
einzigen Chip erreicht.
AMD benötigt für diese Leistung z.B. schon zwei seiner Grafikchips der neuesten Generation, und das ist bloß eine Ankündigung. Und was "Ankündigung" beim Änkündigungsweltmeister heisst, das weiss man ja mittlerweile.
Ernstzunehmender wird da schon NVidia's GK110 bzw die entsprechende Profikarte sein.

solltest du ernsthaft bezweifeln, dass Xeon Phi diese double precision Leistung (wie sie schon vor geraumer Zeit auch von Intel selbst angesagt wurde) erbringt, müßtest du dir schon selbst über diese Zweifel hinweg helfen und entsprechende statements suchen, ich werd's bestimmt nicht tun, ok?
 
@dv2130n
Das mit dem Supercomputer ist mir schon klar, nur ist es ziemlicher Murks dp mit sp zu vergleichen ;)

AMD benötigt für diese Leistung z.B. schon zwei seiner Grafikchips der neuesten Generation, und das ist bloß eine Ankündigung. Und was "Ankündigung" beim Änkündigungsweltmeister heisst, das weiss man ja mittlerweile.
Ernstzunehmender wird da schon NVidia's GK110 bzw die entsprechende Profikarte sein.
AMD erreicht mit der 7979 jedenfalls annähernd 1TFlop DP Leistung. Intel hat da auch noch nicht mehr als angekündigt, ich bezweifle ja nicht, dass sie es nicht erreichen (irgendwann). Ich konnte nur in der Quelle keinen Hinweis entdecken, dass es sich bei der 1Tflop Angabe um DP handelt.

solltest du ernsthaft bezweifeln, dass Xeon Phi diese double precision Leistung (wie sie schon vor geraumer Zeit auch von Intel selbst angesagt wurde) erbringt, müßtest du dir schon selbst über diese Zweifel hinweg helfen und entsprechende statements suchen, ich werd's bestimmt nicht tun, ok?
Ich habe auch kein Problem damit, dass du mir nicht die Statements suchst. Aber man darf doch wohl noch Zweifel an einer Aussage anbringen, zu der es keinen Anhaltspunkt in der Quelle gibt...
Aber wenn die 1TFlop DP natürlich vor geraumer Zeit von Intel angesagt wurde... will ich dem absoluten Wort Intels nichts entgegensetzen ;).
 
knapp 1Tflops erreicht die 7970, es war wohl die 6970, die nur etwa die Hälfte davon erreichte (macht sich bemerkbar, dass ich amd nichts mehr zutraue), sieht also aktuell nicht ganz so mau aus mit den AMD Karten
die 7979 ist eine Ankündigung und will ca. 2 TFlops erreichen

Knights Corner wurde schon letztes Jahr bei einer Life Performance ausgemessen mittels DGEMM, und jetzt Xeon Phi auf der ISC'12 mit dem Industrie Standard Benchmark Linpack (Rmax)1.
 
Zuletzt bearbeitet:
Klingt wie eine amerikanische Studentenverbindung. Intel Xenon Phi :banana:
 
AMD erreicht mit der 7979 jedenfalls annähernd 1TFlop DP Leistung. Intel hat da auch noch nicht mehr als angekündigt, ich bezweifle ja nicht, dass sie es nicht erreichen (irgendwann). Ich konnte nur in der Quelle keinen Hinweis entdecken, dass es sich bei der 1Tflop Angabe um DP handelt.
Made with Intel's innovative 22nm, 3-D tri-gate transistors, the Intel Xeon Phi coprocessor, available in a PCIe form factor, contains more than 50 cores and a minimum of 8GB of GDDR5 memory. It also features 512b wide SIMD support that improves performance by enabling multiple data elements to be processed with a single instruction. Last year Intel showed a live demonstration of the single Knights Corner coprocessor delivering over 1 TeraFLOPs (1 trillion floating point operations per second) of double precision real life performance, as measured by DGEMM. At ISC'12 Intel demonstrated the same effective performance of more than 1 TeraFLOPs per node but measured by the industry standard benchmark Linpack (Rmax)1. By comparison, in 1997, it took more than 9000 Intel® Pentium® processors inside the ASCII RED* supercomputer to break the 1 TeraFLOPs barrier.

Latest Intel® Xeon® Processors E5 Product Family Achieves Fastest Adoption of New Technology on Top500 List
Ansonsten kommt es dann eben darauf an, was die TFlops in der Praxis wert sind und da lässt sich Intels x86-Lösung sicher nicht ohne weiteres mit den AMD/NVidia Karten vergleichen.
 
Ansonsten kommt es dann eben darauf an, was die TFlops in der Praxis wert sind .....


es wird in der Praxis so viel wert sein, dass alles, was Rang und Namen hat im High Performance Computing - SGI, NEC, Cray, Bull, Dell, HP und IBM, insgesamt bereits 44 Hersteller -
entsprechende Systeme mit Xeon Phi bauen möchten. Und die müssen es ja wissen ...
Im investitionsfreudigen und margenträchtigen HCP-Umfeld wird Xeon Phi ganz prächtige Deckungsbeiträge für Intels R&D einfahren, schätze ich

die genaueren Spezifikationen von Xeon Phi würde man gerne mal erfahren, bisher sollen die Karten ja nur mit 50 von 64 Cores gelaufen sein, und zu Effizienz- und Verbrauchswerten weiss man noch nichts, die Anbindung von Xeon Phi wird aber letztlich wohl über PCIe 3.0 erfolgen, zumal die neuen Xeons ja sogar über einen eigenen PCIe 3.0 Root Komplex verfügen

zwar bieten die AMD grakas pcie 3 anbindung, aber der Rest der AMD Technik dümpelt mit pcie 2 rum, was daran liegt, dass AMDs Hyper Transport einfach nicht schnell genug ist;
was ja auch der Grund ist, weswegen es keine AMD chipsets mit pcie 3 gibt, aktuell nicht, und nach allem, was man so hört, wird es pcie 3 von AMD noch nicht mal für die nächste Prozessorgeneration (kaveri, vishera) geben. Fehlt eigentlich nur noch die AMD Folie und Ankündigung von pcie 3, dann weiss man, dass es noch lange dauert.

Interconnect-Technik ist aber eine ganz zentrale Technologie im Computing, vor allem im HPC. Das ist auch der Grund, weswegen Intel AMD kürzlich bei Cray eben mal vom Fahrrad geschubst hat, indem Intel wichtige Interconnect Technologie von Cray erworben hat fürs HPC Umfeld. AMD ist damit raus bei Cray.
(Intel hat sich ja auch Supermicro näher angesehen, und dankend abgelehnt, so ist dort amd zum Zug gekommen. Interessant wird es, wenn die Xeons und Atoms dort durch
amd cpus mit der hinlänglich bekannten Energiespar-Bulldozer-Technik ausgetauscht worden sind. Gut wahrscheinlich, dass Supermicro das nicht mehr unter eigenem Namen
vermarkten muss ...)

... und dass Intel sich auch beim interessierten SoHo-/Home-Technik Kunden um ordentlich Interconnect kümmert, das belegt die blitzschnelle und recht simple Thunderbolt Technik (aber das nur nebenbei)
 
Und was die Software-Anpassungen angeht, da macht es Intel den Programmierern einfach. Verrenkungen wie bei der Parallelprogrammierung von Grafikkarten sind bei Xeon Phi gerade nicht nötig.
Das glaubst aber auch nur du. Du wirst auch mit Xeon Phi auf Sonderlösungen ala OpenCL zurückgreifen müssen, um die Hardwareparallelität nutzen zu können. Dafür haben Hochsprachen wie C oder C++ nämlich keinen standardmässigen Support. In welche ISA der Compiler den Hochsprachencode dann übersetzt, ist für den Entwickler eher nebensächlich.

Versteh mich nicht falsch, Intels Tera Scale ist ansich eine interessante Sache. x86 basierte Kerne halte ich dafür aber nach wie vor für den falschen Ansatz. Softwareseitig sehe ich da keine wirklichen Vorteile. Du kannst eben nicht einfach so problemlos losprogrammieren, wie du das mit herkömmlichen x86 CPUs tun kannst, und bist trotzdem auf Sonderlösungen angewiesen. Und hardwareseitig sehe ich vor allem Nachteile in der Effizienz.
 
Zuletzt bearbeitet:
Das Problem der Paralellisierbarkeit bleibt bestehen. Als ob man alles so extremm parallelisieren könnte. Irgendwann knallts und dann blebt der nicht-parallelisierbare Teil über ;-)
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh