1 Teraflops geknackt: Intel führt Larrabee auf der SC09 vor

SileX86

Enthusiast
Thread Starter
Mitglied seit
02.03.2006
Beiträge
784
Ort
Zelt
<p><img style="margin: 10px; float: left;" alt="intel3" src="images/stories/logos/intel3.jpg" width="100" height="100" />Nach langer Zeit gibt es wieder ein Lebenszeichen von <a target="_blank" href="http://www.intel.de/">Intel</a>s erstem GPU-Projekt namens Larrabee. Auf der gerade stattfindenden Supercomputing Conference 09 demonstrierte der Chiphersteller die Rechenleistung eines Larrabee-Prototypen, wie Heise.de berichtet. Die Karte erreichte bei der SGEMM-Berechnung (Single Precision General Matrix Multiply) eine Leistung von 1006 Gigaflops und konnte somit die Teraflops-Marke knapp überschreiten. Dieser Wert wurde allerdings im übertakteten Zustand erreicht, im Normalbetrieb kam man nur auf 417 Gigaflops Dauerleistung und maximal 712 GFlops. Zum Vergleich die...<p><a href="/index.php?option=com_content&view=article&id=13613&catid=38&Itemid=101" style="font-weight:bold;">... weiterlesen</a></p>
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Im Jahr 2008 hat niemand 1 Tflop mit ner PCIe Karte oder ähnlichem erreicht. Die Frage ist, was kann Fermi zu dem Zeitpunkt an dem Larrabee erscheint (wann auch immer das sein wird ;)).
 
Naja, schwer vergleichen kann man das ganze trotzdem nicht. Abwarten was bei raus kommt, schlimmer als mit Tukwila kanns nich werden..
 
Im Jahr 2008 hat niemand 1 Tflop mit ner PCIe Karte oder ähnlichem erreicht. Die Frage ist, was kann Fermi zu dem Zeitpunkt an dem Larrabee erscheint (wann auch immer das sein wird ;)).

Ich erinnere mich dunkel, auch 2008 schon eine HD4870 besessen zu haben - warte, wieviel Arithmetikleistung hat die noch gleich...? :) Natürlich nicht in dem Bench, aber deine Aussage ist missverständlich.
Insgesamt hat das jedoch auch keine Bedeutung, weil natürlich nicht 2008 die Referenz für LRB sein wird, sondern der Releasezeitpunkt und wie auch im Artikel steht, haben wir die TFLOPS schon heute geknackt.
 
Zuletzt bearbeitet:
Es geht ja um die praktisch nutzbare Leistung. Die theoretischen Werte sind bei ATI wg. der 5D Einheiten natürlich gigantisch ;) Die 4870 dürfte in der bitteren Ralität maximal die Werte der GTX285 erreichen.

1TFlop ist das Terrain der 57xx er ATIs.

Ich bin auch gespannt, wie es zum Launch aussieht. Vor allem ob sich rohe Gewalt oder smartes Design durchsetzt.
 
Zuletzt bearbeitet:
Ihr lest aber auch oder?

Die Angaben der Hersteller sind theoretische Werte. Nach dem Messfahren sieht es ganz anders aus.

Die messbare SGEMM-Rate bei NVIDIAS Tesla C1060 (vergleichbar mit GeForce GTX 280) soll bei 320 GFlops liegen. Die theoretischen Werte werden dabei oftmals weitaus höher angegeben. Somit soll die aktuelle ATI Radeon HD 5870 von AMD 2,72 Teraflops liefern können. Real dürfte die Radeon aber auch bei der SGEMM-Berechnung die Teraflops-Marke knacken, die gerade veröffentlichte Dual-GPU-Variante HD 5970 erst recht.

^^ ah war jemand schneller :d
 
Zumal ja im Artikel steht, dass Intel die GPU übertaktet hat. Fragt sich nur in welchem Maße? Ich denke mal bis zur Grenze übertaktet, damit die Werte so hoch wie möglich sind.

---------- Beitrag hinzugefügt um 22:01 ---------- Vorheriger Beitrag war um 21:56 ----------

Es geht ja um die praktisch nutzbare Leistung. Die theoretischen Werte sind bei ATI wg. der 5D Einheiten natürlich gigantisch ;) Die 4870 dürfte in der bitteren Ralität maximal die Werte der GTX285 erreichen.

1TFlop ist das Terrain der 57xx er ATIs.

Ich bin auch gespannt, wie es zum Launch aussieht. Vor allem ob sich rohe Gewalt oder smartes Design durchsetzt.

Hab ja geschrieben theoretische Werte. ;) Leider habe ich nichts dazu gefunden wie viel die HD4870 nun wirklich an SP-Werte bringt. Aber so gesehen düfte der Larrabee im Standardtakt der HD4870 gleichkommen oder?
 
Zuletzt bearbeitet:
Zumal ja im Artikel steht, dass Intel die GPU übertaktet hat. Fragt sich nur in welchem Maße? Ich denke mal bis zur Grenze übertaktet, damit die Werte so hoch wie möglich sind.

Wie kann man was übertakten das nicht mal nen wirklich festgelegten Stadardtakt hat ;)

Hab ja geschrieben theoretische Werte. ;) Leider habe ich nichts dazu gefunden wie viel die HD4870 nun wirklich an SP-Werte bringt. Aber so gesehen düfte der Larrabee im Standardtakt der HD4870 gleichkommen oder?

Theoretisch stimmen deine 1,2 TFlops, allerdings wird davon durch die Vec5 usw nicht mehr viel übrig bleiben. Wenn 5870 von 2,72 TFlops auf reale 1TFlops rutschen würde, wäre die 4870 im gleichen Verhältniss bei 440 GFlops.... theoretisch ;)
 
Wie kann man denn bei einem Prototypen von Übertakten sprechen? Die finalen Taktraten wurden sicherlich noch nicht festgelegt. Oder war der Takt für max. 1006 GFlops im Dauerbetrieb nicht stabil? /EDIT: Hätte das Posting vor mir lesen sollen, da wurde das Thema ja auch schon angesprochen.
In jedem Fall so schnell wie ein Cypress (HD 5870) in diesem Benchmark, kann sich doch sehen lassen.

/EDIT: Hab noch weitere Werte gefunden:
...to the current fastest matrix-matrix product implementations:

CUBLAS 2.0 on GTX280 achieves 375 Gflop/s
and on HD4870 ATi reckons 540 Gflop/s
Quelle: http://forum.beyond3d.com/showthread.php?t=54842
 
Zuletzt bearbeitet:
Naja, wenn in dem Text von "übertaktet" gesprochen wird, geh ich logisch davon aus, dass bereits Standardtaktraten festgelegt wurden. Ansonsten müsste das "übertaktet" aus dem Artikel gestrichen werden.
 
Zur Übertaktungsproblematik:
Die Quelle (Heise) formulierte es so: "... führte Justin Rattner von Intel eine Larrabee-Karte vor, die im übertakteten Modus bei der Matrixmultiplikation in einfacher Genauigkeit (SGEMM) die Ein-Teraflops-Marke knapp überschritt."
 
Übertaktet wurde das Vorserienexemplar (im Sinne von mehr Takt als die Spec vorgibt). Was dann ausgeliefert wird, kann schneller oder langsamer sein.

Die praktischen Werte der 4870/GTX280 sind interessant! Der Benchmark dürfte ATI liegen, damit bringt eine 5870 sicher über 1 TFlop.
 
Im Jahr 2008 hat niemand 1 Tflop mit ner PCIe Karte oder ähnlichem erreicht.
Doch. Einfach mal in diesen Thread reinschauen. Da ist ein User schon mit einer HD 4870 auf einen solchen SGEMM Durchsatz gekommen. Wann wurde diese Grafikkarte nochmal gelauncht? :rolleyes:
Mit der 5000er Generation sollten sogar 2 TFLOPS drin sein. Diese ist übrigens schon auf dem Markt, Larrabee noch lange nicht. Wie ich schon mal vermutet hatte, Intel wird der Konkurrenz scheinbar mindestens 1-2 Generationen hinterherhinken. Wobei, für Fermi könnte es vermutlich reichen.
 
Zuletzt bearbeitet:
Naja

Intel macht viel Lärm um nichts besonders.
Würde mich nicht überraschen wenn die 1. Generation vom Larrabee ein Flop wird.
 
In dem Benchmark, den Intel durchgeführt hat, werden die zwei HD 5970 ganz sicher keine 9 TFlops zusammenbringen, sondern eher 4 TFlops. Außerdem sollte man Einzel-GPUs vergleichen. Intel kann auch vier Larrabees zusammenschalten, wenn es sein muss.

@mr.dude: Er hat 880 GFlops erreicht bei einer Matrix-Größe von 4096x4096 (offenbar eine optimale Größe für die GPU). Bei 1024x1024-Matrizen lag der Wert mit einer HD 4870 nur bei 720 GFlops. Der Test mit einer anderen Implementierung brachte 540 GFlops. Letztendlich erscheint ein Vergleich kaum sinnvoll, wenn man nicht die genaue Matrixgröße kennt.
 
Zuletzt bearbeitet:
In dem Benchmark, den Intel durchgeführt hat, werden die zwei HD 5970 ganz sicher keine 9 TFlops zusammenbringen, sondern eher 4 TFlops. Außerdem sollte man Einzel-GPUs vergleichen. Intel kann auch vier Larrabees zusammenschalten, wenn es sein muss.

@mr.dude: Er hat 880 GFlops erreicht bei einer Matrix-Größe von 4096x4096 (offenbar eine optimale Größe für die GPU). Bei 1024x1024-Matrizen lag der Wert mit einer HD 4870 nur bei 720 GFlops. Der Test mit einer anderen Implementierung brachte 540 GFlops. Letztendlich erscheint ein Vergleich kaum sinnvoll, wenn man nicht die genaue Matrixgröße kennt.

Das sollte auch nur ein "Extrem" darstellen und zeigen was jetzt schon möglich ist. ;)
 
Ok, der Cypress überflügelt Larrabee höchstwahrscheinlich in Sachen Peak-Rechenleistung, allerdings überflügelt der Cypress auch den Fermi bei den Single-Precision-TFlops - und zwar deutlich (HD 5870 = 2,72 TFlops peak, Tesla C2070 = 1,26 TFlops).
Larrabee kann x86-Code ausführen und dürfte damit für Entwickler wesentlich interessanter sein als Cypress.
 
Das wird sich zeigen. Derzeit müssen sich alle – wenn auch außergewöhnlich –mit ATI messen.
Wir werden sehen, was die nahe Zukunft bringt.
 
1. Larrabee besteht aus vielen vereinfachten Pentium-Cores, wobei die Menge längst noch nicht fix ist, welche sich schlussendlich auf dem Produkt wiederfinden wird. Somit ist die endgültige Leistung nicht ersichtlich und wird dem Markt noch angepasst werden.

2. Eben wegen der Architektur werden Spiele im \"Software-Modus\" berechnet , daher ist auch deshalb die Spiele-Leistung absolut ungewiss.

3. Larrabee wird stark von der Treiber- und Softwarequalität abhängig sein, deshalb sind Roh-Leistungstests nicht aussagefähig und daher unbedeutend. Einziger Wert dieser Benchmarks: \"Ja Larrabee gibt es und es macht was die Entwickler davon erwartet hatten\".

Fazit: Egal was ATI, Nvidia und Intel an Leistungsdaten und Benchmarks von nicht veröffentlichten Produkten zeigen, über die tatsächliche Leistung als Spiele-Grafikkarten werden wir uns erst überzeugen können, wenn alle den Markt in der finalen Version erreichen. ATI ging den klassischen Weg und hat eine Grafikkarte entwickelt, Fermi und Larrabee aber sind \"etwas anderes\", multifunctional processing units (MPU)s wenn man so will. ATI wartet ab was die beiden damit anstellen und wir dürfen gespannt sein.
 
Larrabee kann x86-Code ausführen und dürfte damit für Entwickler wesentlich interessanter sein als Cypress.
Nicht wirklich. Das ist eher Marketing. Entwickler programmieren ja sowieso nicht x86, sondern in Hochsprachen wie C oder C++. Und x86 ist hier nicht das Problem, sondern die nicht vorhandene Semantik für parallele Aufgabenverteilung. Deshalb auch Schnittstellen wie OpenCL oder DirectCompute. Intel braucht dies daher genauso. Sie haben sogar eine eigene Schnittstelle namens Ct dafür.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh