Intel Skylake und Kaby Lake mit rarem Fehler beim HyperThreading

Thread Starter
Mitglied seit
06.03.2017
Beiträge
114.151
intel-cpu.jpg
In aktuellen CPU-Architekturen und den dazugehörigen Chips tauchen immer wieder Fehler auf. Dies ist bei einer Komplexität von mehreren Milliarden Transistoren und den dazugehörigen Mikroschaltungen auch nicht weiter verwunderlich. Je nachdem unter welchen Bedingungen der Fehler auftritt und wie häufig dies bei den Nutzern der Fall ist, kann dies aber durchaus Schwierigkeiten zu den Herstellern bedeuten. Intel hatte mit letzten Atom-C2000-Prozessoren einen Totalausfall zu vermelden, bei AMD konnte ein ähnlicher Fehler per Microcode-Update behoben...

... weiterlesen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Dieser Multimilliarden Konzern strauchelt aber ganz schön. Die Skylake X Vorstellung, völlig überhastet machte diese zum Skyfart. All die Restriktionen rund ums OC sind sehr unfreundlich. Kein Lot, sondern die schlechtere Option WLP. Sinnbefreite Quads für 2066, die kein einziges Merkmal der umfangreichen Eigenschaften nutzen kann, also nur Mainstream auf überteuerter Plattform. Jetzt auch noch einen HT Bug, der Leistungsverlust bedeutet und das alles für einen überzogenen Preis. Wo Intel drauf steht, sollte man also vorsichtig sein.
 
Zuletzt bearbeitet:
Puh, könnte der Fehler auch dazu führen, dass z.B. ein I7 7700K Kabylake, ohne Ende heizt, selbst wenn die CPU geköpft und entsprechend behandelt wurde?
 
Gibt es ein Programm mit dem sich der Fehler provozieren lässt?
 
Puuhhh, mal wieder viele Beiträge zum lachen bei den Kommentaren :coffee:

Zum Thema, mal wieder wird mehr Wind um fast nichts gemacht, "Der Fehler tritt nur in extrem seltenen Anwendungsfällen auf." sagt wohl alles.
 
Puuhhh, mal wieder viele Beiträge zum lachen bei den Kommentaren :coffee:

Zum Thema, mal wieder wird mehr Wind um fast nichts gemacht, "Der Fehler tritt nur in extrem seltenen Anwendungsfällen auf." sagt wohl alles.

Fehler ist Fehler ist Fehler - da hilft auch nichts kleinzureden !
 
Das würde nicht sowas von aufregen.
Von was kommt denn jetzt mein Error? Liegt es am OC, VT, oder an defekter Hardware?
Oder doch am Intelchip!!?
Greetz
 
Fehler ist Fehler ist Fehler - da hilft auch nichts kleinzureden !
Aha, aber maßlos überbewerten soll okay sein, gut, wenn du diese extrem seltenen Anwendungsfälle ausführst ist das natürlich verständlich, wenn nur eine elitäre kleine Gruppe überhaupt weiß wie man diesen Fehler reproduzieren kann muss man natürlich Zeter und Mordio schreien...
 
Aha, aber maßlos überbewerten soll okay sein, gut, wenn du diese extrem seltenen Anwendungsfälle ausführst ist das natürlich verständlich, wenn nur eine elitäre kleine Gruppe überhaupt weiß wie man diesen Fehler reproduzieren kann muss man natürlich Zeter und Mordio schreien...

Wo ?
 
Was wo, manche wollen den Fehler einfach übertrieben darstellen bzw überbewerten sodass es in ihr Firmenkampf-Weltbild hinein passt, ich bin da eher gelassen und sehe mir die Realität an als aus einen Fliegenschiss ein Elefanten der Durchfall hat zu machen ;)
 
Was wo, manche wollen den Fehler einfach übertrieben darstellen bzw überbewerten sodass es in ihr Firmenkampf-Weltbild hinein passt, ich bin da eher gelassen und sehe mir die Realität an als aus einen Fliegenschiss ein Elefanten der Durchfall hat zu machen ;)

Ach so , nee hab alle beide Firmen am laufen, daran kann es nicht liegen :lol:
 
Ich bin ja auch nicht mal ansatzweise von dem Fehler betroffen, da ich diesen extrem seltenen Anwendungsfall nicht betreibe, nach manchen Beiträgen zu urteilen aber doch einige ;)
 
Dieser Multimilliarden Konzern strauchelt aber ganz schön. ... Jetzt auch noch einen HT Bug, der Leistungsverlust bedeutet und das alles für einen überzogenen Preis. Wo Intel drauf steht, sollte man also vorsichtig sein.

Leider wird mal wieder viel zu heis gekocht... Wenn es danach geht, darfst du nämlich überall vorsichtig sein -> denn Bugs haben ALLE! Prozessoren am Markt. Bekannt und nachweislich zum Nachlesen auf den Herstellerseiten. Preise sind eh relativ und von einem Leistungsverlust ist bis dato doch auch noch nicht die Rede??


Der Fehler ist schon seit Skylake, also Jahre! vorhanden, offiziell (warum auch immer die gerade jetzt den Fehler die Runde machen lassen) ist es wohl bei Intel seit 04/2017 gelistet/publiziert, soweit mir bekannt. Die Untersuchungen nach dubiosen Fehlverhalten in gewissen Situationen laufen wohl seit Ende? letzten Jahres.

Interessant (was der News nicht zu entnehmen ist):
Es werden schon UEFI/Bios Updates ausgeliefert und, wenn mich nicht alles täuscht, sogar via OS Update das "reinfallen" in den Fehler per Microcode Update unterbunden.

Heise bspw. sprach das vor größer 14 Tagen schon an -> ohne wirklichen Rummel:
Von neuer Hoffnung, dunkler Bedrohung und dem Erwachen der Macht | c't Magazin
Dafür aber nun jetzt mit Nachdruck und allen Vorurteilen :wink:
Naja, macht mal... Ist eh zwecklos euch zur sachlichen Diskusion anzuhalten ;)

Und der hier ist auch ganz interessant um die Faktenlage etwas besser einzuschätzen:
Bug in aktuellen Intel-Prozessoren macht die Runde | heise online

Ich bin ja auch nicht mal ansatzweise von dem Fehler betroffen, da ich diesen extrem seltenen Anwendungsfall nicht betreibe, nach manchen Beiträgen zu urteilen aber doch einige ;)

Das witzige ist, ALLE!! Skylake/Kabylake CPUs seit Auslieferung, wir sprechen hier über Jahre! haben diesen Fehler bzw. hatten diesen, wenn man über welchen Weg auch immer das Update schon bekommen hat...
Ernste Frage -> wer der anwesenden hier hats bemerkt??

Und was noch interessanter ist -> Keiner hat bis dato den Spaß mal derart genau aufgearbeitet, dass man der "Meute" verständliche Fakten vorzeigen kann, also so, dass 0815 Otto Normalo einschätzen kann -> ich bin betroffen, interessiert mich oder ich bin nicht betroffen -> uninteressant. Beim VME Bug bei Ryzen hats doch auch geklappt... AMD hats abgeschalten und gut ist -> interessiert heute eh fast Keinen mehr. Hier fehlen leider aber quasi alle relevanten Infos :(
 
Das ist schon richtig. Bei Intel scheinen die Probleme aber auch ein Stück weit hausgemacht zu sein. Man hat nicht erst seit SKL-X das Gefühl, dass Intel Produkte überhastet und buggy auf den Markt wirft. Dazu eine interessante Aussage eines ehemaligen Intel Mitarbeiters:

wenn wir dann mal am zitieren sind:
On the AMD side, there might be a bug that’s as serious any recent Intel CPU bug. If you read that linked thread, you’ll see an AMD representative asking people to disable SMT, OPCache Control, and changing LLC settings to possibly mitigate or narrow down a serious crashing bug. On another thread, you can find someone reporting an #MC exception with “u-op cache crc mismatch”.
Moment, AMD macht das auch nicht besser...

Außerdem sollte man vllt. darauf hinweisen, dass dieser Blog von einem Menschen betrieben wird, der lange Zeit x86-CPUs validiert hat und außerdem wohl deutlich mehr Anwender kennt, die diese Bugs auch wirklich treffen (HPC-Bereich), als der gemeine Forenuser. Da die meisten dieser Bugs eben auch nur bei entsprechender Nutzung der entsprechenden Features auftreten, ist es auch sehr einfach zu erklären, warum dort nur Intel erwähnt wird – was er übrigens auch schreibt:
The fault into microcode infinite loop also affects AMD processors, but basically no one runs a cloud on AMD chips. I’m pointing out Intel examples because Intel bugs have higher impact, not because Intel is buggier. Intel has a much better track record on bugs than AMD.
 
Zuletzt bearbeitet:
Is ja schön und gut. Du bist trotzdem völlig off-topic. Hier geht's nicht um AMD. Da hilft es auch nicht, Meinungen des Autors zu posten. Diese haben für die Faktenlage keinerlei Relevanz.
 
Zuletzt bearbeitet:
Damit wir mal die Faktenlage zusammenfassen: https://www3.intel.com/content/dam/www/public/us/en/documents/specification-updates/desktop-6th-gen-core-family-spec-update.pdf#page=17 → Skylake hatte bis jetzt 150-"Bugs" (darunter doch einige mit System-Hang, etc.), der hier hochgekochte war schon im April bekannt.

Jetzt darfst du natürlich gerne Dan Luus Blog zitieren, um zu belegen, dass "Intel Produkte überhastet und buggy auf den Markt wirft"...
Allerdings ist es dann ganz und gar nicht OT, einmal zu fragen, wieso das jetzt daraus in Zusammenhang mit diesem Bug hervor geht, wenn a) überall am Markt Bugs auftreten (und die Quelle auch feststellt, dass das eben bei anderen Herstellern nicht wirklich rauskommt – niemand in dem Bereich nutzt nämlich AMD (die einzige Konkurrenz, die dieses Forum interessiert) und für Power,Sparc und China-MIPS gibt's derartige Listen wohl nicht öffentlich) und b) die dort beschriebenen Änderungen sicher nicht an einzelnen Bugs festzumachen sind.
Komm damit einfach wieder, wenn die Überschrift lautet: "5x so viele Errata für Skylake im Vergleich zu Nehalem", denn so ist das a) einfach eine seltsame Troll/FUD-Strategie oder b) du hast dich vorher einfach nicht mit der Sache auseinandergesetzt (die Tatsache, dass der Post ja jetzt weg ist, deutet darauf hin :)).
 
Jetzt darfst du natürlich gerne Dan Luus Blog zitieren, um zu belegen, dass "Intel Produkte überhastet und buggy auf den Markt wirft"...
Wieso sollte ich das belegen? Ich habe das nie als Fakt hingestellt. Vielleicht solltest du zusammenhängende Sätze zitieren, damit du Aussagen nicht aus dem Kontext reisst. ;)

Allerdings ist es dann ganz und gar nicht OT, einmal zu fragen, wieso das jetzt daraus in Zusammenhang mit diesem Bug hervor geht ...
Doch, es ist völlig off-topic, wenn du AMD als Ausrede vorschiebst, um Intels Bugs schönzureden. Oder glaubst du alle sind hier so naiv, um das nicht zu sehen? Hier geht's um den Intel HTT Bug und um nichts anderes. AMD Bugs kannst du gerne in einem anderen Thread diskutieren.

und die Quelle auch feststellt, dass das eben bei anderen Herstellern nicht wirklich rauskommt – niemand in dem Bereich nutzt nämlich AMD
Der Typ behauptet, dass zB ein "fault into microcode infinite loop" Bug genauso bei AMD auftreten könne, liefert aber keine Quelle dafür. Weiterhin behauptet er, dass Intel weniger Bugs hätte bzw damit seriöser umgeht. Das ist genauso unbelegt. Es ist und bleibt lediglich seine Meinung. Um es mal vorsichtig auszudrücken. Das können wir also getrost ignorieren und beschränken uns auf Fakten.

du hast dich vorher einfach nicht mit der Sache auseinandergesetzt (die Tatsache, dass der Post ja jetzt weg ist, deutet darauf hin :)).
Der Beitrag ist nicht weg. Du solltest dir vielleicht angewöhnen, im richtigen Thread zu zitieren. Anscheinend solltest du dich mit einigen Sache mal näher auseinandersetzen. ;) Aber dass du gleich wieder mit der "Troll/FUD" Keule kommst, nur weil man mal einige Insider Aussagen gepostet hat, die einige sicherlich interessant finden dürften, zeigt eigentlich nur deine Dünnhäutigkeit, und dass du hier gar nicht sachlich und objektiv argumentieren willst.
 
hm, das mit dem threadübergreifenden Zitat ist in der Tat dumm gelaufen (hatte allerdings auch eine komische Fehlermeldung in der Art "diese Operation ist nicht erlaubt, weil der Beitrag nicht existiert". Schön mit escapten "\n\n").

Ansonsten: klar hat AMD erstmal nichts damit zu tun, es ist allerdings auch nicht so, dass dieser Bug jetzt irgendwie etwas besonderes wäre (solche hat jede CPU-Generation) und einzeln ist das ehrlich gesagt noch weniger ein Beleg für die These des Herrn bei Intel und die Management-Probleme? Ich will das nicht "schön reden", aber DIE Manifestation von Mißmanagement ist Bug #150 jetzt wohl auch nicht.

Was dann im übrigen SKL-X damit zu tun haben, kann ich mir auch nicht so genau erklären – grobes Mißmanagement sehe ich da noch keines (zumindest bis die Xeon-Plattform gg. reale Epycs Marktanteile verliert, weil man iwo sparen wollte :?). Problem ist halt, dass die ganzen Spieler hier nicht das OC, singlethread und Kühlwunder bekommen haben, das sie sich in ihren feuchten Träumen vorgestellt haben und deswegen rumjammern. Intel ist eben doch ein ganz normales kapitalistisches Großunternehmen, das weder die Gesetze der Physik außer Kraft setzen kann noch jahrelang die großen Fortschritte (die physikalisch einfach nicht möglich sind) konspirativgeheim gehalten hat....

Und ehrlich gesagt finde ich deinen Umgang mit Quellen schon lustig. Der Belegs-Reddit, den Dan Luu dort anführt, aber nicht verifizieren kann (du glaube ich auch nicht...), ist Tatsache, seine Aussage, dass das ja eigentlich immer noch im Rahmen ist/war nur Meinung. Ich zitiere mal die Einschätzung zu deinen Fakten:
I haven’t been able to confirm this story from another source I personally know, although another anonymous commenter said “I left INTC in mid 2013. From validation. This … is accurate compared with my experience.” Another anonymous person, someone I know, didn’t hear that speech, but found that at around that time, “velocity” became a buzzword and management spent a lot of time talking about how Intel needs more “velocity” to compete with ARM, which appears to confirm the sentiment, if not the actual speech.
Achso, die Dinge, die jemand mal gesagt hat, von dem man gar nicht weiß, dass er der ist, der er vorgibt zu sein, sind eine sinnvolle Quelle, aber die Einschätzung von jemandem, der 10a Bugs in CPUs gesucht hat, ist nur eine "unbelegte" Meinung "um es mal vorsichtig auszudrücken"?!? Ernsthaft?
 
Zuletzt bearbeitet:
Wen juckt es? Der 6700k läuft seit fast 2 Jahren stabil. Außerdem soll der Fehler durch ein Microcode-Update behebbar sein. Ob die Hersteller nachliefern sei dahingestellt. Geht auch ohne.
 
Ansonsten: klar hat AMD erstmal nichts damit zu tun, es ist allerdings auch nicht so, dass dieser Bug jetzt irgendwie etwas besonderes wäre
Hat ja auch niemand behauptet. Bug bleibt trotzdem Bug. Und gerade wenn er mit einer essentiellen Funktion der CPU in Verbindung steht, wie hier mit HTT, dann sollte man das auch seriös zur Kenntnis nehmen und nicht einfach wegreden, indem man mit dem Finger auf andere zeigt.

Und ehrlich gesagt finde ich deinen Umgang mit Quellen schon lustig. Der Belegs-Reddit, den Dan Luu dort anführt, aber nicht verifizieren kann (du glaube ich auch nicht...), ist Tatsache, seine Aussage, dass das ja eigentlich immer noch im Rahmen ist/war nur Meinung. Ich zitiere mal die Einschätzung zu deinen Fakten:

Achso, die Dinge, die jemand mal gesagt hat, von dem man gar nicht weiß, dass er der ist, der er vorgibt zu sein, sind eine sinnvolle Quelle, aber die Einschätzung von jemandem, der 10a Bugs in CPUs gesucht hat, ist nur eine "unbelegte" Meinung "um es mal vorsichtig auszudrücken"?!? Ernsthaft?
Vielleicht kannst du das nochmal auf Deutsch schreiben. Dieses Kauderwelsch ist ja kaum zu verstehen. Dein Zitat belegt übrigens die Aussagen des ehemaligen Intel Mitarbeiters. Und ja, die Meinung des Autors bleibt seine Meinung.


Intel vs. AMD, Akt 2: Skylake-X und Kaby-Lake-X im Test gegen Ryzen - Hardwareluxx

Hat das etwas mit dem HT Fehler zu tun ? Warum ist die CPU ohne HT am schnellsten ?
Wenn's kein Messfehler ist, dann könnte es wirklich was mit SMT/HTT zu tun haben. Das muss aber nichts mit einem Bug zu tun haben. Es ist ja keine Neuigkeit, dass SMT gerade bei Spielen mitunter niedrigere FPS zur Folge haben kann.
 
Hat ja auch niemand behauptet. Bug bleibt trotzdem Bug. Und gerade wenn er mit einer essentiellen Funktion der CPU in Verbindung steht, wie hier mit HTT, dann sollte man das auch seriös zur Kenntnis nehmen und nicht einfach wegreden, indem man mit dem Finger auf andere zeigt.

nur gab es ungefähr schon mindestens 10 andere Bugs "in Zusammenhang mit essentiellen Funktionen". Natürlich kann man sagen, dass das evtl. kein Einzelfall ist und den Blogpost als Beleg nehmen, aber was genau der Zusammenhang mit SKL-X ist, sehe ich auf den ersten Blick nicht (zumindest wurde ja gestern die Sau mit der Stromversorgung afaik noch nicht durchs Dorf getrieben).


Vielleicht kannst du das nochmal auf Deutsch schreiben. Dieses Kauderwelsch ist ja kaum zu verstehen. Dein Zitat belegt übrigens die Aussagen des ehemaligen Intel Mitarbeiters. Und ja, die Meinung des Autors bleibt seine Meinung.

Das ist Deutsch, bei der Satzergänzung mit deinem Zitat fehlt wohl ein Komma, tut mir leid, wenn das deinen Sprachprozessor aus dem Takt bringt.

Ich glaube du verstehst es einfach nicht, daher in Stichpunkten:
1) jemand hat auf Reddit behauptet Intel Mitarbeiter zu sein und behauptet, das Testteam wurde verkleinert
2) Dan Luu (Experte, weiß vermutlich etwas mehr über CPUs, als du...) schreibt einen Blogpost über die vielen kleinen Bugs, die in CPUs auftreten, es werden immer mehr, weil die Komplexität steigt
3) Dan Luu referenziert 1, als "könnte was dran sein"-Behauptung, um 2) zu unterstützen
4) er stellt noch fest, dass jedes Produkt Bugs hat (und bringt ein paar Beispiele, außerdem findet man mangels Existenz der entsprechenden Nutzungsszenarien eher wenig Anwendungen, die diese Bugs triggern)

und jetzt erklär' mir mal, warum die anonyme Behauptung aus 1) mehr Wert ist, als die Expertenmeinung aus 2) (ohne die du nie auf 1) gekommen wärst, geschweige denn irgendetwas mehr als ein Gerücht daraus hättest zitieren können)
 
nur gab es ungefähr schon mindestens 10 andere Bugs "in Zusammenhang mit essentiellen Funktionen". Natürlich kann man sagen, dass das evtl. kein Einzelfall ist und den Blogpost als Beleg nehmen, aber was genau der Zusammenhang mit SKL-X ist, sehe ich auf den ersten Blick nicht (zumindest wurde ja gestern die Sau mit der Stromversorgung afaik noch nicht durchs Dorf getrieben).
Was willst du denn ständig mit SKL-X? Ich kann im Startbeitrag nirgendwo lesen, dass der Thread ausschliesslich dem SKL-X gewidmet wäre.

und jetzt erklär' mir mal, warum die anonyme Behauptung aus 1) mehr Wert ist, als die Expertenmeinung aus 2)
Wieso sollte ich das tun? Ich sehe da keinen Widerspruch. Wie ich zuvor schon schrieb, es untermauert die Geschichte des ehemaligen Intel Mitarbeiters, dass intern Druck gemacht wurde, um Zeitpläne zu stauchen, auf Kosten der Validierung.
 
Seitdem ich diese News zu dem Albtruam bug gelesen habe weiss ich auch warum mein 6700K ständig mit diffusen Fehlermeldungen abstürzte.
HyperThreading aus und seit dem läuft er stabil auch mit XMP an...

Hoffe MSI bringt da für mein Z170er nochrecht zeitnah ein Biosupdate.
 
Euer CPU und/oder RAM OC wurde aber auch richtig auf Stabilität getestet?
 
Euer CPU und/oder RAM OC wurde aber auch richtig auf Stabilität getestet?

CPU OC = nicht vorhanden
RAM OC irrelevant, da die Fehler auch mit non-OC und anderem RAM kommen.

ohne HT habe ich weiterhin keine Fehler...
 
Bei welchen Anwendungen traten denn die „diffusen Fehlermeldungen“ hauptsächlich auf? Würde gerne versuchen dies zu reproduzieren.
 
Ich habe 3 Rechner mit Sky und Kabylake Prozessoren. Davon ein Notebook mit dem ich viel virtualisiert habe und ein PC der seit über ein Jahr als Server 24/7 läuft. Bis auf ein paar nachvollziehbare Abstürze bei Medien Wiedergabe, noch keinerlei Probleme,
 
Zuletzt bearbeitet:
Das ist das Problem die Fehler sind nicht reproduzierbar.
Mal kommt der Desktopmanager mit einer Speicherfehlermeldung, mal Winamp das die Datenbank korrumpiert wäre, dann kackt Firefox ohne ersichtlichen Grund ab (das ist noch das regelmäßigste)...

Hab heute eine IRQ not less or equal Bluescreen gehabt, wo der her kam hab ich noch nicht analysiert.
Aber wahrscheinlich ein Treiber von einem Emulationsprogramm.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh