NEWS

Schadenbilder und Fehleranalyse

Aufnahmen zeigen Defekte in Ryzen-Prozessoren

Portrait des Authors


Aufnahmen zeigen Defekte in Ryzen-Prozessoren
286

Werbung

In den vergangenen Wochen dominierte das Thema der defekten Ryzen-7000-Prozessoren die Netzwelt. AMD hat gemeinsam mit seinen Mainboard-Partnern neue AGESA-, bzw. BIOS-Versionen veröffentlicht, welche zu hohe Spannungen reduzieren sollten – ob letztendlich aber auch die Ursache einer fehlerhaften Temperaturüberwachung beseitigt wurde, ist noch immer nicht bekannt. AMD hat auf unsere Fragen nicht geantwortet und die Kommunikation ist im Bereich der Änderungen durch eine neue AGESA-Version eher mangelhaft.

Die Kollegen von GamersNexus haben einen defekten Prozessor an ein Fehler-Analyselabor geschickt, die diesen mittels verschiedener Methoden untersucht haben. Letztendlich kann man den genauen Fehler zwar in einem gewissen Bereich auf eine zu hohe Spannung zurückführen, warum es aber letztendlich dazu kommt, dies kann letztendlich sicherlich nur AMD beantworten, denen zudem noch andere Möglichkeiten zur Verfügung stehen und die auch das Gesamtsystem und die Vorgaben in der Fertigung besser kennen.

Die Bilder sind jedoch beeindruckend und zeigen das Schadensbild recht deutlich.

Die Bilder der defekten Prozessoren kennen wir bereits und sind wie oben zu sehen mal mehr und mal weniger deutlich zu erkennen. Obiges Beispiel ist eines der extremeren und hat das verwendete Mainboard, bzw. den Sockel ebenfalls zerstört, es gibt aber auch Fälle, in denen nur der Prozessor defekt war.

An dieser Stelle dann gleich der Hinweis, bzw. die Empfehlung, sich das aktuellste BIOS zu installieren und auf zu hohe SoC-Spannungen zu verzichten. Wer auf der Suche nach dem neusten BIOS ist, sollte einen Blick in den AM5 AGESA/UEFI/BIOS Info & Laberthread werfen und findet dort von allen Herstellern Tabellen, in denen die BIOS-Versionen nach Modell sortiert vorzufinden sind. Hier findet man dann den Hinweis, welche AGESA als Basis der BIOS-Version dient.

Die schon äußerlich sichtbaren Schäden sind in den Röntgenaufnahmen ebenfalls sichtbar und zeigen die defekten Verbindungen im Substrat und PCB, welches über die Kontakt-Pads die Verbindung zum Sockel herstellt. In einem nächsten Schritt wurde der Prozessor an der defekten Stelle zerschnitten, um sich diesen Bereich in einem Querschnitt anzuschauen.

Der rötliche Bereich ist das Substrat, nach unten hin gerichtet befindet sich der Sockel. Oben in grau ist der CCD zu erkennen. Die helleren Linien sind Kupferleiterbahnen, welche die Verbindungen zwischen den Kontakt-Pads sowie den BGAs am Chip selbst herstellen. Hier sind bereits massive mechanische Deformierungen zu erkennen. Die BGAs zwischen dem Substrat und dem Silizium des Chips sind teilweise komplett verformt oder gar nicht mehr zu erkennen. Der Underfill fehlt teilweise komplett, was auf hohe Temperaturen und Kräfte schließen lässt.

Die Beschädigungen setzen sich durch das Substrat fort und zeigen sich dann in den untersten Schichten entsprechend, wie sie dann im ersten Bild zu sehen sind.

Der Querschnitt im Rasterelektronenmikroskop sieht wie oben dargestellt und mit einigen Beschriftungen versehen aus. Rot markiert ist der CCD, darüber sitzt in der rechten Bildhälfte der zusätzliche SRAM in Form des 3D-V-Cache-Chips. Links ist ein "Structural Silicon" zu erkennen, welches die Höhe zwischen dem Bereich mit und ohne dem 3D-V-Cache-Chip ausgleicht. Darüber befindet sich ein weiteres Structural Silicon, auf dem wiederum dann letztendlich der Heatspreader aufsitzt. Die µBumps stellen den Kontakt zwischen dem CCD und dem Substrat und letztendlich auf Package-Ebene mit dem Sockel her.

An einer defekten Stelle sieht man die Schäden recht deutlich. Die µBumps sind vollständig zerstört, die runter und darüber liegenden Strukturen sind in Mitleidenschaft gezogen worden. Wenn man sich nun verdeutlicht, dass die eigentlichen Transistor-Ebenen noch um ein Vielfaches kleiner sind, machen die Beschädigungen, die sich bis in den Chip ziehen, auch deutlich, dass die Hardware nicht mehr funktionsfähig sein kann.

Die Beschädigungen sind allerdings nicht nur direkt an den größeren Schadstellen zu erkennen, sondern zudem in anderen Bereichen. Zwischen dem CCD- und dem 3D-V-Cache-Die sind die Beschädigungen zu erkennen. Die TSVs vom CCD zum 3D-V-Cache sowie die Ebene mit den Transistoren haben wir dennoch einmal markiert, um auch die Größenverhältnisse der schadhaften Stelle zu verdeutlichen.

Langzeitschäden zu befürchten

AMD hat eine zu hohe Spannung als Hauptursache identifiziert. Zusammen mit seinen Mainboard-Partnern arbeitet man an einer Problemlösung, die in Form mehrerer BIOS-Updates bereits verteilt wurden.

Die Große Frage ist nun, ob auch solche Prozessoren, die bisher noch keinen Defekt aufweisen, langfristig Beschädigungen aufweisen können. Der Defekt fängt im Kleinen an, Leckströme vergrößern die Auswirkungen und fehlhafte Schutzmechanismen schützen die Hardware nicht vor dem Totalausfall.

Aber auch diese Frage kann letztendlich nur AMD beantworten. Panikmache ist ebenso fehl am Platz, wie zu sagen, dass bei nur wenigen Defekten (wie viele es letztendlich sind, wissen wir gar nicht) solche Maßnahme und eine derartige Berichterstattung gerechtfertigt sind. Dies zeigte sich schon bei NVIDIAs 12VHPW-Desaster, den fehlhaften Kühlern der Radeon RX 7900 XTX im MBA-Design und nun bei den Ryzen-7000-Prozessoren.

Datenschutzhinweis für Youtube



An dieser Stelle möchten wir Ihnen ein Youtube-Video zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Youtube setzt durch das Einbinden und Abspielen Cookies auf ihrem Rechner, mit welchen Sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf den Play-Button. Das Video wird anschließend geladen und danach abgespielt.

Ihr Hardwareluxx-Team

Youtube Videos ab jetzt direkt anzeigen