Dual Opteron "resettet sich"

H_M_Murdock

Urgestein
Thread Starter
Mitglied seit
29.10.2007
Beiträge
8.838
Ort
München
Hi zusammen,

ich hab seit einiger Zeit Probleme mit meinem Dual Opteron System.

Teilweise geht das System einfach mitten drin aus und startet neu.
Bluescreen ist es keiner, der Automatische Neustart ist ausgeschaltet.
Netzteil und Grafikkarte hab ich schon getauscht.

In der Windows Eventlog steht nichts, in der BIOS Eventlog auch nicht.

Ich hab derzeit folgende Hardware drin:
- Fujitsu Siemens D1692 (ist in der Siemens Celsius V810 verbaut, nahezu baugleich mit dem Tyan Thunder K8W)
- 2x Opteron 248 2,2 GHz Singlecore S940
- 4x 1 GB Reg. DDR 400 Micron RAM
- Geforce 4 Ti 4200 (vorher Geforce 6800)
- WD1600SD am Onboard SATA Controller
- Enermax Pro 82+ 385W
- Windows XP Pro 32 Bit

Vielleicht hat ja von euch wer ne Idee was da los sein könnte.

EDIT: Einen frischen Anhaltspunkt kann ich euch noch liefern.

Wenn ich in Prime den Test In-Place Large FFTs laufen lass geht das locker 10 min gut (länger hab ich jetzt nicht testen wollen),
wenn ich aber den "Blend" test laufen lass kackt er innerhalb von 10 Sekunden ab.

Nochmal Edit:

Ich hab jetzt mal angefangen Stückweise den RAM auszubauen und jeweils mit dem Blend Test im Prime zu testen.
Bei CPU 1 und 2 sind jeweils Bank 1 und 2 belegt, der Rest ist leer. Alles die gleichen 1 GB Module von Micron.

1. Schritt:
Module aus Beiden Bänken bei CPU2 raus: Absturz

2. Schritt:
Modul aus Bank 2 bei CPU1 raus: kein Absturz

3. Schritt: Modul aus Bank1 bei CPU1 (das letzte verbliebene) raus und dafür das rein was vorher bei CPU1 Bank2 steckte (also das was als letztes noch drin war als es nicht ging) weil ich annahm das wäre dann wohl defekt: läuft

4. Schritt: Eines der beiden Module die bei CPU2 drin waren in Bank 2 bei CPU1: läuft

Ich teste das jetzt noch noch ein wenig, wenn's so ne Weile läuft kommt das letzte Modul wieder rein bei CPU2 Bank2, wenn's dann wieder zum Absturz kommt probier ich das letzte Modul mal einzeln aus.
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
also die symptome laufen meiner meinung nach eindeutig auf nen speicherproblem raus.
hast du mal die ECC modi aktiviert und in den bios fehler log geschaut?
ansonsten mit memtest mehrere runs einzeln die module durchtesten
 
ECC war an und in der Fehlerlog im BIOS stand nichts drin.
Hab ECC jetzt zum testen extra mal deaktiviert und jetzt gehts, auch wenn alle Riegel wieder drin sind.

Ich werd jetzt den Abend mal Prime vor sich hin laufen lassen und dann werd ich berichten was passiert ist.
 
nuja, prime is wohl nich so effektiv, das beste wäre wirklich nen dedizierten memtest rennen zu lassen.
sprich memtest

kannst den ja einfach mal über nacht mit allen 4 riegeln laufen lassen, dass sollte dir schonmal nen grundlegendes bild geben, inwieweit das system da probleme macht.
 
Ja ich werd Memtest mal 2 Tage übers WE laufen lassen wenn ich nicht da bin.

Bei Prime ist er halt teilweise schon nach 10 Sekunden komplett abgeschmiert.
 
Die Temps scheinen OK zu sein.
Laut HWMon haben die Cores der beiden CPUs jeweils 53 °C und 42 °C (Prime Volllast, CPU1 mit AMD Boxed Kühler und nem langsamen Lüfter drauf, CPU2 mit Scythe Mugen, drum die stark unterschiedlichen Temps).
 
und sonst irgendwelche hitzepools?
grade der chipsatz könnt da noch interessant werden!
 
HWMon kann sonst nur 2 Temps auslesen die aber nicht genau benannt sind:
TMPIN0 hat 29 °C
TMPIN1 hat 40 °C

Die AGP-Bridge und die PCI-X Bridge werden allerdings am Kühlkörper gefühlt so heiß dass man sie kaum anfassen kann.
 
probier mal dort einen luftzug hinzuführen, ggf. einfach mal einen 80mm lüfter davorhängen.
ich hatte mit nem anderem tyan board im sommer auch hitzestau probleme, wer weis, vielleicht ist das bei dir nen anhaltspunkt
 
So jetzt läuft Prime seit 9h stabil.
Was soll man davon nun halten?
Werd auf jeden Fall noch Memtest laufen lassen sobald ich mal nen Tag auf den Rechner verzichten kann.

ECC ist jetzt übrigens aus.

Was die heißen Chipsatzkomponenten betrifft könnt ich ja auf Dauer evtl. andere Kühler drauf bauen, müssten halt möglichst welche sein die nicht hoch sind (aktive von Ezotech) oder was wo der Kühler versetzt ist (von Thermalright gibt's da einen bei dem die Heatpipe erst ein Stück flach vom Kühlerboden weg geht) weil die AGP und die PCI-X Bridge direkt hinter den PCI-X Slots liegen.
Oder doch auf Dauer mal ne Wasserkühlung, sofern's entsprechende Chipsatzkühler gibt die incl. Anschlüssen nicht oder kaum höher sind als die PCI Slots.

Edit:
So, über 24h Memtest 86+ und keine Fehler.
Ich belass es jetzt mal dabei und hoff dass die Kiste keine Probleme mehr macht.
Falls doch nochmal was kommt widme ich mich mal der Chipsatzkühlung.

Nochmal Edit:
Ist jetzt leider wieder aufgetreten, und zwar keine 10 Minuten nachm einschalten.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh