Kernel NULL Referenz Pointer

_roman_

Experte
Thread Starter
Mitglied seit
05.04.2023
Beiträge
1.056
Ich bin mir noch nicht sicher wie ich dies behandeln soll.

So etwas habe ich schon länger nicht mehr gesehen.

Mit fehlerhafter xz library. https://bugs.gentoo.org/928134

Code:
Sienna_Cichlid /home/roman # zgrep MODULE_COMPRESS_XZ /proc/config.gz
CONFIG_MODULE_COMPRESS_XZ=y

Code:
Sienna_Cichlid /home/roman # head /root/dmesg_bug
[    0.000000] Linux version 6.8.2-gentoo_29_03_2024 (root@Sienna_Cichlid) (gcc (Gentoo 13.2.1_p20240210 p14) 13.2.1 20240210, GNU ld (Gentoo 2.42 p3) 2.42.0) #1 SMP PREEMPT Fri Mar 29 20:02:12 CET 2024

Kernel entweder am 29 oder 30-03-2024 gebaut

Code:
[   29.922280] BUG: kernel NULL pointer dereference, address: 0000000000000070
[   29.922871] #PF: supervisor read access in kernel mode
[   29.923459] #PF: error_code(0x0000) - not-present page
[   29.924045] PGD 0 P4D 0
[   29.924632] Oops: 0000 [#1] PREEMPT SMP NOPTI
[   29.925219] CPU: 4 PID: 191 Comm: kworker/u25:0 Not tainted 6.8.2-gentoo_29_03_2024 #1
[   29.925818] Hardware name: ASUS System Product Name/PRIME X670-P, BIOS 2413 02/04/2024
[   29.926403] Workqueue: hci0 0xffffffffc05883e0
[   29.926991] RIP: 0010:0xffffffffc071aed8
[   29.927568] Code: 48 8d 4c 24 07 65 48 8b 04 25 28 00 00 00 48 89 44 24 08 31 c0 c6 44 24 07 01 e8 73 95 eb ff 48 3d 00 f0 ff ff 48 89 c3 77 49 <83> 78 70 13 75 60 48 8b 80 c8 00 00 00 be 02 00 00 00 48 89 df 48
[   29.928180] RSP: 0018:ffffacf405087d00 EFLAGS: 00010207
[   29.928800] RAX: 0000000000000000 RBX: 0000000000000000 RCX: ffffacf405087ca0
[   29.929426] RDX: 0000000000000000 RSI: ffff88a906ea7508 RDI: ffffffffc05fab2b
[   29.930069] RBP: ffffacf405087d30 R08: ffff88a90231aab0 R09: ffff88a90231aab0
[   29.930704] R10: 0000000000000068 R11: 000000000000000a R12: ffff88a90231a000
[   29.931332] R13: ffffacf405087d8c R14: ffff88a908a4c605 R15: ffff88a9091b4180
[   29.931959] FS:  0000000000000000(0000) GS:ffff88b83db00000(0000) knlGS:0000000000000000
[   29.932589] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
[   29.933219] CR2: 0000000000000070 CR3: 0000000107218000 CR4: 0000000000750ef0
[   29.933848] PKRU: 55555554
[   29.934469] Call Trace:
[   29.935094]  <TASK>
[   29.935714]  ? 0xffffffffad00e0fe
[   29.936336]  ? 0xffffffffad046ca8
[   29.936954]  ? 0xffffffffad1ad89c
[   29.937563]  ? 0xffffffffae304110
[   29.938166]  ? 0xffffffffad1ada71
[   29.938768]  ? 0xffffffffae113cde
[   29.939366]  ? 0xffffffffae201256
[   29.939962]  ? 0xffffffffc071aed8
[   29.940552]  0xffffffffc071c3c8
[   29.941134]  0xffffffffc071e7fb
[   29.941714]  ? 0xffffffffae304110
[   29.942292]  0xffffffffc05dbce8
[   29.942868]  0xffffffffc0588462
[   29.943441]  ? 0xffffffffad1ad89c
[   29.944015]  0xffffffffad15ee9d
[   29.944584]  0xffffffffad15f2bd
[   29.945152]  ? 0xffffffffad15efd0
[   29.945712]  0xffffffffad166e90
[   29.946273]  ? 0xffffffffad166db0
[   29.946828]  0xffffffffad01720c
[   29.947407]  ? 0xffffffffad166db0
[   29.947965]  0xffffffffad0011a1
[   29.948515]  </TASK>
[   29.949060] Modules linked in: mac80211 btusb kvm_amd btrtl btbcm btmtk libarc4 btintel iwlwifi kvm bluetooth i2c_algo_bit drm_ttm_helper ttm cfg80211 drm_exec drm_suballoc_helper irqbypass r8169 sp5100_tco rapl amdxcp watchdog drm_buddy acpi_cpufreq(-) k10temp gpu_sched realtek mdio_devres i2c_piix4 drm_display_helper libphy rfkill i2c_designware_platform i2c_designware_core gpio_amdpt gpio_generic
[   29.950266] CR2: 0000000000000070
[   29.950888] ---[ end trace 0000000000000000 ]---
[   30.278654] RIP: 0010:0xffffffffc071aed8
[   30.279252] Code: 48 8d 4c 24 07 65 48 8b 04 25 28 00 00 00 48 89 44 24 08 31 c0 c6 44 24 07 01 e8 73 95 eb ff 48 3d 00 f0 ff ff 48 89 c3 77 49 <83> 78 70 13 75 60 48 8b 80 c8 00 00 00 be 02 00 00 00 48 89 df 48
[   30.279863] RSP: 0018:ffffacf405087d00 EFLAGS: 00010207
[   30.280488] RAX: 0000000000000000 RBX: 0000000000000000 RCX: ffffacf405087ca0
[   30.281121] RDX: 0000000000000000 RSI: ffff88a906ea7508 RDI: ffffffffc05fab2b
[   30.281748] RBP: ffffacf405087d30 R08: ffff88a90231aab0 R09: ffff88a90231aab0
[   30.282397] R10: 0000000000000068 R11: 000000000000000a R12: ffff88a90231a000
[   30.283055] R13: ffffacf405087d8c R14: ffff88a908a4c605 R15: ffff88a9091b4180
[   30.283715] FS:  0000000000000000(0000) GS:ffff88b83db00000(0000) knlGS:0000000000000000
[   30.284374] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
[   30.285029] CR2: 0000000000000070 CR3: 0000000107218000 CR4: 0000000000750ef0
[   30.285672] PKRU: 55555554

Kernel enweder amd 30-03 oder 31-03 gebaut (wegen der xz-utils geschichte mit downograded Version)
Code:
Sienna_Cichlid /home/roman # dmesg |head
[    0.000000] Linux version 6.8.2-gentoo_30_03_2024 (root@Sienna_Cichlid) (gcc (Gentoo 13.2.1_p20240210 p14) 13.2.1 20240210, GNU ld (Gentoo 2.42 p3) 2.42.0) #2 SMP PREEMPT Sun Mar 31 19:25:50 CEST 2024

[/code]
[ 33.523368] BUG: kernel NULL pointer dereference, address: 0000000000000070
[ 33.523811] #PF: supervisor read access in kernel mode
[ 33.524248] #PF: error_code(0x0000) - not-present page
[ 33.524682] PGD 0 P4D 0
[ 33.525114] Oops: 0000 [#1] PREEMPT SMP NOPTI
[ 33.525545] CPU: 0 PID: 189 Comm: kworker/u25:0 Not tainted 6.8.2-gentoo_30_03_2024 #2
[ 33.525982] Hardware name: ASUS System Product Name/PRIME X670-P, BIOS 2413 02/04/2024
[ 33.526416] Workqueue: hci0 0xffffffffc03903e0
[ 33.526854] RIP: 0010:0xffffffffc0522ed8
[ 33.527292] Code: 48 8d 4c 24 07 65 48 8b 04 25 28 00 00 00 48 89 44 24 08 31 c0 c6 44 24 07 01 e8 73 95 eb ff 48 3d 00 f0 ff ff 48 89 c3 77 49 <83> 78 70 13 75 60 48 8b 80 c8 00 00 00 be 02 00 00 00 48 89 df 48
[ 33.527751] RSP: 0018:ffffa23ac5077d00 EFLAGS: 00010207
[ 33.528221] RAX: 0000000000000000 RBX: 0000000000000000 RCX: ffffa23ac5077ca0
[ 33.528692] RDX: 0000000000000000 RSI: ffff999f472979a0 RDI: ffffffffc0402b2b
[ 33.529159] RBP: ffffa23ac5077d30 R08: ffff999f434f6ab0 R09: ffff999f434f6ab0
[ 33.529630] R10: 0000000000000068 R11: 000000000000000a R12: ffff999f434f6000
[ 33.530101] R13: ffffa23ac5077d8c R14: ffff999f4bc04c05 R15: ffff999f48f34900
[ 33.530574] FS: 0000000000000000(0000) GS:ffff99ae7da00000(0000) knlGS:0000000000000000
[ 33.531044] CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
[ 33.531516] CR2: 0000000000000070 CR3: 000000022aa28000 CR4: 0000000000750ef0
[ 33.531995] PKRU: 55555554
[ 33.532463] Call Trace:
[ 33.532931] <TASK>
[ 33.533393] ? 0xffffffff8800e0fe
[ 33.533854] ? 0xffffffff88046ca8
[ 33.534314] ? 0xffffffff881ad89c
[ 33.534776] ? 0xffffffff89304110
[ 33.535231] ? 0xffffffff881ada71
[ 33.535683] ? 0xffffffff89113cde
[ 33.536132] ? 0xffffffff89201256
[ 33.536577] ? 0xffffffffc0522ed8
[ 33.537019] 0xffffffffc05243c8
[ 33.537460] 0xffffffffc05267fb
[ 33.537896] ? 0xffffffff89304110
[ 33.538330] 0xffffffffc03e3ce8
[ 33.538761] 0xffffffffc0390462
[ 33.539191] ? 0xffffffff881ad89c
[ 33.539617] 0xffffffff8815ee9d
[ 33.540042] 0xffffffff8815f2bd
[ 33.540468] ? 0xffffffff8815efd0
[ 33.540890] 0xffffffff88166e90
[ 33.541310] ? 0xffffffff88166db0
[ 33.541729] 0xffffffff8801720c
[ 33.542144] ? 0xffffffff88166db0
[ 33.542558] 0xffffffff880011a1
[ 33.542970] </TASK>
[ 33.543380] Modules linked in: mac80211 btusb kvm_amd btrtl btbcm btmtk libarc4 btintel kvm iwlwifi bluetooth i2c_algo_bit drm_ttm_helper cfg80211 ttm irqbypass drm_exec r8169 sp5100_tco drm_suballoc_helper rapl watchdog amdxcp drm_buddy acpi_cpufreq(-) gpu_sched realtek mdio_devres k10temp libphy i2c_piix4 drm_display_helper rfkill gpio_amdpt i2c_designware_platform gpio_generic i2c_designware_core
[ 33.544291] CR2: 0000000000000070
[ 33.544734] ---[ end trace 0000000000000000 ]---
[ 35.687255] Bluetooth: hci0: command 0xfc01 tx timeout
[ 35.687256] clocksource: Long readout interval, skipping watchdog check: cs_nsec: 2536642653 wd_nsec: 2536640480
[ 35.958452] RIP: 0010:0xffffffffc0522ed8
[ 35.958888] Code: 48 8d 4c 24 07 65 48 8b 04 25 28 00 00 00 48 89 44 24 08 31 c0 c6 44 24 07 01 e8 73 95 eb ff 48 3d 00 f0 ff ff 48 89 c3 77 49 <83> 78 70 13 75 60 48 8b 80 c8 00 00 00 be 02 00 00 00 48 89 df 48
[ 35.959331] RSP: 0018:ffffa23ac5077d00 EFLAGS: 00010207
[ 35.959785] RAX: 0000000000000000 RBX: 0000000000000000 RCX: ffffa23ac5077ca0
[ 35.960247] RDX: 0000000000000000 RSI: ffff999f472979a0 RDI: ffffffffc0402b2b
[ 35.960710] RBP: ffffa23ac5077d30 R08: ffff999f434f6ab0 R09: ffff999f434f6ab0
[ 35.961185] R10: 0000000000000068 R11: 000000000000000a R12: ffff999f434f6000
[ 35.961665] R13: ffffa23ac5077d8c R14: ffff999f4bc04c05 R15: ffff999f48f34900
[ 35.962142] FS: 0000000000000000(0000) GS:ffff99ae7da00000(0000) knlGS:0000000000000000
[ 35.962613] CS: 0010 DS: 0000 ES: 0000 CR0: 0000000080050033
[ 35.963089] CR2: 0000000000000070 CR3: 00000001017aa000 CR4: 0000000000750ef0
[ 35.963558] PKRU: 55555554

[/code]


Interessant finde ich, dass sich dies wiederholt: BUG: kernel NULL pointer dereference, address: 0000000000000070

Maßnahme 1
Ich werde mal ein dowgrade machen der Kernel Version: sys-kernel/gentoo-sources-6.6.23:6.6.23::gentoo Laut https://kernel.org ist dies der aktuelle longterm Kernel.

Maßnahme 2
Kernel Compression von Initramfs, Module, Kernel auf etwas anderes als LZMA oder XZ ändern.

Maßnahme 3
Initramfs neu erstellt aufgrund möglicherweise Schadhaften / Schadcode in XZ Komprimierung.

genkernel für die Erstellung des initramfs kann mit GZIP nicht umgehen. ZSTD ausgewaehlt.


--

Sehr selten crasht mir irgendein Prozess. Das Verhalten habe ich in den letzten 2 Monaten beobachtet. ~1 Crash alle 2 Wochen.
"Stock" XMP Profil vom Ram hat auch keine Abhilfe geschafft. Das hatte ich schon durchprobiert vor einigen Tagen.

Ich sehe nicht viel Unterschied zwischen 5600 MT XMP Profil (inkl aller XMP Einstellungen), 6200er eigen erstellten RAM Profil, und dem etwas nachgelassenen 6000er MT Profil. Sehr lange war die Kiste "problemlos" mit selbst erstellten 6000er Profil mit einer anderen UEFI Version.

--

Vermutung: Intel WLAN crasht selten aber öfters seit einigen Monaten. Beginn vermutlich ab November 2023. Hierbei gab es immer eine andere linux-firmware / andere kernel-Version / andere kernel .config / anderer userspace

Könnte auch die WLAN Komponente betroffen sein. https://lkml.org/lkml/2020/1/7/116

--

Momentan Test mit neuem Initramfs und einer anderen Kernel Version mit anderer Komprimierung. Abwarten ob es wieder auftritt.

--

Wie finde ich den Verursacher? In der perfekten Welt könnte ich feststellen, diese eine Maßnahme, diese eine Kernel Version oder diese eine UEFI Wert ist für diesen Crash verantwortlich.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh