您尚未登录。

#1 2022-09-21 21:21:39

jiang8121
会员
注册时间: 2022-09-21
帖子: 3

ArchLinux无故死机

Archlinux系统在安装完docker版的wallabag后,不知道何种原因,导致一直死机,CPU占用率特别高,怎么查看问题所在?

第一步:先停止运行wallabag容器,无法解决;
第二步:在删除wallabag镜像,无法解决;
第三步:删除软件docker,仍无法解决。

查看日志:
# journalctl -xe

输出结果:
9月 21 21:25:08  kernel: psmouse serio1: VMMouse at isa0060/serio1/input0 lost synchronization, throwing 1 bytes away.
9月 21 21:25:35  kernel: watchdog: BUG: soft lockup - CPU#1 stuck for 22s! [ksoftirqd/1:25]
9月 21 21:25:35  kernel: Modules linked in: rpcrdma vsock_loopback vmw_vsock_virtio_transport_common rdma_cm iw_cm ib_cm vmw_vsock_vmci_transport vsock ib_core cfg80211 8021q g
9月 21 21:26:09  kernel: Unloaded tainted modules: hv_vmbus():1 intel_tcc_cooling():1 intel_tcc_cooling():1 intel_tcc_cooling():1 intel_tcc_cooling():1 intel_cstate():1 intel_cst>
9月 21 21:26:12  kernel: CPU: 1 PID: 25 Comm: ksoftirqd/1 Not tainted 5.19.9-arch1-1 #1 3da5a84b9442a05cd5bc412feaf8d6ab31862ed4
9月 21 21:26:13  kernel: Hardware name: VMware, Inc. VMware Virtual Platform/440BX Desktop Reference Platform, BIOS 6.00 07/22/2020
9月 21 21:26:13  kernel: RIP: 0010:e1000_xmit_frame+0x7b1/0xfb0 [e1000]
9月 21 21:26:14  kernel: Code: c5 c8 ff ff 65 8a 05 d8 8e 92 3f 84 c0 0f 85 22 02 00 00 48 8b 7c 24 08 41 0f b7 47 2a 41 8b 57 18 48 03 87 48 0e 00 00 89 10 <31> c0 48 8b 54 24 5>
9月 21 21:26:16  kernel: RSP: 0000:ffff9920804f76c8 EFLAGS: 00010286
9月 21 21:26:16  kernel: RAX: ffff992082fc3818 RBX: ffff8aab1b17c000 RCX: 00000000000000c1
9月 21 21:26:29  kernel: RDX: 00000000000000c1 RSI: ffff8aab0424b500 RDI: ffff8aab1b17c000
9月 21 21:26:30  kernel: RBP: 0000000000000009 R08: ffff8aab1b17c000 R09: 0000000000000000
9月 21 21:26:33  kernel: R10: 00000000bda7c000 R11: 91290c007b5776c8 R12: 00000000000000c0
9月 21 21:26:35  kernel: R13: ffff99208062fe00 R14: 0000000000000000 R15: ffff8aab0424b500
9月 21 21:26:38  kernel: FS:  0000000000000000(0000) GS:ffff8aabf6e40000(0000) knlGS:0000000000000000
9月 21 21:26:38  kernel: CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033
9月 21 21:26:47  kernel: CR2: 000055936f8b33bc CR3: 0000000124740002 CR4: 00000000003706e0
9月 21 21:26:48  kernel: Call Trace:
9月 21 21:26:51  kernel:  <TASK>
9月 21 21:27:02  kernel:  dev_hard_start_xmit+0x64/0x1d0
9月 21 21:27:02  kernel:  sch_direct_xmit+0xa4/0x370
9月 21 21:27:04  kernel:  __dev_queue_xmit+0xa4c/0xdc0
9月 21 21:27:04  kernel:  ? eth_header+0x2a/0xc0
9月 21 21:30:44  kernel:  __ip_queue_xmit+0x175/0x420
9月 21 21:30:44  kernel:  __tcp_transmit_skb+0x9f6/0xbd0
9月 21 21:30:44  kernel:  tcp_v4_do_rcv+0x14d/0x280
9月 21 21:30:44  kernel:  tcp_v4_rcv+0xdc1/0xef0
9月 21 21:30:44  kernel:  ip_protocol_deliver_rcu+0x36/0x210
9月 21 21:30:44  kernel:  ip_local_deliver_finish+0x76/0xa0
9月 21 21:30:44  kernel:  ip_sublist_rcv_finish+0x7e/0x90
9月 21 21:30:44  kernel:  ip_sublist_rcv+0x183/0x230
9月 21 21:30:44  kernel:  ? __netif_receive_skb_core.constprop.0+0x56c/0xf10
9月 21 21:30:44  kernel:  ip_list_rcv+0x13d/0x170
9月 21 21:30:44  kernel:  __netif_receive_skb_list_core+0x29e/0x2c0
9月 21 21:30:44  kernel:  netif_receive_skb_list_internal+0x1d1/0x310
9月 21 21:30:44  kernel:  ? __alloc_skb+0xf0/0x1e0
9月 21 21:30:44  kernel:  napi_gro_receive+0xd0/0x210
9月 21 21:30:44  kernel:  e1000_clean_rx_irq+0x1d0/0x500 [e1000 7fb57c36a92a81ea96c2c799efb20a012be338be]
9月 21 21:30:44  kernel:  e1000_clean+0x281/0x6b0 [e1000 7fb57c36a92a81ea96c2c799efb20a012be338be]
9月 21 21:30:44  kernel:  ? dev_watchdog+0x106/0x220
9月 21 21:30:44  kernel:  __napi_poll+0x28/0x160
9月 21 21:30:44  kernel:  net_rx_action+0x2a2/0x360
9月 21 21:30:44  kernel:  __do_softirq+0xd0/0x2c9
9月 21 21:30:44  kernel:  ? sort_range+0x20/0x20
9月 21 21:30:44  kernel:  run_ksoftirqd+0x2c/0x40
9月 21 21:30:44  kernel:  smpboot_thread_fn+0xd9/0x1d0
9月 21 21:30:44  kernel:  kthread+0xdb/0x110
9月 21 21:30:44  kernel:  ? kthread_complete_and_exit+0x20/0x20
9月 21 21:30:44  kernel:  ret_from_fork+0x1f/0x30
9月 21 21:30:44  kernel:  </TASK>
9月 21 21:30:44  kernel: psmouse serio1: resync failed, issuing reconnect request
9月 21 21:30:44  kernel: rcu: INFO: rcu_preempt self-detected stall on CPU
9月 21 21:30:44  kernel: rcu:         1-....: (14725 ticks this GP) idle=be5/1/0x4000000000000000 softirq=31910/31910 fqs=173
9月 21 21:30:44  kernel:         (t=18000 jiffies g=39997 q=602 ncpus=4)
9月 21 21:30:44  kernel: NMI backtrace for cpu 1
9月 21 21:30:44  kernel: CPU: 1 PID: 25 Comm: ksoftirqd/1 Tainted: G             L    5.19.9-arch1-1 #1 3da5a84b9442a05cd5bc412feaf8d6ab31862ed4
9月 21 21:30:44  kernel: Hardware name: VMware, Inc. VMware Virtual Platform/440BX Desktop Reference Platform, BIOS 6.00 07/22/2020
9月 21 21:30:44  kernel: Call Trace:
9月 21 21:30:44  kernel:  <IRQ>
9月 21 21:30:44  kernel:  dump_stack_lvl+0x48/0x60
9月 21 21:30:44  kernel:  nmi_cpu_backtrace.cold+0x32/0x79
9月 21 21:30:44  kernel:  ? lapic_can_unplug_cpu+0x70/0x70
9月 21 21:30:44  kernel:  nmi_trigger_cpumask_backtrace+0xf1/0x100
9月 21 21:30:44  kernel:  trigger_single_cpu_backtrace+0x2a/0x31
9月 21 21:30:44  kernel:  rcu_dump_cpu_stacks+0xa0/0xdd
9月 21 21:30:44  kernel:  rcu_sched_clock_irq.cold+0x122/0x560
9月 21 21:30:44  kernel:  ? sched_slice+0x87/0x140
9月 21 21:30:44  kernel:  ? trigger_load_balance+0x71/0x340
9月 21 21:30:44  kernel:  update_process_times+0x74/0xb0
9月 21 21:30:44  kernel:  tick_sched_handle+0x22/0x60
9月 21 21:30:44  kernel:  tick_sched_timer+0x67/0x80
9月 21 21:30:44  kernel:  ? tick_sched_do_timer+0xa0/0xa0
9月 21 21:30:44  kernel:  __hrtimer_run_queues+0x127/0x2c0
9月 21 21:30:44  kernel:  hrtimer_interrupt+0xf8/0x210
9月 21 21:30:44  kernel:  __sysvec_apic_timer_interrupt+0x5e/0x110
9月 21 21:30:44  kernel:  sysvec_apic_timer_interrupt+0x6d/0x90
9月 21 21:30:44  kernel:  </IRQ>
9月 21 21:30:44  kernel:  <TASK>
9月 21 21:30:44  kernel:  asm_sysvec_apic_timer_interrupt+0x1a/0x20
9月 21 21:30:44  kernel: RIP: 0010:memcpy_orig+0x31/0x133
9月 21 21:30:44  kernel: Code: 48 83 fa 20 0f 82 86 00 00 00 40 38 fe 7c 35 48 83 ea 20 48 83 ea 20 4c 8b 06 4c 8b 4e 08 4c 8b 56 10 4c 8b 5e 18 48 8d 76 20 <4c> 89 07 4c 89 4f 0>
9月 21 21:30:44  kernel: RSP: 0000:ffff9920804f7818 EFLAGS: 00010287
9月 21 21:30:44  kernel: RAX: ffff8aaabda83000 RBX: 00000000bda83000 RCX: ffffffff918cc2c0
9月 21 21:30:44  kernel: RDX: fffffffffffffffc RSI: ffff8aab00bc9222 RDI: ffff8aaabda83000
9月 21 21:30:44  kernel: RBP: 0000000000000001 R08: 0c007b5776c86310 R09: 0100060810179129
9月 21 21:30:44  kernel: R10: 0c00020004060008 R11: 0701a8c010179129 R12: 0000000100bc9202
9月 21 21:30:44  kernel: R13: 0000000000003767 R14: 000000000000003c R15: 0000000000200000
9月 21 21:30:44  kernel:  swiotlb_tbl_map_single+0x557/0x590
9月 21 21:30:44  kernel:  swiotlb_map+0x6c/0x270
9月 21 21:30:44  kernel:  dma_map_page_attrs+0x10d/0x280
9月 21 21:30:44  kernel:  e1000_xmit_frame+0x34c/0xfb0 [e1000 7fb57c36a92a81ea96c2c799efb20a012be338be]
9月 21 21:30:44  kernel:  dev_hard_start_xmit+0x64/0x1d0
9月 21 21:30:44  kernel:  sch_direct_xmit+0xa4/0x370
9月 21 21:30:44  kernel:  __dev_queue_xmit+0xa4c/0xdc0
9月 21 21:30:44  kernel:  arp_process+0x7a1/0x8c0
9月 21 21:30:44  kernel:  ? napi_skb_cache_get+0x47/0x60
9月 21 21:30:44  kernel:  ? __napi_alloc_skb+0x3e/0xd0
9月 21 21:30:44  kernel:  __netif_receive_skb_list_core+0x1ae/0x2c0
9月 21 21:30:44  kernel:  netif_receive_skb_list_internal+0x1d1/0x310
9月 21 21:30:44  kernel:  ? __alloc_skb+0xf0/0x1e0
9月 21 21:30:44  kernel:  napi_gro_receive+0xd0/0x210
9月 21 21:30:44  kernel:  e1000_clean_rx_irq+0x1d0/0x500 [e1000 7fb57c36a92a81ea96c2c799efb20a012be338be]
9月 21 21:30:44  kernel:  e1000_clean+0x281/0x6b0 [e1000 7fb57c36a92a81ea96c2c799efb20a012be338be]
9月 21 21:30:44  kernel:  ? dev_watchdog+0x106/0x220
9月 21 21:30:44  kernel:  __napi_poll+0x28/0x160
9月 21 21:30:44  kernel:  net_rx_action+0x2a2/0x360
9月 21 21:30:44  kernel:  __do_softirq+0xd0/0x2c9
9月 21 21:30:44  kernel:  ? sort_range+0x20/0x20
9月 21 21:30:44  kernel:  run_ksoftirqd+0x2c/0x40
9月 21 21:30:44  kernel:  smpboot_thread_fn+0xd9/0x1d0
9月 21 21:30:44  kernel:  kthread+0xdb/0x110
9月 21 21:30:44  kernel:  ? kthread_complete_and_exit+0x20/0x20
9月 21 21:30:44  kernel:  ret_from_fork+0x1f/0x30
9月 21 21:30:44  kernel:  </TASK>
9月 21 21:30:44  kernel: watchdog: BUG: soft lockup - CPU#1 stuck for 67s! [ksoftirqd/1:25]

粗略分析日志:
发现这个错误比较可疑:kernel: watchdog: BUG: soft lockup - CPU#1 stuck for 22s! [ksoftirqd/1:25]
搜索了以下,目前未找到更好的解决办法。
哎,好好的一个系统,怎么说坏就坏了呢?

发现个好玩的事情,继续更新:
我的安装环境是在笔记本上安装VMware中装的虚拟机。
我Archlinux死机后,生气合上笔记本盖子后,奇迹般又好了,不知何故?难道是系统一口气没上来,合上盖子歇了歇又上来气了吗?
很奇怪,又死机了,合上盖子又变好了。

最近编辑记录 jiang8121 (2022-09-21 21:55:56)

离线

#2 2022-09-21 21:41:28

依云
会员
所在地: a.k.a. 百合仙子
注册时间: 2011-08-21
帖子: 7,300
个人网站

Re: ArchLinux无故死机

所以以前好好的,装了上述软件之后才出的问题?
你安装的 docker 和 wallabag 是通过 pacman 安装的吗?

离线

#3 2022-09-21 21:43:24

jiang8121
会员
注册时间: 2022-09-21
帖子: 3

Re: ArchLinux无故死机

依云 说:

所以以前好好的,装了上述软件之后才出的问题?
你安装的 docker 和 wallabag 是通过 pacman 安装的吗?

1、docker安装是通过命令: pacman -S docker
2、wallabag安装是通过命令: docker pull wallabag/wallabag

这个系统我是用了五六年了,一直没问题。最近想要玩wallabag,所以新安装了Manjaro系统,出现该问题后,天真以为是Manjaro问题。随后在Archlinux上同样安装,后来出现同样问题,卸载了却仍不管用。

最近编辑记录 jiang8121 (2022-09-21 21:45:45)

离线

#4 2022-09-21 22:20:47

依云
会员
所在地: a.k.a. 百合仙子
注册时间: 2011-08-21
帖子: 7,300
个人网站

Re: ArchLinux无故死机

死锁了啊。你 journalctl _TRANSPORT=kernel -b 选一个有问题的boot号看看日志。journalctl --list-boots 列出所有的 boot 号。
既然是死锁,当然要看最初问题出现在哪里。目前看来是某个硬件导致的。

离线

#5 2022-09-25 10:16:35

jiang8121
会员
注册时间: 2022-09-21
帖子: 3

Re: ArchLinux无故死机

依云 说:

死锁了啊。你 journalctl _TRANSPORT=kernel -b 选一个有问题的boot号看看日志。journalctl --list-boots 列出所有的 boot 号。
既然是死锁,当然要看最初问题出现在哪里。目前看来是某个硬件导致的。

好像确实电脑引起的原因。因为我重新安装了一次Manjaro系统,在该电脑上仍然出现问题;而将虚拟机放入另外一台电脑则运行流畅,无任何问题。
但是哪个硬件不好判断啊,至少宿主机windows运行还挺流畅的。

离线

页脚