您尚未登录。

#1 昨天 11:02:14

kholin
会员
注册时间: 2024-08-22
帖子: 5

[已解决]最近的更新之后AMDGPU坏掉了

目前用的是RX 7800XT,之前一直用来在Linux上打游戏的,最近不知道更新了什么,GPU直接不起作用,3D游戏根本打不开,启动后直接崩溃,使用`amdgpu_top`工具一直提示`There are no the AMD GPU devices found.`

执行`sudo dmesg`看到相关报错信息:

[    2.696714] amdgpu 0000:03:00.0: amdgpu: RAP: optional rap ta ucode is not available
[    2.696719] amdgpu 0000:03:00.0: amdgpu: SECUREDISPLAY: securedisplay ta ucode is not available
[    2.696723] amdgpu: smu firmware loading failed
[    2.696725] amdgpu 0000:03:00.0: amdgpu: amdgpu_device_ip_init failed
[    2.696728] amdgpu 0000:03:00.0: amdgpu: Fatal error during GPU init
[    2.696732] amdgpu 0000:03:00.0: amdgpu: amdgpu: finishing device.

根据这些信息查了一下,还是没头绪。

执行`lspci -k | grep -A 3 -E "(VGA|3D)"`结果如下:

00:02.0 VGA compatible controller: Intel Corporation Raptor Lake-S GT1 [UHD Graphics 770] (rev 04)
        DeviceName: Onboard - Video
        Subsystem: ASUSTeK Computer Inc. Device 8694
        Kernel driver in use: i915
--
03:00.0 VGA compatible controller: Advanced Micro Devices, Inc. [AMD/ATI] Navi 32 [Radeon RX 7700 XT / 7800 XT] (rev c8)
        Subsystem: XFX Limited Device 7801
        Kernel modules: amdgpu
03:00.1 Audio device: Advanced Micro Devices, Inc. [AMD/ATI] Navi 31 HDMI/DP Audio

能看到 kernel modules, 但是似乎缺少 `kernel driver` ?

已经尝试跟着 AMDGPU - ArchWiki 流程走了一遍, 没解决我的问题,后来尝试把`mesa`包替换成`mesa-git`包,没有任何变化,这可能是什么原因导致的呢?

对了,这两天在电脑上尝试了Waydroid, 跟着 Waydroid - ArchWiki 流程走的,难道是因为安装了什么新模块导致 gpu 驱动损坏了?

最近编辑记录 kholin (昨天 11:55:58)

离线

#2 昨天 11:34:03

nicolasyang
会员
注册时间: 2024-09-20
帖子: 1

Re: [已解决]最近的更新之后AMDGPU坏掉了

kholin 说:
[    2.696723] amdgpu: smu firmware loading failed

这里说明固件加载失败了。发一下完整的 dmesg 输出吧

kholin 说:

对了,这两天在电脑上尝试了Waydroid, 跟着 Waydroid - ArchWiki 流程走的,难道是因为安装了什么新模块导致 gpu 驱动损坏了?

这里有好几种不同的流程啊,所以说说你具体做了什么吧

离线

#3 昨天 11:55:29

kholin
会员
注册时间: 2024-08-22
帖子: 5

Re: [已解决]最近的更新之后AMDGPU坏掉了

nicolasyang 说:
kholin 说:
[    2.696723] amdgpu: smu firmware loading failed

这里说明固件加载失败了。发一下完整的 dmesg 输出吧

kholin 说:

对了,这两天在电脑上尝试了Waydroid, 跟着 Waydroid - ArchWiki 流程走的,难道是因为安装了什么新模块导致 gpu 驱动损坏了?

这里有好几种不同的流程啊,所以说说你具体做了什么吧

刚刚试着把 kernel 参数里面的 `amdgpu.dpm=0`删除,然后运行 `sudo grub-mkconfig -o /boot/grub/grub.cfg`,重启之后就正常了,不清楚什么原因,不过好像有人遇到了跟我一样的问题 https://gitlab.freedesktop.org/drm/amd/-/issues/2922

Waydroid流程里面比较大的两个改动,一个是安装了`linux-zen`,另一个是安装了binder相关组件,这两个似乎都不是主要原因,我从linux-zen切换回arch打包的linux内核,问题还是存在,至于binder,应该也没有那么强的破坏力。

离线

页脚