RTX 5090遇诡异Bug完全无响应!悬赏1000美元寻解决方案
快科技9月7日消息,据报道,NVIDIA的RTX 5090和RTX PRO 6000显卡最近被发现存在一个可复现的虚拟化重置漏洞,该漏洞会导致显卡完全无响应,直到主机系统物理重启才能恢复。
CloudRift是一家GPU云服务提供商,他们在生产环境中多个配备Blackwell芯片的系统上遇到了这个问题后,详细公布了问题的分析报告,并悬赏1000美元,公开征集能够找到解决方案或根本原因的人。
根据CloudRift的日志,这个漏洞发生在GPU通过KVM和VFIO传递给虚拟机后。在虚拟机关闭或GPU重新分配时,主机系统会发出一个PCIe功能级重置(FLR)。
但与正常情况不同的是,GPU并没有恢复到良好状态,而是停止响应,内核报告称:“FLR后65535毫秒仍未就绪;放弃。”
此时,显卡也变得无法被lspci读取,lspci会抛出“未知头部类型7f”的错误,CloudRift指出,唯一恢复正常操作的方法是对整个机器进行断电重启。
AI初创公司Tiny Corp也复现了CloudRift的发现,并直接提出了一个问题:“RTX 5090和RTX PRO 6000是否有硬件缺陷?我们已经调查过,但找不到解决方案。”
社区的讨论中,许多家庭用户和其他RTX 5090的早期采用者也报告了类似的问题,一位用户表示在关闭Windows虚拟机后,整个主机系统挂起,即使操作系统级别的重启后,GPU也无法重新初始化。
用户证实,切换PCIe ASPM或ACS设置并不能缓解故障,目前还没有报告称旧型号显卡(如RTX 4090)存在类似问题,这表明该漏洞可能仅限于NVIDIA的Blackwell系列。
相关文章
- 英伟达独显游戏本用户注意 免费提升性能的方法
- 影驰RTX 5080 HOF OC LAB Deluxe-X 评测|纯白旗
- 最强非公版!影驰RTX 5070 Ti HOF OC LAB黑魂X
- 《空洞骑士:丝之歌》解禁!耕升GeForce RTX 50
- 九月新游大作扎堆!华硕RTX50系显卡助力高帧爽
- 曝5070Ti/5080显卡退市!SUPER系列接棒 显存升
- 小众宝藏ARPG新作!《泰坦之旅2》耕升RTX 5070
- 比MSRP高60%!华硕RTX 5080猫头鹰联名显卡欧洲
- 国产自研6nm GPU性能超RTX 4060!东芯股份:砺
- RTX 5070成当前世代"卡皇" AMD RDNA 4未上榜