被 Windows 台式机折腾了一个周末,问题究竟出在哪里

22 小时 48 分钟前
 kdwycz

最近一年都在用 NUC13 作为日常办公/娱乐电脑。之前的英睿达 48Gx2 内存+4080 显卡被征用了于是换了英睿达 24Gx2 内存(涨价前买的,当时嫌 32Gx2 贵)和 5090 公版显卡。在换配件之前非常稳定。

但最近两个月系统开始经常在开机后蓝屏重启,连续三四次都是不一样的错误代码。在远程桌面连过一次之后也容易死机需要强制重启。但是如果正常开机了,不管是连续开机一周还是长时间高负载工作/打游戏都没出过问题。这就非常诡异

再加上系统自带的杀毒软件把 NUC 控制中心当病毒杀了,然后 Windows 自动更新下载回来无限循环(后来手动关了有问题的补丁);以及输入法总是在切窗口后变成中文这些小问题。我就打算趁周末通过重装系统来解决可能的 99%的问题。

更了 25 年 8 月最新的 BIOS 后。刚装完系统还在更新驱动,重启电脑就又蓝屏了……这下可能只有重买能解决问题了。考虑并排查下可能的故障源

先拔掉显卡和一根内存,换用之前的 24H2 镜像重做系统(减小可能故障面,在有更新的情况下开关机时蓝屏会导致更新失败,出更玄学的问题)成功后开始排查硬件问题:

B 站有个 CPU 缩缸的测试办法:7zip 性能测试,跑了一小时正常。Memtest 跑内存也没报错。在做完以上所有事情后整个周末被蒸发了……

今天又装了些软件,重启了几次。遇到了两次开机时蓝屏。这时候想到可以用 AI 来分析错误日志:用 windbg 解析蓝屏的 dmp 文件( C:\Windows\Minidump 下),将结果交给 AI 分析,得到结论是:"系统在尝试停止一个 Hyper-V (虚拟化) 相关的定时器时,CPU 执行了一条当前级别不允许的指令。这通常指向 BIOS/UEFI 固件与 Windows 虚拟化功能之间的兼容性问题,或者底层硬件电源管理( C-State )在虚拟化环境下的 Bug 。"

问题范围被缩小到了驱动/系统 bug/cpu 故障。AI 建议我关掉 C-State ,可是 BIOS 里没找到选项。等下个周末继续折腾吧

之前看到 Win11 各种 bug 的新闻觉得有些危言耸听,这次彻底被恶心到了

附 1:为什么 750W 电源带 14900K+5090……NUC 闲鱼买来的时候就是 14900K ,BIOS 限制了 150W 运行。而 5090 在调了电压后满载功耗不到 450W 。日常使用几乎不可能同时满载 CPU 和显卡,所以 750W 电源勉强能用,就是显卡只能发挥 85%性能。要升级电源只能选海盗船 SF1000 ,还要海淘特殊转接线才能用。(今天淘宝发现有国产转接线了,已下单电源和定制线)

附 2:触发了一个微软账户的 bug:创建本地账户再换微软账户登录后,开机密码还是之前本地账户的,而不是微软账户密码;并且微软设备页也找不到新设备。Windows 安全中心提示未登录微软账户,但是登录页面报错。登录了账户但没完全登录。我因为这个问题尝试了多个版本系统。

附 3:这次重装系统后 OneDrive 稳定性非常差,动不动就闪退。遗留的快捷方式文件和个人保险库冲突还自动改名了。去官网重新下载了 OneDrive 后有所改善

2347 次点击
所在节点    Windows
29 条回复
felixcode
22 小时 41 分钟前
不管是什么原因,750W 电源是硬伤,还要考虑瞬时峰值,至少要留出持续功耗 30%以上的余量
tool2dx
22 小时 28 分钟前
我 cpu 坏了,就会蓝屏,很莫名奇妙那种。我还以为是系统坏了,其实不是。
你可能长期限制 cpu 低功耗运行,没暴露这问题。
sakujo
22 小时 21 分钟前
我曾经出现过怎么排除也解决不了的蓝屏问题,连进 pe 系统都会蓝屏,最后发现是 cpu 坏了,虽然真的很少见,但是也确实会发生的。不过我那个 cpu 用了十年了。
CatCode
22 小时 14 分钟前
首先看电源是不是 ATX 3.0 的,不是 3.0 以上的 750W 你怎么设置都不够

不管你 BIOS 限制 CPU 还是显卡调电压,这些都是一小段时间的平均功耗。而 14 代+40/50 系的瞬间峰值功耗非常恐怖,可能达到满载功耗的 200%,虽然只有几十毫秒,但也足够触发电源的保护了。
wangritian
21 小时 39 分钟前
1.电源必须换 1000+的了,原因楼上提到,个人推荐振华
2.你设置了 150w 功耗墙,跑 7zip 等性能测试时,cpu 会降频运行,这反而降低了蓝屏概率,日常 1-4 核的间歇高负载更容易高频,建议 bios 把频率锁定在一个相对低的值比如 52-54 再试试,通过后调整 offset 降压,如果用不到这么多核心就关闭超线程
3.5090 也用 afterburner 降压到 1v 或限一下功率看看,这玩意也挺容易坏尤其是散热最差的 fe
xqzr
21 小时 22 分钟前
> 系统在尝试停止一个 Hyper-V (虚拟化) 相关的定时器时,CPU 执行了一条当前级别不允许的指令。这通常指向 BIOS/UEFI 固件与 Windows 虚拟化功能之间的兼容性问题,或者底层硬件电源管理( C-State )在虚拟化环境下的 Bug 。

想到 VT-d
aru
20 小时 46 分钟前
14900k 哈哈哈哈
我能说 14900ks 我保修换了 3 个么

大概率是 cpu 坏了。
intel 13 、14 代的 i7/i9 非常容易坏
haodingzan
20 小时 32 分钟前
我的电脑出现每次开机后几分钟就挂的情况,而且每次蓝屏代码都不一样,是 SSD 出问题了。当时用的海力士 PC601 ,CrystalDiskInfo 显示一切正常,用 AIDA64 看 SMART 的 Media Error 出现了负数,压力测试一跑就挂,换新盘之后恢复正常。但你要说它坏了吧,我把接到 Mac mini 上当尿袋,坚持一年多了没出过问题,唯独不能当 Windows 系统盘……
davidyin
17 小时 30 分钟前
5090 电源需求都要 1000w 。
davidyin
17 小时 27 分钟前
jhytxy
16 小时 59 分钟前
电源的钱千万不能省

你这 14900+5090
配个 750w 非常离谱啊
laminux29
15 小时 33 分钟前
14900K ? 13-14 代 CPU ,这玩意出问题,不是很正常的嘛。

要不降级换 12 代 CPU ,要不升级换 15 代 Ultra CPU 。
Georgedoe
13 小时 30 分钟前
我也折腾过一个周末 , 全部硬件换了一遍最后发现是主板出了问题
4seasons
13 小时 22 分钟前
进 Bios ,排查一下主板电源供电情况。顺带提一嘴,如果有 UPS 的话,一定要检查是不是方波的 UPS ,PC 尽量不要插这种 UPS 。
NxxRngjnbgj
13 小时 16 分钟前

=======================================
有没有可能,这个系列的板子,不同后缀,主板的元器件都不一样,强行换 cpu ,可能导致不稳定。控制变量法,你换个 12400 跑一段时间看看咧
=======================================
另外,13 ,14 代带 k 的处理器,现在真是够狗看都嫌弃
jvr
13 小时 15 分钟前
电源。还有 win11 的稳定性,前段时间我也是经常黑屏卡死,现在好多了。
opengps
13 小时 0 分钟前
是不是最近装了 win11 的某些更新?
lincong94
12 小时 56 分钟前
应该是电源供电不足,750w 确实有点不太够,至少 1000w 起步,反正你都要用到 14900k+5090,一步到位至少来个 1000w 以上的电源,发挥这些硬件应有的水平(感觉 1000w 还是刚好的水平)
xclimbing
12 小时 54 分钟前
1 、既然怀疑 win11 系统有问题,为什么不换成 win10 试一下。另外,强烈建议先关掉 windows 更新,不更新不会死。

2 、能不能去掉独立显卡?既然前面怀疑电源功率不足,去掉显卡可以有效缩小排除范围。

另外,强烈不建议随便更新 BIOS ,你怎么确认新版的 BIOS 没有 bug ?
ntedshen
12 小时 44 分钟前
随机报错那就是炸 u 。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1179105

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX