[求助] 第一次使用 arch Linux ,遇到硬盘报告 smart 错误以及 windows boot manager 的问题

3 天前
 zcion

各位大佬好,我在重装 arch linux 后遇到些问题,虽能够正常使用,但也好奇这些问题是否会埋下祸患,所以想请各位大佬帮忙看看。

设备

thinkpad T14p gen1(Intel® Core™ i5-13500H + 集显)

背景

电脑原来安装的 windows11 ,某天突发奇想想要换个 linux 玩玩,由于不满足在虚拟机上搞,所以把电脑重装了 arch linux 。

安装教程参考了这个: https://arch.icekylin.online/guide/rookie/basic-install

基本上按教程来,不过我没打算双系统,所以在磁盘分区环节没有按照教程的双系统做法做,而是分配以下:


❯ lsblk                        
NAME        MAJ:MIN RM   SIZE RO TYPE MOUNTPOINTS
nvme0n1     259:0    0 953.9G  0 disk 
├─nvme0n1p1 259:1    0     1G  0 part /boot
├─nvme0n1p2 259:2    0    32G  0 part [SWAP]
└─nvme0n1p3 259:3    0 920.9G  0 part /home
                                      /

之后历经一些问题,但也是成功解决并用上了 arch 。

smart 磁盘报告

在开机使用后,smart 报告跳出来,具体信息如下:


smartctl 7.5 2025-04-30 r5714 [x86_64-linux-6.17.8-arch1-1] (local build)

Copyright (C) 2002-25, Bruce Allen, Christian Franke, www.smartmontools.org

  

=== START OF INFORMATION SECTION ===

Model Number: WD PC SN810 SDCQNRY-1T00-1201

Serial Number: 23241L801460

Firmware Version: 61540101

PCI Vendor/Subsystem ID: 0x15b7

IEEE OUI Identifier: 0x001b44

Total NVM Capacity: 1,024,209,543,168 [1.02 TB]

Unallocated NVM Capacity: 0

Controller ID: 8224

NVMe Version: 1.4

Number of Namespaces: 1

Namespace 1 Size/Capacity: 1,024,209,543,168 [1.02 TB]

Namespace 1 Formatted LBA Size: 512

Namespace 1 IEEE EUI-64: 001b44 8b4abe80d5

Local Time is: Wed Nov 19 23:59:41 2025 CST

Firmware Updates (0x14): 2 Slots, no Reset required

Optional Admin Commands (0x0017): Security Format Frmw_DL Self_Test

Optional NVM Commands (0x00df): Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp Verify

Log Page Attributes (0x1e): Cmd_Eff_Lg Ext_Get_Lg Telmtry_Lg Pers_Ev_Lg

Maximum Data Transfer Size: 128 Pages

Warning Comp. Temp. Threshold: 84 Celsius

Critical Comp. Temp. Threshold: 88 Celsius

Namespace 1 Features (0x02): NA_Fields

  

Supported Power States

St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat

0 + 8.00W 8.00W - 0 0 0 0 0 0

1 + 3.50W 3.50W - 0 0 0 0 0 0

2 + 2.60W 2.60W - 0 0 0 0 0 0

3 - 0.0250W - - 3 3 3 3 5000 10000

4 - 0.0035W - - 4 4 4 4 3900 45700

  

Supported LBA Sizes (NSID 0x1)

Id Fmt Data Metadt Rel_Perf

0 + 512 0 2

1 - 4096 0 1

  

=== START OF SMART DATA SECTION ===

SMART overall-health self-assessment test result: FAILED!

- NVM subsystem reliability has been degraded

  

SMART/Health Information (NVMe Log 0x02, NSID 0xffffffff)

Critical Warning: 0x04

Temperature: 33 Celsius

Available Spare: 100%

Available Spare Threshold: 10%

Percentage Used: 0%

Data Units Read: 26,303,449 [13.4 TB]

Data Units Written: 27,982,150 [14.3 TB]

Host Read Commands: 1,424,624,648

Host Write Commands: 629,410,314

Controller Busy Time: 2,193

Power Cycles: 161

Power On Hours: 3,026

Unsafe Shutdowns: 41

Media and Data Integrity Errors: 38,228

Error Information Log Entries: 38,228

Warning Comp. Temperature Time: 0

Critical Comp. Temperature Time: 0

  

Error Information (NVMe Log 0x01, 16 of 256 entries)

No Errors Logged

  

Self-test Log (NVMe Log 0x06, NSID 0xffffffff)

Self-test status: No self-test in progress

Num Test_Description Status Power_on_Hours Failing_LBA NSID Seg SCT Code

0 Short Completed: failed segments 3026 - - 2 - -


主要想知道的是这个,网上查到的说由于磁盘上的重要媒体文件发生错误所以自检失败,我想知道是否和我在安装过程中直接对整个硬盘进行分区的操作有关(在分区后有按照教程进行格式化,之前是在磁盘有几百 G 数据的情况下直接分区的)?还有想知道的是,Media and Data Integrity Errors 38228 这个数值是否异常,是否也是和磁盘分区操作有关?

SMART overall-health self-assessment test result: FAILED!

- NVM subsystem reliability has been degraded

windows boot manager 的问题

不知道是否是直接分区的缘故,用 efibootmgr 命令还能看到 windows boot manager

❯ efibootmgr
BootCurrent: 001E
Timeout: 0 seconds
BootOrder: 0020,001C,001D,001E,001F,0021,0022,0023,0001,0024,0025
Boot0001* Windows Boot Manager  HD(1,GPT,2ab3bfd7-9d04-494b-83ef-d0e79998ec35,0x800,0x200000)/\EFI\Microsoft\Boot\bootmgfw.efi57494e444f5753000100000088000000780000004200430044004f0042004a004500430054003d007b00390064006500610038003600320063002d0035006300640064002d0034006500370030002d0061006300630031002d006600330032006200330034003400640034003700390035007d00000030000100000010000000040000007fff0400
Boot0010  Setup FvFile(721c8b66-426c-4e86-8e99-3457c46ab0b9)
Boot0011  Boot Menu     FvFile(126a762d-5758-4fca-8531-201a7f57f850)
Boot0012  Diagnostic Splash Screen      FvFile(a7d8d9a6-6ab0-4aeb-ad9d-163e59a7a380)
Boot0013  Lenovo Diagnostics    FvFile(3f7e615b-0d45-4f80-88dc-26b234958560)
...

这个沟槽的 windows boot manager ,在我第一次安装引导程序(成功且用 efibootmgr 查看,在 Boot0000 位置)时,重启是就直接进入 BIOS 无法正常开机,之后经过一段时间排查才发现原来安装的引导程序被 windows boot manager 覆盖了(如上面所示),之后重新安装也还是这样。在经过一段较为迷茫的排查,直到我安装引导程序加上 --removable 才成功开机。现在虽然能够正常使用,但执行 efibootmgr 还能看到这个 windwos boot manager,且根据序号看它还覆盖了其他的一些内容。所以我想知道这个有没有影响?

# 安装的引导程序被覆盖的命令长这样
grub-install --target=x86_64-efi --efi-directory=/boot --bootloader-id=ARCH

# 之后成功开机的引导程序安装长这样
grub-install --target=x86_64-efi --efi-directory=/boot --removable

麻烦各位大佬指点指点!!!

803 次点击
所在节点    Linux
13 条回复
w568w
3 天前
> 网上查到的说由于磁盘上的重要媒体文件发生错误所以自检失败,我想知道是否和我在安装过程中直接对整个硬盘进行分区的操作有关(在分区后有按照教程进行格式化,之前是在磁盘有几百 G 数据的情况下直接分区的)?
> 是否也是和磁盘分区操作有关?

应该没关系,这个问题大多是固件或硬件问题。

> Media and Data Integrity Errors 38228 这个数值是否异常

异常。这个数字只要大于 0 ,就应该视为硬盘报废了。几万非常严重了。建议立刻停止使用、备份重要数据,然后找售后
w568w
3 天前
另外,看你的写入量也不大,多半是硬盘本身的问题。有质保的话尽快找售后吧
zcion
3 天前
@w568w 行,谢谢大佬
commrson
3 天前
「不知道是否是直接分区的缘故」 efi 启动项是固件管理的。windows boot manager 如果不需要可以直接用 efibootmgr 删。
zcion
3 天前
@commrson 删过一次,重新开机它又出来了
commrson
3 天前
那就是你的 BIOS 在自作聪明的尝试“修复引导”。看看 efi 分区对应的文件是否存在,尝试删除
zcion
3 天前
@commrson 之前是用 efibootmgr -b Boot0001 -B 删的 windwos boot manager ,重启后还是有。efi 分区没有对应的文件。
commrson
3 天前
`/boot/efi/EFI/Microsoft/` 的 `Microsoft` 文件夹也要删除;然后看看 bios 里面有无 windows 优化之类的,不过笔记本的话估计没多少选项;实在不行的话只能试试用 systemd-boot 在同位置下顶替,或者放弃 UEFI 换成 legacy 模式
commrson
3 天前
或者放弃折腾这里
zcion
3 天前
@commrson 好,谢谢大佬
ryd994
3 天前
smartctl -a /dev/nvme0n1 看看具体数据
但是 smart 报错的话这盘基本就确定不行了,只能存些不重要的数据
这和格式化什么的都无关,就是硬件不行了。可能是因为安装过程中产生了大量写入,也可能只是 Windows 默认不监控 smart 数据,你之前不知道而已
yulgang
3 天前
1 、清一下 UEFI 的菜单,你可以进 BIOS 里选择对应项删除,或者使用 bootice 工具删。
2 、看看你的/boot/efi/EFI 里是不是有 Windows 的引导文件
3 、检查你的 grub 配置文件,菜单里是不是多了 Windows 的引导项目
4 、备份/boot 分区文件,在 nvme0n1p1 前面 4M 区域填 0 后重建/boot 或引导
zcion
3 天前
做个反馈:
1. SSD 本身除了问题,打算直接换了
2. windows boot manager 之前删除了 efi 分区中的( efibootmgr 删除、/boot/EFI/ 中没有相关文件),但没有清理 bios 中对应的条目,直接在 boot 中将 windows boot manager 删了,问题解决。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1173846

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX