V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
V392920
V2EX  ›  程序员

PVE 运行缓慢如何排查?

  •  
  •   V392920 · 100 天前 · 1387 次点击
    这是一个创建于 100 天前的主题,其中的信息可能已经有所发展或是发生改变。

    自己用 N5105 配 nvme 硬盘搭建的 pve ,用了 2 年了吧

    突然在前天断电了一次,就启动不了了,接上显示器查看卡在了

    /dev/mapper/pve-root: clean, 213944/7012352 files, 16716818/20049408 blocks 一直进不去

    在网上搜索相关资料,基本都是说重装/硬盘损坏等,有 1-2 个说改配置文件之类的,照着改了也没生效,一样卡住

    然后自己进恢复模式也不行,也是一堆的报错,一直卡住,我就一直手动重启重启,也不知道重启了多少次,折腾了 3 个小时,突然进系统了

    但是特别的卡,web 页面很久都加载不出来,哪怕 ssh 输入了都很久没反应,从 ip 能 ping 通到 ssh 能连上,起码有 20 分钟

    我总共就装了 2 个 lxc ,1 个 vm

    等能正常进 ssh 和 web 了,我在 web 看了下 io ,基本几秒钟就能跑 80%以上,甚至 95%以上,直接卡红,但是通过 iotop 等命令查看,并没有很高的磁盘读写进程,然后又用命令看了下硬盘健康度,也都是正常范围内,没有问题,磁盘剩余空间也大于 60%

    现在就不知道怎么搞了,也不敢再重启或者断电,怕又起不来,现在在 web 端备份一下虚拟机(备份完成文件 8g 左右),备份了一下午才备份完成,以前都是 4-5 分钟就好了

    来问问各位大佬,这种该如何排查,请指教,谢谢。

    V392920
        1
    V392920  
    OP
       100 天前
    没有老哥指点吗?
    yc8332
        2
    yc8332  
       100 天前
    应该是硬盘有问题了。可能你的盘坏了
    Alliot
        3
    Alliot  
       100 天前
    iowait 很可能是主要问题 看看硬盘
    V392920
        4
    V392920  
    OP
       100 天前
    @yc8332 我通过命令和 web 看 smart 值,都是正常的,还有啥方法确认是硬盘问题吗?
    V392920
        5
    V392920  
    OP
       100 天前
    @Alliot SMART/Health Information (NVMe Log 0x02)
    Critical Warning: 0x00
    Temperature: 55 Celsius
    Available Spare: 91%
    Available Spare Threshold: 10%
    Percentage Used: 6%
    Data Units Read: 113,625,498 [58.1 TB]
    Data Units Written: 62,643,145 [32.0 TB]
    Host Read Commands: 1,455,671,213
    Host Write Commands: 1,812,177,678
    Controller Busy Time: 191,896
    Power Cycles: 160
    Power On Hours: 20,235
    Unsafe Shutdowns: 146
    Media and Data Integrity Errors: 0
    Error Information Log Entries: 0
    Warning Comp. Temperature Time: 68
    Critical Comp. Temperature Time: 14

    这是硬盘信息,应该没啥问题哇
    GobyHsu
        6
    GobyHsu  
       100 天前
    趁着还能访问,别折腾了,直接备份 -> 更换,就得了。N5105 这种小主机更换成本也相对不高,也算正好有理由换个 N150 ,N355 的升级下
    hysjw
        7
    hysjw  
       100 天前
    而且你放小主机本来应该也不是啥重要数据 重来就行了 重要的还是推荐 NAS+云端双保险
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5930 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 02:29 · PVG 10:29 · LAX 19:29 · JFK 22:29
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.