又是 Ubuntu Server 造孽的一天

27 天前
 imes

Ubuntu 24.04 为了实现 secure boot 以及便于管理,将英伟达的驱动打包之后配合 linux modules 实现签名,然后通过 ubuntu-drivers 提供,看起来,一切都很美好。

按照正流程安装:

  1. sudo ubuntu-drivers install --gpgpu在服务器上安装nvidia-headless-no-dkms-570-server驱动
  2. sudo apt install nvidia-utils-570-server安装常用软件,包括nvidia-smi
  3. 输入nvidia-smi查看 GPU 信息

不好意思,报错NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running

这是因为ubuntu-drivers-common的包有个不大不小的 bug:只记得安装nvidia-driver-no-dkms-<series>,忘了安装linux-modules-nvidia-<series>-server-generic。本来就是no-dkms,再加上缺少内核模块,注定无法正常工作。

Ubuntu 其实在 2024-10-07 就已经发现这个问题了(1:0.9.7.6ubuntu3.1),但是直到 2025-03-11 才修复这个问题并重新发布(1:0.9.7.6ubuntu3.2)。但是,问题又来了,一直被推迟:

The following upgrades have been deferred due to phasing:
  ubuntu-drivers-common

至于原因?不好意思,我们分批推送,但是还没有推送,因为还是有问题,已经被暂停并回滚了,至于修复版的修复版,你先等着吧:

ubuntu-drivers-common:
  Installed: 1:0.9.7.6ubuntu3.1
  Candidate: 1:0.9.7.6ubuntu3.2
  Version table:
     1:0.9.7.6ubuntu3.2 500 (phased 0%)
        500 http://cn.archive.ubuntu.com/ubuntu noble-updates/main amd64 Packages
 *** 1:0.9.7.6ubuntu3.1 100
        100 /var/lib/dpkg/status
     1:0.9.7.6ubuntu3 500
        500 http://cn.archive.ubuntu.com/ubuntu noble/main amd64 Packages

为什么这么严重的 bug ,看起来 Ubuntu 并不着急?因为 Ubuntu 的手册上来就让你sudo ubuntu-drivers install,直接在 server 上安装 xorg/x11 ,附带着把东西全装上,用户就发现不了这个问题了。用户的硬盘跟我有什么关系?我用 snap 在硬盘里面拉了一堆 loop 的屎,不也照样活的好好的,嘻嘻😁。

2625 次点击
所在节点    程序员
11 条回复
mooyo
27 天前
开源的东西不就是这样,要不你就上去修一修呗。
hwdq0012
27 天前
直接去 ubuntu 官网下载驱动, 反正安装时也是用 gcc 编译了驱动再安装的
hwdq0012
27 天前
@hwdq0012 #2 说错了,nvidia 官网
hefish
27 天前
24.04 看起来还是太新了。
imes
27 天前
@hefish #
是的,还是得低一个版本才有保障
imes
27 天前
@hwdq0012 2#
吃一堑长一智,当时图方便结果吃大亏
cq65617875
26 天前
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get install cuda-toolkit cuda-drivers -y

请用官方方法
realpg
26 天前
ubuntu 不着急的原因根本就不是这个
是因为影响用户低于十万分之一

ubuntu server 和 ubuntu 现在几乎已经是完全共版本库和基础机制了
这些机制是给那些 desktop 用户的 方便他们使用

你就是最小众的用法 十万分之一都可能高估了 可能全球用户加起来个位数
而且涉及驱动的问题, 很容易搞崩系统, phase 推进很慢很正常
julyclyde
26 天前
@realpg 从来都是共用啊。看你说的就好像最近改成共用似的
realpg
26 天前
@julyclyde #9

首先 我没有说表示近期才共用的意思 可能是我用词有点问题造成你误解了


另外, 较真的话 以前确实不是 我从 6.06 用到现在 14.04 还不是这个架构
16.04 才完全本质共用这套

之前虽然 mirror 都是一个 基底是有区别的 用 server 的你装全了包 两者也是有不同的
16.04 以后 装全了包 几乎就是一样
julyclyde
26 天前
@realpg 不就是 ubuntu-desktop 这个 meta 包吗?这十年内有什么变动?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1139957

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX