关于 All In Boom 到底是 Boom 在哪里?

10 天前
 OneLiteCore

都说 All in one 是 All in boom 但是真的 boom 的时候是哪个地方炸?

自组了一台 NAS 配置是 8100 + 32G 内存 + 海韵 GX650 电源,多盘位塔式机箱装了 3 个前风扇,主板也是一手的,硬件上爆炸的风险应该不高。

软件上 SSD 装 PVE 并存放虚拟机的磁盘镜像,直通 Sata 控制器到 Debian 虚拟机里做存储服务,然后在飞牛的虚拟机里挂载并提供影音服务。

网络

网络使用全家硬路由,PVE 里面也没有装软路由,只是在 Debian 里用 Docker 装了 Sub-Store 来整合复数个机场的订阅给其他设备的客户端使用,避免单个机场跑路的问题。

不折腾全家网络和软路由自然网络不会因为 All in one 爆炸。

意外断电

无论是否 All in one 都有这个问题而且城市供电一般没什么问题,最多加一个 UPS 就搞定了,所以暂时不纠结这个

硬件磨损

作为数据盘的 HDD 注定是有寿命的,在散热和电源都比较到位的情况下做好备份就行。其他的部件比如 CPU 、内存、电源、主板、风扇和机箱等基本不考虑寿命问题。

唯独作为系统盘的 SSD 可能是风险点出问题的话自然就是全 Boom 了,但是用 PVE 定时备份系统到 HDD 里届时恢复反而会比物理机直装更方便些。

作为参考某些 Nas 厂商会在多个数据盘上多分一个区以此组 Raid 给系统盘,这个方法对于存储设备来说是挺好的,但是除非组黑裙否则这个路子没法用。

软件爆炸

更新/配置 PVE 导致系统全挂或者整机无法联网,这个算人为的错误不是设备的问题,熟悉 Linux 的各种操作和习惯之后一般不会炸。

其他潜在的 Boom ?

最后的问题就是,在考虑了上述的问题之后是否还有其他会导致爆炸的点?

6557 次点击
所在节点    NAS
97 条回复
wmgylc
10 天前
我用绿联,自己写了个打包 docker 然后扔到云盘的脚本,没注意到 docker 零散文件太多了,某天晚上打包直接把 ssd 干到变成只读,然后同个 ssd 里的虚拟机里的旁路由跟着挂掉,直接连不上了,还好重启了没事,发现原因后把脚本下了就没事了
OneLiteCore
10 天前
@davidyin 这个确实是个好办法。我选择 PVE 有一个点就是电源买的是海韵 GX650 用来做家用服务器或者 NAS 无论是功率还是纹波稳定性都是足够好了,日常负载大概也就 35W 而电源足够跑 600W 于是觉得有点大材小用,所以才觉得可以上点强度。
OneLiteCore
10 天前
@helleon

Happy WiFi, Happy Wife,
Happy Wife Happy Life!
bytesfold
10 天前
折腾了一遍,pve+pbs 似乎约等于 1 小时恢复
zod9527
10 天前
@OneLiteCore 有道理
zhaoxiaofeng
10 天前
硬路由+PEV(fnos+immortalWRT+linux+win),默认还是指给硬路由,有需要的自己指给 immortalwrt
PEV 挂了还有硬路由可以用,硬路由挂了没辙
zhaoxiaofeng
10 天前
@zhaoxiaofeng 非下载服务直接扔给阿里云 docker 部署,还配置了 tailscale 中继,直接练到家里的内网
coldle
10 天前
boom 过一次主板,整个周末都在搭灾备环境
lovelylain
10 天前
你这个网络使用硬路由,不算 all in boom ,看看我的:n1 刷 openwrt 做主路由,上面 docker 跑 homeassistant+nodered+zigbee2mqtt ,家里的开关窗帘都是接入这个 zigbee2mqtt ,接移动硬盘当 NAS 用,外面用手机和老家电视也能通过 wireguard 访问,手机访问 google V2EX 也是 wg 连回来,还在上面跑了 frigate 当 nvr ,emmc 剩余寿命 20%,你说我这个炸的风险有多高,炸了影响有多大。
charles0
10 天前
我的理解是有单点故障的风险,包括误操作、硬件问题等等
Kylin30
10 天前
手贱
AkinoKaedeChan
10 天前
漏了一点啊,内存故障导致比特翻转,然后文件损坏出现不可预测的错误,建议换成 REG ECC 内存。
xixiv5
10 天前
昨天炸了一次,应该是路由器的电源适配器里的电容炸了 导致这条回路的空开跳闸,UPS 没有成功完成关机操作,看到日志只有切换到 UPS ,但是没有关机的日志,通电后查看电量有 90%,估计是电池噶了
WizardLeo
10 天前
人家 all in boom 路由、储存、服务全在一台设备的一块盘上,启动顺序不对 boom 、掉盘 boom 、手贱改网络配置 boom 、异常断电 boom 。
最主要的还是 0 修复宽容度,只要坏一次基本就得大动干戈用其他设备直接修改磁盘内的系统文件。
msg7086
10 天前
用软路由炸了直接把线接到硬路由上先把网络搞通再搞别的啊,多大点事。
我是服务器上跑 PVE ,PVE 上直接用 zfs 跑 NAS ,然后一个虚拟机里 OPNSense 做路由,另一个跑 frigate 。
PVE 本来也挺稳的,真炸了就 IPMI 连上去修。
唯一要担心的是 SSD 损坏。真要担心的话就定期备份一下就好了。
CapNemo
10 天前
还有一个可能性是没有仔细考虑冷启动/恢复时的循环依赖,导致到时候要修好 A 得从 B 里提取备份,要修好 B 得从 A 里提取备份
AkinoKaedeChan
10 天前
还有一点 消费级主板普遍没有 IPMI ,在没有的情况下把宿主机显卡全部直通了的话会导致宿主机网络挂掉的情况下难以维护,可以通过 SR-IOV 保留 PF 在宿主机(仅 12th 后 Intel 核显和工作站/数据中心显卡(须购买付费授权))。
buruoyanyang
9 天前
我之前是路由器都是用的爱快,然后突然有一天盘炸了,刚好我出差了,家里直接断网
bowencool
9 天前
All in Boom 六七年了,boom 的时候把路由器插在光猫上,自己插网线 debug 不就行了。。。
alb
9 天前
All in One ,玩的就是家庭环境下的 DIY 。考虑省钱,涉及的东西又太多,不 boom 怎么去折腾呢。比如说,电源波纹对电容的长期影响,Lucky 的每次升级了什么代码。都是年轻人在玩,有精力的把票玩成品牌就出坑,没精力的,玩上几年,理清需求了也就转赛道了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1154262

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX