多卡部署 QWQ Q8 是否可行

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 108 天前的主题，其中的信息可能已经有所发展或是发生改变。

目前手上有一块 3090 ，想再买个 5070ti ，凑个 40g 显存，这样可行吗？主板是华南 H12D ，CPU 是 7532 ，主要是想在本地部署个 ragflow ，可能还要部署 embedding ，rerank 和 ocr 的模型，或者买 2 张 5070ti 这样？

3 条回复 • 2025-06-16 11:00:05 +08:00

lithiumii

108 天前 via Android

可行，不过建议 48G 的 4090 或者 4090D 一步到位

mumbler

108 天前

1. 2080ti 22G 支持 nvlink ，两块组成 44G ，加上准系统不到 1 万，这是最廉价的方案

2. qwq 32B 不如 qwen3 32B

coefu

107 天前