ryd994
155 天前
因为不需要。GDDR 带宽大是靠位宽。延迟比 DDR 高。CPU 做计算需要的是延迟不是带宽,各种控制指令让 CPU 有大量随机读写。miss 多几次,有效带宽就下来了。
苹果用的是 LPDDR ,LPDDR 功耗低但是价格贵。容量很有限。苹果的内存带宽高是不得已为之。因为是融合内存架构。GPU 没有显存,等于核显共享内存。所以内存必须做到带宽高同时延迟低。这就是金子内存的原因。X86 移动平台一直都有用 LPDDR 的选项,在苹果自研 soc 之前就有。
PC 上内存和显存分离,分别优化延迟和带宽,成本更低。普通台式 PC 要么低成本,要么打游戏。都不是带宽敏感的应用,很少会跑满内存带宽。GPU 用显存,也不需要考虑内存带宽。
像你这样非要在家用平台上跑 AI 的,根本就是小众异类。服务器平台十五年前就是 4 通道。最新的 xeon 支持 12 通道,就问你带宽够不够?你跑 AI 爆显存之后慢,瓶颈是 pcie 延迟和带宽,内存带宽再大也白搭。人家跑 AI 用的是专业计算卡,不需要拿内存当显存用。这种 GPU 计算服务器,CPU 和内存可以极致减配,只负责为显卡服务。