快速傅里叶变换(FFT)在很多行业都是常用算法 为什么 intel/amd 这些 cpu 厂商没有为这个算法开发专用指令集

73 天前
 ljiaming19
像 AES 加密算法有 AES-NI 指令集,为什么 FFT 这种常见的算法这些 cpu 厂商不开发 FFT 指令集
4421 次点击
所在节点    程序员
15 条回复
FabricPath
73 天前
因为 FFT 本来就已经非常快了,在 CPU 上随便吊打 DSP ,即使 DSP 有 FFT 加速指令,但是 CPU 凭借几十 W 的功耗,轻松吊打 DSP 。
rekulas
73 天前
aes 这类算法是因为很多场景确实需要快速计算
傅里叶我想象不出有什么场景有这个需求, 就算有估计也是小众需求,不值得专门搞吧
soul11201
73 天前
OT:matlab 里面确实是一条指令~~~
laminux29
73 天前
mayli
73 天前
确实
@rekulas aes 基本上每个联网的机器都会一直用到 fft 就不是 而且 fft 处理的数据量也不大
w568w
73 天前
FFT 主要用在信号处理里吧。加密算法你每天上网都要用到( TLS ),但信号处理应该不是什么需要持续做的事情吧
geelaw
73 天前
AES-NI 只是把 AES 中的一部分做成了指令,作用一次 AES PRP 需要调用指令多次,每个指令的参数也是定长的。特别地,并不是一个指令就可以加密任意长的字节数组。

类似的思路运用到 FFT 上,首先需要找出 FFT 中反复用到的同类、定长参数的步骤,然后做成指令,一通分析之后可能会发现没有很好的除了加法、乘法、求余数之外的很好的抽象层。
rus4db
73 天前
1 、FFT 的硬实现已经做进各类硬件了,比如音视频硬 codec 、DSP 、无线网卡、射频/基带芯片等等。
2 、FFTW 之类的库已经足够快了,做成硬件指令不划算。
3 、FFT 的变体非常多,效率与问题规模有关,与其做成通用指令,不如直接做进应用场景,针对性优化。
icyalala
73 天前
FFT 变体很多很灵活,要全支持很麻烦,让上层软件去写 SIMD 更划算。
比如苹果的 vDSP: https://developer.apple.com/documentation/accelerate/fast-fourier-transforms
passive
73 天前
别说 FFT ,连复数的表示都没统一。

做 1 维 FFT ,做不做 2 维?做 2 维 FFT ,做不做 2 维 DCT ?做不做三维 FFT ?做不做任意维度 FFT ?

做了 float 还需要做 double ,那做不做 80 位的浮点?
YsHaNg
73 天前
@passive 然后要不要再做个 ntt
julyclyde
73 天前
@soul11201 matlab 是纯软件吧?这里说的是硬件呢
linearxian
73 天前
FFT 是矩阵乘法算子,但是会形成复数,所以一般都用 DCT 。用 CUDA 会需要把数据拷来拷去,并且一般矩阵纬度不大,杀鸡焉用牛刀
Alias2023
72 天前
有些指令看似个新的,也是几个指令拼起来的
InkStone
72 天前
优化过一次 NTT (可以理解为 FFT 的变种),这玩意儿的问题在于,它里面的计算不是固定的……原根可以取不一样的,模数可以取不一样的,乘法可以用几种不同的方法实现,输入格式也很灵活。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1134075

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX