![]() |
1
FabricPath 73 天前
因为 FFT 本来就已经非常快了,在 CPU 上随便吊打 DSP ,即使 DSP 有 FFT 加速指令,但是 CPU 凭借几十 W 的功耗,轻松吊打 DSP 。
|
![]() |
2
rekulas 73 天前
aes 这类算法是因为很多场景确实需要快速计算
傅里叶我想象不出有什么场景有这个需求, 就算有估计也是小众需求,不值得专门搞吧 |
![]() |
3
soul11201 73 天前
OT:matlab 里面确实是一条指令~~~
|
6
w568w 73 天前
FFT 主要用在信号处理里吧。加密算法你每天上网都要用到( TLS ),但信号处理应该不是什么需要持续做的事情吧
|
![]() |
7
geelaw 73 天前 via iPhone ![]() AES-NI 只是把 AES 中的一部分做成了指令,作用一次 AES PRP 需要调用指令多次,每个指令的参数也是定长的。特别地,并不是一个指令就可以加密任意长的字节数组。
类似的思路运用到 FFT 上,首先需要找出 FFT 中反复用到的同类、定长参数的步骤,然后做成指令,一通分析之后可能会发现没有很好的除了加法、乘法、求余数之外的很好的抽象层。 |
![]() |
8
rus4db 73 天前 ![]() 1 、FFT 的硬实现已经做进各类硬件了,比如音视频硬 codec 、DSP 、无线网卡、射频/基带芯片等等。
2 、FFTW 之类的库已经足够快了,做成硬件指令不划算。 3 、FFT 的变体非常多,效率与问题规模有关,与其做成通用指令,不如直接做进应用场景,针对性优化。 |
![]() |
9
icyalala 73 天前
FFT 变体很多很灵活,要全支持很麻烦,让上层软件去写 SIMD 更划算。
比如苹果的 vDSP: https://developer.apple.com/documentation/accelerate/fast-fourier-transforms |
![]() |
10
passive 73 天前 via Android
别说 FFT ,连复数的表示都没统一。
做 1 维 FFT ,做不做 2 维?做 2 维 FFT ,做不做 2 维 DCT ?做不做三维 FFT ?做不做任意维度 FFT ? 做了 float 还需要做 double ,那做不做 80 位的浮点? |
13
linearxian 72 天前
FFT 是矩阵乘法算子,但是会形成复数,所以一般都用 DCT 。用 CUDA 会需要把数据拷来拷去,并且一般矩阵纬度不大,杀鸡焉用牛刀
|
14
Alias2023 71 天前
有些指令看似个新的,也是几个指令拼起来的
|
![]() |
15
InkStone 71 天前
优化过一次 NTT (可以理解为 FFT 的变种),这玩意儿的问题在于,它里面的计算不是固定的……原根可以取不一样的,模数可以取不一样的,乘法可以用几种不同的方法实现,输入格式也很灵活。
|