V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
ljiaming19
V2EX  ›  程序员

快速傅里叶变换(FFT)在很多行业都是常用算法 为什么 intel/amd 这些 cpu 厂商没有为这个算法开发专用指令集

  •  
  •   ljiaming19 · 73 天前 · 4420 次点击
    这是一个创建于 73 天前的主题,其中的信息可能已经有所发展或是发生改变。
    像 AES 加密算法有 AES-NI 指令集,为什么 FFT 这种常见的算法这些 cpu 厂商不开发 FFT 指令集
    15 条回复    2025-05-26 10:03:55 +08:00
    FabricPath
        1
    FabricPath  
       73 天前
    因为 FFT 本来就已经非常快了,在 CPU 上随便吊打 DSP ,即使 DSP 有 FFT 加速指令,但是 CPU 凭借几十 W 的功耗,轻松吊打 DSP 。
    rekulas
        2
    rekulas  
       73 天前
    aes 这类算法是因为很多场景确实需要快速计算
    傅里叶我想象不出有什么场景有这个需求, 就算有估计也是小众需求,不值得专门搞吧
    soul11201
        3
    soul11201  
       73 天前
    OT:matlab 里面确实是一条指令~~~
    laminux29
        4
    laminux29  
       73 天前
    mayli
        5
    mayli  
       73 天前 via Android
    确实
    @rekulas aes 基本上每个联网的机器都会一直用到 fft 就不是 而且 fft 处理的数据量也不大
    w568w
        6
    w568w  
       73 天前
    FFT 主要用在信号处理里吧。加密算法你每天上网都要用到( TLS ),但信号处理应该不是什么需要持续做的事情吧
    geelaw
        7
    geelaw  
       73 天前 via iPhone   ❤️ 2
    AES-NI 只是把 AES 中的一部分做成了指令,作用一次 AES PRP 需要调用指令多次,每个指令的参数也是定长的。特别地,并不是一个指令就可以加密任意长的字节数组。

    类似的思路运用到 FFT 上,首先需要找出 FFT 中反复用到的同类、定长参数的步骤,然后做成指令,一通分析之后可能会发现没有很好的除了加法、乘法、求余数之外的很好的抽象层。
    rus4db
        8
    rus4db  
       73 天前   ❤️ 4
    1 、FFT 的硬实现已经做进各类硬件了,比如音视频硬 codec 、DSP 、无线网卡、射频/基带芯片等等。
    2 、FFTW 之类的库已经足够快了,做成硬件指令不划算。
    3 、FFT 的变体非常多,效率与问题规模有关,与其做成通用指令,不如直接做进应用场景,针对性优化。
    icyalala
        9
    icyalala  
       73 天前
    FFT 变体很多很灵活,要全支持很麻烦,让上层软件去写 SIMD 更划算。
    比如苹果的 vDSP: https://developer.apple.com/documentation/accelerate/fast-fourier-transforms
    passive
        10
    passive  
       73 天前 via Android
    别说 FFT ,连复数的表示都没统一。

    做 1 维 FFT ,做不做 2 维?做 2 维 FFT ,做不做 2 维 DCT ?做不做三维 FFT ?做不做任意维度 FFT ?

    做了 float 还需要做 double ,那做不做 80 位的浮点?
    YsHaNg
        11
    YsHaNg  
       73 天前 via iPhone
    @passive 然后要不要再做个 ntt
    julyclyde
        12
    julyclyde  
       72 天前
    @soul11201 matlab 是纯软件吧?这里说的是硬件呢
    linearxian
        13
    linearxian  
       72 天前
    FFT 是矩阵乘法算子,但是会形成复数,所以一般都用 DCT 。用 CUDA 会需要把数据拷来拷去,并且一般矩阵纬度不大,杀鸡焉用牛刀
    Alias2023
        14
    Alias2023  
       71 天前
    有些指令看似个新的,也是几个指令拼起来的
    InkStone
        15
    InkStone  
       71 天前
    优化过一次 NTT (可以理解为 FFT 的变种),这玩意儿的问题在于,它里面的计算不是固定的……原根可以取不一样的,模数可以取不一样的,乘法可以用几种不同的方法实现,输入格式也很灵活。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3092 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 00:03 · PVG 08:03 · LAX 17:03 · JFK 20:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.