V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
beyondstars
V2EX  ›  问与答

求音乐品鉴 AI 推荐

  •  
  •   beyondstars · 26 天前 · 844 次点击

    想寻找具有下列功能的 AI 模型:

    1. 接受声音波形(或傅立叶频谱瀑布图)作为输入;(波形输入)
    2. 文字输出;
    3. 能够以自然语言的方式表达对音乐的品鉴、赏析;(类比为就好像你用文生文模型品鉴古诗一样)
    4. hugging face 这样的平台有这类模型?关键字?类别? github 上有这样的 pre-trained 模型?
    1 条回复    2025-06-21 14:44:56 +08:00
    Tamio
        1
    Tamio  
       25 天前
    接受声音文件的多模态都可以. 比如 gemini-2-flash 就支持
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5831 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 02:08 · PVG 10:08 · LAX 19:08 · JFK 22:08
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.