需要部署基于 funasr 和 Paraformer 的语音识别接口，有没有大神可以支持

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 84 天前的主题，其中的信息可能已经有所发展或是发生改变。

任务主要是部署和二次开发：基于 funASR 和 Paraformer 的语音识别 API 需要离线模式和在线模式两种 API 其中在线模式是通过 websocket 实现的

识别音频主要为 8K 客服电话音频。框架都是标准的，主要是要有实践经验最好，否则坑跨不过去。

我自己也部署过，上线用过一段时间，参数没有太多时间去调，如果对于降噪和调整熟练方面熟练应该能马上跑起来。

主要的优化点：

原版部署噪音过滤效果较差导致错误率较高，需要会调整参数，有一定实践经验，了解如何高效率降噪或调参达到较优水平。 2)需要理解框架和模型性能，部署完成后最大程度发挥服务器性能支持高并发 3)封装为 docker 镜像

2 条回复 • 2025-09-24 11:05:36 +08:00

hardto

83 天前

有的,联系微信：thisiseasytosearch

helloxubiao96

60 天前

8k 的降噪好像开源方案不多欸，楼主你有解决吗？