求佬推荐一个本地可部署的音频转文字模型

288 天前
 7747139suy

8-16g 显卡可跑,中文能力强

1634 次点击
所在节点    Local LLM
7 条回复
lpf0309
288 天前
百度 paddlespeech ,阿里的 funasr ,cpu 都能跑
isSamle
288 天前
Whisper/SeamlessM4T/vosk
mumbler
288 天前
donaldturinglee
288 天前
cuda Whisper
n
288 天前
试了下,有些 cpu 都能跑,有趣。借楼请教这些方案哪个支持识别 speaker 呢?
n
288 天前
哦,不好意思,仔细看了下,几乎都支持。
hellojay
288 天前
@n 好像都没有支持的。哎

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1101223

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX