寻找飞书妙记(语音转文本)平替?

2024-11-12 22:21:28 +08:00
 jiaqiliu

飞书妙记的免费版开始限制 ASR 的时长了(每月 300 分钟)。有没有其他免费的替代品?或者本地部署的也可以。

https://imgur.com/a/AzL3e7i

3510 次点击
所在节点    云计算
16 条回复
wkla
2024-11-12 22:31:45 +08:00
openai whisper.
阿里达摩院 funasr.
jiaqiliu
2024-11-13 00:13:26 +08:00
自己简单研究了下,有几个工具,都是离线方案:

https://github.com/CheshireCC/faster-whisper-GUI
faster-whisper 的 GUI ,bug 有点多,任务经常卡死,弃

https://github.com/chidiwilliams/buzz
也是一些 asr 引擎的 GUI ,比 faster-whisper 稳定,但是在我电脑上无法正常调用 GPU ,弃

https://github.com/SubtitleEdit/subtitleedit
主要是一个字母编辑软件,但是其中可以调用自选的底层引擎进行 ASR ,可以正常使用 GPU ,缺点是 ASR 没有进度条,其他还不错目前用的这个。笔记本 4060 ,用 largev3 模型处理一个 90 分钟的视频耗时 15 分钟。
cyp0633
2024-11-13 00:26:44 +08:00
实现随便你,但是搭配的模型可以试试 belle-large-v3-punct ,在 whisper 基础上微调过效果好多了
simonsww
2024-11-13 01:43:17 +08:00
同找,妙记日常用的还挺多
janpun
2024-11-13 08:44:42 +08:00
我也在找,妙记用的很多,企业级应用就是这点不好,我可以接受付款,但绑定了整个大平台的付费我就不想买了,因为我只用这个功能
pozhenzi998
2024-11-13 09:14:44 +08:00
JensenQian
2024-11-13 09:35:23 +08:00
有黄老板显卡的话我用的这个 https://github.com/chidiwilliams/buzz
JensenQian
2024-11-13 09:40:07 +08:00
@JensenQian https://github.com/chidiwilliams/buzz/blob/main/CONTRIBUTING.md#gpu-support
默认用的 cpu ,gpu 的话自己看他文档设置,不过得有 cuda

https://github.com/Const-me/Whisper
这个支持 amd 的 gpu ,我的 6800H 的核显也能跑,但是好久没更新了
steelshadow39
2024-11-13 10:07:31 +08:00
最近看了阿里云的通义听悟,可以试试
wulv
2024-11-13 10:15:03 +08:00
通义听悟、钉钉闪记
Xi
2024-11-13 10:21:59 +08:00
通义听悟
linxi7
2024-11-13 11:08:09 +08:00
600 块一年,还有 1500 GB 云存储,平时再用用云文档之类的,感觉能回本。
juicy
2024-11-13 11:36:30 +08:00
iorilu
2024-11-13 11:40:44 +08:00
太多了, 自己折腾可以用 whisper

或者我开发得 ai 字幕机 (www.aizimuji.com)
ladeo
2024-11-13 11:42:06 +08:00
通义听悟
s4d
2024-11-13 19:42:47 +08:00
我用三星手机自带的录音,AI 转录能识别音色,体验很棒。

这个叫 Galaxy AI 。

没有使用限制,但是貌似不能上传录音,必须用手机录。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1089019

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX