请问安卓一般如何做语音转文本

188 天前
 Yiverin

rt 请问安卓是否有自带包可以实现?目前最好用的一般是走什么方案?谢谢~

4076 次点击
所在节点    Android
19 条回复
dayeye2006199
188 天前
不需要本地就随便找个 API
Yiverin
188 天前
@dayeye2006199 您一般推荐什么 api 呀?而且我的需求不是实时的。比如 1 小时的录音转文本
unclemcz
188 天前
长音频转录当前好像还没看到有纯客户端方案。
Yiverin
188 天前
@unclemcz 是的,感觉大家都只做实时的。感觉很奇怪,不支持导入音频
unclemcz
188 天前
@Yiverin 性能跟不上吧,举个例子,我用 4070laptop ,转录一个小时的音频,差不多 5 分钟左右,这还是用 whisper turbo 模型的情况下。同样模型,手机端估计没办法。
unclemcz
188 天前
实时转录也就几十秒,体验会好很多。
felixlong
188 天前
有支持 Android 的客户端方案,而且是 Whisper:
https://github.com/ggerganov/whisper.cpp
Yiverin
188 天前
@unclemcz 好的感谢!
Yiverin
188 天前
@felixlong 谢谢您~
Yiverin
188 天前
@felixlong 这简直太棒了
hahiru
188 天前
语音转文字用飞书就挺好。客户端效果非常不错。
Yiverin
188 天前
@hahiru 飞书妙记吗,好像有 300 分钟一个月的限制?
magicZ
187 天前
当然是新一代的 kaldi ,文档详细功能强大, https://github.com/k2-fsa/sherpa-onnx
ykrank
187 天前
借楼问一下,有没有本地图像识别的 SDK ?最好免费的模型
ykrank
187 天前
识别图片里的文字
Yiverin
187 天前
@magicZ 辣么牛皮!我来康康,谢谢!
luaex
187 天前
ASR 建议用 sherpa
luaex
187 天前
@ykrank cnocr 里面的那些 onnx 的模型也许能试一下 https://github.com/SvenVincent/cnocr
XXWHCA
187 天前
@ykrank #14 谷歌的 ML Kit 机器学习就可以本地 OCR ,免费
https://developers.google.com/ml-kit/guides?hl=zh-cn

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1097637

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX