1
yuanxing008 2 天前
其实这类工具最大的问题就是如何有效识别用户的不正确发音导致的识别异常,同一个专业术语单词 让十个人来发音可能会有三四种发音
|
2
380cc 2 天前
mac whisper 我用了好几年了,感觉这款听写效果越来越好,从一开始的 cpp 到现在用 kit V2,速度有提升,幻听有下降,非中文的听写质量非常不错。中文听写质量不行,可以在这个 app 里自定义国内 AI 运营商的 api 进行修改,诸如 deepseek, 通义千问,这样生成的中文效果还不错的。大模型不要选 v3 ,要选 v2 不含任何后缀的。
|
3
565656 2 天前
chatgpt 有会议模式?
|
![]() |
4
milestance OP 之前看到在 LINUX.DO 有人推荐 GEMINI 2.5 PRO,这个我还没有测试,看有人反馈长时间音频不支持
|