最近在找一种方式,能自动为视频添加双语字幕(比如中英对照),主要用于讲座、课程或播客内容的整理。
理想流程是:
视频中识别出准确的语音转文字( ASR );
同时识别原语种(如英语/西班牙语/意大利语等)+ 翻译成目标语种(如中文);
输出双语字幕,最好是带时间轴的 .srt 或 .ass 格式;
最好可以本地跑,或者有 API 调用方式;
目前看到一些方案,比如:
Whisper + GPT 翻译流程(但翻译质量不稳定且较难控格式);
B 站自带字幕生成功能目前只能出中文字幕,英文字幕不全。
想问下大家有没有:
本地部署/自动化脚本推荐?
模型调用(比如 openai 、gemini 、claude )有没有现成轮子?
或者有没有开源项目能做到稳定双语字幕输出?
感谢!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.