项目地址
项目首页
在网站上点击使用在线工具就可以直接尝试,第一次因为需要加载模型,时间会比较久一点。
🎯 核心功能
- 🎤 智能语音识别:基于 Whisper 模型的高精度语音转文字,支持多种语言
- ✂️ 可视化字幕编辑:直观的字幕片段选择和删除界面
- 🎬 实时视频预览:与字幕同步的视频播放器,支持区间播放
- 📤 多格式导出:支持 SRT 、JSON 字幕格式以及视频文件导出
- 🎨 字幕样式定制:自定义字幕字体、颜色、位置等样式
- 🌐 国际化支持:组件化国际化设计,支持中文、英文、自定义语言包(如日语示例)
🔧 技术特色
- ⚡ 现代化技术栈:React 19 + TypeScript + Vite + Tailwind CSS
- 🧠 本地 AI 处理:使用 Hugging Face Transformers.js 在浏览器本地运行 AI 模型
- 🎯 Web Workers:ASR 处理在后台线程运行,不阻塞主界面
- 📱 响应式设计:适配不同屏幕尺寸的现代化界面
- 🎪 组件化架构:模块化设计,易于维护和扩展
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://ex.noerr.eu.org/t/1161338
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.