求開源的 AI 翻譯和 OCR 工具

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

要求：翻譯英文和日文的 pdf 小說和技術書籍（ 100-1000 頁）

在 github 找了一個開源的 pdftranslate 測試了一天，發現如下問題

1.一半的模型用不了，要不提示 api 不對要不未知報錯 2.某些掃描圖片格式的 pdf 不識別文字及排版，翻譯出來要么是原文無變化要么報錯 3.某些文件翻譯出來各種亂碼及排版不對 4.英文識別率好於日文，日文存在從右到左的豎排排版問題比較難處理

求靠譜的工具，可付費

AI翻译

OCR工具

PDF翻译

8 条回复 • 2025-07-21 10:28:11 +08:00

neteroster

14 天前 via Android

https://github.com/NEKOparapa/AiNiee
https://github.com/neavo/LinguaGacha (不支持 PDF)

术语表生成： https://github.com/neavo/KeywordGacha

其实感觉起来先从 PDF 提文本再给工具翻比较好，比如 doc2x 之类（不想用也可以自己写脚本扔给 Gemini API ），竖排日文不确定能不能做。不行的话单独处理，用类似 https://github.com/kha-white/manga-ocr 的东西

unclemcz

14 天前 via Android

商用还是非商用？
如果非商用，ocr 可以参考 v2 之前一个帖子，从微信提取的 ocr 工具，帖子地址忘了，docker 地址是 https://hub.docker.com/r/golangboyme/wxocr ，我试过对日文识别很好。
翻译的话用本地化的 qwen3 就很好。
你可以参考我之前一个项目所使用的 ocr 和翻译相关接口（ https://github.com/unclemcz/wodict ），我觉得非商用的情况下，qwen3+wxocr 可以很好解决你的需求。
当然 pdf 这部分需要你自己再处理。