哪个开源模型最擅长翻译?

256 天前
 caizhenbin

使用 Qt 开发的安卓 app ,目前是英文界面,play 商店上下载量一直不多,希望做本地化来提高下载量,所以需要翻译多语言 ts 文件。

测试了在线的 ChatGPT 、Kimi 、DeepSeek ,以及 VS Code 中使用豆包 API ,都因为文件太长(有 2000 行)不能全部翻译,再要求继续翻译 AI 就开始偷懒,甚至不输出。

于是写了个 python 脚本调用 llamafile 在本地的 server api ,逐句翻译,模型用的 Llama-3.2-3B-Instruct.Q6_K (本地没有 GPU ),发现翻译质量挺差的,译文用词不合适,或者同一个名词在不同句子中翻译不一样(是否因为逐句翻译的原因?)。

想换个其他模型试试,但不知道哪个最擅长翻译工作(模型不能太大,不然运行不起来,电脑是 mini 主机)?或者有其他可行的在线方案?谢谢

5681 次点击
所在节点    程序员
34 条回复
zhze93
256 天前
我们之前用的 nllb_200
EthanZC
256 天前
@InkStone 会员的 2000W 月额度没有你想象中那么多,我都不算什么大容量需求的人,就看看 YouTube,然后偶尔看看英文开发文档, 清明三天都没咋用,结果到今天,给我消耗了 1300W 的额度,这才 17 号...要弄到月底..真的有点不够用
SiWXie
256 天前
pc 版的欧陆词典,用着还不错,支持自定义 api 接口
Xheldon
256 天前
@tool2dx 你的韩语翻译是怎么处理的最后? 我的项目 https://appledocs.dev ,翻译文档有多个回滚的策略,和特定指令。前一个模型翻译不符合我的要求(我会检测翻译结果以符合特定要求),才会使用更高级的模型,回滚策略依次是 Qwen-2.5-14B -> 32B -> 72B -> Grok-2 -> Grok-3 ,目前看只有韩语最终落到高成本的 Grok-3 处理的概率是最高的,其他语言比如日语、中文就很少需要 Grok-3 处理的,很头疼,感觉还是大模型韩语训练语料太少导致的,有什么解决办法吗
enihcam
256 天前
DeepL 好个屁,扯淡。
acezgq
256 天前
开源的 GLM-4-9B
caizhenbin
256 天前
@acezgq 正想说这个,因为 gemini pro 超出每天限量,还有几个语言没有翻译,刚才正好试用了一下 https://chat.z.ai/ ,选择 GLM-4-32B ,上下文数量也能支持我的语言文件的翻译任务,质量也很好,甚至不需要登录,也没有用量限制,除了速度不如 gemini ,其他方面完全没问题。
Azmeont
256 天前
别说翻译了,几乎所有任务上,DeepSeek-V3 和 R1 都是最好的开源模型,其次的是 Qwen 和 QwQ 系列。
Azmeont
256 天前
@Azmeont #28 准确来说是 V3.5 和 R1
BenX
255 天前
Phi-4
msg7086
255 天前
只用过日中翻译,翻译结果主要观察正确性和表达的流畅度。
综合下来最强的是 Claude 和 Gemini Pro ,如果你是做翻译的,取其中一个当底稿然后照着另一个改,基本就八九不离十了。
开源里我就只用了 Deepseek 0324 ,因为 DS 用的语料和国外的不太一样,所以表达出来的用词用语也差别很大,可以看到很多本地化的表达( Gemini/Claude 的表达会更「正统」「生硬」一些),但大多数时候会觉得有点过于放飞自我了,很长一句句子给你缩成一个短句,选择性扔掉一半,剩下的找个本地表达。
其他国产模型没什么机会用,就不多评价了。
bbsingao
255 天前
3b 不够,我公司自建的 gpu 资源,qwen-14b,上下文设置 16k 就很好了。
v2ruiex
255 天前
ai 翻译还是需要调教的,其实翻译的项目 GitHub 肯定很多,不建议重复造轮子。我用的是 AiNiee ,买了 ds 的 api ,体验良好。
想自己写,你也可以看看他们是怎么调教 ai 的,获取一些经验想法,比如 AiNiee ,有很多功能,如提示词、术语表、禁翻表。采用一些的话,应该也会提升翻译的质量。
openmynet
255 天前

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1126139

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX