最近发现两个广东话粤语 TTS,效果很好接近口语,能猜到背后的模型吗

217 天前
 mogutouer
1. https://cantonese.ai/
2. https://cantontts.replit.app/

非常接近现有普通话 TTS 的感觉,更接近真人说话的语气和停顿。

听声音不是现有例如阿里微软等公司出的粤语 TTS 的声音,更像是私域语料训练的结果,用 CosyVoice2 试了一下,并不一样,应该不是用 CosyVoice2 ,对 TTS 了解的朋友能大概知道他们背后用的是哪个模型训练的吗?
1883 次点击
所在节点    问与答
6 条回复
cyhulk
217 天前
cosyvoice2 的效果怎么样
kNmNP3O7G4Tm3ehH
217 天前
商汤的吧
hahasong
217 天前
Dongdong 声线不就是抖音的
mogutouer
217 天前
@cyhulk #1 声音没问题,但粤语发音不准很难受
loyth06
217 天前
蹲一下,类似这种语音方言模型是怎么训练出来的呢?
zomco
216 天前
蹲,感觉这个粤语模型比 CosyVoice2 好多了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1113773

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX