![]() |
1
sanshiliu 19 天前
有需求,但是感觉不如豆包生成的自然。加油。
|
![]() |
2
cat 19 天前
好牛逼…… TTS 接口是哪个啊
|
3
kurthumburgmtz97 OP @sanshiliu #1 不敢跟大厂抢市场,主打一个小众需求。
|
4
kurthumburgmtz97 OP ![]() @cat #2 好几个,fish audio ,minimax, gemini ,这些 github 上有写
|
![]() |
5
cat 19 天前
@kurthumburgmtz97 看到了看到了,v2ex 热榜的那个 demo 是哪个模型和角色?
|
6
kurthumburgmtz97 OP ![]() @cat #5 就是 https://twocast.app/zh 上默认的选项,即:董**,女大学生
|
![]() |
7
bestie 19 天前
前几天看到的 gogole 这个也还行 https://notebooklm.google/。
OP 这个感觉两个人没有对话感,像是两个人分别在念台词,而且没有什么轻重缓急,要是能优化下就好了。 |
8
kurthumburgmtz97 OP @bestie #7 用 gemini 模型可以有对话感,但是贵。目前阶段还是追求性价比
|
![]() |
9
Kaiv2 19 天前
在 bilibili 上看到了类似这样的视频,不知道是不是用的你这个
|
10
kurthumburgmtz97 OP @Kaiv2 #9 市面上有类似的产品,不过他们都不开源
|
![]() |
11
Newbee24 19 天前
👍
|
![]() |
12
Dex7er 19 天前
大老牛逼,赶紧搞一个根据已知语音的语速和语感模拟出相同语速和语感的不同语言音频的出来呗,前途无量。。。影视行业的本地化是一片蓝海,Netflix Amazon Apple 在朝你招手。。。
|
![]() |
13
xuyihao 19 天前
太卡了,完全打不开
|
14
kuhung 19 天前
看起来可以。好奇老哥这一套开发多久。我之前也写了一个类似的,但是侧重工作流。后来发现没啥热度和变现能力,加上头部厂商也在做这部份,就搁置了。
|
15
kurthumburgmtz97 OP @kuhung #14 基于已有代码又搞了一个月左右
|
16
whung 19 天前
@kurthumburgmtz97 #4 fish audio 不错,一些复刻的音频也很真实。
|
![]() |
17
luofeiff6666 18 天前
大佬牛逼!双人播客很自然。 市面上有没有这样一个产品, 把小说转换成旁白、多角色对话的剧本,然后根据剧本输出有声小说。
|
18
GGswitch 18 天前
发现个 bug 。 任务标题: 婚后爱情的变化及五种爱的语言的重要性, 4 分钟之后就一直重复一句话 使用的长文本 方式
|
19
kurthumburgmtz97 OP @GGswitch #18 感谢反馈。我看了下,4 分钟后,就只剩 6 秒了,主要是没听到有重复的现象,有没有可能是网络问题呢?另一方面,你用的音色好像是英文的,最好还是用中文的。建议切到 /zh 页面,用默认推荐的中文音色。
|
![]() |
20
yxjxx 18 天前
能生产单口播客吗
|
21
kurthumburgmtz97 OP @yxjxx #20 目前不行,如果需要的人多的话,我可以弄一个出来
|
22
IndexOutOfBounds 18 天前 via Android
太需要这个了,有 api 开放吗
|
![]() |
23
yxjxx 17 天前
@kurthumburgmtz97 +1
|