四博 AI 小黄鸭几点体验

13 小时 58 分钟前
 rming

对小智机器人了解不多,基本上只看过名字和简介
昨天收到货,拆开包装大概看了说明书,操作联网配置默认参数。

和不到 3 岁的闺女一起体验了下,有几点体验:

  1. 孩子非常好奇:“为什么他会说话呢”,“他的眼镜会说话呢”,“快看看我会 xxx (向机器人炫技,我说他看不到的)”,“他为什么不睁开眼睛”

  2. 语音识别能力一般。小孩子刚学会说话,一些话比较模糊,默认模型听不懂,可能需要配置更高级的付费版模型?

  3. 好像没有语音唤醒?我都是按右侧按钮开启对话,试了几次好像唤醒词无法唤醒,我给起的名字是“光头强”,试了好几次都不行

  4. 机器人说话无法打断。好像分为“说” 和 “听” 两个状态,是不能通过唤醒词打断的,这点对于一个没有耐心的孩子简直是个灾难 😭

  5. MCP 功能不错,可以播放音乐,一放音乐孩子就开始跳舞了,但是默认的曲库应该是太少资源了,自建应该是可以扩充。

虽然在我看来这是一款不算成熟的产品,后续我也了解到通过双 mic 可以实现语音打断,通过摄像头可以让 VLM 看见,不过一直到刚才,闺女还在和“光头强”胡扯,还是挺有意思的。

科技是服务于生活的,虽然还不完美,不过方向没毛病。

517 次点击
所在节点    分享发现
11 条回复
stinkytofux
13 小时 54 分钟前
我今天刚拿到货, 产品非常有意思, 我家小孩爱不释手. 比小爱同学聪明多了. 刚刚去淘宝又买了两个准备送给朋友小孩, 哈哈. 大模型果然厉害, 尤其是连续对话能力.
stinkytofux
13 小时 54 分钟前
我儿子还问我, 它是不是真的人.
rainfox
13 小时 45 分钟前
我收到的喇叭有点破音,不知道是不是个例
rming
13 小时 11 分钟前
@rainfox 有破音,不清楚是 TTS 的问题还是硬件问题
rainfox
12 小时 27 分钟前
@rming 感觉像是硬件,我是让播放音乐的时候感觉超级明显。另从小智平台上来听,麦克风的声音也有些失真。这些都是发现的缺点,其他感觉都挺好。
python35
12 小时 8 分钟前
行业相关,实现打断是需要实现 aec ,也就是回声消除,跟双 mic 关系其实不大
不做回声消除的话,mic 是会录到喇叭放出的音频的
举个例子假设‘小爱同学’播放了一句‘你可以通过小爱同学唤醒我哦’,然后识别到了‘小爱同学’自己把自己唤醒了
做 aec 这种前端算法算力要求其实在端侧芯片上对芯片有一定的要求的
所以很多场景如果没有做 aec 的话,在播放的时候会把 mic 路禁用掉
itnoob
11 小时 50 分钟前
B 站这个视频有延时,播放过程中可以打断; https://www.bilibili.com/video/BV1icXPYVEMN/;确实开放后台 DIY 的话,可玩性还不错;不过,使用了后台的模板,让播放笑话的时候,并没有遵循角色设定是一个 8 岁三年级学生,讲的笑话还有 WTF 。
foxhunt
11 小时 5 分钟前
我也收到了,在想怎么刷机

但成品没有找到螺丝,不知道是不是要用到小绿毛巾打开它
imydou
9 小时 18 分钟前
hpliu
8 小时 38 分钟前
@foxhunt 金属网可以撬开,下面按键区域也可以撬开,然后就有 6 颗螺丝孔。原推荐帖有所有开发资料。
@rming 语音唤醒只支持“你好小智”,改了名字也不支持。mcp 音乐是怎么实现的啊?外行有啥简单的办法?
MajestySolor
8 小时 21 分钟前
那么哪里可以买到现成的呢?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1171539

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX