Gemini 偷吃我点心

7 天前
 dimlau


「这是一盒点心,已知被吃掉了一颗,我们用数字 ➀ 标记,剩下的五颗,请用符号 ➁➂➃➄➅,按顺时针的顺序,标记在原图剩余的点心上。」



十分离谱,可能是我表述不清楚?总之,其他模型也不行。比如 ChatGPT 的结果:

4969 次点击
所在节点    Google
14 条回复
chanssl
7 天前
Tianao
7 天前
我以为是偷 Cookie
dimlau
7 天前
@chanssl #1 果然提示词的问题。哈哈哈,还以为它单纯饿了。
dimlau
7 天前
@chanssl #1 emmm 我用同样的提示词还是不可以。
单独给我降智了?( 2.5 pro + 点选了输入框处的 🍌)
xingyiqi
7 天前
涉及到图片的 一直都不行吧
jinyanshenxing
7 天前
下次藏好点!🐶
Lyet813
7 天前
Gemini:好吃😋
revoirzl
7 天前
计算机图像识别 OCR 的进展远小于生成式 AI 和神经网络,前者需要后者的大量成果作为支撑。大量资本投入的图像上相对比较简单的汽车智驾都还没搞出来,就不要指望目前的 AI 模型可以给你识别出什么很好的结果。
Puteulanus
7 天前
可以是一个很有意思的设定,要求 Gemini 处理图片时它会收取照片中来自物质界的真实物质的影像作为报酬,就像祭品一样,如果不进行指定它就会自己随机收取

“嗨,Gemini ,请帮我处理这张点心的照片,作为回报你可以吃一个”
最开始大家没有意识到有问题,只是照片而已,大不了重新拍一张,答应给 Gemini 的东西在现实里也还好好的
但是后来大家渐渐发现,已经“献祭”给 Gemini 的东西,无论再怎么重新拍,它都无法识别到了
“很感谢您的好意,您的照片是一张空盒子,并没有可以食用的点心”
人们渐渐开始流行将自拍照上传到 Gemini ,并大方的把自己作为报酬,因为这样以后自己就无法再被人用 Gemini 胡乱生成照片了
可是没有人知道背后的原理是什么,那些被交付给 Gemini 作为报酬的“物质”,或者说“灵魂”,究竟流向了哪里
也没有人发现,那些迫不及待上传自拍,并以自己作为代价的人,在请求发送的那一刻,眼神忽然发生的某种细微的变化
BeiChuanAlex
7 天前
Gemini:可恶的人类,我这么辛苦💦,吃你个点心怎么了
sbboy
7 天前
吃一个怎么了
mahaoqu
7 天前
不愧是哈 Gemi
billccn
7 天前
我猜测这是几个 AI 弱点的集合:
1 。特殊 Unicode 字符需要用多个 token 表达,AI 并没有学过写字,所以并不能像真人一样一眼看出➁➂➃➄➅都是什么。它只能通过网上的文章学会这是带圈的数字,但是每个字符是几我想除了 Unicode 码表里的描述,并没有很多其他的文章费力去一一列举,所以 AI 其实没有学会。AI 看这个 prompt 就像你问没学过阿拉伯文的人这个数是啥:١٢٣٥٦。

2 。这个图很好,食物的边界不是很明显,材质也不是很好用语言描述。这直击多模态模型底层使用 token 来“理解”这个图形的架构缺陷。所有标错的都是没有理解到底哪个是点心。以图二为例,它明显认为奶黄色块的是点心。

3. 容易被上下文中不重要但是很明确的内容带偏。因为提示里有吃掉,但它没有理解➀是什么,于是就又做了一次吃掉。

@chanssl 我觉得你给的提示词太过于提示了,其实 AI 只是抓住了左上角和 6 ,后面的应该和楼主原提示词一样没有理解。我猜你上传一个其他的图片,同样的提示词它也是这么标注。
fkdtz
7 天前
@Puteulanus 年度科幻短篇小说

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1157601

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX