今天看新闻 kimi 的数理化远超 gtp-4o,我用了一个小学三年级奥数题目考它,它竟然无限循环了

201 天前
 changyang

如题 题目是:

请你帮我做一个数学习题 请你使用加号,减号,乘号,除号,括号,填入下面几个数之间,让结果等于 24 10 10 4 4 = 24

它不停的输出应该是 xx 答案,但是这么算好像不对,重新计算答案。 所以这样的成绩真的能高考拿到一本分数吗?

7287 次点击
所在节点    OpenAI
68 条回复
hello267015
200 天前
我感觉是你的输入有点歧义,加个冒号就可以了,试了几个大模型都是秒解

请你帮我做一个数学习题 请你使用加号,减号,乘号,除号,括号,填入下面几个数之间,让结果等于 24:
10 10 4 4 = 24
java123
200 天前
gemini2.0 flash 不行,第一次其实算出来了,但是给出的答案确实另外一个错误的。
Amazon Q:一次性通过,目前也是 IDEA 里我在使用的 AI 插件
4Et5ShxMIq58n6Lr
200 天前
kimi 循环了 30 次停止了,
```
最终,我们发现以下组合可以得到 24:

(
10
×
4
)

(
10

4
)
=
40

6
=
34
(10×4)−(10−4)=40−6=34
```,笑死,
goodryb
200 天前
只能说针对现有的大模型,提问是一个很有技巧的东西,当然,专业说法应该叫提示词工程,针对 qwen2.5 来说,稍微引导下就直接给出正确的结果

vipfts
200 天前
@goodryb 我赞成您的观点, 应该跟问题关系比较大
wowpaladin
200 天前
我的 Gemini 2.0 为什么是个弱智?

----

好的,这是一个经典的数学谜题。答案是:

(10 - 4) * (10 - 4) = 24

或者

(10 - 4) * 4 + 10 - 10 = 24

希望你喜欢!
gulullu
200 天前


GPT o1 成功。
shawnli3299
199 天前
让 gpt 把问题先翻译成英文,再让它回答,我试了,一次性成功,o1-mini

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1098158

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX