一道三年级数学题把大模型难住了,不是说数学推理都很厉害吗

1 天前
 goodryb
昨晚辅导儿子作业,本来想秀一下大模型,结果翻车了

原题目是:一笔画(隐含意思是不能走回头路),从红色位置开始 经过图形中的每个方块,其中灰色的方块不能经过




试了下 qwen 、豆包、gemini 都没做出来,其中 qwen 一直深度思考,豆包给的答案是错误的,gemini 说这个题目无解,但确实是有正确答案的


是题目太刁钻还是我使用的方法不对,或者说是没找到最厉害的大模型
3726 次点击
所在节点    程序员
53 条回复
Cruzz
1 天前
可以一笔走完,终点会落在 **(1,7)**。
按下面顺序从红点 **(5,2)** 出发依次经过所有白格(仅四向移动),灰格均避开:

1. (5,2) → (4,2) → (3,2) → (3,1) → (2,1) → (1,1) → (1,2) → (2,2) → (2,3) → (1,3)
2. (1,4) → (1,5) → (2,5) → (2,4) → (3,4) → (3,3) → (4,3) → (5,3) → (5,4) → (5,5)
3. (5,6) → (5,7) → (5,8) → (4,8) → (3,8) → (3,7) → (4,7) → (4,6) → (4,5) → (3,5)
4. (3,6) → (2,6) → (2,7) → **(1,7)**

对应方向序列( U 上/D 下/L 左/R 右):
**U U L U U R D R U R R D L D L D D R R R R R U U L D L L U R U R U**

这样能恰好覆盖所有可走格且不重复经过。

gpt5 给的答案,不知道对不对,还有,你给他的坐标对不对,只喂一张图,他有可能识别的有问题,gpt 会问你他识别的图是否是正确的,补充下坐标就行了,怎么问大模型也是个技术活。
JConlee
1 天前
类比人的话,不能让人/大模型空想,需要给他们纸笔/tools (function calling)。最简单的 function 比如写代码尝试。
goodryb
1 天前
@Cruzz 我提问的时候特意把图形转化成坐标,就怕它识别有问题 [有一个 8*5 的二维坐标,起始坐标是( 0 ,0 ),最大坐标是( 7 ,4 ),现在需要从( 1 ,0 )作为起点,找到一条路径,经过这个坐标中的所有点,其中( 0 ,0 )( 0 ,1 )( 3 ,1 )( 5 ,4 )( 7 ,3 )( 7 ,4 ) 这些点不能经过,请给出合适的路径,不能重复经过相同的点,每次移动的两个点必须是相邻的] ,但结果如我上面所说
vivisidea
1 天前
这种问题,感觉更适合让大模型写代码来解决

有一个 8*5 的二维坐标,起始坐标是( 0 ,0 ),最大坐标是( 7 ,4 ),现在需要从( 1 ,0 )作为起点,找到一条路径,经过这个坐标中的所有点,其中( 0 ,0 )( 0 ,1 )( 3 ,1 )( 5 ,4 )( 7 ,3 )( 7 ,4 ) 这些点不能经过,请用 python 代码求解这个问题

```
/usr/bin/python /home/vivi/Desktop/run.py
正在计算路径,请稍候...

成功找到一条满足条件的路径,共 34 个点:
(1, 0) (1, 1) (1, 2) (0, 2) (0, 3) (0, 4) (1, 4) (1, 3) (2, 3) (2, 4)
(3, 4) (4, 4) (4, 3) (3, 3) (3, 2) (2, 2) (2, 1) (2, 0) (3, 0) (4, 0)
(5, 0) (6, 0) (7, 0) (7, 1) (7, 2) (6, 2) (6, 1) (5, 1) (4, 1) (4, 2)
(5, 2) (5, 3) (6, 3) (6, 4)
```

结果没验证,但看代码是递归回溯的,应该不会错 :)
nickwzy129
1 天前
GPT:
可以。满足“从 (1,0) 出发、只走相邻格、不走禁用点、覆盖其余全部点且不重复”的一条路径如下(共 34 个点):

(1,0) → (1,1) → (1,2) → (0,2) → (0,3) → (0,4) → (1,4) → (1,3) → (2,3) → (2,4) → (3,4) → (4,4) → (4,3) → (3,3) → (3,2) → (2,2) → (2,1) → (2,0) → (3,0) → (4,0) → (5,0) → (6,0) → (7,0) → (7,1) → (7,2) → (6,2) → (6,1) → (5,1) → (4,1) → (4,2) → (5,2) → (5,3) → (6,3) → (6,4)

说明:
• 禁用点 {(0,0),(0,1),(3,1),(5,4),(7,3),(7,4)} 未被经过。
• 每一步均为四邻(上下左右)相邻移动。
• 覆盖了 8×5 网格中除禁用点外的全部 34 个可用坐标,各点仅经过一次。
HappyFox
1 天前
使用方法问题,刚试了试,引导得当的情况下豆包极速版和 claude4.5 都能做出来
TLND:别把 AI 当预言机,当成手下刚入职的实习生,一步一步带
1 、如果希望解决问题、应该给出你希望的解决方向和预期结果格式。和上班一样,只给题目不给要求、拿到的永远是“努力”但不一定有用的结果。
2 、如果希望辅导作业,建议结合课本内容和孩子的知识储备,不然 AI 直接上 DFS 那太欺负小朋友了。

提示句可参考这个版本,在豆包不开思考的情况下就可以给出结果
请帮我写一个代码解决以下问题
有一个 8*5 的二维坐标,起始坐标是( 0 ,0 ),最大坐标是( 7 ,4 ),现在需要从( 1 ,0 )作为起点,找到一条路径,经过这个坐标中的所有点,其中( 0 ,0 )( 0 ,1 )( 3 ,1 )( 5 ,4 )( 7 ,3 )( 7 ,4 ) 这些点不能经过,请给出合适的路径,不能重复经过相同的点,每次移动的两个点必须是相邻的
注意
1 、代码编写后应检查是否有语法问题
2 、需要写测试用例验证输出路线是否符合题目要求,输出步数、路径
coefu
1 天前
上面的各种问题转换+提示词,真 “人工”智能。
shihira
1 天前
@coefu 🤣对,就差直接喂答案了
coefu
1 天前
@shihira 现在所追求的通用 AGI ,就是有别于 80 年代失败的专家系统,如果每个问题都要提问者自己反刍给 LLM ,还有什么值得吹的。,本质上来说和 80 年代的专家系统,只是更更更高级一点罢了。
cambria
1 天前
没感觉有什么困难,上传图片直接问就行。


prompt:

[图片]这张图片是由红白灰三种颜色组成的,如果从红色开始,只能将相邻的白色格子涂成红色,一个格子不能涂两遍,如何将整个图片中的白色格子都涂成红色?


GPT5:

可以,把它当成“从红色出发的哈密顿路径”问题来走就行(只走上下左右、每个白格只进一次)。
按下面的移动序列即可把所有白格一次性全部涂红( U=上,D=下,L=左,R=右;起点是底行第 2 列那一格的红色):

U2, L1, U2, R1, D1, R1, U1, R2, D1, L1, D1, L1, D2, R5, U2, L1, D1, L2, U1, R1, U1, R1, U1

也可以写成一串:
UULUURDRURRDLDLDDRRRRRUULDLLURURU

照此顺序走,能覆盖所有白格且不走回头路。
nakun233
1 天前
图片有问题,直接给图 gemini 会识别出 5x7 的格子导致没给出答案
burnsby
1 天前
我很好奇,三年级有这种数学题吗
Gilfoyle26
1 天前
《一个知名的数学教授,居然连高中的数学题都做不出来,真是白当教授了》
NessajCN
1 天前
谁告诉你大模型数学厉害的?
从原理上来讲大模型就是不会数学的,因为它是文本匹配
所有的编程或数学能力都不是单纯的大模型能力而是配合其他的计算或编码工具
早版本的大模型甚至 3 的 3 次方都不会算
idragonet
1 天前
是的,大模型数学能力很差的,经常给小学题 AI 做错,
fortytwo
1 天前
大模型不适合直接解答此类包含高维的数据问题。需要借助工具降维处理。
有两点:
1 、应该让他编写解答问题的方法即计算代码,而不是让他自己直接计算,概率模型无法做到 100%预测正确,只能趋近。2 、输入的问题需要精确,这个图如果转为二维序列,能够推导解答代码也是很容易的。
donaldturinglee
1 天前
你把图喂给 AI ,如果是图你要做寻路,你得把入口和出口给它标出来,这样就大概率能做出来
abelmakihara
1 天前
@coefu #9 写代码一样的 复杂一点点的就需要一步步拆
最后累死累活半天反复 review ai 的代码..
goodryb
1 天前
@burnsby 有的兄弟,你搜下一笔画就知道了,这个题就是设置了一些不可经过的点,稍微有点难度
goodryb
1 天前
@coefu #7 确实,我以为经过近几年的发展已经能直接对话了,没想到还是要有人工,然后才能智能

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1169107

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX