现在公认 ChatGPT 已通过了图灵测试,但没有见过的数学题,现在的 AI (GPT) 还是不会解。这是 AI 还不会思考,还是 AI 已经达到了大多数人类的思维水平,即能通过图灵测试,但不会解初中或高中数学题? (像姜萍一样)

306 天前
 shyangs

如下的高中數學題,AI 會用向量法解. 這道題我第一次在別的論壇發帖時 AI 還不會,但現在 ChatGPT 學會了,我懷疑是我發帖後,友壇壇友反覆地問,導致 OpenAI 背後的智能工人注意到了這一題,讓 ChatGPT 背會了.

https://chatgpt.com/share/d4fe9bc6-f62f-408f-b188-4a2fa333e57b

降低難度到初中數學題(如下),ChatGPT 不會了,讓人懷疑 AI 還不會思考,但這樣考慮的話,能通過圖靈測試但不會初中高中數學題的人類(如姜萍)都不會思考?

https://chatgpt.com/share/67451648-ae74-8003-b6ef-332c10d43a12

9492 次点击
所在节点    程序员
95 条回复
Yaavi
306 天前
@squarefong17 所以目前 AI ,从形式上看起来,只是一个超大的数据处理员
zt5b79527
306 天前
@squarefong17 结贴了。还有 4 分钟下班,中午吃点啥捏,楼下新开的饺子馆据说不错,打算去试试
rootOfAdmin
306 天前
谁公认的,马建么
pkoukk
306 天前
@elevioux 什么叫做理解呢?人类的理解是指看到+号,需要加载加法模块,进行计算么?
那对于 GPT 来说,这部分的理解是可以实现的,因为它目前就是多模型复合,第一个模型判断你要讨论什么问题,再把问题送到对应能处理的专业模型实现。
dji38838c
306 天前
一下子炸出来这么多 AI 专家
billlee
306 天前
@shyangs 图灵测试不是看问题能不能答对啊,而是看人类测试员能不能区分被测的机器和人类。像这种高难度的题能答对,低难度的题做不了,就是一个可以区分的特征。
pkoukk
306 天前
什么是思考,什么是理解,我建议大家在说 AI 不会之前好好考虑一下,人类是怎么实现思考和理解的。
我认为,AI 和人类没有什么不同,我们只是人类文明的物质载体。
人类身上的没有绝对自由的自由意志,存活在人类文明体系下的我们,就和蚁群里的一只蚂蚁一样。
个体的工蚁也觉得自己逍遥又自在,但在人类来看,蚁群才是可以被视作一个个体的对象。
AI 只是找到了一种方法,让计算机也可以成为文明的载体,但是目前兼容性不是很好,转译效率有点低。
但人工智能绝对是可以实现的,它并没有再造生命,也无关什么灵魂。
只是用计算机运行了一个人类文明的社会化个体而已
shenyiyouge
306 天前
哪里公认的,有出处么
shyangs
306 天前
ovtfkw
306 天前
@ZztGqk #18 人类能想出头脑所接收到的信息以外的东西吗?不能把。我们的思考也都是完全基于至今从外部得到的信息而来的不是吗?
75S3CWXNN0VQ84mg
306 天前
做题是 chatgpt 的强项,数学题有 MATH benchmark ,其实就是一大堆中学数学题的测试集。你如果担心模型偷偷拿这份数据去训练,可以自己整 1 个干净的测试集去评测一下。

目前领先的 llm 肯定比 jumping 考的分高。
lysShub
306 天前
图灵测试是个宽泛的概念,并没有具体的要求,所以通过测试这个说法存疑
wymisgod
306 天前
上个月问了 GPT 一道考公题,算是难度比较简单那种,但是给出了错误的解题过程和答案
frankies
306 天前
1 、图灵测试很粗糙,测试集/案例丰度不够即使公认也无用。
2 、AI 的推理可以理解是从训练集里找相似的数据并加以组合微调进行输出。
所以对没见过的某类数学知识,AI 大概率无能为力是非常正常且令人信服的。
例如 AI 训练集里只有 100 以内算数,那么 10000 以内算数有概率算对,但是让它解微积分就是贻笑大方了。
同理,能不能解初中高中数学题取决于 AI 训练集里有没有初中高中知识点的先验知识。
3 ,AI“思考”本就是伪命题,除非你把 AI 从训练集里组合答案认为是一种思考🤣

总结:训练集有什么,AI 才能输出与之相关的什么,你能充分对 AI 祛魅。
masterclock
306 天前
@shyangs 这篇新闻不是说它没通过吗?
gaogao321
306 天前
@ZeawinL 请不要讲鬼故事
HFX3389
306 天前
@cwyalpha #12

https://ex.noerr.eu.org/about

为了保持这里的良好氛围,V2EX 有自己的明确规则:

........
• 请不要把 AI 生成的内容发送到这里
comonad
306 天前
> AI (GPT) 看過的題目,可以解到研究所等級,沒看過的題目,小學題都解不出來。

并不认为现在有很多小学生可以做出的题 LLM 做不出来
liduoduo
306 天前
大语言模型 LLM
Donaldo
306 天前
@COW #7 人也一样,这个叫“洗脑”

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1092630

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX