现在公认 ChatGPT 已通过了图灵测试,但没有见过的数学题,现在的 AI (GPT) 还是不会解。这是 AI 还不会思考,还是 AI 已经达到了大多数人类的思维水平,即能通过图灵测试,但不会解初中或高中数学题? (像姜萍一样)

307 天前
 shyangs

如下的高中數學題,AI 會用向量法解. 這道題我第一次在別的論壇發帖時 AI 還不會,但現在 ChatGPT 學會了,我懷疑是我發帖後,友壇壇友反覆地問,導致 OpenAI 背後的智能工人注意到了這一題,讓 ChatGPT 背會了.

https://chatgpt.com/share/d4fe9bc6-f62f-408f-b188-4a2fa333e57b

降低難度到初中數學題(如下),ChatGPT 不會了,讓人懷疑 AI 還不會思考,但這樣考慮的話,能通過圖靈測試但不會初中高中數學題的人類(如姜萍)都不會思考?

https://chatgpt.com/share/67451648-ae74-8003-b6ef-332c10d43a12

9497 次点击
所在节点    程序员
95 条回复
Nzelites
306 天前
人也一样要外部输入才能产生新东西 关在绝对小黑屋不允许任何交互你怎么测试外部环境得到反馈?ai 只是目前没有主动与外部物理环境交互迭代的支持而已
vishun
306 天前
@kw8023cn #22 是的,即便你知道目前 ai 就是靠概率来猜,但是人脑就会不是一样的工作原理吗?所以很难说。
qiany
306 天前
数学题不会就是不会
sillydaddy
306 天前
@vishun #62
说的很对。很多人都强调,现在的 AI 是基于统计的,基于概率的,肯定不是真正的智能。可是,如果看底层,它和人脑不都是神经网络吗。如果说 ai 是概率统计,那人脑就不是了?
如果承认 ai 的本质只不过是一种统计,那么请问,以前的统计方法为什么远远没有达到神经网络的统计效果呢?神经网络模拟人脑,并取得了其他方法触不可及的效果,就说明它是真正智能的可能性非常大,这不是什么巧合,这恰恰是概率论里面的贝叶斯定理。
很多人嘲笑 ai 没有达到人的水平,讽刺它只不过是一个统计机器,却没有看到它的巨大进展,嘲笑 ai 的人也太急于被另外的物种取代了吧。
sillydaddy
306 天前
目前的 ai ,其神经网络的连接方式只不过被探索了很少的一部分,跟人脑进化的时间不能相提并论。而且目前神经网络的学习机制也仅仅是反向传播,跟人脑的也不一定相同。那么 ai 还没有到人脑的水平,不是很正常吗?
ai 达到人脑的思考水平,可能就在于一念之间,可能是一种连接方式的改变,可能是一种学习方式的创新。可能每个人都有机会创造这个历史。
acorngyl
306 天前
刚问了 gpt 两个问题
1 、768 个 1 加 768 个 1 ( 1111....1 + 11....111=?)。
gpt 的回答是 768 个 2.
点开计算过程,生成了段 python
# Calculating the sum of two large numbers
num1 = int("1" * 768) # 768 digits of 1
num2 = int("1" * 768) # 768 digits of 1

result = num1 + num2
result

2 、如果直接问 11+11 就是直接给的 22.
说明 gpt 的代码做了分支,如果简单计算,用的是 LLM ,直接“transformer”答案了;如果计算比较复杂,会用二次 prompt 调计算引擎。按理说 transformer 算概率的话,没办法这么精准的算上百个数字的。但是它现在学会“作弊”了,我生成不了你,我会写代码啊,哈哈哈。如果说 transformer 是黑盒,智能不智能得解释不清楚,这都出来 python 代码了,这就不能是 AI 了吧。

现在生产上的定制大模型,都是用通用接口加海量 prompt ,通用模型只是做个语意检索用的,返回答案都是通过检索到的模版回答的。比如让 agent 给写个工作汇报,公司模版库里有汇报模版,模版会细到指导通用模型写 hmtl ,然后再调通用模型,出来的工作汇报是整篇有图表的文档。现在的 gpt 也,提问个复杂问题,看回答过程,有好几部推理。这里边编写 prompt ,做工作流的工作,都不应该算 LLM 的能力了。

所以,一个堆砌了量工作流的提示词的系统,有智力?它能不能自己写提示词呢?
amosannn
306 天前
gpt 没有思维,是地球村顶级背题家,背过了,就能答上,没背过就胡言乱语
zuotun
306 天前
@Livid #12 多次发布 AI 生成的内容,markdown 格式都还在
Baoni
306 天前
@sillydaddy 你所表达的理解成乘法才是正确的,你想问的是“用 768 个 1 组成的数加另一个用 768 个 1 组成的数,等于?”
009694
306 天前
@superrichman 然而很多人类连鹦鹉都比不上😂 既不会说话也不会做事 只会呼吸吃饭和添乱
xylxAdai
306 天前
@shyangs #2 至今没人能解释思想是如何形成的,一堆胡乱跑着的神经信号怎么就能产生思维呢,我也认为 gpt 当它的胡乱思考达到某个限度的时候,也会产生思维。
lizytalk
306 天前
你是觉得每个人类都会解初高中数学题吗?有这个能力的,我觉得连 30%都没有吧 :(
bao3
306 天前
@huangsijun17 我看过小红书的评论区,很多人认为 X.11 大于 X.8 。这是个很诡异的现象。
sealinfree
306 天前
@vishun 看后收获很多,感谢推荐,很想知道您是如何获得这类高质量信息的,我感觉搜索引擎效率较低,ai 又都是加工过的,不知道如何找到一个有价值和效率的信息源,能源源不断更新自己的知识和认识
vipfts
306 天前
我管你这那的, 能帮我写代码了
sillydaddy
306 天前
@Baoni 你 @错人了
qiaobeier
306 天前
“公认 ChatGPT 已通过了图灵测试”的信源在哪里?
kyro00000
306 天前
几道有机化学题都不会做,搞的我头大.只能自己做
mumbler
306 天前
@sillydaddy #64 总有一部分人对任何新事物都排斥的,这是基因决定的,不需要叫醒,自己先吃时代红利,别跟他们浪费时间
shyangs
306 天前
@masterclock @qiaobeier

ChatGPT broke the Turing test.

這裡的 broke (break) 是打破、攻破、突破、即通過測試的意思.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1092630

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX