现在公认 ChatGPT 已通过了图灵测试，但没有见过的数学题，现在的 AI (GPT) 还是不会解。这是 AI 还不会思考，还是 AI 已经达到了大多数人类的思维水平，即能通过图灵测试，但不会解初中或高中数学题？（像姜萍一样）

如下的高中數學題，AI 會用向量法解. 這道題我第一次在別的論壇發帖時 AI 還不會，但現在 ChatGPT 學會了，我懷疑是我發帖後，友壇壇友反覆地問，導致 OpenAI 背後的智能工人注意到了這一題，讓 ChatGPT 背會了.

https://chatgpt.com/share/d4fe9bc6-f62f-408f-b188-4a2fa333e57b

降低難度到初中數學題(如下)，ChatGPT 不會了，讓人懷疑 AI 還不會思考，但這樣考慮的話，能通過圖靈測試但不會初中高中數學題的人類(如姜萍)都不會思考?

https://chatgpt.com/share/67451648-ae74-8003-b6ef-332c10d43a12

Nzelites

306 天前

人也一样要外部输入才能产生新东西关在绝对小黑屋不允许任何交互你怎么测试外部环境得到反馈?ai 只是目前没有主动与外部物理环境交互迭代的支持而已

vishun

306 天前

@kw8023cn #22 是的，即便你知道目前 ai 就是靠概率来猜，但是人脑就会不是一样的工作原理吗？所以很难说。

qiany

306 天前

数学题不会就是不会

sillydaddy

306 天前

@vishun #62
说的很对。很多人都强调，现在的 AI 是基于统计的，基于概率的，肯定不是真正的智能。可是，如果看底层，它和人脑不都是神经网络吗。如果说 ai 是概率统计，那人脑就不是了？
如果承认 ai 的本质只不过是一种统计，那么请问，以前的统计方法为什么远远没有达到神经网络的统计效果呢？神经网络模拟人脑，并取得了其他方法触不可及的效果，就说明它是真正智能的可能性非常大，这不是什么巧合，这恰恰是概率论里面的贝叶斯定理。
很多人嘲笑 ai 没有达到人的水平，讽刺它只不过是一个统计机器，却没有看到它的巨大进展，嘲笑 ai 的人也太急于被另外的物种取代了吧。

sillydaddy

306 天前

目前的 ai ，其神经网络的连接方式只不过被探索了很少的一部分，跟人脑进化的时间不能相提并论。而且目前神经网络的学习机制也仅仅是反向传播，跟人脑的也不一定相同。那么 ai 还没有到人脑的水平，不是很正常吗？
ai 达到人脑的思考水平，可能就在于一念之间，可能是一种连接方式的改变，可能是一种学习方式的创新。可能每个人都有机会创造这个历史。

acorngyl

306 天前

刚问了 gpt 两个问题
1 、768 个 1 加 768 个 1 （ 1111....1 + 11....111=?）。
gpt 的回答是 768 个 2.
点开计算过程，生成了段 python
# Calculating the sum of two large numbers
num1 = int("1" * 768) # 768 digits of 1
num2 = int("1" * 768) # 768 digits of 1

result = num1 + num2
result

2 、如果直接问 11+11 就是直接给的 22.
说明 gpt 的代码做了分支，如果简单计算，用的是 LLM ，直接“transformer”答案了；如果计算比较复杂，会用二次 prompt 调计算引擎。按理说 transformer 算概率的话，没办法这么精准的算上百个数字的。但是它现在学会“作弊”了，我生成不了你，我会写代码啊，哈哈哈。如果说 transformer 是黑盒，智能不智能得解释不清楚，这都出来 python 代码了，这就不能是 AI 了吧。

现在生产上的定制大模型，都是用通用接口加海量 prompt ，通用模型只是做个语意检索用的，返回答案都是通过检索到的模版回答的。比如让 agent 给写个工作汇报，公司模版库里有汇报模版，模版会细到指导通用模型写 hmtl ，然后再调通用模型，出来的工作汇报是整篇有图表的文档。现在的 gpt 也，提问个复杂问题，看回答过程，有好几部推理。这里边编写 prompt ，做工作流的工作，都不应该算 LLM 的能力了。

所以，一个堆砌了量工作流的提示词的系统，有智力？它能不能自己写提示词呢？

amosannn

306 天前

gpt 没有思维，是地球村顶级背题家，背过了，就能答上，没背过就胡言乱语

zuotun

306 天前

@Livid #12 多次发布 AI 生成的内容，markdown 格式都还在

Baoni

306 天前

@sillydaddy 你所表达的理解成乘法才是正确的，你想问的是“用 768 个 1 组成的数加另一个用 768 个 1 组成的数，等于？”

009694

306 天前

@superrichman 然而很多人类连鹦鹉都比不上😂 既不会说话也不会做事只会呼吸吃饭和添乱

xylxAdai

306 天前

@shyangs #2 至今没人能解释思想是如何形成的，一堆胡乱跑着的神经信号怎么就能产生思维呢，我也认为 gpt 当它的胡乱思考达到某个限度的时候，也会产生思维。

lizytalk

306 天前

你是觉得每个人类都会解初高中数学题吗？有这个能力的，我觉得连 30%都没有吧 :(

bao3

306 天前

@huangsijun17 我看过小红书的评论区，很多人认为 X.11 大于 X.8 。这是个很诡异的现象。

sealinfree

306 天前

@vishun 看后收获很多，感谢推荐，很想知道您是如何获得这类高质量信息的，我感觉搜索引擎效率较低，ai 又都是加工过的，不知道如何找到一个有价值和效率的信息源，能源源不断更新自己的知识和认识

vipfts

306 天前

我管你这那的, 能帮我写代码了

sillydaddy

306 天前

@Baoni 你 @错人了

qiaobeier

306 天前

“公认 ChatGPT 已通过了图灵测试”的信源在哪里？

kyro00000

306 天前

几道有机化学题都不会做,搞的我头大.只能自己做

mumbler

306 天前

@sillydaddy #64 总有一部分人对任何新事物都排斥的，这是基因决定的，不需要叫醒，自己先吃时代红利，别跟他们浪费时间

shyangs

306 天前

@masterclock @qiaobeier

ChatGPT broke the Turing test.

這裡的 broke (break) 是打破、攻破、突破、即通過測試的意思.

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1092630

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

现在公认 ChatGPT 已通过了图灵测试，但没有见过的数学题，现在的 AI (GPT) 还是不会解。这是 AI 还不会思考，还是 AI 已经达到了大多数人类的思维水平，即能通过图灵测试，但不会解初中或高中数学题？ （像姜萍一样）

现在公认 ChatGPT 已通过了图灵测试，但没有见过的数学题，现在的 AI (GPT) 还是不会解。这是 AI 还不会思考，还是 AI 已经达到了大多数人类的思维水平，即能通过图灵测试，但不会解初中或高中数学题？（像姜萍一样）