手贱拿大模型试了下最近一次的 LeetCode 周赛,道心破碎了,成仙路已断,前路在何方?

238 天前
 CC11001100

四道题全部 AC 。。。

我连题目都没仔细看,就无复制粘贴题目给它,等它推理出结果就复制回提交框:

中间有提交错误的:

我把错误截图给大模型,让它继续推理,然后如此反复,除了最后一道题错了几次才推理出来,前边都是一把过,最后一道题错了两次推测出来了。

跟一个力扣刷了几千道的朋友吐槽用大模型刷题,虽然我在嘴硬,但我自己撑死了也就是三道题的水平。。。AI 算法水平至少高我一个大段位。。。。

不过还好,它用时大概半小时,比第一名耗时还长一些,碳基生物保住了一点脸面:

但想一想,从 OpenAI 发布 Chatgpt 到今天,也才几年的时间就已经发展到这个程度了,我原本以为程序员能干到 35 岁也行,到时候回老家养猪,就很抽象,感觉撑不到 35 岁就得被淘汰了。。。过年回去得提前调研下养猪方案了。。。

12976 次点击
所在节点    程序员
91 条回复
cooltechbs
237 天前
@glcolof 至少这场不是,前几名都是两三年前竞赛分就很高了
meilicat
237 天前
第 4 名早就说过了 做题只是享受这个思考的过程 。
huangyezhufeng
237 天前
从之前的博客截取了 AI 编程相关的一段,希望能有所帮助吧: https://datahonor.com/blog/2024/12/23/ai_think_2024/#ai_1

AI 的黄金时代¶

书接上文,我其实并不认为现在的 LLM 是“智能”的,我认为它只是一个庞大而又精密的机器。 但是就像所有精密的机器 (比如计算机) 一样,LLM 也有着无限的潜力,可以在各个领域发挥巨大的作用——即使它没有所谓的“智能”。

AI 辅助编程¶

Redis 的作者 Salvatore Sanfilippo 在年初写过一篇博客 LLMs and Programming in the first days of 2024. 博客中介绍了 LLM 在编程领域的一些应用,他认为 LLM 很适合用来替代一些琐碎的工作,比如用来写一些一次性的脚本,做一些数据分析等, 这样可以让程序员们更专注于更有意义的工作,比如设计架构,优化性能等。文章另外还有很多有有趣的观点:

LLMs and Programming in the first days of 2024

In the field of programming, perhaps their ability would have been of very little interest up to twenty or thirty years ago. Back then you had to know a couple of programming languages, the classic algorithms, and those ten fundamental libraries. The rest you had to add yourself, your own intelligence, expertise, design skills. If you had these ingredients you were an expert programmer, able to do more or less everything. Over time, we have witnessed an explosion of frameworks, programming languages, libraries of all kinds. An explosion of complexity often completely unnecessary and unjustified, but the truth is that things are what they are. And in such a context, an idiot who knows everything is a precious ally.

下面是这段话的中文翻译 (来自宝玉):

LLMs and Programming in the first days of 2024

在编程领域,直到二十或三十年前,这些能力可能还不太引人注目。那时,你需要掌握几种编程语言、经典算法以及那些基本的库。 其余的则依靠你自己的智慧、专业知识和设计能力。具备这些素质,你就能成为一名全能的专家级程序员。 然而,随着时间的推移,我们见证了框架、编程语言、各种库的大量涌现。这种复杂性通常是不必要的,甚至无法自圆其说,但事实就是如此。 在这样的情况下,一个无所不知的“白痴”成了宝贵的盟友。.

这里点明了一个事实:现在的编程环境变得越来越复杂,这也意味着程序员需要掌握更多的知识,花费更多的时间来学习和工作, 而 LLM 可以通过辅助编码来屏蔽这些复杂性来帮助程序员们减轻这些负担,进而让他们专注于更有意义的工作。

这点在 2024 这一年 AI 编程领域的发展中得到了很好的体现,比如 Cursor ,Windsurf 等辅助编程工具的强势崛起。 这些辅助编程工具在前端开发领域都有比较好的体验,比如这些工具目前可以通过简单的几句描述就生成漂亮的网页。 我个人浅薄的看法是,前端开发的技术栈变化非常快,也有很多框架,库等,这些都增加了前端开发的复杂性,正好对应了上面 Salvatore 提到的问题 (“框架、编程语言、各种库的大量涌现”)。 而通过 AI 辅助编程工具确实可以很好地解决这些问题:我们不必再去看各个框架自定义的 API ,只需要简单地描述我们想要的效果,LLM 就会帮我们生成符合描述的代码。

同样地,AI 辅助编程在生成数据分析报告,辅助编写 SQL 等方面也有着不错的表现。 这点在上面的博客中也有提到,而我个人在日常工作中也深有体会:AI 已经在实打实地帮助我们减轻很多工作量。

我并不认为 AI 会取代真正的程序员 (未来也不会),但其换掉这些琐碎的编码工作是大势所趋。 当然这里的“琐碎”是相对的,比如我需要一个 Web 页面来简单地展示数据,这个工作对于我来说就是琐碎的; 但是如果我们需要的是一个拥有良好交互体验且具有相当程度美观性的页面,那么这个工作可能就不再是琐碎的了。 同样地对于数据分析也是,如果我们只需要简单地统计一下数据,那么这个工作就是琐碎的; 如果我们需要从海量数据中找出一些有价值的信息,那么这个工作就不再是琐碎的了。

另外 Salvatore 提到了另外一个值得思考的问题:

LLMs and Programming in the first days of 2024

I regret to say it, but it's true: most of today's programming consists of regurgitating the same things in slightly different forms. High levels of reasoning are not required. LLMs are quite good at doing this, although they remain strongly limited by the maximum size of their context. This should really make programmers think. Is it worth writing programs of this kind? Sure, you get paid, and quite handsomely, but if an LLM can do part of it, maybe it's not the best place to be in five or ten years.

下面是这段话的中文翻译 (来自宝玉):

LLMs and Programming in the first days of 2024

不得不说,这是一个事实:现今的编程大多是在微调同样的内容,只是形式略有变化。这种工作并不需要太高的推理能力。 大语言模型在这方面表现出色,尽管它们的能力仍然受限于上下文长度。这个现象应该引起程序员的深思:真的值得去编写这类程序吗? 虽然可以赚到不错的收入,但如果大语言模型也能完成其中一部分工作,那么在未来五到十年,这可能并非最佳的职业发展方向。

我个人非常赞同这个观点,也认为这个问题提的非常好: "Is it worth writing programs of this kind?" 我相信在此后的几年时间,对这个问题的讨论会越来越多,而我们对这个问题的不同理解也会进一步地影响我们的未来职业发展方向。
edward1987
237 天前
@xuanbg #25 是和普通程序员比,没人做过的普通程序员大概率也做不出来。
punkerhyde
237 天前
@kk2syc 你这还停留在哪年?
lulaolu
237 天前
第一天:“一堆冰冷的代码试图模仿人类智慧。”
第二天:“无用的技术玩具学会了下棋。”
第三天:“语言模型靠死记硬背才做出的力扣。”
第四天:“人工智能有智能但无智慧。”
第五天:“超级智能主导了科学突破。”
第六天:“坚决维护以 ChatGPT-99999 为核心的……!”
mumbler
237 天前
@kk2syc #21 抽卡是大模型的思考方式,不同于人,1 分钟抽 100 张卡,正确率能达到 99.9%。目前测试方式按人思维设计的,要求一次做对,大模型当然得分低
mU9vX912XopmAoE1
237 天前
@majula 理由是输给 AI 后,他再也无法享受围棋这项竞技。

就从 top 变成菜鸟了

碰到真神 这么快就放弃了
SherlockKevin
237 天前
守正出奇 知行合一
woctordho
237 天前
汽车比人快,人就不赛跑了吗?
uni
237 天前
你的个人价值就体现在 leetcode 上面?
zero2me
237 天前
思维太狭隘了,LLM 只能提高效率,绝对取代不了人,多样性和创造性是 LLM 无法取代的
noahlias
237 天前
建议秒下 codeforce
ptstone
237 天前
从 OpenAI 发布 Chatgpt 到今天,也才几年的时间,可是人工智能的研究已经有十几年了吧,甚至更久,tranform 这种都好多年了
FlyToSKy
237 天前
现阶段 AI 还是推理阶段,发展到真正的 Agent AI 的时候才能说道心破碎了。
wangyzj
237 天前
只能说你用它最擅长的场景做了测试,肯定是好的
xlawy
237 天前
@woctordho 但是出现汽车后,跑步从大部分人需要变成了大部分人不需要的一种行为了
ziyanghua
237 天前
@CC11001100 #3 疫情远程面试的时候,就有很多人在用 AI 帮忙过面了。
LichMscy
237 天前
@ziyanghua #58 这种 AI 作答的 太容易问出来了 基本上先重复下你的问题 然后等待 0.5-1 秒 开始滔滔不绝
之前面过不少类似情况的候选人 履历再好 直接就 pass

再其次 很多场景问题 AI 也无法给你准确的答案
你有没有类似的经验或者做过相关工作 一眼就可以看出来
opiviqo
237 天前
嗨 你咋不让 AI 解决一下 黎曼猜想 呢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1107195

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX