答案无疑肯定是在 Codex 和 Claude Sonnet/Opus 中产生。
为什么要抛开性价比这个选项?
我发现现在甚至有人还在吹 Deepseek 、GLM 。
2025 年了,哪吒票房那段时间还没完?年还没过完?
吹的有两种人(我说的比较难听):
抛开爱国情绪、抛开花费,目前写代码最强模型到底是 Codex 还是 Claude ?
没深度使用过多家的,没对比过的,只用过某一种的,回答也基本没有什么参考价值。
1
mooyo 4 天前 via iPhone ![]() claude-sonnet-4.5
|
2
imjiaoyuan 4 天前 via Android
claude-sonnet-4.5
和这个比起来国产的像低能儿 |
![]() |
3
TimePPT PRO ![]() GPT-5 High
|
4
ty29022 4 天前 via iPhone ![]() 我个人的感觉是 gpt5 像个 cs 科班的大佬
claude 像个经验丰富的中级程序员 对复杂情况无能为力 |
![]() |
5
novaren 4 天前 via Android
claude 毋容置疑
|
6
facebook47 4 天前 via Android ![]() Claude 写代码无敌,另外在这个论坛,头一次听说有人吹 deepseek 的,一拉一踩非常不可取
|
![]() |
7
spike0100 4 天前 via iPhone
我自己用下来 glm 其实还好。主要差别是 claude sonnect 4.5 一般一次生成的代码直接就可以跑,glm 需要主动提醒一两次才能调好。最终效果感觉差别不大。
|
![]() |
8
spike0100 4 天前 via iPhone
@spike0100 都是用 claude code + 对应基础模型测的。deepseek 和 qwen3 max 试过跑了 50 ,60 人民币的 token ,结果都没法看。
|
![]() |
9
takanashisakura 4 天前 ![]() 说性能的话毋庸置疑吧。但是在真正用的时候,很难不考虑性价比和可用性吧。
所以我也没得选,只有 deepseek 和 gemini 。 |
10
xiaojie668329 4 天前
有时候 Gemini 做得比 Claude 好
|
11
raydg7777 4 天前
还是 Codex
|
12
Alias4ck 4 天前 ![]() 吹 glm 的和 deepseek 的 肯定是没吃过细糠
|
![]() |
13
victor 4 天前 ![]() claude 够快所以是主力。但 claude 4.5 写完的功能,codex 还能挑出来一堆毛病。
|
![]() |
14
skiy 4 天前 ![]() 你抛开花费但抛开不了人家不让你用吧?这是不可控因素。刚刚又有 up 说自己被封号了。
|
![]() |
15
yb2313 4 天前
抛开花费我选同时使用几个顶尖模型,然后每次需求选择最好的一个结果,即使不同时使用也可不断轮换使用对比每个模型擅长领域。
|
![]() |
16
lithiumii 4 天前 via Android
可能有一个月没写代码了,之前是用免费的 copilot 里的旧版本 gpt (好像是 4.1 )和 Claude ( 3.5 吧大概)或者用 Aider 调免费的 Gemini 2.5 Pro ,或者付费的 DeepSeek V3 或者 3.1 和 GLM 4.5 (这俩便宜)。
体感最强是 Gemini 2.5 Pro ,其次相差不远是 DS 和 GLM ,免费 copilot 送的模型是真的不行了。 |
![]() |
17
haiku 4 天前 via Android ![]() GPT 5 high
下个月等 Gemini 3 |
18
streamrx 4 天前 via iPhone
gpt5 high
|
![]() |
19
zpvip 4 天前
claude-sonnet-4.5
这个是毒品, 不能碰 |
![]() |
20
Imindzzz 4 天前 via Android ![]() 你想抛开谈就抛开谈呗,为啥要贬低一下“吹”deepseek...
|
21
mywjyw 4 天前
codex cli 做的比 claude code 差,很多功能不全,很难用
|
![]() |
22
lancevps 4 天前
生成 html 的 UI 设计稿,豆包最强
|
![]() |
23
sunnysab 4 天前 ![]() 额,倒也不是爱国情绪,https://www.reddit.com/r/LocalLLaMA/
reddit 上很多外国人考虑中国的模型,超级积极… qwen 和 glm 评价不错。llama 挨骂较多,openai 被骂的也不少 |
24
Thymolblue 4 天前
现在用 GPT-5 和 Claude 有什么渠道吗?直接用 API 都需要组织认证,目前国内身份没法通过
|
![]() |
27
ggp1ot2 4 天前
Claude Sonnet 4.5
没有什么价格不价格的,这个模型可以满足我现在的需求 |
29
charles0 4 天前
GPT-5 high (比 GPT-5-Codex 强很多)
|
![]() |
30
Bad0Guy 4 天前
cc ,但是封号比 codex 还疯狂,如果 Gemini3 效果比 Claude4.5 好那我会考虑日常转用 Gemini3
|
31
Gekou 4 天前
没用过 claude ,但 claude 肯定不能一次处理 100w 的 token ,10w 行代码
反驳请给出详细方法谢谢 |
![]() |
32
plasticman64 4 天前
claude 会找 bug ,这是我最佩服的一点
|
![]() |
35
agagega 4 天前 via iPhone ![]() 为了那点所谓的优势整天琢磨哪个模型在 benchmark 里表现更好真的有意思么,还不如找到一个坚持用下去。有 gemini 用 gemini ,没有用 deepseek-v3 也能达到目的。天天炒作 claude 看着都麻了,是不是公司的政治观点还会影响用户?
|
![]() |
36
jonty 4 天前
2025 年了,还有人在对比最强模型?谁不知道 claude 好用,是大家不想用吗?
|
37
rubyacgn 4 天前
谁没事国庆写代码啊
|
![]() |
38
binaryify 4 天前
Codex 虽然有点慢但是经常一步到位, claude 像是应届生,着急写代码,但是经常返工
|
39
bytesfold 4 天前 via iPhone
Claude 4.5 体感跟 Codex 效果区别不大了;
Claude 4 体感就是愣头青 |
![]() |
40
asuka02 4 天前 via Android
你这是从抖音学的标题吗?
|
![]() |
41
zy5a59 PRO 我感觉这两个是互补的,codex 写逻辑强一些,但是 UI 写出来是真丑,claude 正好相反
|
42
xuhuanzy 4 天前 via Android
codex 上下文读取很激进,对于复杂项目效果远超 claude
|
![]() |
43
Bluecoda 4 天前
claude-sonnet-4.5 用下来比 gpt5-high 强多了,速度又快,体验感太棒
|
![]() |
44
kennylam777 4 天前
@sunnysab Local AI 來講中國的開放 LLM 的確不錯, 但私有商業 SOTA(只賣 API 那種)模型比還是比中國模型強
|
45
welcomezhangjun 4 天前
claude-sonnet-4.5
|
![]() |
46
coderlxm 4 天前 via Android
codex-gpt5-high
|
![]() |
47
bf109_ PRO codex cloud 吊打一切
|
![]() |
48
yjxjn 4 天前
claude-sonnet-4.5
CodeX |
![]() |
49
Aolose 4 天前 ![]() 抛开性价比?那我选择牛马大模型
|
51
mendax2019 4 天前
gemini 2.5 pro ,快也是强
|
![]() |
52
pkokp8 4 天前
顺便想问问大家,各位用这些模型的时候都是开箱即用吗
会不会有什么奇技淫巧是我不知道的 |
![]() |
54
ferock PRO cl 4.0 ,没钱用 4.5 还没体验过
|
55
andrew2558 4 天前
|
56
gmuubyssss 4 天前
@sunnysab 跟人家天天骂川普一样,你能天天????????
|
![]() |
57
jiayouzl 4 天前
毫无疑问 claude-sonnet-4.5
|
![]() |
58
salor 4 天前
写代码 GPT-5 High ,修 bug GPT-5 Pro
|
59
Seck 4 天前 via Android
没有先发优势?
强者恒强,互联网的赢者通吃效应?🌚 超过,想过了,直到 ai 热潮结束,也不能超过! 要真是超过才是危险的,妈的做了三个版本才火起来,今天对面随随便便,资源比你少,人才投入比你少,市场价格比你低,然后被超越 那估计三战就来了,创新失败效应才是人类社会进步最后的壁垒,如果创新者被对面:资源,人才,技术,市场,教育都不如你超过……那世界才真有意思 |
60
234ygg 4 天前
但凡有点水平的代码,gpt 明显强一大截,垃圾代码的话 claude 和 gpt 差不多
|
![]() |
61
wangweiggsn 3 天前
@mendax2019 我也用的 Gemini Pro 2.5, 注册 API 免费,vscode 里配置一下 API key 直接用,我用量没超,一直是免费的。
|
62
qoras 3 天前
gpt5-high 比 gpt5-codex 好,就是有点慢,不过可以加钱用 gpt5-high-fast
|
![]() |
63
kulove 3 天前 via Android
抛不开 用了几天 Codex 效果差很多
|
![]() |
64
novaa 3 天前
windows 下用了下 codex 跟个智障一样各种错误
|
65
lscho 3 天前 via Android
你想问就问,非要贬低一下别人。。。
其实所有模型都试用一两个月你就会发现,所有的模型都有它擅长和不擅长的。 而且每个人的使用习惯不一样(提示词习惯、规则配置、项目配置等),甚至网络环境的区别都会导致他对不同的模型体验不一样。 所以这玩意目前我觉得没有固定答案,每个人都可以多试用几种来找到最合适自己的。 就个人而言,claude 在大多数情况下符合预期,但是在少部分情况下确实有可能表现的还没有其他模型好。所以我已经习惯多种模型交叉验证解决稍微复杂的问题。 |
![]() |
66
shintendo 3 天前
|
![]() |
67
lovdanny 3 天前 via Android
我最近真切感受到 Codex 的强大——比我之前在 Cursor 里用的 Claude 模型更稳,也更少生成冗余代码。最近我用 Codex 一口气写完了一个 Rust 命令行工具(用于处理 TSV 和 Excel 表格数据,tsvkit: https://github.com/dawnmy/tsvkit ),基本上都是一次就过。
前期用的是 Local 模式,额度用完后换成 Cloud 模式,结果真是让我震惊,在这种通用编程任务上,AI 已经可以做到几乎“代写”了,人只需要提清楚需求就行。 |
68
kneo 3 天前 via Android
不知道是不是错觉,前段时间 claude 降智,到现在我觉得 sonet 4.5 也智障一样,没缓过来。都在推 sonet 4.5 我还挺意外的。
|
70
Wkj1998 2 天前 via Android
GPT-5-high 、Claude Sonnet4.5 、不截断的 Gemini2.5 Pro ,最重要的是互补,每个 LLM 都有短板,要取长补短
|
![]() |
71
anteros 2 天前
哪个被骂的人最多,就用哪个。我说的是世界范围内。
|
72
yippee0539 2 天前
之前也是一直用 claude
但是架不住贵/白嫖的不稳定 索性 dp 了,够用、快、稳定、便宜 |
![]() |
73
byasm32 2 天前
Gemini 2.5 Pro 已经完全够用。。超长上下文支持,几百 k 的附件代码也随便分析,速度也快。
|
![]() |
74
yyws2012 2 天前 via Android
@byasm32 gemini 非常擅长讲述内容,但是在分析较多内容时幻觉严重,之前我让它分析代码它能信誓旦旦地说出一个不存在的 feature
|
75
ptstone 2 天前
”我发现现在甚至有人还在吹 Deepseek 、GLM “ 。 八月底九月初的时候,我用 deepseek 和 sonet 4 ,同样的提示词写一个项目,deepseek 做的 ui 效果明显强与 sonet4.1 。 都是用 claude code 。后来放弃了 sonet4 生产的项目,用 sonet 4 接着 deepseek 生成的项目接着写后端,做单一任务,deepseek 在某些方面不一定差,做复杂任务,需要关联很多代码,你不提示 deepseek 会不读仓库其他代码直接写,sonnet 不降智的情况下,会读应用到的代码。凡是不要这么武断下结论。
|
![]() |
76
fourninenine 1 天前
我就是第一种人😁我来反驳第二种
什么叫“大谈敌对势力”? deepseek 不让美国人用了吗? 到底是谁在搞敌对? |
![]() |
77
Vaspike 17 小时 42 分钟前 via iPhone
写 UI 我个人觉得 Gemini 依然最强
|