抛开性价比这个选项，你认为目前写代码最强模型是？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 49 天前的主题，其中的信息可能已经有所发展或是发生改变。

答案无疑肯定是在 Codex 和 Claude Sonnet/Opus 中产生。

为什么要抛开性价比这个选项？

我发现现在甚至有人还在吹 Deepseek 、GLM 。

2025 年了，哪吒票房那段时间还没完？年还没过完？

吹的有两种人（我说的比较难听）：

用不起贵的，强行拉出性价比，所谓的便宜好用。
爱国，大谈 Claude 敌对势力。

所以，你认为

抛开爱国情绪、抛开花费，目前写代码最强模型到底是 Codex 还是 Claude ？

没深度使用过多家的，没对比过的，只用过某一种的，回答也基本没有什么参考价值。

Codex

claude

性价比

79 条回复 • 2025-10-09 10:10:03 +08:00

mooyo

49 天前 via iPhone

claude-sonnet-4.5

imjiaoyuan

49 天前 via Android

claude-sonnet-4.5

和这个比起来国产的像低能儿

TimePPT

PRO

49 天前 via Android

GPT-5 High

ty29022

49 天前 via iPhone

我个人的感觉是 gpt5 像个 cs 科班的大佬
claude 像个经验丰富的中级程序员对复杂情况无能为力

novaren

49 天前 via Android

claude 毋容置疑

facebook47

49 天前 via Android

Claude 写代码无敌，另外在这个论坛，头一次听说有人吹 deepseek 的，一拉一踩非常不可取

spike0100

49 天前 via iPhone

我自己用下来 glm 其实还好。主要差别是 claude sonnect 4.5 一般一次生成的代码直接就可以跑，glm 需要主动提醒一两次才能调好。最终效果感觉差别不大。

spike0100

49 天前 via iPhone

@spike0100 都是用 claude code + 对应基础模型测的。deepseek 和 qwen3 max 试过跑了 50 ，60 人民币的 token ，结果都没法看。

takanashisakura

49 天前

说性能的话毋庸置疑吧。但是在真正用的时候，很难不考虑性价比和可用性吧。
所以我也没得选，只有 deepseek 和 gemini 。

xiaojie668329

49 天前

有时候 Gemini 做得比 Claude 好

raydg7777

49 天前

还是 Codex

Alias4ck

49 天前

吹 glm 的和 deepseek 的肯定是没吃过细糠

victor

49 天前

claude 够快所以是主力。但 claude 4.5 写完的功能，codex 还能挑出来一堆毛病。

skiy

49 天前

你抛开花费但抛开不了人家不让你用吧？这是不可控因素。刚刚又有 up 说自己被封号了。

yb2313

49 天前

抛开花费我选同时使用几个顶尖模型，然后每次需求选择最好的一个结果，即使不同时使用也可不断轮换使用对比每个模型擅长领域。

lithiumii

49 天前 via Android

可能有一个月没写代码了，之前是用免费的 copilot 里的旧版本 gpt （好像是 4.1 ）和 Claude （ 3.5 吧大概）或者用 Aider 调免费的 Gemini 2.5 Pro ，或者付费的 DeepSeek V3 或者 3.1 和 GLM 4.5 （这俩便宜）。
体感最强是 Gemini 2.5 Pro ，其次相差不远是 DS 和 GLM ，免费 copilot 送的模型是真的不行了。

haiku

49 天前 via Android

GPT 5 high
下个月等 Gemini 3

streamrx

49 天前 via iPhone

gpt5 high

zpvip

49 天前

claude-sonnet-4.5
这个是毒品, 不能碰

Imindzzz

49 天前 via Android

你想抛开谈就抛开谈呗，为啥要贬低一下“吹”deepseek...

mywjyw

49 天前

codex cli 做的比 claude code 差，很多功能不全，很难用

lancevps

49 天前

生成 html 的 UI 设计稿，豆包最强

sunnysab

49 天前

额，倒也不是爱国情绪，https://www.reddit.com/r/LocalLLaMA/

reddit 上很多外国人考虑中国的模型，超级积极… qwen 和 glm 评价不错。llama 挨骂较多，openai 被骂的也不少

Thymolblue

49 天前

现在用 GPT-5 和 Claude 有什么渠道吗？直接用 API 都需要组织认证，目前国内身份没法通过

yyws2012

49 天前 via Android

@mooyo 都不考虑价格了还 sonnet

yyws2012

49 天前 via Android

@skiy 可以买别人转接的，就是 opus 会非常贵，但既然不考虑价格那就是可以的

ggp1ot2

49 天前

Claude Sonnet 4.5

没有什么价格不价格的，这个模型可以满足我现在的需求

mooyo

49 天前

@yyws2012 #25 sonnet 4.5 现在就是比 opus 4.1 好用啊。有又快又好用的为啥要用又慢又垃圾的

charles0

49 天前

GPT-5 high (比 GPT-5-Codex 强很多)

Bad0Guy

49 天前

cc ，但是封号比 codex 还疯狂，如果 Gemini3 效果比 Claude4.5 好那我会考虑日常转用 Gemini3

Gekou

49 天前

没用过 claude ，但 claude 肯定不能一次处理 100w 的 token ，10w 行代码
反驳请给出详细方法谢谢

plasticman64

49 天前

claude 会找 bug ，这是我最佩服的一点

v20220522

49 天前

@charles0 为什么会这样, 能展开讲讲吗?

lcandy

49 天前

@TimePPT 支持，codex-high 都没 5-high 好用

agagega

49 天前 via iPhone

为了那点所谓的优势整天琢磨哪个模型在 benchmark 里表现更好真的有意思么，还不如找到一个坚持用下去。有 gemini 用 gemini ，没有用 deepseek-v3 也能达到目的。天天炒作 claude 看着都麻了，是不是公司的政治观点还会影响用户？

jonty

49 天前

2025 年了，还有人在对比最强模型？谁不知道 claude 好用，是大家不想用吗？

rubyacgn

49 天前

谁没事国庆写代码啊

binaryify

49 天前

Codex 虽然有点慢但是经常一步到位, claude 像是应届生,着急写代码,但是经常返工

bytesfold

49 天前 via iPhone

Claude 4.5 体感跟 Codex 效果区别不大了；
Claude 4 体感就是愣头青

asuka02

49 天前 via Android

你这是从抖音学的标题吗？

zy5a59

PRO

49 天前

我感觉这两个是互补的，codex 写逻辑强一些，但是 UI 写出来是真丑，claude 正好相反

xuhuanzy

49 天前 via Android

codex 上下文读取很激进，对于复杂项目效果远超 claude

Bluecoda

49 天前

claude-sonnet-4.5 用下来比 gpt5-high 强多了，速度又快，体验感太棒

kennylam777

49 天前

@sunnysab Local AI 來講中國的開放 LLM 的確不錯, 但私有商業 SOTA(只賣 API 那種)模型比還是比中國模型強

welcomezhangjun

49 天前

claude-sonnet-4.5

coderlxm

49 天前 via Android

codex-gpt5-high

bf109_

PRO

49 天前

codex cloud 吊打一切

yjxjn

49 天前

claude-sonnet-4.5
CodeX

Aolose

49 天前

抛开性价比？那我选择牛马大模型

gfbts

49 天前

@Aolose 牛马竟是我自己

mendax2019

49 天前

gemini 2.5 pro ，快也是强

pkokp8

49 天前

顺便想问问大家，各位用这些模型的时候都是开箱即用吗
会不会有什么奇技淫巧是我不知道的

BernieDu

49 天前

@xuhuanzy codex 读的上下文可能更多，你让他给代码找错确实更好用，但是一旦让它上手干活比 4.5 差远了，还是搭配着用吧

ferock

PRO

49 天前 via Android

cl 4.0 ，没钱用 4.5 还没体验过

andrew2558

49 天前

现在这些大模型写代码是真的强呀，期待 gemini3

gmuubyssss

49 天前

@sunnysab 跟人家天天骂川普一样，你能天天????????

jiayouzl

49 天前

毫无疑问 claude-sonnet-4.5

salor

49 天前

写代码 GPT-5 High ，修 bug GPT-5 Pro

Seck

49 天前 via Android

没有先发优势？
强者恒强，互联网的赢者通吃效应？🌚

超过，想过了，直到 ai 热潮结束，也不能超过！

要真是超过才是危险的，妈的做了三个版本才火起来，今天对面随随便便，资源比你少，人才投入比你少，市场价格比你低，然后被超越

那估计三战就来了，创新失败效应才是人类社会进步最后的壁垒，如果创新者被对面：资源，人才，技术，市场，教育都不如你超过……那世界才真有意思

234ygg

49 天前

但凡有点水平的代码，gpt 明显强一大截，垃圾代码的话 claude 和 gpt 差不多

wangweiggsn

49 天前

@mendax2019 我也用的 Gemini Pro 2.5, 注册 API 免费，vscode 里配置一下 API key 直接用，我用量没超，一直是免费的。

qoras

49 天前

gpt5-high 比 gpt5-codex 好，就是有点慢，不过可以加钱用 gpt5-high-fast

kulove

49 天前 via Android

抛不开用了几天 Codex 效果差很多

novaa

49 天前

windows 下用了下 codex 跟个智障一样各种错误

lscho

48 天前 via Android

你想问就问，非要贬低一下别人。。。

其实所有模型都试用一两个月你就会发现，所有的模型都有它擅长和不擅长的。

而且每个人的使用习惯不一样（提示词习惯、规则配置、项目配置等），甚至网络环境的区别都会导致他对不同的模型体验不一样。

所以这玩意目前我觉得没有固定答案，每个人都可以多试用几种来找到最合适自己的。

就个人而言，claude 在大多数情况下符合预期，但是在少部分情况下确实有可能表现的还没有其他模型好。所以我已经习惯多种模型交叉验证解决稍微复杂的问题。

shintendo

48 天前

lovdanny

48 天前 via Android

我最近真切感受到 Codex 的强大——比我之前在 Cursor 里用的 Claude 模型更稳，也更少生成冗余代码。最近我用 Codex 一口气写完了一个 Rust 命令行工具（用于处理 TSV 和 Excel 表格数据，tsvkit： https://github.com/dawnmy/tsvkit ），基本上都是一次就过。

前期用的是 Local 模式，额度用完后换成 Cloud 模式，结果真是让我震惊，在这种通用编程任务上，AI 已经可以做到几乎“代写”了，人只需要提清楚需求就行。

kneo

48 天前 via Android

不知道是不是错觉，前段时间 claude 降智，到现在我觉得 sonet 4.5 也智障一样，没缓过来。都在推 sonet 4.5 我还挺意外的。

Wkj1998

48 天前 via Android

@Gekou 这么多代码，逻辑复杂应该只有 GPT-5-high 、Gemini2.5 Pro 能处理了，

Wkj1998

48 天前 via Android

GPT-5-high 、Claude Sonnet4.5 、不截断的 Gemini2.5 Pro ，最重要的是互补，每个 LLM 都有短板，要取长补短

anteros

48 天前

哪个被骂的人最多，就用哪个。我说的是世界范围内。

yippee0539

48 天前

之前也是一直用 claude
但是架不住贵/白嫖的不稳定
索性 dp 了，够用、快、稳定、便宜

byasm32

47 天前

Gemini 2.5 Pro 已经完全够用。。超长上下文支持，几百 k 的附件代码也随便分析，速度也快。

yyws2012

47 天前 via Android

@byasm32 gemini 非常擅长讲述内容，但是在分析较多内容时幻觉严重，之前我让它分析代码它能信誓旦旦地说出一个不存在的 feature

ptstone

47 天前

”我发现现在甚至有人还在吹 Deepseek 、GLM “ 。八月底九月初的时候，我用 deepseek 和 sonet 4 ，同样的提示词写一个项目，deepseek 做的 ui 效果明显强与 sonet4.1 。都是用 claude code 。后来放弃了 sonet4 生产的项目，用 sonet 4 接着 deepseek 生成的项目接着写后端，做单一任务，deepseek 在某些方面不一定差，做复杂任务，需要关联很多代码，你不提示 deepseek 会不读仓库其他代码直接写，sonnet 不降智的情况下，会读应用到的代码。凡是不要这么武断下结论。

fourninenine

47 天前

我就是第一种人😁我来反驳第二种
什么叫“大谈敌对势力”？
deepseek 不让美国人用了吗？
到底是谁在搞敌对？

Vaspike

46 天前 via iPhone

写 UI 我个人觉得 Gemini 依然最强

NineTree

44 天前

claude code

millken

44 天前

Claude Sonnet 4.5 确实用起来最爽