V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
tlerbao
V2EX  ›  程序员

抛开性价比这个选项,你认为目前写代码最强模型是?

  •  
  •   tlerbao · 4 天前 · 6308 次点击

    答案无疑肯定是在 Codex 和 Claude Sonnet/Opus 中产生。

    为什么要抛开性价比这个选项?

    我发现现在甚至有人还在吹 Deepseek 、GLM 。

    2025 年了,哪吒票房那段时间还没完?年还没过完?

    吹的有两种人(我说的比较难听):

    1. 用不起贵的,强行拉出性价比,所谓的便宜好用。
    2. 爱国,大谈 Claude 敌对势力。

    所以,你认为

    抛开爱国情绪、抛开花费,目前写代码最强模型到底是 Codex 还是 Claude ?

    没深度使用过多家的,没对比过的,只用过某一种的,回答也基本没有什么参考价值。

    77 条回复    2025-10-07 10:38:39 +08:00
    mooyo
        1
    mooyo  
       4 天前 via iPhone   ❤️ 3
    claude-sonnet-4.5
    imjiaoyuan
        2
    imjiaoyuan  
       4 天前 via Android
    claude-sonnet-4.5


    和这个比起来国产的像低能儿
    TimePPT
        3
    TimePPT  
    PRO
       4 天前 via Android   ❤️ 1
    GPT-5 High
    ty29022
        4
    ty29022  
       4 天前 via iPhone   ❤️ 3
    我个人的感觉是 gpt5 像个 cs 科班的大佬
    claude 像个经验丰富的中级程序员 对复杂情况无能为力
    novaren
        5
    novaren  
       4 天前 via Android
    claude 毋容置疑
    facebook47
        6
    facebook47  
       4 天前 via Android   ❤️ 6
    Claude 写代码无敌,另外在这个论坛,头一次听说有人吹 deepseek 的,一拉一踩非常不可取
    spike0100
        7
    spike0100  
       4 天前 via iPhone
    我自己用下来 glm 其实还好。主要差别是 claude sonnect 4.5 一般一次生成的代码直接就可以跑,glm 需要主动提醒一两次才能调好。最终效果感觉差别不大。
    spike0100
        8
    spike0100  
       4 天前 via iPhone
    @spike0100 都是用 claude code + 对应基础模型测的。deepseek 和 qwen3 max 试过跑了 50 ,60 人民币的 token ,结果都没法看。
    takanashisakura
        9
    takanashisakura  
       4 天前   ❤️ 1
    说性能的话毋庸置疑吧。但是在真正用的时候,很难不考虑性价比和可用性吧。
    所以我也没得选,只有 deepseek 和 gemini 。
    xiaojie668329
        10
    xiaojie668329  
       4 天前
    有时候 Gemini 做得比 Claude 好
    raydg7777
        11
    raydg7777  
       4 天前
    还是 Codex
    Alias4ck
        12
    Alias4ck  
       4 天前   ❤️ 1
    吹 glm 的和 deepseek 的 肯定是没吃过细糠
    victor
        13
    victor  
       4 天前   ❤️ 1
    claude 够快所以是主力。但 claude 4.5 写完的功能,codex 还能挑出来一堆毛病。
    skiy
        14
    skiy  
       4 天前   ❤️ 8
    你抛开花费但抛开不了人家不让你用吧?这是不可控因素。刚刚又有 up 说自己被封号了。
    yb2313
        15
    yb2313  
       4 天前
    抛开花费我选同时使用几个顶尖模型,然后每次需求选择最好的一个结果,即使不同时使用也可不断轮换使用对比每个模型擅长领域。
    lithiumii
        16
    lithiumii  
       4 天前 via Android
    可能有一个月没写代码了,之前是用免费的 copilot 里的旧版本 gpt (好像是 4.1 )和 Claude ( 3.5 吧大概)或者用 Aider 调免费的 Gemini 2.5 Pro ,或者付费的 DeepSeek V3 或者 3.1 和 GLM 4.5 (这俩便宜)。
    体感最强是 Gemini 2.5 Pro ,其次相差不远是 DS 和 GLM ,免费 copilot 送的模型是真的不行了。
    haiku
        17
    haiku  
       4 天前 via Android   ❤️ 1
    GPT 5 high
    下个月等 Gemini 3
    streamrx
        18
    streamrx  
       4 天前 via iPhone
    gpt5 high
    zpvip
        19
    zpvip  
       4 天前
    claude-sonnet-4.5
    这个是毒品, 不能碰
    Imindzzz
        20
    Imindzzz  
       4 天前 via Android   ❤️ 13
    你想抛开谈就抛开谈呗,为啥要贬低一下“吹”deepseek...
    mywjyw
        21
    mywjyw  
       4 天前
    codex cli 做的比 claude code 差,很多功能不全,很难用
    lancevps
        22
    lancevps  
       4 天前
    生成 html 的 UI 设计稿,豆包最强
    sunnysab
        23
    sunnysab  
       4 天前   ❤️ 1
    额,倒也不是爱国情绪,https://www.reddit.com/r/LocalLLaMA/

    reddit 上很多外国人考虑中国的模型,超级积极… qwen 和 glm 评价不错。llama 挨骂较多,openai 被骂的也不少
    Thymolblue
        24
    Thymolblue  
       4 天前
    现在用 GPT-5 和 Claude 有什么渠道吗?直接用 API 都需要组织认证,目前国内身份没法通过
    yyws2012
        25
    yyws2012  
       4 天前 via Android
    @mooyo 都不考虑价格了还 sonnet
    yyws2012
        26
    yyws2012  
       4 天前 via Android
    @skiy 可以买别人转接的,就是 opus 会非常贵,但既然不考虑价格那就是可以的
    ggp1ot2
        27
    ggp1ot2  
       4 天前
    Claude Sonnet 4.5

    没有什么价格不价格的,这个模型可以满足我现在的需求
    mooyo
        28
    mooyo  
       4 天前
    @yyws2012 #25 sonnet 4.5 现在就是比 opus 4.1 好用啊。有又快又好用的为啥要用又慢又垃圾的
    charles0
        29
    charles0  
       4 天前
    GPT-5 high (比 GPT-5-Codex 强很多)
    Bad0Guy
        30
    Bad0Guy  
       4 天前
    cc ,但是封号比 codex 还疯狂,如果 Gemini3 效果比 Claude4.5 好那我会考虑日常转用 Gemini3
    Gekou
        31
    Gekou  
       4 天前
    没用过 claude ,但 claude 肯定不能一次处理 100w 的 token ,10w 行代码
    反驳请给出详细方法谢谢
    plasticman64
        32
    plasticman64  
       4 天前
    claude 会找 bug ,这是我最佩服的一点
    v20220522
        33
    v20220522  
       4 天前
    @charles0 为什么会这样, 能展开讲讲吗?
    lcandy
        34
    lcandy  
       4 天前
    @TimePPT 支持,codex-high 都没 5-high 好用
    agagega
        35
    agagega  
       4 天前 via iPhone   ❤️ 7
    为了那点所谓的优势整天琢磨哪个模型在 benchmark 里表现更好真的有意思么,还不如找到一个坚持用下去。有 gemini 用 gemini ,没有用 deepseek-v3 也能达到目的。天天炒作 claude 看着都麻了,是不是公司的政治观点还会影响用户?
    jonty
        36
    jonty  
       4 天前
    2025 年了,还有人在对比最强模型?谁不知道 claude 好用,是大家不想用吗?
    rubyacgn
        37
    rubyacgn  
       4 天前
    谁没事国庆写代码啊
    binaryify
        38
    binaryify  
       4 天前
    Codex 虽然有点慢但是经常一步到位, claude 像是应届生,着急写代码,但是经常返工
    bytesfold
        39
    bytesfold  
       4 天前 via iPhone
    Claude 4.5 体感跟 Codex 效果区别不大了;
    Claude 4 体感就是愣头青
    asuka02
        40
    asuka02  
       4 天前 via Android
    你这是从抖音学的标题吗?
    zy5a59
        41
    zy5a59  
    PRO
       4 天前
    我感觉这两个是互补的,codex 写逻辑强一些,但是 UI 写出来是真丑,claude 正好相反
    xuhuanzy
        42
    xuhuanzy  
       4 天前 via Android
    codex 上下文读取很激进,对于复杂项目效果远超 claude
    Bluecoda
        43
    Bluecoda  
       4 天前
    claude-sonnet-4.5 用下来比 gpt5-high 强多了,速度又快,体验感太棒
    kennylam777
        44
    kennylam777  
       4 天前
    @sunnysab Local AI 來講中國的開放 LLM 的確不錯, 但私有商業 SOTA(只賣 API 那種)模型比還是比中國模型強
    welcomezhangjun
        45
    welcomezhangjun  
       4 天前
    claude-sonnet-4.5
    coderlxm
        46
    coderlxm  
       4 天前 via Android
    codex-gpt5-high
    bf109_
        47
    bf109_  
    PRO
       4 天前
    codex cloud 吊打一切
    yjxjn
        48
    yjxjn  
       4 天前
    claude-sonnet-4.5
    CodeX
    Aolose
        49
    Aolose  
       4 天前   ❤️ 1
    抛开性价比?那我选择牛马大模型
    gfbts
        50
    gfbts  
       4 天前
    @Aolose 牛马竟是我自己
    mendax2019
        51
    mendax2019  
       4 天前
    gemini 2.5 pro ,快也是强
    pkokp8
        52
    pkokp8  
       4 天前
    顺便想问问大家,各位用这些模型的时候都是开箱即用吗
    会不会有什么奇技淫巧是我不知道的
    BernieDu
        53
    BernieDu  
       4 天前
    @xuhuanzy codex 读的上下文可能更多,你让他给代码找错确实更好用,但是一旦让它上手干活比 4.5 差远了,还是搭配着用吧
    ferock
        54
    ferock  
    PRO
       4 天前 via Android
    cl 4.0 ,没钱用 4.5 还没体验过
    andrew2558
        55
    andrew2558  
       4 天前
    现在这些大模型写代码是真的强呀,期待 gemini3
    gmuubyssss
        56
    gmuubyssss  
       4 天前
    @sunnysab 跟人家天天骂川普一样,你能天天????????
    jiayouzl
        57
    jiayouzl  
       4 天前
    毫无疑问 claude-sonnet-4.5
    salor
        58
    salor  
       4 天前
    写代码 GPT-5 High ,修 bug GPT-5 Pro
    Seck
        59
    Seck  
       4 天前 via Android
    没有先发优势?
    强者恒强,互联网的赢者通吃效应?🌚

    超过,想过了,直到 ai 热潮结束,也不能超过!

    要真是超过才是危险的,妈的做了三个版本才火起来,今天对面随随便便,资源比你少,人才投入比你少,市场价格比你低,然后被超越

    那估计三战就来了,创新失败效应才是人类社会进步最后的壁垒,如果创新者被对面:资源,人才,技术,市场,教育都不如你超过……那世界才真有意思
    234ygg
        60
    234ygg  
       4 天前
    但凡有点水平的代码,gpt 明显强一大截,垃圾代码的话 claude 和 gpt 差不多
    wangweiggsn
        61
    wangweiggsn  
       3 天前
    @mendax2019 我也用的 Gemini Pro 2.5, 注册 API 免费,vscode 里配置一下 API key 直接用,我用量没超,一直是免费的。
    qoras
        62
    qoras  
       3 天前
    gpt5-high 比 gpt5-codex 好,就是有点慢,不过可以加钱用 gpt5-high-fast
    kulove
        63
    kulove  
       3 天前 via Android
    抛不开 用了几天 Codex 效果差很多
    novaa
        64
    novaa  
       3 天前
    windows 下用了下 codex 跟个智障一样各种错误
    lscho
        65
    lscho  
       3 天前 via Android
    你想问就问,非要贬低一下别人。。。

    其实所有模型都试用一两个月你就会发现,所有的模型都有它擅长和不擅长的。

    而且每个人的使用习惯不一样(提示词习惯、规则配置、项目配置等),甚至网络环境的区别都会导致他对不同的模型体验不一样。

    所以这玩意目前我觉得没有固定答案,每个人都可以多试用几种来找到最合适自己的。

    就个人而言,claude 在大多数情况下符合预期,但是在少部分情况下确实有可能表现的还没有其他模型好。所以我已经习惯多种模型交叉验证解决稍微复杂的问题。
    shintendo
        66
    shintendo  
       3 天前
    lovdanny
        67
    lovdanny  
       3 天前 via Android
    我最近真切感受到 Codex 的强大——比我之前在 Cursor 里用的 Claude 模型更稳,也更少生成冗余代码。最近我用 Codex 一口气写完了一个 Rust 命令行工具(用于处理 TSV 和 Excel 表格数据,tsvkit: https://github.com/dawnmy/tsvkit ),基本上都是一次就过。

    前期用的是 Local 模式,额度用完后换成 Cloud 模式,结果真是让我震惊,在这种通用编程任务上,AI 已经可以做到几乎“代写”了,人只需要提清楚需求就行。
    kneo
        68
    kneo  
       3 天前 via Android
    不知道是不是错觉,前段时间 claude 降智,到现在我觉得 sonet 4.5 也智障一样,没缓过来。都在推 sonet 4.5 我还挺意外的。
    Wkj1998
        69
    Wkj1998  
       2 天前 via Android
    @Gekou 这么多代码,逻辑复杂应该只有 GPT-5-high 、Gemini2.5 Pro 能处理了,
    Wkj1998
        70
    Wkj1998  
       2 天前 via Android
    GPT-5-high 、Claude Sonnet4.5 、不截断的 Gemini2.5 Pro ,最重要的是互补,每个 LLM 都有短板,要取长补短
    anteros
        71
    anteros  
       2 天前
    哪个被骂的人最多,就用哪个。我说的是世界范围内。
    yippee0539
        72
    yippee0539  
       2 天前
    之前也是一直用 claude
    但是架不住贵/白嫖的不稳定
    索性 dp 了,够用、快、稳定、便宜
    byasm32
        73
    byasm32  
       2 天前
    Gemini 2.5 Pro 已经完全够用。。超长上下文支持,几百 k 的附件代码也随便分析,速度也快。
    yyws2012
        74
    yyws2012  
       2 天前 via Android
    @byasm32 gemini 非常擅长讲述内容,但是在分析较多内容时幻觉严重,之前我让它分析代码它能信誓旦旦地说出一个不存在的 feature
    ptstone
        75
    ptstone  
       2 天前
    ”我发现现在甚至有人还在吹 Deepseek 、GLM “ 。 八月底九月初的时候,我用 deepseek 和 sonet 4 ,同样的提示词写一个项目,deepseek 做的 ui 效果明显强与 sonet4.1 。 都是用 claude code 。后来放弃了 sonet4 生产的项目,用 sonet 4 接着 deepseek 生成的项目接着写后端,做单一任务,deepseek 在某些方面不一定差,做复杂任务,需要关联很多代码,你不提示 deepseek 会不读仓库其他代码直接写,sonnet 不降智的情况下,会读应用到的代码。凡是不要这么武断下结论。
    fourninenine
        76
    fourninenine  
       1 天前
    我就是第一种人😁我来反驳第二种
    什么叫“大谈敌对势力”?
    deepseek 不让美国人用了吗?
    到底是谁在搞敌对?
    Vaspike
        77
    Vaspike  
       17 小时 42 分钟前 via iPhone
    写 UI 我个人觉得 Gemini 依然最强
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   705 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 20:21 · PVG 04:21 · LAX 13:21 · JFK 16:21
    ♥ Do have faith in what you're doing.