V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
wilddog
2.3D
V2EX  ›  程序员

github copilot 提供的免费模型里面,哪个模型的代码能力更好一点?

  •  
  •   wilddog · 14 天前 · 3117 次点击
    GPT-4.1
    GPT-4o
    GPT-5 mini
    Grok Code Fast 1
    Raptor mini (Preview)

    12 月的第三天,高级请求就快要被我干没了,节省一点,用用免费模型先 = =
    37 条回复    2025-12-05 18:16:10 +08:00
    bbbblue
        1
    bbbblue  
       14 天前
    跑分的话是 GPT-5 mini 推理 medium 的一些跑分在 minimax m2/qwen3 coder 那一档 你可以搜下 SWE-rebench
    wilddog
        2
    wilddog  
    OP
       14 天前
    @bbbblue 嗯,评分我知道,主要是问问有没有老哥实际 code 过的,输出的实际能力如何,因为我还看到有人说 Grok code fast 不错,不过我今天试用下来 Grok 一直限流没用成
    codehz
        3
    codehz  
       14 天前 via Android
    Grok code fast 输出 patch 正确性高(甚至比付费的 codex 还好),但是复杂任务不是很行,raptor mini 是微调的 gpt 5 mini ,能解决一定程度的复杂问题,但速度太慢,用于编写代码不是很稳定,我建议是免费的话就用 raptor 做 plan ,然后 grok 执行计划()
    wilddog
        4
    wilddog  
    OP
       14 天前
    @codehz 感谢,不过 Grok 几乎处于不可用的状态,一直提示上游限制,看起来现在只能用 gpt 5 mini 了
    burnsby
        5
    burnsby  
       14 天前
    我直说了, 哪怕你使用 GP 里面的 Opus 4.5 模型, 它也是个弱智, 我用 OpenSpec 来开发功能, 在完成任务的时候它居然给我任务列表都改掉了
    labubu
        6
    labubu  
       14 天前
    同问付费里面的哪个好用
    zisen
        7
    zisen  
       14 天前
    @burnsby Opus 4.5 经常列一个 plan ,然后就杵在那也不执行,还得我说继续才执行,感觉是降智了,还是买 api 靠谱
    zisen
        8
    zisen  
       14 天前   ❤️ 1
    @labubu 不降智的话 claude 响应快,适合问问题,gpt5.1 调查比较严谨,适合改代码,降智的话都不好用,改用自己买的 api
    tog
        9
    tog  
       14 天前
    @zisen #8 copilot 没有 claude
    zenfsharp
        10
    zenfsharp  
       14 天前
    GPT-5 mini 和 Raptor mini 不知道为什么,我这里经常断,回复一半就停了。
    我都是简单没有歧义的东西,比如写个 SQL 语句,或者回复一封美式英语邮件,用 GPT-4.1 ;
    遇到大任务,切 agent ,用 Opus 4.5 ;
    带图片什么的,只能 GPT-4.1 ;
    其他非编程问题,GPT-4.1 。
    hailaz
        11
    hailaz  
       14 天前
    我觉得 Claude 的几个都可以,haiku 的反应最快,一般情况下都用他。
    hailaz
        12
    hailaz  
       14 天前
    噢,问的是免费模型,没认真读题我的错。免费那几个感觉都不太行
    Leoking222
        13
    Leoking222  
       14 天前
    Grok 真心不建议,如果拿来写代码的话,还不如 gpt
    maolon
        14
    maolon  
       14 天前
    都不怎么样,用这些还不如直接用国产模型(自己接 api ),现在国产这些不是在搞活动 coding plan 20 块一个月?
    sagnitude
        15
    sagnitude  
       14 天前
    别浪费时间,如果效果达不到,反复问答太浪费时间了,返工更是
    imik
        16
    imik  
       14 天前
    @tog
    mmdsun
        17
    mmdsun  
       13 天前 via iPhone
    @tog 你 IP 有问题吧,copilot claude 模型、GPT 都能用。
    wu67
        18
    wu67  
       13 天前 via Android
    我只用 gpt4.1 和 claude4.5 系列
    ghm2mail
        19
    ghm2mail  
       13 天前
    闲鱼 9 块 9 的 claude 没上车?
    56way
        20
    56way  
       13 天前
    免费的都是智障不值得浪费时间,直接 pro 付费模式。。一个月 40 刀。。
    yzongyue
        21
    yzongyue  
       13 天前
    我免费的用 Grok Code Fast 1 , 感觉比其他的效果好还快
    Msxx
        22
    Msxx  
       13 天前
    真就不考虑 codex 或 gemini 吗?
    gadfly3173
        23
    gadfly3173  
       13 天前 via Android
    @Msxx 这俩都不能原生运行,要用的话一定会污染自己的全局依赖,还不如隔壁 cc 呢
    bytesfold
        24
    bytesfold  
       13 天前 via iPhone
    你们写的东西很复杂吗,我直接说需求,10 轮对话完成,5 轮对话修 bug 和格式就好了
    Zy143L
        25
    Zy143L  
       13 天前
    可以考虑多找几个号...我自己用 haiku 速度很好 sonet 那个老断
    COW
        26
    COW  
       13 天前 via Android
    调研问问题,我直接用网页 gpt 。稍微复杂点的用 raptor mini 。一小段代码比如一两个函数之类的,用 grok code fast 。gpt 开始还行,用多了就容易降智。付费里 0.33x 那个性价比最高。
    wilddog
        27
    wilddog  
    OP
       13 天前
    @zisen #7 这个应该是因为网络连接问题,他需要实时稳定的长连接才能用
    wilddog
        28
    wilddog  
    OP
       13 天前
    @56way 但是 pro 模式每个月只有 300 条高级模式的用量啊,高强度用很快就用干了
    wilddog
        29
    wilddog  
    OP
       13 天前
    @Msxx 这都是高级请求才能用的模型啊,我用超了啊
    wilddog
        30
    wilddog  
    OP
       13 天前
    @bytesfold 那也得看模型能力,我用 claude 是很好用的,免费的 GPT 5 mini 有点拉
    wilddog
        31
    wilddog  
    OP
       13 天前
    @COW 我是在 IDE 里面用的,所以不用网页,IDE 集成的 Agent 就那么几个,模型也就是那些
    56way
        32
    56way  
       13 天前
    @wilddog 哦我用的 vscode 的 第二档收费的那个,那个很耐用。。
    AoEiuV020JP
        33
    AoEiuV020JP  
       12 天前
    单文件编辑我会用用 GPT-4o ,其他都是废物, 远不如 1/3 倍率的 claude haiku 4.5,
    wilddog
        34
    wilddog  
    OP
       12 天前
    @56way #32 你用的哪个? github 的吗,感觉不耐用啊
    56way
        35
    56way  
       12 天前
    @wilddog github 的啊第二档收费的 40 刀一个月的,正常用基本够用了
    wilddog
        36
    wilddog  
    OP
       11 天前
    @56way #35 我还以为你把免费的当成第一档
    56way
        37
    56way  
       11 天前
    @wilddog 免费的就是鸡肋。。哈哈快开收费第二档 量大管饱
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3388 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 04:30 · PVG 12:30 · LAX 20:30 · JFK 23:30
    ♥ Do have faith in what you're doing.