GLM-4.7 上线并开源:更强的编码

1 天前
 Zhipuai

GLM-4.7 上线并开源。 新版本面向 Coding 场景强化了编码能力、长程任务规划与工具协同,并在多项主流公开基准测试中取得开源模型中的领先表现。

目前,GLM-4.7 已通过 BigModel.cn 提供 API ,并在 z.ai 全栈开发模式中上线 Skills 模块,支持多模态任务的统一规划与协作。

Coding 能力再提升

GLM-4.7 在编程、推理与智能体三个维度实现突破:

Code Arena:全球百万用户参与盲测的专业编码评估系统,GLM-4.7 位列开源第一、国产第一,超过 GPT-5.2 。

在主流基准测试表现中,GLM-4.7 的代码能力对齐 Claude Sonnet 4.5: 在 SWE-bench-Verified 获得 73.8% 的开源 SOTA 分数; 在 LiveCodeBench V6 达到 84.9% 的开源 SOTA 分数,超过 Claude Sonnet 4.5 ; SWE-bench Multilingual 达到 66.7%(提升 12.9%); Terminal Bench 2.0 达到 41%(提升 16.5%)。

真实编程场景下的体感提升

在 Claude Code 环境中,我们对 100 个真实编程任务进行了测试,覆盖前端、后端与指令遵循等核心能力。结果显示,GLM-4.7 相较 GLM-4.6 在稳定性与可交付性上均有明显提升。

GLM Coding Plan

作为本次升级的首个体验权益,所有购买套餐的用户将获得「体验卡」礼包,可邀请 3–7 位新用户免费体验 7 天套餐权益。

领取链接:[https://zhipuaishengchan.datasink.sensorsdata.cn/t/kc]

6193 次点击
所在节点    程序员
93 条回复
0n2ynu
20 小时 46 分钟前
4.6 这个玩意,我让他帮我查查为什么我 raid0 的 zfs 挂不上,这 b 看半天后直接给我重做了。。。我让你重做了么??害丢了我整个分区的数据
shine1996
20 小时 38 分钟前
为什么用你们家的送的资源包,能把我余额扣成负数?
YLGG
20 小时 38 分钟前
已经用上了 偶尔用用还行吧。
Felldeadbird
20 小时 34 分钟前
我 AI 库里面,GLM 属于应急水平。我现在全力用 Gemini3 中。我只能说,智谱加油吧。
byteLoading
20 小时 33 分钟前
还是要看性价比的吧,如果足够便宜,可以买一个做一些简单任务,节省高级模型的额度,比如你只想调用一个 mcp 工具去做一些相对简单的任务,就可以用一些性价比高的模型。但是这样的话 200 元的额外投入属实有点贵了,所以我主力还是 claude ,再买了 49 的 minmax code plan 来做补充
LaTero
18 小时 59 分钟前
@jokcylou 因为降智问题很可能受时区影响
maoqiucute
18 小时 20 分钟前
我再也不会相信任何国产编程模型,今天超越这个了明天超越那个了,实际一用就是一坨

狼来了我只能说
shunia
18 小时 15 分钟前
@Felldeadbird #64 全力用 Gemini3 的话,如果是用它来编码,那你可能也需要加加油。。。毕竟全网公认三大家里最垃圾的编程模型。
shunia
18 小时 11 分钟前
@jokcylou #36 reddit 上叫好也是有前提的,一部分人不拿 4.6 来编码,一部分人考虑到性价比,还有一些是配合特定的工具比如 kilo 体验会好一些等等。降智、乱改等问题一直有人在 sub 里提到,并非有多优秀。

我长期关注多个 AI 工具/模型的 sub reddit ,目前只有 gpt-5.2-high+codex 和 opus-4.5+claude code 是公认体验较好的。
kumiko
17 小时 48 分钟前
https://zhipuaishengchan.datasink.sensorsdata.cn/t/Qd
你家的优惠活动链接为啥打不开,到底有没有赚钱的诚心啊
lanyi96
17 小时 45 分钟前
今天有个简单的需求测试了一下国内的各个大模型编程能力,https://mp.weixin.qq.com/s/BpnipZmak5PBREfx53B88g
bbao
17 小时 41 分钟前
上线好 3 天,随后该什么样还是什么样。
fcten
17 小时 36 分钟前
真的有点好奇,楼里这么多用闭源模型的,是公司一点数据安全的要求都没吗?或者是独立开发者?
YanSeven
17 小时 27 分钟前
@fcten 但是我更好奇的是,“开源模型”真能”用“吗?除非 BAT 这些头部公司,中小公司内部自部署的模型够得上生产吗。
tracebundy
17 小时 26 分钟前
代码能力不是很好,主要是量大管饱,拿来做项目调研挺好
anan1314git
17 小时 10 分钟前
拿来做理解项目源码的活, 还是挺好用的.
Zhipuai
17 小时 8 分钟前
@kumiko 您好,换个浏览器试一试,Chrome 测试可以正常打开的。如果实在不行,用这个: https://bigmodel.cn/glm-coding
Saigut
16 小时 43 分钟前
在 4.7 的帖子下对着 4.6 狂喷,然后得出结论 4.7 垃圾,这是什么脑回路
illiteracy0001
16 小时 40 分钟前
GLM-4.7 位列开源第一、国产第一,超过 GPT-5.2 。看这个描述中的好几个第一,上次信邪在 kimi 充了 50 块钱,到现在也没用完
stinkytofux
16 小时 16 分钟前
@Zhipuai #77 能不能退钱啊? 4.7 慢成狗屎了, 上午用着还行, 现在一个小时都解决不了一个问题, 执行中还自己断了无响应, 再好的耐心都磨没了. 还有你们官网那个在线客服如果连接不上的话, 可以删掉入口, 干嘛恶心用户.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1180676

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX