GLM-4.7 上线并开源:更强的编码

1 天前
 Zhipuai

GLM-4.7 上线并开源。 新版本面向 Coding 场景强化了编码能力、长程任务规划与工具协同,并在多项主流公开基准测试中取得开源模型中的领先表现。

目前,GLM-4.7 已通过 BigModel.cn 提供 API ,并在 z.ai 全栈开发模式中上线 Skills 模块,支持多模态任务的统一规划与协作。

Coding 能力再提升

GLM-4.7 在编程、推理与智能体三个维度实现突破:

Code Arena:全球百万用户参与盲测的专业编码评估系统,GLM-4.7 位列开源第一、国产第一,超过 GPT-5.2 。

在主流基准测试表现中,GLM-4.7 的代码能力对齐 Claude Sonnet 4.5: 在 SWE-bench-Verified 获得 73.8% 的开源 SOTA 分数; 在 LiveCodeBench V6 达到 84.9% 的开源 SOTA 分数,超过 Claude Sonnet 4.5 ; SWE-bench Multilingual 达到 66.7%(提升 12.9%); Terminal Bench 2.0 达到 41%(提升 16.5%)。

真实编程场景下的体感提升

在 Claude Code 环境中,我们对 100 个真实编程任务进行了测试,覆盖前端、后端与指令遵循等核心能力。结果显示,GLM-4.7 相较 GLM-4.6 在稳定性与可交付性上均有明显提升。

GLM Coding Plan

作为本次升级的首个体验权益,所有购买套餐的用户将获得「体验卡」礼包,可邀请 3–7 位新用户免费体验 7 天套餐权益。

领取链接:[https://zhipuaishengchan.datasink.sensorsdata.cn/t/kc]

6118 次点击
所在节点    程序员
93 条回复
isquare
1 天前
上面评论看下来,感觉 zhipu 在 v2 做推广算是白花钱了 。。 毕竟这里是真的程序员在用哈哈,小红书、b 站可能投流更管用,能吸引很多学生
maxwel1
1 天前
去 B 站那里做广告吧,那里小学生多一点,只看 ppt 不用在生产环境的小朋友也多。但我是真要当生产力工具。
trio
1 天前
都用 AI 了,就用一线的;我不会再给任何非一线产品试用机会。我的时间更宝贵。
catwalk
1 天前
@ktyang 我更惨,内外都试过,内的都被坑过,还是只能用主流一线的,其他都是坑钱的
jqtmviyu
1 天前
有请 4.6 上当惨遭降智的网友发言.
catwalk
1 天前
@jqtmviyu 4.5 后阶段已经开始了,一次不忠百次不用
silencefly
1 天前
因为不好用而用不了的东西是最贵的
maolon
1 天前
先不说别的了,你们在 V2 的 AMA 一言不发搞了个寂寞?你们之前说的抽奖抽了吗?结果是什么?
就纯搞宣发把 v 友当傻子耍?
wwhc
21 小时 59 分钟前
支持楼主,请继续加油开源更多的 AI 模型。对了,有 GLM 4.7 air 么?非常可惜的是至今并没有一个能抗衡 gpt-oss-120b 的开源模型在同一尺寸上。
xiangran0028
21 小时 44 分钟前
被上面的 diss 了这么久一言不发?那就是实锤了呗
iorilu
20 小时 21 分钟前
要上市了拼命推广阿
quanjw
20 小时 13 分钟前
降智垃圾玩意 还没退款渠道 终生拉黑
MIUIOS
20 小时 3 分钟前
这次不会在上当了,哈哈哈😅
MIUIOS
20 小时 2 分钟前
少搞一点营销多整一点算力吧,求你们了 务实点
jokcylou
19 小时 51 分钟前
@mogutouer 照你这么说除了 opus4.5 别的模型都没必要存在了?
jokcylou
19 小时 49 分钟前
很搞笑的是 reddit 上一片叫好,又便宜,效果也不错,还开源,到这里就是不如 opus 就别拿出来了,太典了
MIUIOS
19 小时 38 分钟前
@jokcylou #36 你买 codeplan 吗 没有就没有发言权,你买一个再说,每次他们新发模型的时候 TTFT 和 TPS 贼高,过几天就低下来了,高峰期卡壳降智是日常。
MIUIOS
19 小时 37 分钟前
@jokcylou #36 我是实打实的支持国产模型,结果被人背后来了一刀,吐槽下还要被戴帽子😅
herbloo
19 小时 33 分钟前
打个小广告,可以用小绵羊 AI 同时向多个 AI 提问,从而对比各个 AI 的回答结果是否可靠,小绵羊 AI 也是支持 z.ai 的。
https://github.com/HerbLuo/xmy-ai
cherryas
19 小时 31 分钟前
看到 v2 这么多骂的就知道稳了。
这次真的是可用级别的了
昨天刚发布的 4.7 !!!
看评论以为都被坑很久了!!
别拿 glm4.6 来杠不是一个东西

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1180676

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX