智谱开源的 GLM4.5 怎么没人讨论

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 142 天前的主题，其中的信息可能已经有所发展或是发生改变。

官方称 “GLM-4.5 在包含推理、代码、智能体的综合能力达到开源 SOTA 水平，在真实代码智能体的人工对比评测中，实测国内最佳。”

号称拳打 kimik2 ，脚踢 qwen3-coder ，仅比 Claude-4 稍弱（ qwen3-coder 不也这么吹的么）。

测不动，真测不动了，哪位老哥有兴趣测完说说体验

GLM4.5

推理

代码

25 条回复 • 2025-07-31 16:16:19 +08:00

miracleyin

142 天前

官网 chatbot 测试了一下，感觉不太聪明

iorilu

142 天前

随便吹牛逼, 我只信 claude , 除非免费, 那可以试试

sthwrong

142 天前

复杂的我用 claude 4, 弱一点的 claude 3.7, 常规的 k2 。qwen3-coder 比 qwen3 本身还难受，感觉好像过于专精结果丧失了需求的理解能力，更别说 api 真的贵。

thatlazyman

142 天前

审查比较严格，我试一下问个代理问题被禁止回答

zzfly256

142 天前

正在对接，API 和 GLM 4 感觉断档了，多了不少参数

darksword21

PRO

142 天前 via iPhone

只用 claude ，除非哪天全网都在说某模型爆锤 claude ，不然为什么要浪费时间关心和对比一堆效果差的模型

kebamt

142 天前

不太好用而且 UI 太乱了，校友送了我两年会员都不想用

kebamt

142 天前

@iorilu Claude 也菜，昨天白白浪费了我快半小时时间

qxmqh

142 天前

只用克劳德。其他的都是浪费时间。

mintist

142 天前

白开了 50 块钱，配合 Claude Code 不太行，，，

oceanclock

142 天前

和 kimi k2 一样的慢，上下文不如 qwen3 ，会过度思考，感觉还是不太行，等官方调优一波

tt67wq

142 天前

50 块的羊毛薅的人估计有点多，卡的狠

hellodigua

142 天前

测试了一下，不太行，速度很慢，不太实用

yb2313

142 天前

用过 kimi 和智谱, 感觉像脑袋尖尖阿诺, 目前使用体验最好的是阿里 qw3 一些新的模型, 然后是 gpt 的, 还有密塔的也不错. 再然后就是 dk 的 r1, 然后代码这一块肯定是 claude4 和 qwcoder. 平时我是用插件同时问多个网页的 ai 的, 基本上所有 ai 都用过, 包括法国团队的那些什么模型. 综合来说 qw 的体验最好, 但不能用国内的 qw, 连暗黑模式都没有, 我用的这插件里也不能强制暗黑模式