最近测试了几款 AI 国产模型,结果比我想象的还复杂

3 天前
 catwalk

最近这两周,我一直在使用 cc + ccr 对不同 AI 模型的能力测试,想了解它们在实际应用中的表现。通过这些测试,我对几个热门模型有了一些使用上的心得和体会。

首先是 KimiDeepSeek。官网版,但体验并不理想。两者在执行时都显得有些“力不从心”,不仅效果不如预期,而且余额很快消耗光,主要都限速(要充钱才能变快),几乎没能完成什么有价值的输出。Kimi 我用于写代码较多,Deepseek 用推理较多,尽管如此,我还是持续关注它们,期待能有所改进。

后续出的 DeepSeek-V3.1 在最初测试时,竟然出现了“极”这样的异常情况,后面好像修复更新,也是拿来推理用。

接着,我试了 GLM-4.5。令我意外的是,GLM-4.5 的表现超出了我的预期:它的速度相对更快,且能够产出不错的效果。在与其他模型对比时,GLM-4.5 无疑给了我更多的惊喜,它的稳定性和表现让我觉得性价比更高。缺点就是上下文有点短。好消息是有包月套餐,算是 cc 的平替版,但在隔壁站传出扣费问题,写的文档不清晰等问题。

现在又有两个新模型发布了——qwen3-max-previewkimi-k2-0905256K。我首先测试了 kimi-k2-0905256K,发现它在前端的表现似乎不如 GLM-4.5,虽然其他方面的性能还没来得及详细测试,但初步使用下来,给我的感觉并不算太突出。

接着,测试 qwen3-max-preview,这次的体验可以用“崩溃”来形容。测试过程中,速度极慢,不仅如此,出错了还说修复问题,结果还把生成的文件都删掉了。这个过程让我产生了强烈的幻觉感,似乎 AI 开始“自己”不知道该生成什么了,完全没有方向。介绍写着这次版本减少了幻觉的现象,但从实测结果来看,幻觉问题依然存在,甚至比之前的 qwen 版本还要明显。

这两个新模型,目前的体验并没有带来太多突破。像 GLM-4.5 这样的模型,稳定性不错,另外据说 GPT-5 的效果有惊喜,后面再测试其他模型看看。综合来看,目前最好的效果还是 cc 。

各位都用哪些模型?

4017 次点击
所在节点    Claude
50 条回复
Wenstor
2 天前
@catwalk #4 大佬,因为我有一张 4060Ti 16G 内存的显卡了,我想再整个 5600MHz 128G 内存的极魔客 k12 AMD Ryzen™ 7 H 255 ,8 核 16 线程,Zen 4 处理器,自带 oculink 的小主机,用来本地跑 Qwen3-coder 模型,看看代码使用,请问这个配置可以吗?或者有什么建议的能够流程跑 Qwen3-coder 模型(模型具体的量化版本还没考虑清楚),速度还可以的配置?只做选配置参考使用,大佬请放心建议!感谢!
catwalk
2 天前
@uni 准备开,codex 听闻比 cc 还好,是吗,实测怎么样
catwalk
2 天前
@Wenstor 抱歉,我不是什么大佬,只是玩玩,硬件这块不在行,可以问问 gpt
DivSoup
2 天前
glm-4.5 效果很不错,主要是包月很便宜。
Wenstor
2 天前
@catwalk #43 好的,你的配置方便分享下我参考参考吗? CPU 型号和内存大小这一块
catwalk
2 天前
@Wenstor 可能你误会了,我只是用 APi ,不是本地模型
killua67
2 天前
和我感觉也差不多,kimi 感觉太慢了,ds 就不说了,qwen code 感觉效果和价格不匹配,GLM 是综合不错的
catwalk
2 天前
@killua67 qwen coder 之前还算不错,但这次的 qwen3-max-preview 比较失望,曾经很多遍,有点不如 kimi-k2-0905256K ,现在测试的 kimi-k2-0905256K 和 glm4.5 差不多了,感觉 k2 还不错,因为上下文大点,只要提示词足够详细,还是可以的
oncethink
1 天前
目前在用 TRAE 、GLM-4.5 + CC
TRAE 是比较便宜能用上 Claude Sonnet 4 的方式了
GLM-4.5 的能力比 Claude 差一点,但是配合 cc 用起来非常舒服,做仓库的一些问答,写一些小脚本都非常好使
catwalk
17 小时 57 分钟前
@oncethink 可以考虑 codex ,有点被惊艳到了,特别是做原型验证阶段,非常好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1157569

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX