为什么不同的编程工具使用相同的模型写出的结果大相径庭?

54 天前
 madm4n

我试过 claude code sonnet4 ,国际 trae sonnet4 , 后者效果明显差于前者。明明模型一样,为什么在不同开发工具上的表现相差很大?有佬解释一下吗?

1913 次点击
所在节点    程序员
10 条回复
Atoony
54 天前
同样一把青龙偃月刀,你来使和关二爷来使那能一样吗
vvxu
54 天前
不同工具的内置提示词不一样吧,之前不是 Windsurf 提示词疯狂 pua AI
SGL
54 天前
我理解,核心技术都是大模型的,基础的 IDE(编辑器)是人家微软的。
各种套皮的 AI IDE 的核心竞争点可能就是内置提示词的不同和提示词的优化技术了吧。
v2er119
54 天前
在编码方面,没有绝对的领先之说。同一个问题,有时免费的比 pro 回答的更好。
原来的 cursor 比 trae.ai 用起来更好,现在基本于处同一水平了。
随着时间推移。越到后面,水平只会无限接近。
国产的 AI 也会跟上,因为主流的编码语言特性是可以从穷举到优化的。

如果免费的没有限制,只要你提问的(提示词)次数多一些,也不是不能完成。

好的算法,有先发优势,但这个没有技术护城河,只有算力护城河。
madm4n
54 天前
由于囊中羞涩,在考虑 claude code+国产模型(k2/glm4.5), 还是用国际版 trae ? 看到一些人说 claude code 和第三方模型不太兼容,roo code+(k2/glm4.5)比 claude code+(k2/glm4.5)效果要好。augment($50/月、kiro($50/月、claude code sonnet4($20/月,这些属实用不起。所以我在国际版 trae 和 roo code+glm4.5/k2 中犹豫。因为 roo code+glm4.5/k2 我没试过,不知道效果怎么样,特别是我比较关心上下文工程能力。其次是 glm4.5 和 k2 是按量计费,trae 是包月订阅,成本方面不太好评估哪个性价比更高
madm4n
54 天前
@madm4n 国际版 trae 作为选择之一,主要是因为提供了 claude sonnet4 模型
TimePPT
54 天前
囊中羞涩其实也可以考虑下 Github Copilot ,便宜稳定,也提供 Claude Sonnet 4
fruitmonster
54 天前
之前我复制了 A 的结果给 B ,然后告诉他,有人反驳你是错的,他觉得他比你写的更好,两个互相验证就好了
royorange
54 天前
他们两者对模型上下文窗口的利用率就不同

毕竟第三方编辑器需要节省 api 消耗,而一方自己的软件不管是对自己模型的理解或者 context 的利用率上一般会更高,两者提示词上应该也有很大的差别。
之前看 claude 的演讲,他们在 claude code 中光是对 compact 压缩上下文但是减少影响这部分就做了非常久的优化,那第三方编辑器作为要适配各个模型的方案,肯定不会在单个上和原生比那么精。

我目前自从使用了 claude code 后,其他的单独用已经很少了
asd999cxcx
54 天前
@royorange cc 有啥好的使用姿势吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1150556

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX