最近取消订阅了多家厂商的包月 token 服务,现在纯按 token 量消费, 因为它们都有降智问题。

1 天前
 dbow

主要的问题是这些厂商,它的后台的模型并不总是用了它的主力的模型,会在后台降智。
智谱的这个 GLM 4.6 ,新出的 Minimax M2 ,一开始挺好的,服务一有压力就乱来。 只要这些模型出 token 的速度一提升,就知道开始降智了,用了次一档的东西。 造成的结果就是写出来非常烂的代码,写出来一个文件,每个函数都是错误的,然后我要给他擦屁股几个小时。 这太可怕了,浪费我的大量的时间,去给他他们的模型提供优化数据。 还不如老老实实消费 token 去。

1535 次点击
所在节点    程序员
13 条回复
zzutmebwd
1 天前
牛马们如果都有活一多就降低工作质量的觉悟就好了。
CC11001100
1 天前
@zzutmebwd 实际上人的负载一旦高了之后出错率就会不由自主的升高,领导们有时候也会靠这个来辅助判断压榨牛马的性能极限。。。
musi
1 天前
@CC11001100
jd 上叫抗压能力
面试时叫压力测试
Seck
23 小时 16 分钟前
听了楼上的 3 层楼,醍醐灌顶,摸鱼摸鱼🖐️🐟️
YanSeven
22 小时 43 分钟前
什么意思,没看懂,是在说同一个厂商推出的“包月服务”里面的模型会出现降智以次充好的现象,而该厂商的以 api 充值的方式则不会吗。
mightofcode
22 小时 29 分钟前
自己掌握生产力是多麽重要
dbow
22 小时 19 分钟前
@YanSeven 包月服务里,厂商有明显的动态调度,节省资源的情况,用次一等规模较小的模型,临时取代规模大的那个,以获得得快的 token 输出,以及服务量,但是输出的代码就差了很多, 小模型不仅 token 成本低,并发服务能力也好的多。
kneo
21 小时 39 分钟前
按 token 付费不降智吗?
dbow
21 小时 30 分钟前
@kneo 部分第三方厂商会用量化版本来忽悠客户,但通常不会用小模型来替代,我觉得花点钱是次要的,出了垃圾代码要我花几小时修正才最恶心。
bobohu
20 小时 8 分钟前
GLM 4.6 两天我用了 100 万 token ,太可怕了
Linioi
19 小时 32 分钟前
@bobohu 一百万 token 也就是 1M ,这用量挺小吧,我一小时可能就要好几 M 了。
bbbblue
17 小时 47 分钟前
minimax m2 套餐不是才刚上吗。。。这么快就试出来降智了?
roygong
8 小时 11 分钟前
老老实实用 Claude 吧,人家超额是直接停用

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1172970

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX