2. 关于打榜推理:打榜推理的好处是用量可控加时间短,所以可以上八路推理;得到比较好的效果。但如果是日常使用,一个是损耗比较大,因为日常的问题往往不需要那么多并行推理选其一(大部分问题没那么复杂,这也是为啥 claude code 把 ultrathink 作为一个单独的 magic word 来使用);另外一块是要考虑到成本,国内的竞争非常的卷,以至于各家可能都是贴着成本在做,甚至亏本在卖 API ,这样导致其实很难会选择给你最强的模型推理方案。
Heavy Mode: K2 Thinking Heavy Mode employs an efficient parallel strategy: it first rolls out eight trajectories simultaneously, then reflectively aggregates all outputs to generate the final result. Heavy mode for GPT-5 denotes the official GPT-5 Pro score.