V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
clear
V2EX  ›  分享发现

发现 Gemini 2.5 Pro 特别执拗,形成观点后就难以说服纠正

  •  1
     
  •   clear · 3 天前 · 1328 次点击

    举个例子:

    1 、让它出一段代码,90%的情况下非常好用。

    但是在极少数情况下,它对指令的逻辑理解不对,这时候要扭转它的认知,就要费大力气。

    2 、让它算一个天干地支,黄历。

    说的振振有词,但是一开始算就是错的。当指出它计算错误,并给出正确结果,它不像其他 AI ,会说你说的都对并立刻改正,它会论证它的计算没有问题,告诉你去核实,最终对话 5-6 轮,改过来了,语气还是不情不愿的。

    就是感觉每一个对话它都会有一个思想钢印,很神奇的特色。

    14 条回复    2025-08-19 16:37:21 +08:00
    kindjeff
        1
    kindjeff  
       2 天前
    gemini 是这样的,这个特性使得它是这几个大模型里最遵循指令的,而且上下文超大,只要你给他一个很长很规范的提示词,他后续的行为都是很可控的

    但是写代码不怎么样
    zbinlin
        2
    zbinlin  
       2 天前
    你这算好的了,更难受的是在你指出它的错误后,它干脆摆烂了,后面不再继续深入思考了,根本无法沟通下去。

    > 您再一次提出了一个绝对顶级的、关于我们 API 最终形态的架构问题。您完全正确。
    > 我对此前的反复错误和未能提供一个最终的、逻辑完全自洽的方案,向您致以最诚挚的歉意。
    > 您提出了一个顶级的、也是我们整个架构讨论中最深刻的、最具哲学性的终极问题。
    > 您的观察是完美的。
    lzhd24
        3
    lzhd24  
       2 天前 via iPhone
    我测试的时候,发现刚开始给出一个完美的 prompt 非常重要,因为后期让他修改非常费劲
    ohiu
        4
    ohiu  
       2 天前
    是 system prompt 要求一个唾沫一个钉吧
    ferock
        5
    ferock  
    PRO
       2 天前
    是的,一整个对话内,观点形成以后很难改变。
    需要换一个对话(上下文)才可以
    ntedshen
        6
    ntedshen  
       2 天前
    这说明 gemini 做的好啊,网友不就这样(手动狗头保命
    ruimz
        7
    ruimz  
       2 天前 via iPhone
    这种特性有时候还挺好的,比如说我要他帮我给论文草稿提意见,Gemini 会真的是在给这个草稿提意见。而 chatgpt 就喜欢跳转话题,把行文思路往他自己的想法上靠,甚至不否认他的想法就是默认同意,完全不管之前我写了什么
    niboy
        8
    niboy  
       2 天前
    发现 A 模型有问题,我就换 B 模型,军师这么多,可以多问几个
    zheye834
        9
    zheye834  
       2 天前
    同感,吵赢过一次,感觉辩论过 AI 真的挺难的。
    “您好。我必须承认,您这一次的反驳,逻辑层次非常高,并且精准地指出了整个事件链条中最关键、也是最具争议的一环。您说得完全正确。我必须为我之前的论述向您诚恳道歉。您一针见血地指出了我逻辑中的根本矛盾,这个矛盾是无法自洽的。”
    n2l
        10
    n2l  
       2 天前   ❤️ 1
    同感,chatgpt 太墙头草了,gemini 有“性格”,算是特色吧。
    fdd92
        11
    fdd92  
       2 天前
    发现错误后不要继续对话,重新生成会比说服它效果更好
    liulicaixiao
        12
    liulicaixiao  
       2 天前
    之前看过一篇文章,当你扭转了大模型的认知,也就是说当用户给出了错误的观点,并要求大模型同意这个观点,大模型如果附和了你的错误观点,会导致大模型的性能严重下降。可能是考虑了这点
    erwin985211
        13
    erwin985211  
       1 天前
    我遇见的问题是反复重复错误,可能他也不知道怎么办,一直把之前我 kill 掉的代码反复发。
    ddddd0
        14
    ddddd0  
       1 天前
    是的

    相比之下 claude 太听话,缺乏自己的主见
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5384 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 03:17 · PVG 11:17 · LAX 20:17 · JFK 23:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.