V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
nealHuang
V2EX  ›  程序员

Gemini 2.5 pro 在这个问题上栽跟斗

  •  
  •   nealHuang · 1 天前 · 4431 次点击
    因为最近发现了一个 bug 代码示例如下

    public static void main(String[] args) {
    double num = 0.0;
    double min = Double.MIN_VALUE;
    System.out.println(num < min);
    }



    然后我就去问 Gemini ,这段代码输出的结果是什么,结果在这种简单问题上都是答错的,紧接着去测试了一下 ChatGPT 和 DeepSeek ,都能正确分析给出 True 的结果

    第 1 条附言  ·  1 天前
    虽然这个帖子是在讨论 Gemini 的问题,但实际上弱弱的想问一句,是不是只有我一直误以为 Double.MIN_VALUE 是负数 shit T_T
    30 条回复    2025-09-04 15:25:11 +08:00
    surbomfla
        1
    surbomfla  
       1 天前
    写代码 不要使用 Gemini ,pom.xml 文件开头 <?xml ,gemini cli 生成了 <xml ,测试其他 ds claude glm4.5 模型没出过这样的低级问题
    liulicaixiao
        2
    liulicaixiao  
       1 天前
    claude 也错了
    ma46
        3
    ma46  
       1 天前
    推理过程正确,结果错误
    omega3
        4
    omega3  
       1 天前
    我的 gemini 两次都回答 true ,你可能遇到降智了
    xomix
        5
    xomix  
       1 天前
    AI 本质上是内容生成,现在就算是看起来再有逻辑,它也不会直接通过逻辑判断,所以这种测试在当下没有什么必要。对于训练者无非是针对这些东西做一些内容训练。
    thinkever
        6
    thinkever  
       1 天前
    gemini 代码能力确实欠缺一些,建议 claude 或 deepseek-r1
    2en
        7
    2en  
       1 天前
    htfcuddles
        8
    htfcuddles  
       1 天前
    我用 API 测试者正确的,有没有可能你 IP 太脏被降智了?
    Curtion
        9
    Curtion  
       1 天前
    Sonnet 4 还会自我纠正
    suxiaoxiann
        10
    suxiaoxiann  
       1 天前
    为什么我的也是 true 。
    bbao
        11
    bbao  
       1 天前
    Gemini 我不信任他,刚开始我用一个开源项目进行测试,分析,只有它的输出驴唇不对马嘴,就在那编; chatgpt 都是没问题的。
    Jasonqiao
        12
    Jasonqiao  
       1 天前
    我也感觉大概率是被降智,最近我的 gemini 也频繁遇到这样的问题,对话中我使用一些完全不生僻的简写或名词,它能直接开始臆想瞎编,哪怕调用一下搜索也不至于生成完全驴唇不对马嘴的答案。我这用的 IP 纯净度应该还好啊,有重置或修复的办法么?
    livin2
        13
    livin2  
       1 天前
    降智这种成本控制操作确实难顶,哪怕直接严风控封 IP 呢
    street000
        14
    street000  
       1 天前 via Android
    感觉 App 的 Gemini 是被降智了,AI Studio 里的 Flash Lite 都能答对。
    qxmqh
        15
    qxmqh  
       1 天前
    Gemini 只会道歉和一个劲的客气,跟 tm 日本人似的。很傻瓜。
    snow0
        16
    snow0  
       1 天前
    网页版 Gemini 和 AI Studio 都回答 false ,一纠正马上就抱歉了
    nealHuang
        17
    nealHuang  
    OP
       1 天前
    @liulicaixiao 强如 Claude 也降智
    nealHuang
        18
    nealHuang  
    OP
       1 天前
    @htfcuddles 有可能哈,不过我是 gemini 的年度 pro 教育白嫖版,居然都降智!真是大胆
    eroneko
        19
    eroneko  
       1 天前
    2.5 Pro 降智很严重,怀念 03-25
    pweng286
        20
    pweng286  
       1 天前
    2.5-flash,纠正了两次
    westfall
        21
    westfall  
       1 天前
    今天薅了个 Gemini 教育版,免费 12 个月,第一次对话就给我干懵了,它居然倾向于欺骗我。它声称自己能听懂音频,我上传了个外企工作相关的访谈节目让它总结一下,它给我瞎编一通。
    https://g.co/gemini/share/46062a841a23
    kekxv
        22
    kekxv  
       1 天前 via iPhone
    gemini-cli 的 2.5 Pro 贼强
    yulon
        23
    yulon  
       1 天前
    可能数据有污染,Qwen 正确,GLM 居然错了,而且它自己都说 0 小于正数了,结果却是 false 。
    rrfeng
        24
    rrfeng  
       1 天前
    Gemini flash 回答正确
    Kairossaster
        25
    Kairossaster  
       1 天前 via Android
    gemini2.5pro 和 chatgpt 输出 true 。claude sonnet4.1 和 grok3 false
    charles0
        26
    charles0  
       1 天前
    三个不同渠道的 gemini-2.5-pro 都给了 true 的正确答案,你肯定遇到降智了
    yulon
        27
    yulon  
       1 天前
    我好像知道某些 AI 的逻辑了:

    因为二进制的存储方式,把「正数」和「无符号数/非负数」划等号了,0 被 AI 当成了「正数」,此时 0 自己就是「最小的正数」,当然不能小于「最小的正数」。

    并且在某些推理过程中,虽然能得出 Double.MIN_VALUE 是「大于 0 的正数」,但是在后续推理中,可能出于节省 token ,变成了「正数」,而「正数」又被误解为「全体正数」,被当成「正数」的 0 ,自然也不能小于「全体正数」。
    cat1879
        28
    cat1879  
       14 小时 49 分钟前
    gemini 2.5pro False
    PPLX ture
    claude false
    since2021
        29
    since2021  
       13 小时 39 分钟前
    我第二次开了 deep thought 回答对了,第一次不对
    zpxshl
        30
    zpxshl  
       9 小时 19 分钟前
    gemini2.5 输出 true ,我是用 poe 中转的 e
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1500 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 16:44 · PVG 00:44 · LAX 09:44 · JFK 12:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.