Gemini 2.5 pro 在这个问题上栽跟斗

4 天前
 nealHuang
因为最近发现了一个 bug 代码示例如下

public static void main(String[] args) {
double num = 0.0;
double min = Double.MIN_VALUE;
System.out.println(num < min);
}



然后我就去问 Gemini ,这段代码输出的结果是什么,结果在这种简单问题上都是答错的,紧接着去测试了一下 ChatGPT 和 DeepSeek ,都能正确分析给出 True 的结果

4721 次点击
所在节点    程序员
30 条回复
surbomfla
4 天前
写代码 不要使用 Gemini ,pom.xml 文件开头 <?xml ,gemini cli 生成了 <xml ,测试其他 ds claude glm4.5 模型没出过这样的低级问题
liulicaixiao
4 天前
claude 也错了
ma46
4 天前
推理过程正确,结果错误
omega3
4 天前
我的 gemini 两次都回答 true ,你可能遇到降智了
xomix
3 天前
AI 本质上是内容生成,现在就算是看起来再有逻辑,它也不会直接通过逻辑判断,所以这种测试在当下没有什么必要。对于训练者无非是针对这些东西做一些内容训练。
thinkever
3 天前
gemini 代码能力确实欠缺一些,建议 claude 或 deepseek-r1
2en
3 天前
htfcuddles
3 天前
我用 API 测试者正确的,有没有可能你 IP 太脏被降智了?
Curtion
3 天前
Sonnet 4 还会自我纠正
suxiaoxiann
3 天前
为什么我的也是 true 。
bbao
3 天前
Gemini 我不信任他,刚开始我用一个开源项目进行测试,分析,只有它的输出驴唇不对马嘴,就在那编; chatgpt 都是没问题的。
Jasonqiao
3 天前
我也感觉大概率是被降智,最近我的 gemini 也频繁遇到这样的问题,对话中我使用一些完全不生僻的简写或名词,它能直接开始臆想瞎编,哪怕调用一下搜索也不至于生成完全驴唇不对马嘴的答案。我这用的 IP 纯净度应该还好啊,有重置或修复的办法么?
livin2
3 天前
降智这种成本控制操作确实难顶,哪怕直接严风控封 IP 呢
street000
3 天前
感觉 App 的 Gemini 是被降智了,AI Studio 里的 Flash Lite 都能答对。
qxmqh
3 天前
Gemini 只会道歉和一个劲的客气,跟 tm 日本人似的。很傻瓜。
snow0
3 天前
网页版 Gemini 和 AI Studio 都回答 false ,一纠正马上就抱歉了
nealHuang
3 天前
@liulicaixiao 强如 Claude 也降智
nealHuang
3 天前
@htfcuddles 有可能哈,不过我是 gemini 的年度 pro 教育白嫖版,居然都降智!真是大胆
eroneko
3 天前
2.5 Pro 降智很严重,怀念 03-25
pweng286
3 天前
2.5-flash,纠正了两次

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1156718

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX