![]() |
1
surbomfla 1 天前
写代码 不要使用 Gemini ,pom.xml 文件开头 <?xml ,gemini cli 生成了 <xml ,测试其他 ds claude glm4.5 模型没出过这样的低级问题
|
![]() |
2
liulicaixiao 1 天前
|
![]() |
3
ma46 1 天前
推理过程正确,结果错误
|
![]() |
4
omega3 1 天前
我的 gemini 两次都回答 true ,你可能遇到降智了
|
![]() |
5
xomix 1 天前
AI 本质上是内容生成,现在就算是看起来再有逻辑,它也不会直接通过逻辑判断,所以这种测试在当下没有什么必要。对于训练者无非是针对这些东西做一些内容训练。
|
![]() |
6
thinkever 1 天前
gemini 代码能力确实欠缺一些,建议 claude 或 deepseek-r1
|
![]() |
7
2en 1 天前
|
![]() |
8
htfcuddles 1 天前
我用 API 测试者正确的,有没有可能你 IP 太脏被降智了?
|
![]() |
9
Curtion 1 天前
|
![]() |
10
suxiaoxiann 1 天前
|
11
bbao 1 天前
Gemini 我不信任他,刚开始我用一个开源项目进行测试,分析,只有它的输出驴唇不对马嘴,就在那编; chatgpt 都是没问题的。
|
12
Jasonqiao 1 天前
我也感觉大概率是被降智,最近我的 gemini 也频繁遇到这样的问题,对话中我使用一些完全不生僻的简写或名词,它能直接开始臆想瞎编,哪怕调用一下搜索也不至于生成完全驴唇不对马嘴的答案。我这用的 IP 纯净度应该还好啊,有重置或修复的办法么?
|
13
livin2 1 天前
降智这种成本控制操作确实难顶,哪怕直接严风控封 IP 呢
|
14
street000 1 天前 via Android
感觉 App 的 Gemini 是被降智了,AI Studio 里的 Flash Lite 都能答对。
|
![]() |
15
qxmqh 1 天前
Gemini 只会道歉和一个劲的客气,跟 tm 日本人似的。很傻瓜。
|
16
snow0 1 天前
|
![]() |
17
nealHuang OP @liulicaixiao 强如 Claude 也降智
|
![]() |
18
nealHuang OP @htfcuddles 有可能哈,不过我是 gemini 的年度 pro 教育白嫖版,居然都降智!真是大胆
|
19
eroneko 1 天前
2.5 Pro 降智很严重,怀念 03-25
|
![]() |
20
pweng286 1 天前
|
![]() |
21
westfall 1 天前
今天薅了个 Gemini 教育版,免费 12 个月,第一次对话就给我干懵了,它居然倾向于欺骗我。它声称自己能听懂音频,我上传了个外企工作相关的访谈节目让它总结一下,它给我瞎编一通。
https://g.co/gemini/share/46062a841a23 |
22
kekxv 1 天前 via iPhone
gemini-cli 的 2.5 Pro 贼强
|
23
yulon 1 天前
可能数据有污染,Qwen 正确,GLM 居然错了,而且它自己都说 0 小于正数了,结果却是 false 。
|
![]() |
24
rrfeng 1 天前
Gemini flash 回答正确
|
![]() |
25
Kairossaster 1 天前 via Android
gemini2.5pro 和 chatgpt 输出 true 。claude sonnet4.1 和 grok3 false
|
26
charles0 1 天前
三个不同渠道的 gemini-2.5-pro 都给了 true 的正确答案,你肯定遇到降智了
|
27
yulon 1 天前
我好像知道某些 AI 的逻辑了:
因为二进制的存储方式,把「正数」和「无符号数/非负数」划等号了,0 被 AI 当成了「正数」,此时 0 自己就是「最小的正数」,当然不能小于「最小的正数」。 并且在某些推理过程中,虽然能得出 Double.MIN_VALUE 是「大于 0 的正数」,但是在后续推理中,可能出于节省 token ,变成了「正数」,而「正数」又被误解为「全体正数」,被当成「正数」的 0 ,自然也不能小于「全体正数」。 |
28
cat1879 14 小时 49 分钟前
gemini 2.5pro False
PPLX ture claude false |
![]() |
29
since2021 13 小时 39 分钟前
我第二次开了 deep thought 回答对了,第一次不对
|
30
zpxshl 9 小时 19 分钟前
gemini2.5 输出 true ,我是用 poe 中转的 e
|