看到论坛里面不少人借助 AI 可以轻松搞定某某小项目,我试了下怎么感觉 AI 的输出问题很多啊

1 天前
 xFrank
我在尝试搞一个安卓的记忆游戏相关应用(原来有过一些安卓开发经验,不多)。
AI 的输出大部分问题很多,都要经过大量修改优化才行。

相对而言,谷歌的 Gemini 输出最好( 2.5pro ,免费额度比较少)。
豆包、grok 、chatgpt4 、Qwen3-Coder 输出质量都非常差,大部分连编译都过不了,游戏逻辑也无法满足基本要求。
业余时间搞了两周了也还没搞定

你们的 AI 都这么好用么。。。
3539 次点击
所在节点    程序员
41 条回复
lxz6597863
1 天前
claude sonnet
Alias4ck
1 天前
试试 codex 和 claude code 就知道了 豆包是什么东西
Alias4ck
1 天前
而且使用 agent 工作不要问答的 问答反馈很慢
kamikaze472
1 天前
V 友都是 Claude Code 和 Codex, 你用 GPT-4 当然编不出来
kelo6
1 天前
写完之后让他自己写单元测试,自己修复问题
kelo6
1 天前
不过你说的这几个模型是不行
SeduceQAQ
1 天前
大伙儿都是劳斯莱斯奔驰,你坐马自达
AastroLula
1 天前
@SeduceQAQ 谢谢你给我开启的快乐的一天
Mystery0
1 天前
https://xgkb.mystery0.vip 昨天花 5 个小时左右 vibe 出来的,不过这上面的文案图标这些是以前就有的
全程除了搭建项目是问 gemini 给的步骤之外,代码生成全部是 webstorm 的 junie 做的
xFrank
1 天前
@SeduceQAQ 纯玩团,没有奔驰预算
94
1 天前
如果 [免费模式] 的都在几轮简单对话中达成预期,那么 [付费模式] 应该是一种什么样的畅想了……
做一个完整的项目 VibeCoding 出来的多多少少会有一些问题。但是一般都能跑起来,跑不起来直接把报错贴出来给 AI ,让他自己解决就好了。

大概可以参考 2 年前林亦 LYi 关于机器学习项目的实践中的 AI Chat History
[street-fighter-ai/README_CN.md at master · linyiLYi/street-fighter-ai]( https://github.com/linyiLYi/street-fighter-ai/blob/master/README_CN.md)
whoosy
1 天前
codex ,claude code ,你是一点细糠都不肯吃啊
SayHelloHi
1 天前
现在用 AI

先把大需求分割成小需求

有问题就修改直到当个小需求基本上是正确的+可运行的

自己把小需求合并起来 基本上没啥大问题了 修修补补用下

PS:

一开始就丢一个完整的需求给 AI AI 有时候真的是一本正经的胡说八道😂
jko123
1 天前
AI 生成雏形 10 分钟,让 AI 整改 N 小时-N 天
yjxjn
1 天前
你要是一句话说你给我做个淘宝,那肯定 AI 达不到。
首先,模型要选好,CC ,CodeX 最佳。
其次,提示词要好好写,Rules 也要有,要把所有需求一步一步拆解(对于开发来说就容易多了)
再次,做完一部分发现没问题就 commit ,防止瞎改。
这是我前期模板靠 AI 生成,后期需求自己改+AI 改做的一款 markdown 笔记。
https://github.com/jetyu/NoteWizard
Asimov01
1 天前
@Mystery0 请问下朋友,是指 https://xgkb.mystery0.vip 网页,还是 西瓜课表 这个 APP 呢?我看这个 App 的仓库有 700+ commit ,不像是 5 个小时能弄出来的 😂
mightybruce
1 天前
直接用 AI 是无法感知上下文和做一些复杂地功能地,除非你自己去写一个编程 agent 来做各种上下文管理以及 MCP 、长短记忆以及执行,所以你需要先去用用 claude code 以及 codex cli, 等你懂了如何开发 AI agent, 可以自己写一个更加贴近业务的 agent 出来,这个根据公司内部脚手架(未开源的那种)代码和文档以及各种架构图设计就能自动生成公司的项目已经是搞 AI 创业 和一些软件公司的产品方向,随便给一个比赛,大家可以看看

https://competition.atomgit.com/competitionInfo?id=1a3e1f9990e267464c8d1bbef2bee337#heading-1-0


赛题 3:复杂代码生成 DeepCodeResearch

赛题描述

本赛题要求参赛者设计并实现复杂代码生成任务,让智能体先做自主研究,再设计和实现项目代码。



支持多技术文档输入,如方案详细设计文档、paper 、流程图、技术框图等形式;文档类型涵盖 PDF 、PPT 、DOCX 、TXT 等格式

先做深度研究,再做代码生成

支持 web search

产出 repo-level code

自主探索、自主设计、自主编码实现/调试/修复

支持 human-in-the-loop


技术考察点:



Agent 对于外部文档/知识库的自主深度理解和洞察的能力

多模态知识检索的能力( Multimodal RAG )

长短期记忆依赖与超长上下文管理

Code Agent 的自我反思能力( bug shooting )
j6711
1 天前
@SeduceQAQ 谢谢你,比喻侠
Mystery0
1 天前
@Asimov01 网页 app 是我自己写的
ynxh
1 天前

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1162813

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX