看到论坛里面不少人借助 AI 可以轻松搞定某某小项目，我试了下怎么感觉 AI 的输出问题很多啊

我在尝试搞一个安卓的记忆游戏相关应用（原来有过一些安卓开发经验，不多）。
AI 的输出大部分问题很多，都要经过大量修改优化才行。

相对而言，谷歌的 Gemini 输出最好（ 2.5pro ，免费额度比较少）。
豆包、grok 、chatgpt4 、Qwen3-Coder 输出质量都非常差，大部分连编译都过不了，游戏逻辑也无法满足基本要求。
业余时间搞了两周了也还没搞定

你们的 AI 都这么好用么。。。

lxz6597863

1 天前

claude sonnet

Alias4ck

1 天前

试试 codex 和 claude code 就知道了豆包是什么东西

Alias4ck

1 天前

而且使用 agent 工作不要问答的问答反馈很慢

kamikaze472

1 天前

V 友都是 Claude Code 和 Codex, 你用 GPT-4 当然编不出来

kelo6

1 天前

写完之后让他自己写单元测试,自己修复问题

kelo6

1 天前

不过你说的这几个模型是不行

SeduceQAQ

1 天前

大伙儿都是劳斯莱斯奔驰，你坐马自达

AastroLula

1 天前

@SeduceQAQ 谢谢你给我开启的快乐的一天

Mystery0

1 天前

https://xgkb.mystery0.vip 昨天花 5 个小时左右 vibe 出来的，不过这上面的文案图标这些是以前就有的
全程除了搭建项目是问 gemini 给的步骤之外，代码生成全部是 webstorm 的 junie 做的

xFrank

1 天前

@SeduceQAQ 纯玩团，没有奔驰预算

1 天前

如果 [免费模式] 的都在几轮简单对话中达成预期，那么 [付费模式] 应该是一种什么样的畅想了……
做一个完整的项目 VibeCoding 出来的多多少少会有一些问题。但是一般都能跑起来，跑不起来直接把报错贴出来给 AI ，让他自己解决就好了。

大概可以参考 2 年前林亦 LYi 关于机器学习项目的实践中的 AI Chat History
[street-fighter-ai/README_CN.md at master · linyiLYi/street-fighter-ai]( https://github.com/linyiLYi/street-fighter-ai/blob/master/README_CN.md)

whoosy

1 天前

codex ，claude code ，你是一点细糠都不肯吃啊

SayHelloHi

1 天前

现在用 AI

先把大需求分割成小需求

有问题就修改直到当个小需求基本上是正确的+可运行的

自己把小需求合并起来基本上没啥大问题了修修补补用下

PS：

一开始就丢一个完整的需求给 AI AI 有时候真的是一本正经的胡说八道😂

jko123

1 天前

AI 生成雏形 10 分钟，让 AI 整改 N 小时-N 天

yjxjn

1 天前

你要是一句话说你给我做个淘宝，那肯定 AI 达不到。
首先，模型要选好，CC ，CodeX 最佳。
其次，提示词要好好写，Rules 也要有，要把所有需求一步一步拆解（对于开发来说就容易多了）
再次，做完一部分发现没问题就 commit ，防止瞎改。
这是我前期模板靠 AI 生成，后期需求自己改+AI 改做的一款 markdown 笔记。
https://github.com/jetyu/NoteWizard

Asimov01

1 天前

@Mystery0 请问下朋友，是指 https://xgkb.mystery0.vip 网页，还是西瓜课表这个 APP 呢？我看这个 App 的仓库有 700+ commit ，不像是 5 个小时能弄出来的 😂

mightybruce

1 天前

直接用 AI 是无法感知上下文和做一些复杂地功能地，除非你自己去写一个编程 agent 来做各种上下文管理以及 MCP 、长短记忆以及执行，所以你需要先去用用 claude code 以及 codex cli, 等你懂了如何开发 AI agent, 可以自己写一个更加贴近业务的 agent 出来，这个根据公司内部脚手架（未开源的那种）代码和文档以及各种架构图设计就能自动生成公司的项目已经是搞 AI 创业和一些软件公司的产品方向，随便给一个比赛，大家可以看看

https://competition.atomgit.com/competitionInfo?id=1a3e1f9990e267464c8d1bbef2bee337#heading-1-0

赛题 3：复杂代码生成 DeepCodeResearch

赛题描述

本赛题要求参赛者设计并实现复杂代码生成任务，让智能体先做自主研究，再设计和实现项目代码。

支持多技术文档输入，如方案详细设计文档、paper 、流程图、技术框图等形式；文档类型涵盖 PDF 、PPT 、DOCX 、TXT 等格式

先做深度研究，再做代码生成

支持 web search

产出 repo-level code

自主探索、自主设计、自主编码实现/调试/修复

支持 human-in-the-loop

技术考察点：

Agent 对于外部文档/知识库的自主深度理解和洞察的能力

多模态知识检索的能力（ Multimodal RAG ）

长短期记忆依赖与超长上下文管理

Code Agent 的自我反思能力（ bug shooting ）

j6711

1 天前

@SeduceQAQ 谢谢你，比喻侠

Mystery0

1 天前

@Asimov01 网页

app 是我自己写的

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1162813

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.