V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
xFrank
V2EX  ›  程序员

看到论坛里面不少人借助 AI 可以轻松搞定某某小项目,我试了下怎么感觉 AI 的输出问题很多啊

  •  
  •   xFrank · 1 天前 · 3398 次点击
    我在尝试搞一个安卓的记忆游戏相关应用(原来有过一些安卓开发经验,不多)。
    AI 的输出大部分问题很多,都要经过大量修改优化才行。

    相对而言,谷歌的 Gemini 输出最好( 2.5pro ,免费额度比较少)。
    豆包、grok 、chatgpt4 、Qwen3-Coder 输出质量都非常差,大部分连编译都过不了,游戏逻辑也无法满足基本要求。
    业余时间搞了两周了也还没搞定

    你们的 AI 都这么好用么。。。
    41 条回复    2025-10-01 11:59:35 +08:00
    lxz6597863
        1
    lxz6597863  
       1 天前   ❤️ 1
    claude sonnet
    Alias4ck
        2
    Alias4ck  
       1 天前
    试试 codex 和 claude code 就知道了 豆包是什么东西
    Alias4ck
        3
    Alias4ck  
       1 天前
    而且使用 agent 工作不要问答的 问答反馈很慢
    kamikaze472
        4
    kamikaze472  
       1 天前
    V 友都是 Claude Code 和 Codex, 你用 GPT-4 当然编不出来
    kelo6
        5
    kelo6  
       1 天前
    写完之后让他自己写单元测试,自己修复问题
    kelo6
        6
    kelo6  
       1 天前
    不过你说的这几个模型是不行
    SeduceQAQ
        7
    SeduceQAQ  
       1 天前 via iPhone   ❤️ 27
    大伙儿都是劳斯莱斯奔驰,你坐马自达
    AastroLula
        8
    AastroLula  
       1 天前   ❤️ 1
    @SeduceQAQ 谢谢你给我开启的快乐的一天
    Mystery0
        9
    Mystery0  
       1 天前
    https://xgkb.mystery0.vip 昨天花 5 个小时左右 vibe 出来的,不过这上面的文案图标这些是以前就有的
    全程除了搭建项目是问 gemini 给的步骤之外,代码生成全部是 webstorm 的 junie 做的
    xFrank
        10
    xFrank  
    OP
       1 天前
    @SeduceQAQ 纯玩团,没有奔驰预算
    94
        11
    94  
       1 天前
    如果 [免费模式] 的都在几轮简单对话中达成预期,那么 [付费模式] 应该是一种什么样的畅想了……
    做一个完整的项目 VibeCoding 出来的多多少少会有一些问题。但是一般都能跑起来,跑不起来直接把报错贴出来给 AI ,让他自己解决就好了。

    大概可以参考 2 年前林亦 LYi 关于机器学习项目的实践中的 AI Chat History
    [street-fighter-ai/README_CN.md at master · linyiLYi/street-fighter-ai]( https://github.com/linyiLYi/street-fighter-ai/blob/master/README_CN.md)
    whoosy
        12
    whoosy  
       1 天前
    codex ,claude code ,你是一点细糠都不肯吃啊
    SayHelloHi
        13
    SayHelloHi  
       1 天前
    现在用 AI

    先把大需求分割成小需求

    有问题就修改直到当个小需求基本上是正确的+可运行的

    自己把小需求合并起来 基本上没啥大问题了 修修补补用下

    PS:

    一开始就丢一个完整的需求给 AI AI 有时候真的是一本正经的胡说八道😂
    jko123
        14
    jko123  
       1 天前
    AI 生成雏形 10 分钟,让 AI 整改 N 小时-N 天
    yjxjn
        15
    yjxjn  
       1 天前
    你要是一句话说你给我做个淘宝,那肯定 AI 达不到。
    首先,模型要选好,CC ,CodeX 最佳。
    其次,提示词要好好写,Rules 也要有,要把所有需求一步一步拆解(对于开发来说就容易多了)
    再次,做完一部分发现没问题就 commit ,防止瞎改。
    这是我前期模板靠 AI 生成,后期需求自己改+AI 改做的一款 markdown 笔记。
    https://github.com/jetyu/NoteWizard
    Asimov01
        16
    Asimov01  
       1 天前
    @Mystery0 请问下朋友,是指 https://xgkb.mystery0.vip 网页,还是 西瓜课表 这个 APP 呢?我看这个 App 的仓库有 700+ commit ,不像是 5 个小时能弄出来的 😂
    mightybruce
        17
    mightybruce  
       1 天前
    直接用 AI 是无法感知上下文和做一些复杂地功能地,除非你自己去写一个编程 agent 来做各种上下文管理以及 MCP 、长短记忆以及执行,所以你需要先去用用 claude code 以及 codex cli, 等你懂了如何开发 AI agent, 可以自己写一个更加贴近业务的 agent 出来,这个根据公司内部脚手架(未开源的那种)代码和文档以及各种架构图设计就能自动生成公司的项目已经是搞 AI 创业 和一些软件公司的产品方向,随便给一个比赛,大家可以看看

    https://competition.atomgit.com/competitionInfo?id=1a3e1f9990e267464c8d1bbef2bee337#heading-1-0


    赛题 3:复杂代码生成 DeepCodeResearch

    赛题描述

    本赛题要求参赛者设计并实现复杂代码生成任务,让智能体先做自主研究,再设计和实现项目代码。



    支持多技术文档输入,如方案详细设计文档、paper 、流程图、技术框图等形式;文档类型涵盖 PDF 、PPT 、DOCX 、TXT 等格式

    先做深度研究,再做代码生成

    支持 web search

    产出 repo-level code

    自主探索、自主设计、自主编码实现/调试/修复

    支持 human-in-the-loop


    技术考察点:



    Agent 对于外部文档/知识库的自主深度理解和洞察的能力

    多模态知识检索的能力( Multimodal RAG )

    长短期记忆依赖与超长上下文管理

    Code Agent 的自我反思能力( bug shooting )
    j6711
        18
    j6711  
       1 天前
    @SeduceQAQ 谢谢你,比喻侠
    Mystery0
        19
    Mystery0  
       1 天前
    @Asimov01 网页 app 是我自己写的
    ynxh
        20
    ynxh  
       1 天前   ❤️ 1
    hengshenyu
        21
    hengshenyu  
       1 天前 via Android
    @Mystery0 深色模式切换有点 bug ,会闪一下。
    Kimipoker
        22
    Kimipoker  
       1 天前
    @Mystery0 junie 这个是用的什么模型呢? 自己配置吗
    fbu11
        23
    fbu11  
       1 天前
    想免费白嫖个好用的是不可能的,只有花钱,当然像“Claude Code”这种,你想给它花钱也麻烦,毕竟 Anthropic 已经……
    lscho
        24
    lscho  
       1 天前
    1.大伙儿都是劳斯莱斯奔驰,你坐马自达
    2.都是劳斯莱斯车技也分高下,prompt 也是一门严谨的学科
    AreYou0k
        25
    AreYou0k  
       1 天前
    @SeduceQAQ #7 保守了, 它这直接问, 都没上 cli 或者工具, 撑死算是电动车
    asdf12303116
        26
    asdf12303116  
       1 天前
    @Kimipoker 设置可改 gpt5/sonnet3.7/sonnet4,默认 gpt5
    hnbcinfo
        27
    hnbcinfo  
       1 天前
    别用那么多乱七八糟的东西了,你这个需求,找个 AI 编程助手,如 Cursor 或 augment code ,随便选一个用就够了。输出的基本没啥问题
    wick
        28
    wick  
       1 天前
    我觉得我用 cursor 什么都能写 除了原子弹不能造
    luworld
        29
    luworld  
       1 天前
    @SayHelloHi 如何分割为小需求?是分割成一个一个的小模块,然后函数调用吗?
    liyi123
        30
    liyi123  
       1 天前
    先构建整体架构,如何安装功能模块一个一个让 AI 开发,每个功能模块开发完成提交代码到 GitHub ,测试每一个功能模块是否存在问题,智能体开发时选择对应的工作文件空间,这样子成型的项目比较好,同样模型选择也是比较重要:claude 泛化比较好,可以用来做架构设计开发,codex 幻觉小一点可以局部修改
    wxw752
        31
    wxw752  
       1 天前
    鉴定为需要氪金,走了去下一贴
    Promtheus
        32
    Promtheus  
       1 天前
    你讲的那些谁用啊 不都是 claude sonnet 吗
    visper
        33
    visper  
       1 天前
    论零元党萌新和氪金大佬的区别。
    florentino
        34
    florentino  
       1 天前
    有没有 jetbrains 下面能用的啊
    Mystery0
        35
    Mystery0  
       1 天前 via Android
    @Kimipoker 刚刚打开 ide 看了一下,是默认的 gpt-5 ,没有调过
    Mystery0
        36
    Mystery0  
       1 天前 via Android
    @hengshenyu pc 和移动端都没有复现呀😭
    ovtfkw
        37
    ovtfkw  
       1 天前 via iPhone
    出来了就吃点好的先
    Mystery0
        38
    Mystery0  
       1 天前 via Android
    @florentino junie 不就能用吗
    Mystery0
        39
    Mystery0  
       1 天前
    @Mystery0 #9
    附上相关使用记录,左侧的数字表示我给它分配了 19 次任务,单个任务基本上都是让它写组件,我给它描述页面上的东西,还有页面的大概布局,PLAN 那个地方是它自己解析任务信息之后生成的执行步骤,然后单个步骤就去走它自己的 LLM 逻辑了
    julyclyde
        40
    julyclyde  
       11 小时 39 分钟前
    如果不说成“轻松搞定”还怎么起号吸引流量呢?
    julyclyde
        41
    julyclyde  
       8 小时 38 分钟前
    有挺多人,性格上会沉迷于修工具而忘记最终目标
    诚然,对“AI 本身”的发展来说,沉迷于修工具的人是有益处的
    但是对于需要结果的行业、对于需要发展的人来说,其实并不会有什么收益
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2192 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 12:37 · PVG 20:37 · LAX 05:37 · JFK 08:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.