@
sampeng Thanks
今天研究并试验了一下,我个人觉得 TDD 并没有带来什么额外的东西,只是流程上发生了变化,似乎真正带来增益的是测试来把关。其他发现比如:
1. Tokens 用得很多,开了订阅其实没所谓,但是那个 tokens 多 = 很久,今天测试用的前端项目 5 个 cycles 今天跑了半小时+,效率不行。
2. 检查了测试,除非人为写测试 description ,否则还是问题。
3. 由于是写 markdown 来驱动开发,比在 IDE 里选中行,直接告诉如何实现效率要低很多,也更加不可控。
4. 前端需要更好的测试方法,单元测试无法解决 UI 界面测试问题。
5. 有时候 agent 会 skip 掉往 github 添加 comment 或更新 tag 的步骤。
6. 有时候 agent 会忽略掉生成代码,只是分析了一遍,我觉得这是 markdown agent 的问题,不同于 n8n/dify/code 的 agent ,它无法确保步骤被执行。
说实话,我挺期待能够找到更加自动化的方法。目前后端我只敢半自动,因为后端和数据相关,崩溃没关系,最怕数据结果算错了,那个很致命。另外后端设计除非 API 这种,否则无论 opus 还是 sonnet 还是经常犯傻。前端目前我能够 90% 以上生成,但前端却难在自动化测试。
说个题外话,我觉得目前最好使的是 Claude Code 加个 mcp server 外接 gpt ,让 gpt 和 opus 同时出方案,相互比对代码性能更加,并且强制测试。