Bitter Lesson of Coding Agent: Agentic Search vs Codebase Indexing

45 天前
 largep

Cursor/Windsurf 核心功能的使用需要 Codebase Indexing (将代码库填进向量数据库,方便快速搜索),这样做一方面的确提高了用户体验,但 Indexing 本身是个黑盒,需要诸多工程上的专有优化,还有截断等诸多问题。

Claude Code 放弃了 Indexing 的做法,其实通过系统命令/字符串匹配的方式去搜索,速度慢些,但跟人/工程师的思维/做法相同,因为更方便人理解,也更好做模型训练/系统优化,更容易扩展 (包括最近的 Skills),CC 的其他实现也是考虑工程师如何考虑问题,因此才能后来者居上。这套思路如此直接,以致于很方便一般化到普通业务领域 (也是为啥 Claude Code SDK 改名为 Claude Agent SDK 了)。

这也让我联想到 Rich Sutton 提到的 The Bitter Lesson: 可扩展的通用做法最终总会超越基于特定领域的专有实现。

Reference:

  1. https://cursor.com/docs/context/codebase-indexing
  2. https://support.claude.com/en/articles/12386420-claude-code-faq#h_8c70bdf68f
  3. https://docs.claude.com/en/docs/agent-sdk/overview
  4. http://www.incompleteideas.net/IncIdeas/BitterLesson.html
812 次点击
所在节点    OpenAI
1 条回复
JustGoGoGO
44 天前
其实向量检索和文本检索是可以互补的,不是非此即彼的关系。只是前者在本地运行成本更高罢了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1173380

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX