大家在实现 AI Agent 的时候都用什么框架呢?

13 小时 12 分钟前
 chman
问题 1:
最近做一个项目,需要用做一个类似医生的 AI Agent ,需要大模型根据每一步的结果决定下一步的检查,自主规划、循环思考。
病人描述自己的病情,医生自主规划检查的方案,我们会提供 MCPTools 供医生使用,这些 Tools 包括:血液检查、B 超、X 光等等。医生 Agent 会根据每一步的结果决定下一步的检查,直到找到病因,得出结论。
我们目前使用 OpenManus ,效果还行,但是感觉还有较大的优化空间,现在的框架也比较多,请教下足智多谋的 v 友,有没有更好的选择?

问题 2:
在问题 1 中,我们寄希望于病人能一次性、全面、准确地描述出自己的症状,然后医生 AI 才开始行动。
但是现实情况,往往并不是这样的,我们去看病,在前期问诊过程中,病人往往无法做到一次性、全面、准确地描述出自己的症状,医生往往需要多轮提问,才能回去足够的信息,才能开始检查。

[问诊阶段]
医生:哪里不舒服?
病人:头疼

医生:哪个部位?
病人:额头

医生:痛了好久了?
病人:前天开始痛的

医生:怎么个痛法?针刺、盾击、闷痛、跳动痛
病人:闷痛

医生:表面痛还是里面痛
病人:表面靠里一点点

医生:了解了,开个脑电图。
[问诊阶段结束]

如果我们要实现这个 AI 自主规划检查之前的循环对话问诊,有没有现成的方案?还是说需要自己手搓。
1836 次点击
所在节点    程序员
20 条回复
aeron
13 小时 0 分钟前
自己手搓吧,
litchinn
12 小时 54 分钟前
感觉框架解决不了你的问题,你要的是提示词
beginor
12 小时 52 分钟前
bleaker
12 小时 49 分钟前
有语音对话需求的话,可以考虑 https://github.com/TEN-framework/ten-framework
leehaoze98
12 小时 46 分钟前
1. 如果是要纯 Agent 的话,类似于 AgentScope 的都可以,只用基础能力,需要自定义的 Agent 流程基于框架开发。
2. 问题 2 ,倒是也可以直接让 Agent 去收集。如果收集的信息可以根据场景枚举的话,应该可以简单套个 LLM 做一下,现成的方案就不太熟悉了

最后一般医疗场景用 workflow 的比较多一些,也可以考虑下 LangGraph ,纯 Agent 的话不太敢给用户用呀
vonfry
12 小时 45 分钟前
核心不是框架,是你的业务逻辑如何拆解成逐步执行的逻辑与分发。另外现在大部分框架都是做简单原型还行,但复杂需求都要东改西改,不如手搓方便。
liu731
12 小时 43 分钟前
我的理解是 OP 需要 Embedding 检查报告,然后结合 Prompt 生成回答。
mufanzz
12 小时 30 分钟前
Spirng AI Alibaba
Eino
chenglus
11 小时 22 分钟前
微软有个以强化学习思路训练 agent 的框架: https://github.com/microsoft/agent-lightning

应该可以用到
etnperlong
10 小时 42 分钟前
如果有复杂工作流,目前用的是 Mastra.ai ;语音框架用的是 Livekit.io
mmdsun
9 小时 17 分钟前
有语言要求不? Spirng AI 的工具调用可以支持多轮循环、或者 Recursive Advisor 也就是循环的 Agent 调用。

感觉你的场景多轮函数调用就可以,可以手动控制:
https://docs.spring.io/spring-ai/reference/api/tools.html#_user_controlled_tool_execution


还有个 Embabel Agent ,也是 jvm 系语言,可以用的 agent 框架。
littleshy
8 小时 52 分钟前
https://github.com/microsoft/agent-framework
这个可以一试了,我们已经在从 dify 逐步迁移了。
daodao
8 小时 35 分钟前
当然首选 langchain langgraph...
v2gba
8 小时 0 分钟前
( off-topic )你让我想到了 https://xiaoce.fun/guessdisease
crackidz
7 小时 46 分钟前
我现在第一步都是先尝试用 Claude Code 实现,如果还有问题就使用 pydantic ai
TabGre
7 小时 39 分钟前
Claude agent sdk or ai sdk
highkay
6 小时 27 分钟前
例如 langgraph 的 react agent ,这种 case 主要是靠提示词( ooda )驱动 agentic 的诊断过程,workflow 其实不太好做。而且生产用的话,不要去搞什么多智能体,复杂,浪费 token ,不好调试,反正缺点远远大于优点。
d0r1an
5 小时 11 分钟前
https://github.com/boxlite-labs/boxlite
我现在正在基于这个项目开发一个全自主框架中
JustRuning
4 小时 1 分钟前
同医疗行业小作坊,已调研使用以下 Agent 框架参考
**Python 生态:**
1. Langgraph ;
Tips: 已用于生产环境。
优点:生态成熟,稳定,支持多种 Memory 驱动、文档最佳实践齐全
缺点:调试繁琐、性能较弱、有学习成本
https://www.langchain.com/langgraph

2. CrewAI
优点:编排 Agent 开发快速效率高,支持多 Agent 适合快速编排
缺点:学习曲线稍陡
https://github.com/crewAIInc/crewAI

**Golang 生态:**
1. adk-go Google AI 生态;正在研究测试阶段
优点:Google Gemini 生态
缺点:目前功能还比较少,缺少社区活跃度。
https://github.com/google/adk-go

2. Eino 字节出品;
优点: 像是抄的 Langgraph ,如果会 Langgraph 很容易上手,思想相通。官方也说了 Eino ADK 对齐 google adk go
缺点:文档不够细,有些时候理解一个功能,反而去看 Langgraph 就理解了。
https://github.com/cloudwego/eino

PS: 由于团队成员大多数是 Gopher ,不愿意学习 Python, 没办法只好调研了 Golang 生态; 目前计划使用 Eino 😂

最后一点小经验:如果 Agent 功能简单 workflow 不复杂,不建议使用复杂状态机难调试,可以使用简单的 CrewAI, pydantic AI 已经能满足大多数简单任务 Agentic 需求。
ihainan
3 小时 42 分钟前
既然都用 OpenManus 了,我觉得你可以考虑 Claude Agent SDK ,模型可以换成国产模型,接入你的 MCP 或者干脆写一个 Agent Skill 。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1180423

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX