聊天派:只说不做(是agent?)
检索派:不仅说还可以查,相关技术RAG
工具派:通过mcp协议借助工具解决问题,存在系统安全问题
规划派:每个任务先规划,但是想的可能比做的好
工作流派:有每步的固定流程,不够灵活,但也不易越界(工作流设计??)
协作派:多智能体,专职、分工,token消耗高,干活甩锅
记忆派(Memory-Augmented Agent) :agent 具备某种持续记忆机制,而不只是依赖当前上下文窗口,eg:gemini
自治派:自己从头到位做反复循环。
总结一个agent或许修炼上面多个门派,技多不压身,问题在于专精哪里。
并没有哪一派是最强的,还是要具体问题,具体分析;
eg:
简单任务:工作流派、工具派最实用
知识问答:检索派更靠谱
复杂开放任务:规划派、协作派更有潜力
高风险任务:自治派最该被拴着
.png)
聊天->检索
模型的知识取决于训练结束前的知识,陈旧的知识+硬答,产生幻觉,这时引入RAG检索从构建的知识库里检索相关(与question 相关),再去回答用户。
聊天/聊天+检索 ->工具
接入了实际操作本身,从说到执行。
工具->规划
解决工具调用混乱的问题,任务拆分问题。附带错误恢复功能(git)
协作派:
单个agent上下文紊乱(内容太多时),复杂任务引入多agent
AI建议:
看论文,我建议你直接判断作者在解决哪一个矛盾
知识接入问题 → RAG
外部操作问题 → tool use
多步决策问题 → planning ReAct reflection
协作与扩展问题 → multi-agent
长期任务问题 → autonomous agents
谁解决哪个痛点,门派就归哪边。
口诀:聊天派会说,检索派会查,工具派会做,规划派会拆,工作流派会守规矩,记忆派会记事,协作派会摇人,自治派会自己乱跑。
这句不够优雅,但非常耐用。
