所有课程

智能体LLM系统与记忆增强架构

章节 1: 智能体行为的基本原理

界定LLM情境下的自主行动能力

自主大型语言模型系统的组成部分

Agentic 系统设计中的挑战

先进智能体框架概览

章节 2: 进阶智能体架构与推理

ReAct 框架：推理与行动的整合

实现 ReAct 智能体

自问：通过迭代提问提升事实准确性

思维树（ToT）应对复杂问题

基于图的推理结构

推理架构的比较分析

实践：构建自定义ReAct智能体

章节 3: 设计复杂的记忆系统

记忆在智能体系统中的作用

短期记忆机制

长期记忆：向量数据库与嵌入

高级检索策略

结构化记忆表示

记忆整合与摘要技术

管理内存读写操作

动手实践：集成向量数据库记忆

章节 4: 复杂规划与工具集成

任务分解策略

分层规划方法

集成外部工具和API

工具描述与选择机制

API 错误与工具执行故障的处理

自我校正与计划优化

实践：搭建一个使用工具的多步骤规划智能体

章节 5: 多智能体系统

多智能体系统（MAS）设计原则

LLM 智能体的通信协议

协作解决问题架构

代理角色与专业分工

竞争与谈判场景

多智能体系统扩展中的挑战

动手实践：构建协作代理团队

章节 6: 智能体系统的评估与优化

制定代理任务的成功衡量标准

评估推理与规划能力

评估工具使用的可靠性和准确性

记忆系统性能评估

智能体系统的基准测试 (AgentBench等)

复杂代理行为的调试策略

代理系统性能优化方法

大语言模型针对特定智能体角色的微调

实践：构建评估框架

记忆系统性能评估

使用 Kerb 更快构建 LLM 应用

简洁的语法。内置调试功能。从第一天起就可投入生产。

为 ApX 背后的 AI 系统而构建

这部分内容有帮助吗？

参考文献

Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, 2008 (Cambridge University Press) - 一本标准教材，涵盖信息检索基础概念及如精确率、召回率、MRR和nDCG等指标。
AgentBench: Evaluating LLM Agents on Diverse Real-world Tasks, Xiao Liu, Hao Yu, Hanchen Zhang, Yifan Xu, Xuanyu Lei, Hanyu Lai, Yu Gu, Hangliang Ding, Kaiwen Men, Kejuan Yang, Shudan Zhang, Xiang Deng, Aohan Zeng, Zhengxiao Du, Chenhui Zhang, Sheng Shen, Tianjun Zhang, Yu Su, Huan Sun, Minlie Huang, Yuxiao Dong, Jie Tang, 2023 arXiv preprint arXiv:2308.03688 DOI: 10.48550/arXiv.2308.03688 - 提出了AgentBench，一个用于评估大型语言模型代理在各种实际任务中性能的基准，提供了对端到端代理评估的见解。

© 2025 ApX Machine Learning用心打造