所有课程

智能体LLM系统与记忆增强架构

章节 1: 智能体行为的基本原理

界定LLM情境下的自主行动能力

自主大型语言模型系统的组成部分

Agentic 系统设计中的挑战

先进智能体框架概览

章节 2: 进阶智能体架构与推理

ReAct 框架：推理与行动的整合

实现 ReAct 智能体

自问：通过迭代提问提升事实准确性

思维树（ToT）应对复杂问题

基于图的推理结构

推理架构的比较分析

实践：构建自定义ReAct智能体

章节 3: 设计复杂的记忆系统

记忆在智能体系统中的作用

短期记忆机制

长期记忆：向量数据库与嵌入

高级检索策略

结构化记忆表示

记忆整合与摘要技术

管理内存读写操作

动手实践：集成向量数据库记忆

章节 4: 复杂规划与工具集成

任务分解策略

分层规划方法

集成外部工具和API

工具描述与选择机制

API 错误与工具执行故障的处理

自我校正与计划优化

实践：搭建一个使用工具的多步骤规划智能体

章节 5: 多智能体系统

多智能体系统（MAS）设计原则

LLM 智能体的通信协议

协作解决问题架构

代理角色与专业分工

竞争与谈判场景

多智能体系统扩展中的挑战

动手实践：构建协作代理团队

章节 6: 智能体系统的评估与优化

制定代理任务的成功衡量标准

评估推理与规划能力

评估工具使用的可靠性和准确性

记忆系统性能评估

智能体系统的基准测试 (AgentBench等)

复杂代理行为的调试策略

代理系统性能优化方法

大语言模型针对特定智能体角色的微调

实践：构建评估框架

大语言模型针对特定智能体角色的微调

这部分内容有帮助吗？

参考文献

LoRA: Low-Rank Adaptation of Large Language Models, Edward J. Hu, Yelong Shen, Phillip Wallis, Zeyuan Allen-Zhu, Yuanzhi Li, Shean Wang, Lu Wang, Weizhu Chen, 2021 International Conference on Learning Representations (ICLR) DOI: 10.48550/arXiv.2106.09685 - 介绍了用于高效微调大型语言模型的低秩适应基础技术。
QLoRA: Efficient Finetuning of Quantized LLMs, Tim Dettmers, Artidoro Pagnoni, Ari Holtzman, Luke Zettlemoyer, 2023 arXiv preprint arXiv:2305.14314 DOI: 10.48550/arXiv.2305.14314 - 介绍了QLoRA，它能够有效微调4比特量化的大型语言模型，并显著降低内存消耗。
Parameter-Efficient Fine-tuning (PEFT) library, Hugging Face, 2024 (Hugging Face) - Hugging Face PEFT库的官方文档，提供了实现LoRA等高效微调方法的实用指南和API详情。

© 2025 ApX Machine Learning用心打造