设计和构建多智能体LLM系统后,注意力自然会转向它们的运行稳定性和效率。本章将介绍开发后的环节:评估系统输出、发现并解决问题,以及提升整体性能。你将学会:定义并应用衡量标准,以评估多智能体系统的效果。为智能体间的交互实施可靠的日志记录和追踪,以便进行分析。制定策略来诊断复杂行为和交互问题。找出瓶颈并应用方法来调整系统性能和控制成本。考虑应用程序的安全实践和验证方法。这些技能对于维持多智能体LLM部署的可靠性和成本效益非常重要。我们将介绍系统性的方法,确保你的系统不仅能按预期运行,还能以最佳状态工作。