趋近智
尽管直接操作大型语言模型(LLM)API提供了最大的灵活性,但这种方式常常暴露出一些重复的模式。设置API调用、管理参数 (parameter)、解析响应,特别是串联多个大型语言模型交互,可能导致代码重复,并随着应用程序复杂度的提升而难以管理。从零开始构建时,处理对话历史或整合外部数据源会进一步增加难度。
大型语言模型应用程序开发框架正是在此发挥作用。可以将它们看作专门用于构建集成大型语言模型的软件的工具集。它们在原始API调用的基础上提供更高层级的抽象,提供预置的组件和结构,以简化开发流程。就像Web框架(如Flask、Django、Ruby on Rails或Express)通过处理路由、请求处理和模板来简化Web应用程序开发一样,大型语言模型框架提供了为大型语言模型核心任务量身定制的构建模块。
使用框架有多个优势,尤其当你的应用程序不再是简单的单次提示时:
在本章中,我们将主要使用 LangChain 作为示例框架。LangChain是目前最受欢迎、最全面的开源大型语言模型应用开发框架之一。其核心理念围绕组合性,允许开发者将各种组件串联起来构建复杂的应用程序。
我们将在后续部分分析LangChain的基本构建块:
以下是这些组件在LangChain这类框架中可能如何交互的简化视图:
这张图表说明了大型语言模型框架中的组件可能如何交互。简单流程通常涉及将提示、模型和解析器串联起来,而更高级的代理流程则涉及决策和工具使用。
尽管我们主要关注LangChain,但值得一提的是,也存在其他框架,例如LlamaIndex(通常侧重于RAG能力)和微软的Semantic Kernel。每个框架可能在设计理念、优势和抽象层级上略有不同。然而,模块化组件、组合和集成等基本思想在大多数高效的大型语言模型框架中都是共通的。理解其中一个为审视其他框架提供了坚实的基础。
大型语言模型框架在复杂应用的结构和开发速度方面提供了显著优势。然而,它们也引入了一层抽象。这意味着你可能需要花费一些初始时间学习框架的特定组件和约定,而不是直接操作API请求。对于非常简单的任务,使用框架可能显得大材小用。但随着应用程序复杂度的增加,模块化、可维护性和内置功能的优势通常会超过初始学习投入。对直接API交互(第4章)的良好理解对于调试和理解框架的内部运作原理仍然有价值。
在后续部分,我们将更详细地审视LangChain等框架提供的核心组件,从模型、提示和解析器开始。
简洁的语法。内置调试功能。从第一天起就可投入生产。
为 ApX 背后的 AI 系统而构建
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•