所有课程

大型语言模型入门

章节 1: 了解大型语言模型

什么是人工智能？简单介绍

自然语言处理 (NLP) 简介

定义大型语言模型（LLMs）

LLM如何从文本数据中学习

LLM能完成的任务示例

大型语言模型的常见误解

第 1 章测验

章节 2: 大型语言模型的工作原理（简化版）

词语表示：分词和嵌入

预测下一个词：核心理念

训练数据规模的作用

理解模型参数

Transformer架构（高层）简介

语境如何影响生成

第 2 章测验

章节 3: 与大型语言模型沟通：提示词

什么是提示词？

基本提示技巧

明确给出指示

提供示例（少样本提示）

控制输出长度和格式

常见提示问题

练习：编写你的第一个提示

第 3 章测验

章节 4: 认识不同的大语言模型

基础模型概览

通用模型与专用模型对比

开放模型与封闭模型：有何不同？

理解模型大小与能力

模型使用方法：API与界面

第 4 章测验

章节 5: 使用预训练大语言模型

什么是预训练模型？

查找与选择大语言模型服务

通过网页界面交互

LLM API使用简介

发送您的第一个API请求

解释 LLM 响应

动手实践：简单的文本生成任务

第 5 章测验

训练数据规模的作用

全新 · 开源

Kerb - 大语言模型开发工具包

用于构建生产级 LLM 应用的 Python 工具包。提供提示词、RAG、智能体、结构化输出和多提供商支持等模块化实用工具。

这部分内容有帮助吗？

参考文献

Scaling Laws for Neural Language Models, Jared Kaplan, Sam McCandlish, Tom Henighan, Tom B. Brown, Benjamin Chess, Rewon Child, Scott Gray, Alec Radford, Jeffrey Wu, Dario Amodei, 2020 arXiv preprint arXiv:2001.08361 DOI: 10.48550/arXiv.2001.08361 - 这篇论文通过实证方法确立了模型性能、模型规模、数据集大小与计算资源之间的关系。它阐明了训练数据量如何影响模型能力。
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer, Colin Raffel, Noam Shazeer, Adam Roberts, Katherine Lee, Sharan Narang, Michael Matena, Yanqi Zhou, Wei Li, and Peter J. Liu, 2020 Journal of Machine Learning Research, Vol. 21 - 这篇论文介绍了T5模型和C4数据集，一个广泛使用的、源自Common Crawl的公共数据集。它提供了一个准备LLM训练数据时，数据集规模和整理工作的实例。
On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? 🦜, Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, and Margaret Mitchell, 2021 Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency (Association for Computing Machinery) DOI: 10.1145/3442188.3445922 - 这项工作批判性地讨论了大型语言模型相关的伦理和社会风险，特别关注了源于其广泛训练数据集中偏见和局限性的问题。

© 2025 ApX Machine Learning用心打造