所有课程

大型语言模型入门

章节 1: 了解大型语言模型

什么是人工智能？简单介绍

自然语言处理 (NLP) 简介

定义大型语言模型（LLMs）

LLM如何从文本数据中学习

LLM能完成的任务示例

大型语言模型的常见误解

第 1 章测验

章节 2: 大型语言模型的工作原理（简化版）

词语表示：分词和嵌入

预测下一个词：核心理念

训练数据规模的作用

理解模型参数

Transformer架构（高层）简介

语境如何影响生成

第 2 章测验

章节 3: 与大型语言模型沟通：提示词

什么是提示词？

基本提示技巧

明确给出指示

提供示例（少样本提示）

控制输出长度和格式

常见提示问题

练习：编写你的第一个提示

第 3 章测验

章节 4: 认识不同的大语言模型

基础模型概览

通用模型与专用模型对比

开放模型与封闭模型：有何不同？

理解模型大小与能力

模型使用方法：API与界面

第 4 章测验

章节 5: 使用预训练大语言模型

什么是预训练模型？

查找与选择大语言模型服务

通过网页界面交互

LLM API使用简介

发送您的第一个API请求

解释 LLM 响应

动手实践：简单的文本生成任务

第 5 章测验

预测下一个词：核心理念

这部分内容有帮助吗？

参考文献

Attention Is All You Need, Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser, and Illia Polosukhin, 2017 Advances in Neural Information Processing Systems (NIPS 2017), Vol. 30 (Curran Associates, Inc.) DOI: 10.5555/3295222.3295349 - 介绍Transformer架构的基石论文，该架构支撑了大多数现代大型语言模型，并使其能够进行复杂的上下文理解和下一个词元预测。
Speech and Language Processing (3rd ed. draft), Daniel Jurafsky and James H. Martin, 2025 - 一本全面的教材，涵盖语言模型、序列预测以及自然语言处理的统计基础，这些是理解大型语言模型机制的。第三章（“N-gram 语言模型”）和深度学习在自然语言处理中的应用等相关章节尤为切合主题。
The Hugging Face Course: How do Large Language Models work?, Hugging Face, 2023 (Hugging Face) - 对大型语言模型如何通过顺序词元预测、概率分布和贪婪解码等策略生成文本，提供了易懂且详细的说明。

© 2025 ApX Machine Learning用心打造