所有课程

大型语言模型入门

章节 1: 了解大型语言模型

什么是人工智能？简单介绍

自然语言处理 (NLP) 简介

定义大型语言模型（LLMs）

LLM如何从文本数据中学习

LLM能完成的任务示例

大型语言模型的常见误解

第 1 章测验

章节 2: 大型语言模型的工作原理（简化版）

词语表示：分词和嵌入

预测下一个词：核心理念

训练数据规模的作用

理解模型参数

Transformer架构（高层）简介

语境如何影响生成

第 2 章测验

章节 3: 与大型语言模型沟通：提示词

什么是提示词？

基本提示技巧

明确给出指示

提供示例（少样本提示）

控制输出长度和格式

常见提示问题

练习：编写你的第一个提示

第 3 章测验

章节 4: 认识不同的大语言模型

基础模型概览

通用模型与专用模型对比

开放模型与封闭模型：有何不同？

理解模型大小与能力

模型使用方法：API与界面

第 4 章测验

章节 5: 使用预训练大语言模型

什么是预训练模型？

查找与选择大语言模型服务

通过网页界面交互

LLM API使用简介

发送您的第一个API请求

解释 LLM 响应

动手实践：简单的文本生成任务

第 5 章测验

词语表示：分词和嵌入

这部分内容有帮助吗？

参考文献

Efficient Estimation of Word Representations in Vector Space, Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean, 2013 arXiv preprint arXiv:1301.3781 DOI: 10.48550/arXiv.1301.3781 - 该论文介绍了Word2Vec，这是学习词嵌入的开创性工作，它能够捕捉语义关系。
Tokenization (from Hugging Face Course), Hugging Face, 2024 (Hugging Face) - 提供了关于分词的实用且易懂的解释，包括子词分词等不同类型，与LLM相关。
Speech and Language Processing, Daniel Jurafsky and James H. Martin, 2025 (Pearson) - 一本全面教科书，涵盖了自然语言处理的基本概念，包括分词、词嵌入及其演变。
CS224N: Natural Language Processing with Deep Learning, Stanford University, 2024 - 提供了关于自然语言处理深度学习方法的全面讲义和资料，包括对词向量和嵌入的详细解释。

© 2025 ApX Machine Learning用心打造