所有课程

大型语言模型入门

章节 1: 了解大型语言模型

什么是人工智能？简单介绍

自然语言处理 (NLP) 简介

定义大型语言模型（LLMs）

LLM如何从文本数据中学习

LLM能完成的任务示例

大型语言模型的常见误解

第 1 章测验

章节 2: 大型语言模型的工作原理（简化版）

词语表示：分词和嵌入

预测下一个词：核心理念

训练数据规模的作用

理解模型参数

Transformer架构（高层）简介

语境如何影响生成

第 2 章测验

章节 3: 与大型语言模型沟通：提示词

什么是提示词？

基本提示技巧

明确给出指示

提供示例（少样本提示）

控制输出长度和格式

常见提示问题

练习：编写你的第一个提示

第 3 章测验

章节 4: 认识不同的大语言模型

基础模型概览

通用模型与专用模型对比

开放模型与封闭模型：有何不同？

理解模型大小与能力

模型使用方法：API与界面

第 4 章测验

章节 5: 使用预训练大语言模型

什么是预训练模型？

查找与选择大语言模型服务

通过网页界面交互

LLM API使用简介

发送您的第一个API请求

解释 LLM 响应

动手实践：简单的文本生成任务

第 5 章测验

基础模型概览

这部分内容有帮助吗？

参考文献

A Survey of Large Language Models, Wayne Xin Zhao, Kun Zhou, Junyi Li, Tianyi Tang, Xiaolei Wang, Yupeng Hou, Yingqian Min, Beichen Zhang, Junjie Zhang, Zican Dong, Yifan Du, Chen Yang, Yushuo Chen, Zhipeng Chen, Jinhao Jiang, Ruiyang Ren, Yifan Li, Xinyu Tang, Zikang Liu, Peiyu Liu, Jian-Yun Nie, Ji-Rong Wen, 2023 arXiv preprint arXiv:2303.18223 DOI: 10.48550/arXiv.2303.18223 - 全面回顾了大型语言模型，包括其发展、架构、训练方法（在海量数据上进行预训练）和适配技术，直接支持对基础模型的理解。
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova, 2018 Proceedings of NAACL-HLT 2019 DOI: 10.48550/arXiv.1810.04805 - 这篇论文介绍了 BERT 模型，建立了在大量数据上预训练大型通用语言模型，然后针对各种下游任务进行微调的范式，这是基础模型的核心概念。
CS224N: Natural Language Processing with Deep Learning, Diyi Yang, Tatsunori Hashimoto, 2023 (Stanford University) - 这门大学课程提供了关于深度学习自然语言处理原理的深入讲座和材料，涵盖了大型语言模型架构、预训练和微调等主题，这些都是理解基础模型的基石。

© 2025 ApX Machine Learning用心打造