所有课程

自然语言处理基本原理

章节 1: 自然语言处理基本原理与高级文本处理

自然语言处理流程

高级分词方法

词干提取与词形还原比较

文本数据中的噪声处理

停用词高级定制

文本标准化方法

动手实践：构建预处理流程

第 1 章测验

章节 2: 文本特征工程

从词袋模型到TF-IDF

计算 TF-IDF 分数

使用N-gram来获取语境信息

特征哈希简介

文本特征的降维

比较不同的文本表示方法

动手实践：生成文本特征

第 2 章测验

章节 3: 监督学习在文本分类中的应用

分类算法回顾

将分类器应用于文本数据

分类模型评估指标

交叉验证策略

文本模型的超参数调优

处理不平衡数据集

实践：构建文本分类器

第 3 章测验

章节 4: 嵌入表示与序列数据理解

基于频率的模型的局限性

分布式语义学简介

词嵌入基本原理

Word2Vec：CBOW 与 Skip-gram 模型结构

GloVe：词语的全局向量表示

词嵌入的可视化

使用预训练词嵌入模型

动手实践：使用词嵌入

第 4 章测验

章节 5: 自然语言处理中的序列模型介绍

序列感知的必要性

循环神经网络（RNN）基础

理解梯度消失问题

长短期记忆（LSTM）网络

门控循环单元 (GRUs)

将序列模型应用于文本

动手实践：构建一个简单的序列模型

第 5 章测验

将序列模型应用于文本

这部分内容有帮助吗？

参考文献

Deep Learning, Ian Goodfellow, Yoshua Bengio, and Aaron Courville, 2016 (MIT Press) - 对深度学习进行了全面介绍，包含对循环神经网络、LSTM和GRU的详细解释。
Efficient Estimation of Word Representations in Vector Space, Tomas Mikolov, Kai Chen, Greg Corrado, and Jeffrey Dean, 2013 International Conference on Learning Representations (ICLR) DOI: 10.48550/arXiv.1301.3781 - 介绍了Word2Vec模型（CBOW和Skip-gram），用于学习词嵌入，这对于为序列模型准备文本至关重要。
Sequence to Sequence Learning with Neural Networks, Ilya Sutskever, Oriol Vinyals, Quoc V. Le, 2014 Advances in Neural Information Processing Systems (NIPS), Vol. 27 DOI: 10.48550/arXiv.1409.3215 - 提出了使用LSTM的编码器-解码器架构，用于将输入序列映射到长度可能不同的输出序列，适用于机器翻译及其他seq2seq任务。
CS224n: Natural Language Processing with Deep Learning, Diyi Yang, Tatsunori Hashimoto, 2023 (Stanford University) - 提供讲义、作业和视频，涵盖本节讨论的序列模型、词嵌入和各种自然语言处理应用。

© 2025 ApX Machine Learning用心打造