趋近智
为有效使用多种类型的数据,人工智能系统首先需要对每种数据类型有充分的认识。本章将说明文本、图像、音频和视频等不同形式的信息如何进行准备和组织,以便机器进行处理。我们将介绍这些数据常见的表示方式,以及为应对更复杂的跨模态任务而采取的初步处理步骤。
您将了解到:
掌握这些数据准备工作是学习人工智能模型如何整合不同信息流的重要一步。
2.1 文本数据表示:从字符到意义
2.2 图像数据表示:像素、特征与结构
2.3 音频数据表示:声波到数字信号
2.4 视频数据:图像与声音的序列
2.5 不同数据类型的基本预处理
2.6 多源数据对齐
2.7 跨模态信息比较
2.8 动手实践:观察数据格式
© 2026 ApX Machine Learning用心打造