在构建数据管理系统之前,需要了解其原始材料。本章将介绍数据工程师处理的基本构成要素。你将学会区分结构化数据、半结构化数据和非结构化数据。我们会了解数据的常见来源和收集方法。关系型数据库、NoSQL数据库、数据仓库和数据湖等主要存储结构将被定义。我们还将简单提及使用API获取数据。本章包含一个识别不同数据形式的实践练习。掌握这些基本要点,将为理解后面会讲到的数据管道和存储方案提供扎实的依据。