趋近智
上一章我们已奠定了ETL的基本原理,现在将侧重于第一阶段:提取。这是该流程的起点,从原始系统获取原始数据。
本章介绍数据导出的实用内容。你将学习以下内容:
在本章结束时,你将了解成功提取数据所需的方法和考量,这是构建ETL管道的第一步。
2.1 连接数据源
2.2 完全抽取与增量抽取
2.3 处理结构化数据(例如:数据库、CSV)
2.4 半结构化数据(例如JSON、XML)简介
2.5 数据变化捕获(CDC)原理
2.6 处理提取错误
2.7 实践:模拟数据提取
© 2026 ApX Machine Learning用心打造