加载策略：完整加载

你已在转换阶段抽取、清理并整理好数据，使其成为理想的格式。现在，是时候将这些处理过的数据迁移到最终目的地了。最直接的方法之一就是采用完整加载策略。

想象你有一块白板（你的目标表）和一系列笔记（你的转换数据）。完整加载就像完全擦除整个白板，然后将你所有的现有笔记都写上去。每次运行该过程时，你都会清空所有内容，并根据最新的转换数据重写一切。

完整加载（ $L_{full}$ ）是一种数据加载策略，用于将全部数据从源系统迁移到目标系统。此过程通常包含一些特定步骤。

准备： ETL 过程完成抽取和转换步骤，生成可供加载的数据集。
目标准备（可选但常见）： 目标表中现有数据通常会被完全移除。这在 SQL 数据库中常用 TRUNCATE TABLE 命令完成，它通常比逐行删除（DELETE FROM table）更快。有时，表甚至可能被删除并重建，特别是当涉及模式变更时。
数据加载： 整个转换后的数据集被插入到当前为空的目标表。

该过程确保在加载操作完成后，目标表包含转换阶段为该次特定运行生成的数据集的准确副本。

一张描绘完整加载过程的图表。数据被抽取并转换。目标表在加载转换后的数据之前被清空，完全替换掉之前的内容。

尽管简单，完整加载并非总是最佳选择，特别是对于非常大的数据集。然而，它通常适用于以下几种情况：

完整加载策略提供了一种基本方法来填充目标系统。它的简单性使其具有吸引力，特别是对于小型数据集或初始加载。然而，它在处理大型数据量时的局限性常常促使数据工程师考虑其他方法，例如增量加载，我们将在后面讨论。

参考文献

The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, Ralph Kimball, Margy Ross, 2013 (John Wiley & Sons, Inc.) - 数据仓库和ETL原理的基础指南，描述了包括全量加载在内的各种加载策略。
Fundamentals of Data Engineering: Plan and Build Robust Data Systems, Joe Reis, Matt Housley, 2022 (O'Reilly Media, Inc.) - 涵盖了现代数据工程实践，包括ETL管道设计和不同的数据加载方法。