合成数据的生成在实际操作中需要借助软件工具和库。手动创建大型或复杂数据集通常效率低下。本章介绍围绕初级合成数据生成的软件生态系统。你将了解软件在自动化数据创建中的作用。我们将看到核心Python库(例如NumPy和Pandas)如何用于生成和处理数据结构。我们还将涉及专门用于生成逼真占位数据(例如Faker)的库。此外,你将大致了解用于简单图像生成和处理任务的库。最后,我们将提供简要指导,说明如何识别针对不同合成数据需求的合适工具。