趋近智
在学会使用简单形状和图案创建基础合成图像后,我们来了解另一种直接的图像数据生成方法:施加噪声和简单变换,通常称之为数据增强。数据增强虽然常用于修改现有真实图像,但相同技术也可应用于我们刚刚提到的基础合成图像,甚至可结合使用,以便为训练机器学习 (machine learning)模型准备更多元的数据集。
可以将数据增强看作是对图像进行微调 (fine-tuning),以生成一个新的、但相关联的版本。为什么要这样做?机器学习模型,尤其是在计算机视觉方面,需要查看同一物体或场景的多种变化,才能有效学习并在不同条件下识别它们。如果数据集只包含完美居中、光线充足的图像,那么模型在遇到轻微旋转、放大或有轻微缺陷的图像时,可能表现不佳。数据增强有助于解决这个问题。
"图像常因相机传感器限制、光照条件差或传输错误而包含噪声。有目的地向合成图像或真实图像中添加噪声,可以使你的模型更能适应这些不完美之处。"
常见的噪声类型是高斯噪声,它向每个像素的强度添加从钟形(正态)分布中提取的小随机值。可以想象成在图像上随机添加亮度不同的小斑点。
另一种类型是椒盐噪声,它随机地将一些像素替换为纯白(盐)或纯黑(椒)像素。
添加噪声模拟了不完美的情况,并帮助模型学习关注重要特征,而不是被轻微的像素差异分散注意力。噪声的数量和类型通常可以调整,让你能模拟不同程度的缺陷。
这些涉及改变图像内容的位置、方向或比例。
对亮度、对比度或饱和度的轻微调 (fine-tuning)整也可以模拟不同的光照条件。使图像略微亮一些或暗一些,或增加其对比度,会产生模型在实际情境中可能遇到的各种变体。
应用这些变换会创建新数据点。如果你从一个基础合成图像(例如程序生成的正方形)开始,并应用五种不同的数据增强(例如,添加噪声、旋转5度、旋转-5度、缩放1.1倍、水平翻转),你的数据集中现在就有六张图像,而不是一张。这是一种简单而有效的扩展数据集的方式,尤其是在结合生成基础形状或图案时。
对原始图像施加各种变换,如添加噪声、旋转、缩放或翻转,可以生成多个新的、增强的图像用于训练。
尽管数据增强功能强大,但也应谨慎使用:
软件库(我们将在第6章中涉及)提供了便捷的功能,可轻松应用这些数据增强。通过将简单形状和图案的生成与噪声及基础数据增强结合起来,你就可以开始为计算机视觉项目构建更多样化的数据集,而无需初始拥有大量数据。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•