趋近智
图像分割不再仅仅对整张图像进行分类或为目标绘制边界框,其目标是对场景内容实现像素级的理解。其目的是为图像中的每个像素分配类别标签,提供一个精细的掩模,勾勒出对象的精确形状。
本章中,您将学习使用深度学习 (deep learning)进行图像分割的基础原理和方法。我们将首先区分语义分割(按类别标记 (token)像素,如“道路”或“人”)和实例分割(标记不同的对象实例,如“人1”和“人2”)。
您将学习专门为此类密集预测任务而开发的几种重要架构和方法,其中包括:
我们还将讨论用于分割任务的常见评估指标,例如交并比(IoU),通常计算为 ,并以实践练习作为本章的结束。
4.1 语义分割与实例分割
4.2 全卷积网络用于图像分割
4.3 编码器-解码器架构:U-Net 和 SegNet
4.4 用于图像分割的空洞(Atrous)卷积
4.5 DeepLab 系列:空洞空间金字塔池化
4.6 实例分割方法 (Mask R-CNN)
4.7 分割的评估指标
4.8 实践操作:构建语义分割模型