趋近智
在图像分类的基础上,本节讨论如何在图像中定位 and 识别多个对象。这就是目标检测的目的。本节中,您将学习有影响力的深度学习目标检测模型的设计与工作方式。
我们将分析两种主要方法的架构差异:以R-CNN系列(包含带有区域提议网络的Faster R-CNN)为代表的两阶段检测器,以及YOLO和SSD等计算更快的单阶段检测器。您将实际理解重要组件,例如用于提议潜在目标位置的锚框,以及用于过滤重叠检测结果的非极大值抑制 (NMS) 等技术。我们还将介绍标准评估协议,重点关注平均精度均值 (mAP) 等指标,并以实践实现练习作结。
3.1 两阶段检测器:R-CNN 系列
3.2 区域候选网络解析
3.3 单阶段检测器:YOLO系列
3.4 单阶段检测器:SSD 和 RetinaNet
3.5 锚框:设计与优化
3.6 非极大值抑制的变体
3.7 目标检测的评估指标
3.8 目标检测器实现练习
© 2026 ApX Machine Learning用心打造