趋近智
图像中可以检测到有趣的兴趣点,例如使用Harris检测器原理找到角点,或者使用Canny检测器找到边缘。像素坐标 提供了这些特征的位置信息。除了仅仅知道它们的位置,理解和描述这些特征对许多计算机视觉任务有益。
但设想你有同一栋建筑的两张不同照片,它们是从略微不同的角度拍摄的。你可以在两张图像上运行角点检测器,并找到与特定窗户的左上角对应的角点。
图像1:在 处检测到窗户角点。 图像2:在 处检测到相同的窗户角点。
仅仅知道坐标并不能告诉我们第一张图像中 处的角点是否与第二张图像中 处的角点是同一个窗户角点。由于视角的改变,坐标是不同的。计算机如何判断这些点可能对应于场景的同一部分呢?
这就是特征描述符的作用。
可以把特征检测器(如Harris或Canny)看作是寻找兴趣点(通常称为关键点)。那么,特征描述符更进一步:它描述了每个关键点周围的区域。
描述符不仅仅是知道位置 ,它提供了一个数值概括,说明该关键点周围的图像块看起来是什么样子。这种描述通常以数字列表或数组的形式存储,常被称为特征向量 (vector)。
目标是创建一种具有以下特点的描述:
创建一个好的描述符是一个复杂的话题,有许多不同的算法(你可能以后会接触到),但一般方法通常涉及分析关键点周围的图像块。这种分析可能会考虑:
算法处理这些局部信息,并将其压缩成一个固定长度的数值向量 (vector)。例如,一个简单的描述符可以捕获图像块不同部分的平均强度,而更复杂的描述符(如SIFT、SURF、ORB,这些超出本介绍范围)则以巧妙的方式编码梯度方向,以获得更好的性能。
流程:图像由特征检测器处理,以找到关键点位置。然后,对于每个关键点,特征描述符算法分析其周围的图像区域,生成一个数值描述符向量,该向量随后可用于各种应用。
特征描述符是许多计算机视觉任务的基础:
通过将局部图像外观转换为数值形式(即描述符向量 (vector)),我们使计算机能够使用这些向量间的相似度或距离的数学度量,有效地比较特征。
总而言之,特征检测告诉我们图像中哪里有有趣的事物,而特征描述则告诉我们这些有趣的事物局部看起来是什么样子,提供了一种在不同条件或图像下比较和匹配它们的方法。你不会在本章的实践练习中实现描述符,但理解其作用在你学习更复杂的计算机视觉应用时很重要。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•