趋近智
在之前的章节中,我们主要将图像视为像素值的网格,并应用通常影响图像大部分甚至全部区域的操作。我们学习了如何调整亮度、对比度,甚至重新调整大小或旋转整个场景。现在,我们将重心从全局处理图像转移到识别突出或包含重要信息的特定局部区域。这些区域就是我们在计算机视觉中称为特征的部分。
想想你是如何识别物体或场景的。你不一定会以统一的方式单独处理每一个像素。相反,你的视觉系统会被独特部分所吸引:建筑物在天空下的清晰轮廓、书本的角落、一块木头的独特纹理。这些类似于计算机视觉中的特征。
那么,图像的哪一部分究竟算是“特征”呢?
特征本质上是图像中被认为对特定任务有趣或提供信息的模式或独特结构。特征是像素数据中的“地标”。它们通常对应:
考虑一张普通白墙的图像。从计算机视觉的角度来看,墙壁的大部分区域看起来非常相似;像素强度变化很小。这种均匀区域通常缺乏独特特征。现在,想象墙上画了一个黑色方块。方块的边缘(白色与黑色交界处)和方块的角点信息量很大。它们代表图像数据的明显变化,是很好的特征候选。
要使特征在计算机视觉任务中有用,它们理想情况下应具备某些特质:
让我们可视化一些常见特征:
在本章中,我们将主要侧重于检测边缘和角点,因为它们是许多计算机视觉应用中使用的基本特征类型。理解如何识别这些点和线条是使计算机能够以更有意义的方式理解视觉场景的基础步骤,从而从简单的像素操作转向内容理解。以下部分将介绍旨在找到图像中这些信息丰富的部位的特定算法。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造