为什么要识别特征？

你已经了解了边缘和角点等特征通常是什么。但为什么要费力找出它们呢？为什么不直接处理原始像素值呢？

直接处理数百万像素值会带来很多难题。想象一下，如果你想在一张人群照片中找到一张特定的脸，通过比较目标人脸图像的每个像素值与人群照片中每个可能位置的像素值，这会是什么情况。这会非常慢，而且对微小变化非常敏感。如果光线稍微不同，或者脸部稍微转动，原始像素值就会发生巨大变化，很可能导致你简单的比较失败。

特征检测提供了一种更有效的方法，它侧重于图像中“有意义”的部分。识别特征有以下好处：

数据减少与效率： 图像包含大量数据。一张1兆像素的彩色图像有100万个像素，每个像素通常有3个颜色值，总计300万个数字！角点或边缘点等特征能更紧凑地表示这些信息。你可能只需要处理数百或数千个特征点，而不是数百万像素值。这大大减轻了后续处理步骤的计算负担，使算法更快、更高效。
信息集中： 特征通常对应于信息含量高的点。边缘通常表示物体的边界，而角点则常出现在边缘相交或形状、纹理发生显著变化的地方。这些位置对于理解图像内容来说通常很重要。通过关注特征，我们将分析集中在这些有意义的区域。
对变化的稳定性： 原始像素值对光照、摄像机视角、物体大小和旋转变化高度敏感。微小的阴影都可能使像素强度发生显著变化。特征，特别是选择得当的特征，在这些变化下往往更稳定。例如，建筑物的一个角点，无论是晴天还是阴天，或是从略微不同的角度（在一定范围内）看，它仍然是一个角点。这种稳定性使得基于特征的方法在条件并非完美受控的实际操作任务中更加可靠。
复杂任务的根基： 特征检测很少是最终目标；它通常是许多高级计算机视觉应用的基本第一步：
- 物体匹配与识别： 如果你能在不同图像中（尽管视角或光照有变化）可靠地检测到物体上的相同特征，你就可以匹配该物体。这对于识别已知物体或在新场景中找到它们很重要。
- 图像拼接： 为了创建全景图，软件需要在重叠图像中找到对应的点（特征）以正确对齐 (alignment)它们。
- 运动追踪： 可以从一个视频帧到下一个视频帧追踪特征，以了解物体的移动方式。
- 3D重建： 通过在从不同视角拍摄的图像中找到对应的特征，可以推断出场景的3D结构。
- 机器人与导航： 机器人常使用特征作为地标来确定自己的位置并进行环境导航。

本质上，识别特征使我们能够从密集、敏感的表示（像素）转向稀疏、更稳定且语义更丰富的表示。这种抽象使得构建能够分析和理解视觉信息的系统成为可能，其方式虽简化，但与生物视觉系统处理显著信息的方式相似。它提供了一系列可靠的锚点，在此之上可以构建更复杂的图像解释。

参考文献

Computer Vision: Algorithms and Applications, Richard Szeliski, 2010 (Springer) DOI: 10.1007/978-1-84882-935-0 - 这本书为计算机视觉提供了全面的基础知识，详细解释了特征检测方法的动机和应用。这是作者的草稿，被广泛认为是更新的第二版。
Multiple View Geometry in Computer Vision, Richard Hartley, Andrew Zisserman, 2003 (Cambridge University Press) DOI: 10.1017/CBO9780511811685 - 尽管内容进阶，这本基础著作广泛使用特征进行相机标定、3D重建和图像匹配，说明了特征对于鲁棒几何任务的重要性。
Distinctive Image Features from Scale-Invariant Keypoints, David G. Lowe, 2004 International Journal of Computer Vision, Vol. 60 (Springer) DOI: 10.1023/B:VISI.0000029664.99615.94 - 这篇基础论文介绍了SIFT，更重要的是，它详细阐述了以往方法的局限性以及对尺度、旋转和光照变化具有鲁棒性的特征的必要性，与本节的核心主题直接相关。