趋近智
让我们不再只看像素和像边缘这样的基本特征。我们已经了解了图像如何进行数字表示以及如何提取出引人注意的点。现在,我们想问一个更深层的问题:图像中到底有什么?这直接引出了物体识别的看法。
物体识别是教计算机系统识别图像或视频序列中特定物体的过程。这里的“物体”可以是多种多样的。它可以是一个普通类别,比如“汽车”、“人”或“树”,也可以是一个非常具体的例子,比如“我的狗Fido”或某个公司标志。
主要目的是让机器以至少部分模仿人类感知的方式来理解视觉场景。我们希望有一个系统能够分析输入图像并输出以下信息:
对于本入门课程,我们主要关注判断已知物体是否出现以及有时在哪里出现的一般想法。
为什么这有用?物体识别是许多应用的基础能力。请思考:
这与我们所学内容有何关联?我们在上一章讨论过的特征,比如边缘和角点,通常与物体的边界或独特之处相对应。颜色分布(来自第二章)和纹理也提供重要的线索。物体识别算法通常通过分析从图像像素数据中提取的这些低层次细节的组合,来推断高层次物体的存在。
然而,使其可靠地工作是有难度的。想象一下尝试识别一个咖啡杯。它可能出现:
人类可以毫不费力地处理这些变化,但编程让计算机做同样的事情需要细致的方法。在本章后面,我们将更多地讨论这些难题。
首先,我们将介绍一种简单而易懂的方法,叫做模板匹配。这有助于我们初步了解计算机如何系统地在大图像中寻找预设的模式。接下来,我们来看看它是如何运作的。
这部分内容有帮助吗?
© 2026 ApX Machine LearningAI伦理与透明度•