趋近智
既然我们已经了解了图像是如何表示为像素网格的,每个像素都有颜色数值,那么我们来思考一下,如何在计算机上将这些图像保存为文件。如果仅仅存储每张图像的原始像素值,文件会很快变得非常大,特别是对于高分辨率照片。这就是图像文件格式的作用所在。
图像文件格式定义了一种标准方式来组织和存储像素数据,以及其他相关信息(例如图像尺寸和色彩空间)。区分这些格式的一个重要方面是它们如何处理压缩。压缩技术旨在减小文件大小,使图像更易于存储和通过网络传输。这里有两种主要的压缩类型:
我们来看看一些最常见的文件格式:
JPEG可以说是摄影图像最流行的格式。它的主要优势在于能够实现非常高的压缩比,从而生成适合网页和共享的小文件。这是通过有损压缩实现的。保存JPEG时,通常会指定一个“质量”设置(通常是0到100之间的一个数字)。较低的质量设置意味着更高的压缩、更小的文件大小,但会丢弃更多信息,可能导致可见的失真,称为“伪影”,尤其是在锐利边缘或文本周围。较高的质量设置会保留更多细节,但会生成更大的文件。JPEG通常不支持透明度。
PNG被开发为GIF等旧格式的一种更具能力且无专利的替代品。它使用无损压缩,这意味着保存文件时不会丢失任何图像数据。这使得它非常适合需要锐利线条、清晰文本和精确颜色的图形。与JPEG不同,PNG支持Alpha通道,允许不同程度的透明度。这就是为什么标志或图标常使用PNG,以便它们可以清晰地叠加到不同背景上。缺点是,对于复杂的摄影图像,PNG文件通常比同等质量的JPEG文件大得多。
GIF是一种较旧的格式,主要以其存储短循环动画的能力而闻名。它使用无损压缩,但有一个主要限制:每帧只支持最多256种不同颜色。这使得它不适合照片,照片通常包含数千或数百万种颜色(用GIF渲染它们通常会导致分带或斑点外观)。它支持基本透明度(像素要么完全透明,要么完全不透明,不像PNG那样支持部分透明)。虽然仍用于动画,但由于更好的压缩和功能,PNG通常更受静态图像(颜色受限)的青睐。
BMP是一种简单、较旧的格式,通常与Windows相关联。它通常直接存储像素数据,几乎不进行压缩。这导致其文件大小与JPEG或PNG等格式相比非常大。因为它未压缩(或使用非常基本的无损压缩),所以它保留了精确的原始图像数据。然而,由于文件大且缺乏高级功能,它在今天不常用于网络分发或一般图像共享。
选择合适的文件格式取决于图像内容和您的需求:
了解这些格式有助于您更好地认识在计算机视觉任务中将加载的数据。不同的格式存储像素数据的方式不同,所使用的压缩方式有时会影响可用于分析的信息。对于大多数入门工作,您会经常加载JPEG或PNG文件,并将其转换为我们之前讨论过的标准数值数组表示形式。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造