定义数据与信息

在我们讨论如何高效存储内容之前，我们先明确两个经常被交替使用的基本术语：数据和信息。理解这其中的区别非常重要，因为数据库主要目的是有效管理数据，以便我们能从中获得有意义的信息。

可以将数据看作是未经加工的事实、数字、符号或观察结果。数据本身可能没有太多意义或上下文 (context)。它是基本组成部分。

请看这些数据示例：

这些单独的项目都是数据片段。单独看到120并不能告诉你很多信息。它是速度？数量？还是测量值？没有上下文，它只是一个数字。同样，Smith只是一个名字，2024-07-18也只是一个日期。

另一方面，信息是经过处理、组织、结构化或在特定上下文 (context)中呈现的数据，使其变得有意义和有用。信息回答了诸如“谁？”、“什么？”、“何时？”和“何地？”等问题。

我们重新审视数据示例，并添加上下文，将它们转化为信息：

注意，添加上下文（如“患者的收缩压”）或结构（如将客户姓名与地址和订单历史一起组织）如何将原始数据转化为可理解和可操作的内容。

通过处理和上下文，将原始数据转化为有用信息的过程。

正如我们前面提到的，使用简单文件管理数据的基本问题在于，文件存储数据的方式通常难以提取一致且可靠的信息。相同的数据片段可能在多个文件中重复（冗余），或者相关的数据片段可能相互矛盾（不一致）。

数据库提供了一种结构化方式来存储数据，以便可以准确、高效、一致地获取信息。它们执行规则，管理关系，并提供工具来查询和操作基础数据，使从原始事实到有意义的见解的转变更加顺畅。在接下来的内容中，请记住这一区别：我们存储数据最终是为了获取信息。

参考文献

Database System Concepts, Avi Silberschatz, Henry F. Korth, S. Sudarshan, 2019 (McGraw-Hill) - 一本涵盖数据库理论和实践的综合教材，包括在数据库管理背景下对数据和信息的定义。