在我们讨论如何高效存储内容之前,我们先明确两个经常被交替使用的基本术语:数据和信息。理解这其中的区别非常重要,因为数据库主要目的是有效管理数据,以便我们能从中获得有意义的信息。什么是数据?可以将数据看作是未经加工的事实、数字、符号或观察结果。数据本身可能没有太多意义或上下文。它是基本组成部分。请看这些数据示例:120Smith2024-07-1894.5New YorkTrue这些单独的项目都是数据片段。单独看到120并不能告诉你很多信息。它是速度?数量?还是测量值?没有上下文,它只是一个数字。同样,Smith只是一个名字,2024-07-18也只是一个日期。什么是信息?另一方面,信息是经过处理、组织、结构化或在特定上下文中呈现的数据,使其变得有意义和有用。信息回答了诸如“谁?”、“什么?”、“何时?”和“何地?”等问题。我们重新审视数据示例,并添加上下文,将它们转化为信息:120:“患者的收缩压是120 mmHg。”Smith:“客户的姓氏是Smith。”2024-07-18:“订单发货日期是2024年7月18日。”94.5:“学生的期末考试成绩是94.5%。”New York:“活动地点是纽约。”True:“用户账户已激活 (True)。”注意,添加上下文(如“患者的收缩压”)或结构(如将客户姓名与地址和订单历史一起组织)如何将原始数据转化为可理解和可操作的内容。digraph DataToInformation { rankdir=LR; node [shape=box, style=rounded, fontname="sans-serif", color="#495057", fillcolor="#e9ecef", style=filled]; edge [color="#495057"]; Data [label="原始数据\n(例如,120, Smith, 2024-07-18)"]; Processing [label="处理\n(上下文, 组织,\n计算, 结构)"]; Information [label="有意义的信息\n(例如, '血压: 120',\n '客户: Smith',\n '发货日期: 2024-07-18')"]; Data -> Processing -> Information; }通过处理和上下文,将原始数据转化为有用信息的过程。为什么这种区别很重要正如我们前面提到的,使用简单文件管理数据的基本问题在于,文件存储数据的方式通常难以提取一致且可靠的信息。相同的数据片段可能在多个文件中重复(冗余),或者相关的数据片段可能相互矛盾(不一致)。数据库提供了一种结构化方式来存储数据,以便可以准确、高效、一致地获取信息。它们执行规则,管理关系,并提供工具来查询和操作基础数据,使从原始事实到有意义的见解的转变更加顺畅。在接下来的内容中,请记住这一区别:我们存储数据最终是为了获取信息。