趋近智
关系型数据库是数据存储的核心,提供了一种结构化的方式来组织和访问信息。可以将它们想象成组织严密的数字文件柜,数据以表的形式存储。这些表类似于电子表格,行代表单个记录(例如特定客户或产品),列代表这些记录的属性或特征(例如客户姓名或产品价格)。
“关系”部分来源于表之间链接数据的能力。例如,您可能有一个Customers表,另一个是Orders表。您无需在Orders表中重复客户信息,而是可以在它们之间建立关系,通常使用唯一标识符。这种结构化方法确保了数据的一致性并减少了冗余。
用于与关系型数据库通信的标准语言是 SQL(结构化查询语言)。几乎每个关系型数据库系统(如 PostgreSQL、MySQL、SQL Server、Oracle)都理解 SQL。作为数据工程师,扎实掌握 SQL 对于提取、转换和加载存储在这些系统中的数据是必不可少的。
关系型数据库的核心是表。
Products表中,列可能包括product_id(数字)、name(文本)和price(数字)。Products表中的一行可能表示一个单独的项,如('101','Laptop',1200.00)。Table: 产品
+------------+----------+--------+
| product_id | name | price | <- 列(属性)
+------------+----------+--------+
| 101 | Laptop | 1200.00| <- 行(记录 1)
| 102 | Keyboard | 75.00| <- 行(记录 2)
| 103 | Monitor | 300.00| <- 行(记录 3)
+------------+----------+--------+
为了管理关系并确保唯一性,关系型数据库使用键:
Products表中,product_id很可能就是主键。没有两个产品可以拥有相同的product_id。Orders表可能有一个product_id列,它指回Products表中的product_id,从而将每个订单行项目链接到特定产品。示意图说明了
Products表和Orders表之间通过外键建立的关系。
SQL 允许您在数据库上执行各种操作。这些命令通常分为几类:
CREATE TABLE:创建一个新表。ALTER TABLE:修改现有表(例如,添加列)。DROP TABLE:删除一个表。INSERT:向表中添加新行(记录)。UPDATE:修改现有行。DELETE:删除行。SELECT:从一个或多个表中获取数据。让我们使用Products表示例来了解一些基本 SQL 命令。
创建表 您定义表名及其列以及它们的数据类型。
CREATE TABLE Products (
product_id INT PRIMARY KEY,
name VARCHAR(100),
price DECIMAL(10, 2)
);
此命令创建了包含三列的Products表:product_id作为整数和主键,name作为文本(最多100个字符),以及price作为十进制数字。
插入数据 向表中添加记录:
INSERT INTO Products (product_id, name, price)
VALUES (101, 'Laptop', 1200.00);
INSERT INTO Products (product_id, name, price)
VALUES (102, 'Keyboard', 75.00);
查询数据 (SELECT)
这可能是最常用的 SQL 命令。它用于检索数据。
获取所有产品的全部列:
SELECT * FROM Products;
*符号是“所有列”的简写。
获取所有产品的名称和价格:
SELECT name, price FROM Products;
筛选数据 (WHERE)
您可以指定条件以仅检索匹配的行。
查找价格低于 100 美元的产品:
SELECT name, price
FROM Products
WHERE price < 100.00;
这将返回“Keyboard”。
更新数据 (UPDATE)
修改现有记录。使用WHERE子句指定要更新哪些行非常重要,否则您可能会更新表中的所有行!
更改“Laptop”的价格:
UPDATE Products
SET price = 1150.00
WHERE product_id = 101;
删除数据 (DELETE)
从表中删除行。同样,WHERE子句对于定位特定行很重要。没有它,您将面临删除所有内容的风险!
删除“Keyboard”产品:
DELETE FROM Products
WHERE product_id = 102;
关系型数据库受欢迎的原因有几个:
您会发现关系型数据库为以下系统提供支持:
尽管功能强大,关系型数据库也有局限性:
理解如何使用 SQL 与关系型数据库进行交互是数据工程师的一项基本技能。它们通常是数据提取到管道的源系统,或是清理和转换后的数据加载以供分析的目标系统。在后面的实践部分,您将亲自动手创建一张简单的表。
这部分内容有帮助吗?
© 2026 ApX Machine Learning用心打造