趋近智
首页
博客
课程
大模型
中
所有课程
数据工程导论
章节 1: 什么是数据工程?
数据工程的定义
数据工程师的职责
数据工程 vs 数据科学 vs 数据分析
数据生命周期
常见数据工程任务
数据工程对人工智能的重要性
章节 2: 基础知识
认识数据类型
数据来源与采集方法
数据库简介
数据仓库解析
数据湖解析
数据获取的API简介
动手实践:识别数据类型
章节 3: 搭建你的第一个数据管道
数据管道是什么?
ETL 过程说明
ELT流程解析
数据提取方法
基本数据转换操作
将数据加载到存储中
简单管道编排原理
实践:勾勒基础数据管道
章节 4: 数据存储基本原理
选择合适的数据存储
操作关系型数据库 (SQL 基础)
NoSQL 数据库简介
理解文件存储系统
对象存储基础知识
常见数据格式
实践:设置一个简单的数据库表
章节 5: 数据处理入门
批处理说明
流式处理介绍
处理框架概述
理解计算资源
数据清洗入门
数据验证方法
实践:简单数据清洗脚本
章节 6: 数据工程师必备工具
SQL数据操作入门
代码版本控制与 Git
命令行界面 (CLI) 基本操作
云平台概览
工作流调度器简介
实践:Git 基本命令
章节 7: 数据工程的下一步
可进一步学习的方面
构建作品集项目构思
贡献开源
跟进新工具
课程要点回顾
云平台概览
这部分内容有帮助吗?
有帮助
报告问题
标记为完成
© 2025 ApX Machine Learning
云平台概览(AWS、GCP、Azure)