All Courses

Building Scalable Data Warehouses

Chapter 1: MPP Architecture and Storage Internals

Massively Parallel Processing Fundamentals

Decoupling Compute and Storage

Columnar Storage Formats and Compression

Micro-partitioning and Metadata Management

Hands-on practice: Inspecting Storage Profiles

Chapter 2: Advanced Data Modeling at Scale

Dimensional Modeling Constraints in Big Data

Data Vault 2.0 Implementation Patterns

Handling Semi-Structured Data

Schema Evolution and Versioning

Hands-on practice: Designing a Data Vault

Chapter 3: High-Throughput Ingestion Pipelines

Change Data Capture Architectures

Idempotency in Data Pipelines

Micro-batch vs Streaming Ingestion

Handling Late Arriving Data

Hands-on practice: Building a CDC Pipeline

Chapter 4: Query Optimization and Performance Tuning

Analyzing Query Execution Plans

Partition Pruning and Clustering Keys

Join Strategies: Broadcast vs Shuffle

Materialized Views and Caching Layers

Hands-on practice: Tuning High-Latency Queries

Chapter 5: Governance, Security, and Observability

Role-Based Access Control Hierarchies

Dynamic Data Masking and Tokenization

Row-Level Security Implementation

Resource Monitoring and Cost Control

Hands-on practice: Configuring Security Policies

Idempotency in Data Pipelines

Was this section helpful?

© 2025 ApX Machine LearningEngineered with