All Courses

Advanced Diffusion Model Architectures and Training

Chapter 1: Foundation Review and Advanced Noise Schedules

Recap: Denoising Diffusion Probabilistic Models (DDPM)

Recap: Denoising Diffusion Implicit Models (DDIM)

Mathematical Underpinnings: Score Matching and ODEs

Limitations of Standard Noise Schedules

Designing Custom Noise Schedules

Learned Variance Schedules

Hands-on Practical: Implementing Noise Schedule Variants

Chapter 2: Advanced U-Net Architectures

The Standard U-Net in Diffusion Models

Attention Mechanisms in U-Nets (Self-Attention, Cross-Attention)

Integrating Time Embeddings in U-Nets

Advanced Conditioning Input Integration

Architectural Variants for Efficiency (Depth, Width, Pooling)

Normalization Techniques (GroupNorm, AdaLN)

Hands-on Practical: Modifying a U-Net with Attention

Chapter 3: Transformer-Based Diffusion Models

Motivation for Transformers in Generative Modeling

Adapting Transformers for Image Data (ViT, Patch Embeddings)

Diffusion Transformers (DiT): Architecture Overview

Conditioning in Diffusion Transformers

Comparison: U-Nets vs. Transformers for Diffusion

Implementation Considerations for DiTs

Hands-on Practical: Building a Simple DiT Block

Chapter 4: Advanced Training Techniques

Classifier Guidance: Principles and Implementation

Classifier-Free Guidance (CFG): Theory and Benefits

Implementing and Tuning CFG Scale

Advanced Loss Function Formulations (v-prediction, L_simple)

Model Parameterization (epsilon-prediction vs. x0-prediction)

Techniques for Training Stability (Gradient Clipping, EMA)

Mixed-Precision Training for Diffusion Models

Hands-on Practical: Implementing Classifier-Free Guidance

Chapter 5: Consistency Models

Motivation: The Need for Faster Sampling

Core Idea: Consistency Property

Consistency Model Training: Distillation Approach

Consistency Model Training: Standalone Approach

Sampling from Consistency Models (Single-step and Multi-step)

Architecture Considerations for Consistency Models

Trade-offs: Speed vs. Quality

Hands-on Practical: Basic Consistency Distillation

Chapter 6: Advanced Sampling and Optimization

Higher-Order Solvers (DPM-Solver, UniPC)

Stochastic Sampling Variants

Guided Sampling Refinements

Troubleshooting Sampling Issues (Artifacts, Blurriness)

Model Distillation for Diffusion

Quantization of Diffusion Models

Hardware Acceleration Considerations (GPU Kernels, Compilation)

Hands-on Practical: Comparing Advanced Samplers

Advanced Loss Function Formulations (v-prediction, L_simple)

Was this section helpful?

References

Denoising Diffusion Probabilistic Models, Jonathan Ho, Ajay Jain, and Pieter Abbeel, 2020 Advances in Neural Information Processing Systems DOI: 10.48550/arXiv.2006.11239 - This foundational paper introduces the Denoising Diffusion Probabilistic Model (DDPM) framework and the simplified noise prediction loss ($L_{simple}$) that became standard for training diffusion models.
Elucidating the Design Space of Diffusion-Based Generative Models, Tero Karras, Miika Aittala, Timo Aila, and Samuli Laine, 2022 Advances in Neural Information Processing Systems DOI: 10.48550/arXiv.2206.00364 - This research systematically analyzes various architectural and training design choices for diffusion models, including different loss weightings and prediction targets such as $v$-prediction, offering insights into their impact on performance.

© 2025 ApX Machine LearningEngineered with