所有课程

计算机视觉应用中的高级卷积神经网络

章节 1: 回顾CNN核心与现代架构

卷积神经网络构建模块简要回顾

CNN 架构的演变：从 AlexNet 到 ResNet

理解残差连接与跳跃架构

Inception 模块和网络中的网络思想

DenseNet：架构与连接模式

EfficientNet：模型复合缩放

架构设计选择与权衡

现代架构构建实践

章节 2: 高级训练与优化方法

高级优化算法

学习率策略和周期性学习率

正则化再论：进阶方法

批量归一化内部运作及替代方案

深度网络的权重初始化策略

梯度裁剪与梯度流动缓解

混合精度训练的基本原理

深度CNN训练的调试与监控

动手实践：实现高级训练循环

章节 3: 目标检测算法

两阶段检测器：R-CNN 系列

区域候选网络解析

单阶段检测器：YOLO系列

单阶段检测器：SSD 和 RetinaNet

锚框：设计与优化

非极大值抑制的变体

目标检测的评估指标

目标检测器实现练习

章节 4: 图像分割技术

语义分割与实例分割

全卷积网络用于图像分割

编码器-解码器架构：U-Net 和 SegNet

用于图像分割的空洞（Atrous）卷积

DeepLab 系列：空洞空间金字塔池化

实例分割方法 (Mask R-CNN)

分割的评估指标

实践操作：构建语义分割模型

章节 5: 视觉中的注意力机制与Transformer

CNN中的自注意力机制

非局部神经网络

视觉Transformer简介

ViT 架构：图像块、嵌入和 Transformer 编码器

混合CNN-Transformer模型

CNN与Transformer在视觉任务中的比较

在CNN中实现注意力模块的实践

章节 6: 高级迁移学习与域适应

回顾迁移学习策略

微调与特征提取：高级考量

使模型适应不同数据分布

域泛化概述

基于CNN的小样本学习

视觉自监督学习预训练

动手实践：在特定数据集上微调模型

章节 7: 生成对抗网络用于图像合成

GAN 基本原理回顾

训练生成对抗网络的挑战

深度卷积生成对抗网络 (DCGAN)

条件GANs用于可控生成

StyleGAN 架构与基于风格的生成

GAN 的评估指标

图像生成实践中的DCGAN实现

章节 8: 模型压缩与高效深度学习

高效模型的动因

网络剪枝技术

知识蒸馏方法

量化：降低模型精度

设计高效架构

神经网络架构搜索概览

动手实践：应用剪枝与量化

StyleGAN 架构与基于风格的生成

这部分内容有帮助吗？

参考文献

A Style-Based Generator Architecture for Generative Adversarial Networks, Tero Karras, Samuli Laine, Timo Aila, 2019 Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (IEEE) DOI: 10.1109/CVPR.2019.00673 - 这篇基础论文介绍了 StyleGAN 架构，包括映射网络、基于 AdaIN 的风格调制和噪声输入。
Progressive Growing of GANs for Improved Quality, Stability, and Variation, Tero Karras, Timo Aila, Samuli Laine, Jaakko Lehtinen, 2018 International Conference on Learning Representations (ICLR) DOI: 10.48550/arXiv.1710.10196 - 引入了用于训练 GAN 的渐进式增长方法，StyleGAN 采纳了这项技术并在 StyleGAN2 中进行了改进。
Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization, Xun Huang, Serge Belongie, 2017 Proceedings of the IEEE International Conference on Computer Vision (ICCV) DOI: 10.48550/arXiv.1703.06868 - 提出了自适应实例归一化 (AdaIN) 的原始论文，这是 StyleGAN 中风格调制的组成部分。

© 2025 ApX Machine Learning用心打造