所有课程

计算机视觉应用中的高级卷积神经网络

章节 1: 回顾CNN核心与现代架构

卷积神经网络构建模块简要回顾

CNN 架构的演变：从 AlexNet 到 ResNet

理解残差连接与跳跃架构

Inception 模块和网络中的网络思想

DenseNet：架构与连接模式

EfficientNet：模型复合缩放

架构设计选择与权衡

现代架构构建实践

章节 2: 高级训练与优化方法

高级优化算法

学习率策略和周期性学习率

正则化再论：进阶方法

批量归一化内部运作及替代方案

深度网络的权重初始化策略

梯度裁剪与梯度流动缓解

混合精度训练的基本原理

深度CNN训练的调试与监控

动手实践：实现高级训练循环

章节 3: 目标检测算法

两阶段检测器：R-CNN 系列

区域候选网络解析

单阶段检测器：YOLO系列

单阶段检测器：SSD 和 RetinaNet

锚框：设计与优化

非极大值抑制的变体

目标检测的评估指标

目标检测器实现练习

章节 4: 图像分割技术

语义分割与实例分割

全卷积网络用于图像分割

编码器-解码器架构：U-Net 和 SegNet

用于图像分割的空洞（Atrous）卷积

DeepLab 系列：空洞空间金字塔池化

实例分割方法 (Mask R-CNN)

分割的评估指标

实践操作：构建语义分割模型

章节 5: 视觉中的注意力机制与Transformer

CNN中的自注意力机制

非局部神经网络

视觉Transformer简介

ViT 架构：图像块、嵌入和 Transformer 编码器

混合CNN-Transformer模型

CNN与Transformer在视觉任务中的比较

在CNN中实现注意力模块的实践

章节 6: 高级迁移学习与域适应

回顾迁移学习策略

微调与特征提取：高级考量

使模型适应不同数据分布

域泛化概述

基于CNN的小样本学习

视觉自监督学习预训练

动手实践：在特定数据集上微调模型

章节 7: 生成对抗网络用于图像合成

GAN 基本原理回顾

训练生成对抗网络的挑战

深度卷积生成对抗网络 (DCGAN)

条件GANs用于可控生成

StyleGAN 架构与基于风格的生成

GAN 的评估指标

图像生成实践中的DCGAN实现

章节 8: 模型压缩与高效深度学习

高效模型的动因

网络剪枝技术

知识蒸馏方法

量化：降低模型精度

设计高效架构

神经网络架构搜索概览

动手实践：应用剪枝与量化

单阶段检测器：YOLO系列

这部分内容有帮助吗？

参考文献

You Only Look Once: Unified, Real-Time Object Detection, Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi, 2016 IEEE Conference Publication (IEEE) DOI: 10.1109/CVPR.2016.91 - 介绍了原始的单阶段、基于网格的对象检测方法，将检测视为回归问题。
YOLO9000: Better, Faster, Stronger, Joseph Redmon, Ali Farhadi, 2017 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (IEEE) DOI: 10.1109/CVPR.2017.783 - 通过引入锚框、批量归一化和新的骨干网络（Darknet-19）改进了YOLOv1，并引入了检测和分类的联合训练。
YOLOv3: An Incremental Improvement, Joseph Redmon, Ali Farhadi, 2018 arXiv DOI: 10.48550/arXiv.1804.02767 - 通过多尺度预测改进YOLO，以提高小目标检测性能，并使用独立的逻辑分类器进行多标签分类。
YOLOv4: Optimal Speed and Accuracy of Object Detection, Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao, 2020 arXiv preprint arXiv:2004.10934 DOI: 10.48550/arXiv.2004.10934 - 提出了一种高度优化的YOLO架构，结合了多项技术进步（“免费包”和“特殊包”），以实现出色的速度-精度平衡。

© 2026 ApX Machine Learning用心打造