所有课程

计算机视觉应用中的高级卷积神经网络

章节 1: 回顾CNN核心与现代架构

卷积神经网络构建模块简要回顾

CNN 架构的演变：从 AlexNet 到 ResNet

理解残差连接与跳跃架构

Inception 模块和网络中的网络思想

DenseNet：架构与连接模式

EfficientNet：模型复合缩放

架构设计选择与权衡

现代架构构建实践

章节 2: 高级训练与优化方法

高级优化算法

学习率策略和周期性学习率

正则化再论：进阶方法

批量归一化内部运作及替代方案

深度网络的权重初始化策略

梯度裁剪与梯度流动缓解

混合精度训练的基本原理

深度CNN训练的调试与监控

动手实践：实现高级训练循环

章节 3: 目标检测算法

两阶段检测器：R-CNN 系列

区域候选网络解析

单阶段检测器：YOLO系列

单阶段检测器：SSD 和 RetinaNet

锚框：设计与优化

非极大值抑制的变体

目标检测的评估指标

目标检测器实现练习

章节 4: 图像分割技术

语义分割与实例分割

全卷积网络用于图像分割

编码器-解码器架构：U-Net 和 SegNet

用于图像分割的空洞（Atrous）卷积

DeepLab 系列：空洞空间金字塔池化

实例分割方法 (Mask R-CNN)

分割的评估指标

实践操作：构建语义分割模型

章节 5: 视觉中的注意力机制与Transformer

CNN中的自注意力机制

非局部神经网络

视觉Transformer简介

ViT 架构：图像块、嵌入和 Transformer 编码器

混合CNN-Transformer模型

CNN与Transformer在视觉任务中的比较

在CNN中实现注意力模块的实践

章节 6: 高级迁移学习与域适应

回顾迁移学习策略

微调与特征提取：高级考量

使模型适应不同数据分布

域泛化概述

基于CNN的小样本学习

视觉自监督学习预训练

动手实践：在特定数据集上微调模型

章节 7: 生成对抗网络用于图像合成

GAN 基本原理回顾

训练生成对抗网络的挑战

深度卷积生成对抗网络 (DCGAN)

条件GANs用于可控生成

StyleGAN 架构与基于风格的生成

GAN 的评估指标

图像生成实践中的DCGAN实现

章节 8: 模型压缩与高效深度学习

高效模型的动因

网络剪枝技术

知识蒸馏方法

量化：降低模型精度

设计高效架构

神经网络架构搜索概览

动手实践：应用剪枝与量化

非极大值抑制的变体

这部分内容有帮助吗？

参考文献

Soft-NMS -- Improving Object Detection With One Line of Code, Navaneeth Bodla, Bharat Singh, Rama Chellappa, Larry S. Davis, 2017 Proceedings of the IEEE International Conference on Computer Vision (ICCV) DOI: 10.48550/arXiv.1704.04503 - 介绍了Soft-NMS算法，该算法通过衰减重叠框的得分而非直接移除，提高了密集场景中的召回率。
Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression, Zhaohui Zheng, Ping Wang, Wei Liu, Jinze Li, Rongguang Ye, Dongwei Ren, 2020 Proceedings of the AAAI Conference on Artificial Intelligence (AAAI), Vol. 34 DOI: 10.48550/arXiv.1911.08287 - 提出了DIoU和CIoU损失，并引入了DIoU-NMS，它在抑制标准中考虑了中心点距离。
YOLACT: Real-time Instance Segmentation, Daniel Bolya, Chong Zhou, Fanyi Xiao, Yong Jae Lee, 2019 Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV) DOI: 10.1109/ICCV.2019.00913 - 介绍了Matrix NMS，这是一种在YOLACT实例分割模型中用于加速后处理的并行化NMS方法。

© 2025 ApX Machine Learning用心打造