所有课程

计算机视觉应用中的高级卷积神经网络

章节 1: 回顾CNN核心与现代架构

卷积神经网络构建模块简要回顾

CNN 架构的演变：从 AlexNet 到 ResNet

理解残差连接与跳跃架构

Inception 模块和网络中的网络思想

DenseNet：架构与连接模式

EfficientNet：模型复合缩放

架构设计选择与权衡

现代架构构建实践

章节 2: 高级训练与优化方法

高级优化算法

学习率策略和周期性学习率

正则化再论：进阶方法

批量归一化内部运作及替代方案

深度网络的权重初始化策略

梯度裁剪与梯度流动缓解

混合精度训练的基本原理

深度CNN训练的调试与监控

动手实践：实现高级训练循环

章节 3: 目标检测算法

两阶段检测器：R-CNN 系列

区域候选网络解析

单阶段检测器：YOLO系列

单阶段检测器：SSD 和 RetinaNet

锚框：设计与优化

非极大值抑制的变体

目标检测的评估指标

目标检测器实现练习

章节 4: 图像分割技术

语义分割与实例分割

全卷积网络用于图像分割

编码器-解码器架构：U-Net 和 SegNet

用于图像分割的空洞（Atrous）卷积

DeepLab 系列：空洞空间金字塔池化

实例分割方法 (Mask R-CNN)

分割的评估指标

实践操作：构建语义分割模型

章节 5: 视觉中的注意力机制与Transformer

CNN中的自注意力机制

非局部神经网络

视觉Transformer简介

ViT 架构：图像块、嵌入和 Transformer 编码器

混合CNN-Transformer模型

CNN与Transformer在视觉任务中的比较

在CNN中实现注意力模块的实践

章节 6: 高级迁移学习与域适应

回顾迁移学习策略

微调与特征提取：高级考量

使模型适应不同数据分布

域泛化概述

基于CNN的小样本学习

视觉自监督学习预训练

动手实践：在特定数据集上微调模型

章节 7: 生成对抗网络用于图像合成

GAN 基本原理回顾

训练生成对抗网络的挑战

深度卷积生成对抗网络 (DCGAN)

条件GANs用于可控生成

StyleGAN 架构与基于风格的生成

GAN 的评估指标

图像生成实践中的DCGAN实现

章节 8: 模型压缩与高效深度学习

高效模型的动因

网络剪枝技术

知识蒸馏方法

量化：降低模型精度

设计高效架构

神经网络架构搜索概览

动手实践：应用剪枝与量化

架构设计选择与权衡

这部分内容有帮助吗？

参考文献

Deep Residual Learning for Image Recognition, Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun, 2015 Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) DOI: 10.1109/CVPR.2016.90 - 提出残差学习和跳跃连接，使训练深度神经网络以提高准确性成为可能。
Densely Connected Convolutional Networks, Gao Huang, Zhuang Liu, Laurens van der Maaten, Kilian Q. Weinberger, 2017 Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR) DOI: 10.48550/arXiv.1608.06993 - 提出一种前馈连接所有层的网络，促进特征复用并减少参数数量。
MobileNetV2: Inverted Residuals and Linear Bottlenecks, Mark Sandler, Andrew Howard, Menglong Zhu, Andrey Zhmoginov, Liang-Chieh Chen, 2018 The IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (IEEE) DOI: 10.48550/arXiv.1801.04381 - 描述一种适用于移动和边缘设备的有效架构，通过倒残差结构实现低计算成本和参数数量。
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks, Mingxing Tan, Quoc V. Le, 2019 International Conference on Machine Learning DOI: 10.48550/arXiv.1905.11946 - 提出一种复合缩放方法，统一缩放网络深度、宽度和分辨率，实现更好的准确性和效率平衡。

© 2025 ApX Machine Learning用心打造