所有课程

高级对抗性机器学习

章节 1: 对抗性机器学习安全的基本原理

机器学习安全弱点概述

机器学习中的威胁模型

攻击面：训练与推理

对抗样本的数学表述

对抗性攻击的分类体系

防御策略概览

章节 2: 进阶规避攻击

基于梯度的攻击：FGSM、BIM、PGD分析

基于优化的攻击：Carlini & Wagner 方法

基于评分的攻击技术

基于判定的攻击方法

对抗样本的可迁移性

攻击集成模型

实现规避攻击：动手实践

章节 3: 数据投毒和后门攻击

投毒攻击策略：可用性与完整性

定向数据投毒技术

后门攻击机制与触发器设计

干净标签投毒攻击

分析投毒对模型训练的影响

构建数据投毒攻击：动手实践

章节 4: 模型推断与隐私攻击

成员推断攻击：理论与方法

属性推断技术

模型反演与重建攻击

模型窃取：功能提取方法

与差分隐私的关联

成员身份推断的实际操作

章节 5: 强大的防御机制

对抗训练：原理与变体

可认证防御：随机平滑

输入转换防御

梯度遮蔽与模糊问题

应对投毒和后门攻击

对抗训练的实现：动手操作

章节 6: 评估模型抗攻击能力

对抗鲁棒性的衡量指标

基准测试工具与框架

自适应攻击：正确评估防御措施

不同威胁模型下的安全评估

解释鲁棒性评估结果

设置鲁棒性基准：实践操作

章节 7: 对抗样本在特定应用场景

针对计算机视觉模型的对抗性攻击

为NLP模型生成对抗性文本

对强化学习智能体的攻击

物理对抗性攻击

特定应用场景的攻击考量

生成对抗性文本：实践

基于判定的攻击方法

这部分内容有帮助吗？

参考文献

Decision-Based Adversarial Attacks: Reliable Attacks on Black-Box Machine Learning Models, Wieland Brendel, Jonas Rauber, Matthias Bethge, 2018 Sixth International Conference on Learning Representations (ICLR 2018) DOI: 10.48550/arXiv.1712.04248 - 这篇开创性论文介绍了边界攻击，一种用于硬标签黑盒对抗性示例的基础性基于决策的方法。
HopSkipJumpAttack: A Query-Efficient Decision-Based Attack, Pinyu Chen, Huan Zhang, Yuan Sinha, Ruoxi Jia, Gauthier Gidel, and Cho-Jui Hsieh, 2019 Advances in Neural Information Processing Systems (NeurIPS), Vol. 32 (Curran Associates, Inc.) DOI: 10.48550/arXiv.1904.02144 - 介绍了HopSkipJumpAttack，这是一种改进的、查询高效的基于决策的攻击，它建立在边界探索技术之上。
Sign-OPT: A Query-Efficient Hard-label Adversarial Attack, Minhao Cheng, Simranjit Singh, Shiyu Chang, Jonghyun Choi, Pengtao Xie, Anna Choromanska, and Ahmed Elgammal, 2019 International Conference on Learning Representations (ICLR) DOI: 10.48550/arXiv.1909.04018 - 提出了Sign-OPT，另一种查询高效的硬标签对抗性攻击，它通过估计梯度符号来指导其搜索。
A Survey on Black-Box Adversarial Attacks and Defenses, Xiaofei Wang, Pengfei Li, Jianxin Li, Jun Liu, Bo Li, and Yu-Gang Jiang, 2021 IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 43 (IEEE) DOI: 10.1109/TPAMI.2020.3039148 - 全面概述了黑盒对抗性攻击和防御，为本节讨论的基于决策的方法提供了背景。

© 2025 ApX Machine Learning用心打造