AITOP

5月11日

00:24

OpenAI Blog（博客/媒体）

65

OpenAI研究发现，针对一种扰动类型（如L-infinity）训练的对抗鲁棒模型，其鲁棒性可以迁移至其他未训练过的扰动类型（如L2或空间变换）。该发现揭示了对抗训练中鲁棒性泛化的内在机制，为构建更通用的安全AI系统提供了理论基础。

论文 adversarial-robustness transfer-learning model-security openai

推荐理由：理解鲁棒性的跨扰动迁移机制，有助于设计更高效的对抗训练策略，减少对多种攻击类型单独训练的需求。