OpenAI Blog(博客/媒体)65OpenAI研究发现,针对一种扰动类型(如L-infinity)训练的对抗鲁棒模型,其鲁棒性可以迁移至其他未训练过的扰动类型(如L2或空间变换)。该发现揭示了对抗训练中鲁棒性泛化的内在机制,为构建更通用的安全AI系统提供了理论基础。论文adversarial-robustnesstransfer-learningmodel-securityopenai推荐理由:理解鲁棒性的跨扰动迁移机制,有助于设计更高效的对抗训练策略,减少对多种攻击类型单独训练的需求。