AITOP

5月11日

00:21

OpenAI Blog（博客/媒体）

精选85

OpenAI在Dota 2中的成果表明，通过自我对弈和充足算力，系统能在一个月内从匹配高排名玩家进步到击败顶级职业选手。自我对弈系统能自动生成更高质量的训练数据，突破监督学习依赖固定数据集的局限。

AI模型 self-play reinforcement-learning dota-2 superhuman ai-gaming

推荐理由：展示了自我对弈在复杂策略游戏中突破监督学习上限的潜力，对强化学习和AI博弈研究具有重要参考价值。