OpenAI Blog(博客/媒体)65OpenAI发现,在强化学习算法参数中添加自适应噪声能显著提升性能。该方法实现简单且极少降低性能,适用于各类强化学习问题,为探索策略提供了高效新思路。技巧reinforcement-learningexplorationparameter-noiseopenai推荐理由:此方法实现简单且效果稳定,可即插即用于现有强化学习系统,大幅减少调参成本。