AITOP

5月11日

00:16

OpenAI Blog（博客/媒体）

精选85

OpenAI与DeepMind合作开发了一种算法，通过比较两种行为的好坏来推断人类期望的目标。该方法避免了手动编写复杂目标函数可能导致的危险行为，为构建更安全的AI系统提供了关键思路。

论文 ai-safety reinforcement-learning human-preferences alignment

推荐理由：该方法解决了AI对齐中的核心难题——如何让AI理解人类真实意图，对构建可控AI系统具有里程碑意义。