AITOP

5月11日

11:44

arXiv cs.AI（学术论文）

65

这项研究通过fMRI记录人类学习新视频游戏时的脑活动，对比了前沿推理模型（LRMs）与深度强化学习代理及贝叶斯理论模型。研究发现LRMs不仅在游戏表现上最接近人类，还能以数量级优势预测人脑活动，且这种对齐主要源于模型对游戏状态的上下文表示而非下游推理。实验证明了LRMs作为复杂环境中人类学习与决策的计算模型的潜力。

论文推理模型行为对齐脑活动预测强化学习游戏学习

推荐理由：该研究首次系统比较了前沿推理模型与强化学习在行为与脑活动对齐上的差异，为理解AI与人类认知机制的一致性提供了重要证据，对认知科学和AI体设计有参考价值。