AITOP

5月13日

21:35

Anthropic: Transformer Circuits（资讯）

60

Gurnee 等人 2025 年的研究揭示了语言模型在计数任务中背后的几何机制。他们发现模型内部存在一种流形结构，用于表示和操作数字信息。这项研究通过分析模型在特定任务中的内部表示，展示了模型如何通过几何变换来执行计数。这为理解语言模型的内部工作原理提供了新的视角，有助于开发更可解释的 AI 系统。

论文语言模型几何结构计数任务可解释性内部机制

推荐理由：对理解大模型内部机制的研究者来说，这篇论文揭示了计数任务背后的几何结构，值得深入阅读。