arXiv cs.AI@Tyler Alvarez, Ali Baheri精选55该论文提出了一种新的幻觉检测方法,将多步推理中的幻觉视为隐藏状态轨迹的几何特性,而非传统对整个输出打分。作者通过对比PCA构建标签条件教师模型,提取七个几何过渡特征,并蒸馏出BiLSTM学生模型,仅需单次前向传播即可定位首个错误步骤。在ProcessBench、PRM800K等基准测试中,该方法优于基于熵、探针和注意力的基线,教师模型跨语言模型和数据集稳定迁移,但学生模型在分布偏移下失效。研究将步骤级幻觉检测重新定义为轨迹动力学问题,并指出分布偏移下保持对比传输裕度是部署的关键障碍。论文幻觉检测推理模型隐藏状态轨迹对比PCA分布偏移推荐理由:这篇论文把幻觉检测从“整体打分”推进到“单步定位”,做推理模型调试和可解释性研究的团队值得关注——它用几何视角揭示了错误发生的精确位置,比传统方法更细粒度。
arXiv cs.LG(学术论文)60论文提出STEPS方法,解决时序预测在分布偏移下测试时自适应(TTA)中的弱可识别性、误差累积和不稳定长时修正问题。该方法将TTA重新定义为时间流形上的狄利克雷边界值问题,利用局部求解器传播前缀误差的时序平滑性,全局求解器获取跨窗口误差记忆,并通过时空流形融合(SMF)整合两者进行最终矫正。在六个标准基准和四个冻结骨干网络上,STEPS相比零样本骨干平均相对MSE降低26.82%,超过最强TTA基线12.77%。额外稀疏前缀和污染测试验证了该方法在有限和噪声前缀下的鲁棒性。论文时序预测测试时自适应分布偏移流形学习推荐理由:该工作首次将时序预测TTA严格建模为微分方程问题,提供了理论清晰的优化视角,并在稀疏噪声数据下表现显著优于现有方法,对实际部署中的低质量观测场景具有重要参考价值。