AITOP

5月15日

11:06

arXiv cs.AI@Renning Pang, Tian Lan, Leyuan Liu, Xiaoming Huang, Piao Tong, Xiaosong Zhang

精选58

多轮对话系统在处理长距离依赖时容易丢失关键信息，导致回答不一致。现有方法要么依赖高延迟的外部记忆，要么通过迭代摘要丢失细节。本文提出Self-Recall Thinking (SRT)框架，让模型在推理时自主识别并召回历史有用轮次，生成更一致的回复。SRT包含依赖构建、能力初始化和推理优化三个阶段，通过可验证奖励优化召回和推理。实验表明，SRT在多个数据集上F1提升4.7%，端到端延迟降低14.7%，在推理延迟和准确性间取得更好平衡。

论文多轮对话一致性长距离依赖推理优化 Self-Recall Thinking

推荐理由：做对话系统或客服机器人的团队，SRT解决了长对话中信息稀疏和一致性差的痛点，无需外部模块就能提升效果，值得在长上下文场景中试试。

5月14日

15:02

xiaomimimo@XiaomiMiMo

41

小米MiMo团队发布警告，使用思考模式进行多轮智能体对话时，若历史记录包含工具调用，后续用户回合必须保留完整推理内容字段，否则API会返回400错误。缺失推理内容会导致上下文不完整，降低指令遵循能力、增加幻觉并影响用户体验。受影响的框架包括TRAE、Cursor、Roo Code、Codex、GitHub Copilot CLI、Zed和AutoGen，团队正与维护者合作推动兼容更新。涉及模型包括MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-Flash。

AI产品小米MiMo API变更智能体多轮对话推理内容

推荐理由：这个API变更直接影响使用小米MiMo模型的智能体开发者，尤其是多轮对话场景。如果你在用TRAE、Cursor等框架集成MiMo，建议立即检查代码，避免因缺失推理内容导致400错误和体验降级。