arXiv cs.AI@Renning Pang, Tian Lan, Leyuan Liu, Xiaoming Huang, Piao Tong, Xiaosong Zhang精选58多轮对话系统在处理长距离依赖时容易丢失关键信息,导致回答不一致。现有方法要么依赖高延迟的外部记忆,要么通过迭代摘要丢失细节。本文提出Self-Recall Thinking (SRT)框架,让模型在推理时自主识别并召回历史有用轮次,生成更一致的回复。SRT包含依赖构建、能力初始化和推理优化三个阶段,通过可验证奖励优化召回和推理。实验表明,SRT在多个数据集上F1提升4.7%,端到端延迟降低14.7%,在推理延迟和准确性间取得更好平衡。论文多轮对话一致性长距离依赖推理优化Self-Recall Thinking推荐理由:做对话系统或客服机器人的团队,SRT解决了长对话中信息稀疏和一致性差的痛点,无需外部模块就能提升效果,值得在长上下文场景中试试。
xiaomimimo@XiaomiMiMo41小米MiMo团队发布警告,使用思考模式进行多轮智能体对话时,若历史记录包含工具调用,后续用户回合必须保留完整推理内容字段,否则API会返回400错误。缺失推理内容会导致上下文不完整,降低指令遵循能力、增加幻觉并影响用户体验。受影响的框架包括TRAE、Cursor、Roo Code、Codex、GitHub Copilot CLI、Zed和AutoGen,团队正与维护者合作推动兼容更新。涉及模型包括MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-Flash。AI产品小米MiMoAPI变更智能体多轮对话推理内容推荐理由:这个API变更直接影响使用小米MiMo模型的智能体开发者,尤其是多轮对话场景。如果你在用TRAE、Cursor等框架集成MiMo,建议立即检查代码,避免因缺失推理内容导致400错误和体验降级。