arXiv cs.LG@Zhuohang Li, Liqun Huang, Wei Xu, Zhengming Zhu, Nie Lin, Xiao Ma, Xinjun Sheng, Ruoshi Wen精选58Vision-Language-Action (VLA) 模型在灵巧操作中容易因高维动作空间和接触丰富的动力学产生累积误差。现有交互式模仿学习(IIL)在接管时存在人机指令不匹配,导致机器人手部“手势跳跃”。Hand-in-the-Loop (HandITL) 提出一种无缝干预方法,将人类纠正意图与自主策略执行融合,避免手势跳跃。实验表明,相比直接遥操作接管,HandITL 减少接管抖动 99.8%,降低抓取失败率 87.5%,平均完成时间缩短 19.1%。在三个长时灵巧任务上,用 HandITL 收集的干预数据训练的策略平均性能提升 19%。论文灵巧操作VLA模型人机交互干预学习机器人推荐理由:灵巧操作是机器人领域的硬骨头,HandITL 解决了人机干预时的“手势跳跃”痛点,做机器人操作或 VLA 模型微调的团队可以直接参考实验方法,减少训练数据收集中的噪声。
Google DeepMind@GoogleDeepMind58Google DeepMind 正在用 AI 重新设计鼠标指针这一经典界面,通过结合运动、语音和自然简写,让用户更直观地指挥 Gemini 完成屏幕操作。实验性演示展示了如何通过手势、说话或简单指令直接与 AI 交互,从而提升操作效率。这一创新有望改变人机交互方式,让计算机更智能地理解用户意图。AI产品人机交互GeminiGoogle DeepMindAI 助手界面创新推荐理由:鼠标指针 50 年没变过,DeepMind 这次用 AI 把它变成了智能助手——做交互设计或产品经理的值得关注,看完会重新思考「点击」这件事。
Demis Hassabis@demishassabis40Google 团队展示了一项创新工作,将传统鼠标指针改造为具备智能的交互工具。该原型已在 Google AI Studio 中提供试用,用户可以直接体验这种“魔法般”的交互方式。这项技术可能改变人机交互的基本范式,让鼠标不再只是被动点击工具,而是能主动理解用户意图。目前尚不清楚具体实现细节,但演示效果令人印象深刻。AI产品智能交互鼠标指针Google AI Studio人机交互原型推荐理由:鼠标指针变智能,这是人机交互的一次有趣尝试,做 UI/UX 或交互设计的开发者值得点开看看,直接在 Google AI Studio 就能试。