AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:VLA×
5月14日
11:23
IT之家(博客/媒体)
65
小米发布并开源了 Xiaomi OneVL,一个一步式潜空间语言视觉推理框架。雷军称,该模型在业内率先通过潜空间推理将 VLA(视觉语言动作模型)和世界模型统一到同一框架中。在推理和规划等主流基准上,Xiaomi OneVL 全面刷新了潜在推理方法的性能上限。该模型在精度上超越显式 CoT,速度上对齐“仅答案”预测的潜空间 CoT 方案。小米已将模型权重和训练、推理代码全面开源,邀请全球开发者探索自动驾驶大模型的可能性。
AI模型自动驾驶Xiaomi OneVLVLA世界模型潜空间推理

推荐理由:小米把 VLA 和世界模型统一到一套框架,解决了自动驾驶多模型协同的痛点,做自动驾驶或具身智能的开发者可以直接用开源代码试试,性能还刷新了基准。
5月13日
17:17
IT之家(博客/媒体)
精选70
小米技术发布并开源了 Xiaomi OneVL 一步式潜空间语言视觉推理框架,首次将 VLA(视觉语言动作)与世界模型统一到同一框架中。该模型在多个自动驾驶基准上刷新了潜在推理方法的性能上限,同时提供语言和视觉双维度的可解释性。相比传统方法,OneVL 在精度上超越显式 CoT,在速度上对齐“仅答案”预测。小米已将模型权重、训练和推理代码全面开源。
AI模型自动驾驶VLA世界模型开源/仓库小米

推荐理由:自动驾驶研究者终于有了一个统一 VLA 与世界模型的开源方案——OneVL 在精度和速度上均优于现有方法,做端到端驾驶或世界模型开发的团队可以直接拿来用。