arXiv cs.AI@Mannam Veera Narayana, Rohit Singh, Deepa M. R, Radha Krishna Ganti精选45该研究发布了一个从商用5G网络收集的真实数据集,涵盖步行、自行车、汽车、公交和火车等多种移动模式及不同速度。数据集聚焦切换场景,包含定时提前测量等关键信号事件,旨在减少切换中断时间并维持连续吞吐量。现有研究多依赖仿真数据,无法反映真实部署行为,该数据集填补了这一空白。论文详细描述了数据采集设置、提取过程,并进行了探索性分析,特别关注移动性、波束管理和定时提前。该数据集可用于训练和评估AI/ML模型,例如定时提前预测,为6G原生AI移动性研究提供基础。论文6G5GAI/ML移动性数据集推荐理由:做6G/5G移动性优化或AI-Native网络研究的团队,终于有了真实部署数据来训练模型,比仿真数据靠谱得多,建议直接下载使用。
Clement Delangue@ClementDelangue70Hugging Face宣布其平台上公开数据集数量突破100万,总数据量达到PB级别,每天有数百万AI开发者下载、分析和训练模型。值得注意的是,自智能体技术成熟以来,数据集增速显著加快,过去8个月新增50万个数据集,而达到首个50万耗时4年。业界普遍认为,更好的数据是让更多人自主构建AI而非依赖API的下一个关键瓶颈。行业数据集开源/仓库Hugging Face智能体推荐理由:这一里程碑表明高质量数据的获取和分享正在变得更加高效,对AI模型训练和开源生态的持续发展具有积极意义。
arXiv cs.AI@Ishpuneet Singh, Gursmeep Kaur, Uday Pratap Singh Atwal, Guramrit Singh, Gurjot Singh, Maninder Singh45本文发布了BEACON(Behavioral Engine for Authentication & Continuous Monitoring),一个大型多模态行为数据集,包含28名玩家79次《Valorant》游戏会话的430GB同步数据,涵盖鼠标动力学、键盘事件、网络包、屏幕录制、硬件元数据和游戏配置。该数据集旨在填补现有行为认证基准在规模、模态和上下文同步方面的不足,适用于连续认证、行为画像、用户漂移和多模态表示学习研究。数据集和代码已在Hugging Face和GitHub上开源,为下一代行为指纹和网络安全模型提供可复现的基准。论文多模态行为认证数据集AI安全推荐理由:该数据集以高精度、高认知负担的战术射击游戏为测试场景,为行为生物特征研究提供了真实且严苛的基准,对AI安全和连续认证领域具有重要参考价值。
Clement Delangue@ClementDelangue30Hugging Face CEO Clement Delangue发推宣布UFO数据集已通过MTSlive上传至Hugging Face平台。该数据集包含UFO相关图像,旨在推动计算机视觉模型训练。此举动可能激发开发者利用公开数据集进行异常目标检测等CV任务,扩展AI在非传统领域的研究边界。目前尚未有公开训练结果,但已引发社区关注。AI产品数据集计算机视觉Hugging FaceUFO推荐理由:UFO数据集作为非传统视觉数据资源,为CV研究者提供了探索异常检测、低置信度场景的新材料,有助于推动AI在开放世界感知中的鲁棒性研究。