AITOP

5月15日

09:54

arXiv cs.AI@Paolo Mandica, Michał Brzozowski, Zuzanna Dubanowska, Neo Christopher Chung

精选58

GPart 提出一种全新的参数高效微调方法，通过全局等距分区矩阵直接将低维可训练向量映射到模型全权重空间，完全去除了低秩瓶颈。与 LoRA 等现有方法不同，GPart 保持了映射的距离保持性（等距性），避免了优化景观扭曲问题。该方法仅需一个随机投影、一个超参数（维度 d）和 d+1 个存储值（向量加随机种子），极其简洁高效。实验表明，GPart 在自然语言理解、计算机视觉和数学推理任务上达到或超越现有 PEFT 方法的性能。这项工作为参数高效微调提供了更优雅的理论基础和实践路径。

论文参数高效微调 LoRA 等距映射 GPart 大模型

推荐理由：GPart 用极简设计解决了 LoRA 等方法的优化扭曲问题，做模型微调的研究者和工程师可以直接参考其理论框架，尤其适合追求极致参数效率的团队。

5月13日

13:05

IT之家（博客/媒体）

精选70

面壁智能联合清华大学及 OpenBMB 开源社区发布 MiniCPM-V 4.6，参数规模 1.3B，仅需约 6GB 内存即可在端侧流畅运行。该模型在 Artificial Analysis 评测中以 13 分超越 Ministral 3 3B，整体能力接近 Qwen3.5-2B 级别。效率方面，基于 vLLM 框架的 Token 吞吐量是 Qwen3.5-0.8B 的 1.5 倍，计算 Token 消耗仅为后者的 2.5%。技术创新包括 LLaMA-UHD v4 架构，将图像编码计算量降低 55.8%，处理 3132×3132 高清图首字延迟仅 75.7 毫秒。模型已全面开源，支持 iOS、Android 和 HarmonyOS 等系统。

AI模型大模型多模态开源/仓库 MiniCPM-V 面壁智能

推荐理由：1.3B模型6G内存就能跑

10:14

IT之家（博客/媒体）

精选50

苹果发布 Xcode 26.5，增强智能体编程能力。新功能包括编程智能体消息队列，允许开发者连续发送多条消息而无需等待回复，提升协作流畅度。智能体现在可以在任务描述不完整时主动提出澄清问题，避免执行偏差。此外，更新还支持新的 StoreKit Testing 计费方案。

AI产品编程助手 Agent 大模型 Xcode 苹果

推荐理由：Xcode 26.5 通过消息队列和主动澄清机制，显著提升 AI 编程智能体的交互效率和准确性，对使用苹果生态的开发者有实际帮助。