AlphaSignal@AlphaSignalAI70Hugging Face 开源了一个 CLI 智能体,能自动执行机器学习工程师的完整研究循环:从阅读论文、追踪引用,到拉取数据集、编写训练脚本,再到启动 GPU 任务并迭代优化。在科学推理任务中,它训练 Qwen3-1.7B 将 GPQA 得分从 10% 提升至 32%,超越 Claude Code 的 22.99%。在医疗领域,它因公开数据集质量不足,自动生成 1100 个合成样本并上采样 50 倍,在 HealthBench 上比 Codex 高出 60%。该智能体还具备自主诊断失败评估、恢复训练的能力,以 CLI 和 Web 应用形式提供,甚至可在手机上运行。AI产品Hugging FaceCLI 智能体开源/仓库自动化研究模型训练推荐理由:Hugging Face 这个开源智能体把 ML 研究全流程自动化了,做实验的团队可以直接用它跑论文复现和模型训练,省掉大量手动调参和写脚本的时间。
Anthropic: Research(资讯)70Anthropic 发布了一项新研究,提出利用大型语言模型(LLM)作为自动化对齐研究者,以解决 AI 对齐中的可扩展监督问题。该方法通过让 LLM 自动生成和测试对齐假设,减少对人类研究者的依赖,从而加速对齐研究进程。实验表明,自动化对齐研究者能够发现一些人类可能忽略的漏洞,并生成有效的对齐策略。这项研究为未来更安全的 AI 系统开发提供了新思路,尤其适用于需要大规模监督的复杂场景。论文AnthropicAI 对齐可扩展监督自动化研究LLM推荐理由:Anthropic 用 LLM 自动化对齐研究,解决了可扩展监督的人力瓶颈,做 AI 安全和对齐的团队值得关注,可以直接参考其方法加速自己的研究。