VOL.2026.05.10·1167 STORIES·AITOP DAILY

AIHOT日报

二〇二六年五月十日 星期日DAILY · 每早八时
01

模型发布/更新

Model Releases
5

OpenAI发布o3和o4-mini:最强全能模型

官方OpenAI Blog

OpenAI推出o3和o4-mini系列,是其迄今最智能、能力最强的模型,具备完整工具调用权限。o3在推理、编程和多任务处理上大幅提升,o4-mini则优化了效率与成本。这标志着AI模型在通用性和实用性上的重大进步。

OpenAI 发布 GPT-5 重大升级

官方OpenAI Blog

GPT-5 是 OpenAI 迄今为止最强大的 AI 系统,在编码、数学、写作、医疗和视觉感知等多个领域实现了前所未有的性能提升。相比前代模型,它代表了智能水平的重大飞跃。

GPT-5首批开发者体验曝光

官方OpenAI Blog

OpenAI邀请顶尖开发者首次试用GPT-5,展示了其在复杂推理、多模态理解和代码生成等方面的显著提升。新模型在处理长上下文和减少幻觉方面取得突破,性能较GPT-4实现代际飞跃。

OpenAI发布GPT-5.2:前沿推理与视觉模型

官方OpenAI Blog

GPT-5.2是OpenAI最新推出的前沿模型,具备更强的推理能力、长上下文理解、编码和视觉功能。该模型已在ChatGPT和API中可用,旨在支持更快、更可靠的智能代理工作流,为日常专业工作提供顶级性能。

GPT-5.2:数学与科学新SOTA

官方OpenAI Blog

OpenAI发布了GPT-5.2,在GPQA Diamond和FrontierMath等基准测试上取得新SOTA,并成功解决一个开放理论问题、生成可靠数学证明。该模型在数学和科学领域展现出突破性能力,将直接推动研究进展。

02

产品发布/更新

Product
5

OpenAI Five首胜Dota2世界冠军

官方OpenAI Blog

OpenAI Five在Dota2 Finals中连续两局击败世界冠军OG,成为首个在电竞游戏中战胜世界冠军的AI。此前AI虽能在私下战胜职业选手,但这是首次在直播中公开击败顶级职业战队,标志着AI在复杂实时策略游戏中的重大突破。

ChatGPT推出应用功能与全新Apps SDK

官方OpenAI Blog

OpenAI宣布在ChatGPT内推出可对话的新一代应用,开发者现可使用预览版Apps SDK开始构建。此举将ChatGPT从单一对话工具扩展为应用平台,显著提升其生态价值。

ChatGPT推出即时购买与代理商务协议

官方OpenAI Blog

OpenAI在ChatGPT中引入代理商务功能,支持用户、AI代理与商家协同完成购物,实现即时结账。该协议为AI驱动的自动化交易奠定基础,标志着从信息交互向行动执行的转变。

OpenAI推出ChatGPT Enterprise企业版

官方OpenAI Blog

OpenAI发布了ChatGPT Enterprise版本,提供企业级安全与隐私保护,以及最强大的ChatGPT功能。该版本针对企业需求优化,包括数据加密、访问控制和合规性支持。此举标志着AI助手正式进入大规模商业应用阶段。

03

行业动态

Industry
5

OpenAI获1100亿美元融资估值7300亿

官方OpenAI Blog

OpenAI宣布获得1100亿美元新投资,估值达7300亿美元。软银、英伟达和亚马逊各投300亿、300亿和500亿美元,彰显AI行业领军企业的资本信心。这笔资金将用于推进通用人工智能(AGI)研发,降低AI使用门槛。

OpenAI、Oracle和软银新增5个星门AI数据中心

官方OpenAI Blog

OpenAI、Oracle和软银联合宣布新增五个星门(Stargate)AI数据中心站点,加速建设5000亿美元、10千兆瓦的基础设施。该项目旨在为下一代AI提供算力支撑,并创造数万个就业机会。

OpenAI 启动星门计划

官方OpenAI Blog

OpenAI 宣布启动 Stargate Project,旨在构建下一代 AI 基础设施,支持 AGI 研发。该项目将整合大规模计算资源与分布式网络,为未来 AI 模型训练与部署提供底层支撑。标志着 AI 产业向超大规模基础设施竞赛迈进。

AI训练算力需求呈指数级增长,每3.4个月翻番

官方OpenAI Blog

OpenAI发布分析报告显示,自2012年以来,最大AI训练任务使用的算力以每3.4个月翻倍的速度增长,远超摩尔定律的2年翻倍周期。该指标已增长超过30万倍,算力进步成为AI突破的关键驱动力,预示着未来系统能力将远超当前水平。

OpenAI重组:非营利主导,股权激励推动AI安全

官方OpenAI Blog

OpenAI宣布将其非营利部门作为核心领导机构,并通过设立公共利益公司(PBC)引入股权结构,从而筹集超1000亿美元资源,专注于开发安全且有益的通用人工智能。此举旨在平衡商业化与使命驱动,确保AI发展造福全人类。

04

论文研究

Research
5

指令跟随对齐技术详解

官方OpenAI Blog

本文介绍了OpenAI如何通过监督学习和强化学习从人类反馈(RLHF)对齐语言模型,使其更好地遵循指令。该方法显著提升了模型在有用性、真实性和无害性上的表现,成为后续GPT系列模型的关键训练范式。

GPT-4内部模式识别突破:提取1600万概念

官方OpenAI Blog

OpenAI利用稀疏自编码器扩展技术,从GPT-4计算中自动识别出1600万个概念模式。该方法揭示了模型内部表征的稀疏性与可解释性,为理解大语言模型决策提供了新工具。这是可解释性研究的关键进展,有助于调试和提升AI安全性。

GPT-5.2 推导出理论物理学新结果

官方OpenAI Blog

最新预印本显示,GPT-5.2 在理论物理学领域提出了一种新胶子振幅公式,随后由OpenAI及学术合作者正式证明并验证。这展示了大型语言模型在高级科学推理中的突破性能力。

弱到强泛化:超对齐新方向

官方OpenAI Blog

OpenAI提出弱到强泛化新研究方向,利用深度学习泛化特性,让弱监督模型控制强模型。初步实验显示该方法在NLP任务上能有效对齐超级智能,为解决AI超对齐问题提供可行路径。

05

技巧与观点

Tips & Takes
5

OpenAI提升指令层次,增强LLM抵御提示注入

官方OpenAI Blog

OpenAI发布IH-Challenge方法,通过训练模型优先处理可信指令,显著提升指令层次和安全性。该技术增强了模型的可控性,有效抵御提示注入攻击,为前沿LLM的安全部署提供关键保障。

🤗 Accelerate利用PyTorch运行超大模型

官方HuggingFace Blog

Hugging Face的Accelerate库利用PyTorch的动态显存管理(通过torch.empty中的文件系统后端)和CPU卸载技术,使得训练和推理超大模型成为可能。该方法将模型张量按需加载到显存或共享内存中,突破了单GPU显存限制。对于需要在有限硬件资源下运行大模型的实践者,此技术提供了高效、低成本的解决方案。

PyTorch FSDP加速大模型训练实战

官方HuggingFace Blog

本文详细介绍了PyTorch的完全分片数据并行(FSDP)技术,通过将模型参数、梯度和优化器状态分片到多个GPU上,显著降低了显存占用,使得大模型的训练和微调更加高效。文章涵盖了FSDP的分片策略、混合精度训练、激活检查点等实用技巧,帮助开发者轻松扩展模型规模。

用LoRA高效微调Stable Diffusion

官方HuggingFace Blog

本文详细介绍了如何使用LoRA(低秩适配)技术对Stable Diffusion模型进行高效微调。LoRA通过冻结原模型并引入少量可训练参数,大幅降低了显存需求和训练时间,同时保持了生成质量。这种方法使得在消费级显卡上进行个性化图像生成成为可能。

用🤗 Transformers微调ViT图像分类

官方HuggingFace Blog

本文详细介绍如何使用Hugging Face Transformers库对Vision Transformer(ViT)模型进行图像分类任务的微调。涵盖数据准备、模型加载、训练流程及推理,为计算机视觉从业者提供开箱即用的解决方案。

1167
今日事件
1167
一手报道
171
新模型
2
信源
AITOP · 编辑系统自动生成