AITP
精选全部 AI 动态AI 日报Agent 接入关于更新日志信源提报反馈
登录 / 注册
AITOP
全部 AI 动态
AI 相关资讯全量信息流
全部博客资讯推文论文
全部模型产品行业论文技巧
标签:llm×
5月11日
00:21
OpenAI Blog(博客/媒体)
精选80
OpenAI推出gpt-oss-120b和gpt-oss-20b两款开源权重模型,采用Apache 2.0许可。它们在推理任务上超过同级开源模型,具备强工具使用能力,并优化了在消费级硬件上的高效部署。
AI模型open-sourcellmreasoningtool-use

推荐理由:标志着OpenAI首次开源高性能模型,对AI从业者进行低成本推理和工具集成研究有重要参考价值。
00:20
OpenAI Blog(博客/媒体)
70
OpenAI提出一套框架对解码器类生成模型进行定量分析,从神经网络宽度与注意力机制角度探究模型行为。该工作为理解大语言模型的表现规律提供了新的理论基础,并对模型设计与训练优化具有指导意义。
论文llmdecoderquantitative-analysisattentiondeep-learning

推荐理由:为理解大模型内部机制及优化方向提供了严谨的理论框架,直接助力模型开发与实践。