IT之家(博客/媒体)精选63高德宣布推出华为鸿蒙HarmonyOS首个生成式UI开源框架AGenUI,基于谷歌A2UI协议,以C++为核心,能将AI大模型生成的界面意图直接转化为鸿蒙原生组件渲染。该框架只需一套通用界面协议即可无缝适配鸿蒙手机、平板、车机、智慧屏、穿戴等多种终端设备,无需单独适配调试。性能上,鸿蒙版AGenUI相较iOS、Android端渲染性能提升20%,内存占用降低18%。目前该项目已在GitHub全面开源,面向开发者和学术界。AI产品生成式UI鸿蒙/HarmonyOS开源/仓库多终端适配AGenUI推荐理由:鸿蒙开发者终于有了原生生成式UI框架,一套协议搞定多终端适配,省去大量重复调试工作,做鸿蒙应用或AI界面的团队值得直接上手试试。
IT之家(博客/媒体)精选63三星电子正在研发下一代HBM技术,旨在提升移动设备端侧AI性能。该技术采用多层堆叠FOWLP方案,通过改进VCS铜柱结构(从3:1~5:1提升至15:1~20:1)和FOWLP补强,解决传统LPDDR带宽和散热瓶颈。理论带宽可提升15-30%,并支持更多I/O接口。业内预计该技术最快在Exynos 2800后期或Exynos 2900中集成。AI产品三星HBM端侧AI移动设备FOWLP推荐理由:端侧AI手机的性能瓶颈即将被打破,关注移动端AI落地的开发者可以提前了解三星的技术路线,看看未来手机能跑多强的模型。
IT之家(博客/媒体)精选63微软明确押注 WinUI 3 以改善 Windows 11 长期被批评的卡顿、臃肿问题。通过优化 WinUI 框架,文件资源管理器启动过程中的内存分配次数减少 41%,临时内存分配减少 63%,WinUI 代码执行时间降低 25%。微软还将开始菜单从基于 React 的网页组件转向纯原生 WinUI 3 代码,并发布开源 dotnet new 项目模板,支持命令行创建原生应用。此外,微软推出 WinUI 智能体插件,可接入 GitHub Copilot、Claude Code 等 AI 助手,辅助开发者生成代码和修复错误。部分优化目前需选择加入,未来将在 WinAppSDK 3.0 或 4.0 中默认启用。AI产品WinUI 3Windows 11原生开发AI 智能体性能优化推荐理由:WinUI 3 的优化直接解决了 Win11 卡顿和内存占用高的痛点,Windows 原生应用开发者可以借此提升应用性能,建议关注新模板和 AI 插件,降低开发门槛。
shao__meng@shao__meng精选73xAI 推出了 Grok Build CLI (beta),这是一个面向编码、应用构建和工作流自动化的 Agentic CLI 工具。目前仅向 SuperGrok Heavy 订阅用户开放,xAI 希望通过用户反馈迭代模型和产品。该工具具备快速终端渲染、计划视图、子智能体并行执行、技能装载、插件市场以及主动澄清等能力。底层模型为 grok-code-fast-1,在 SWE-Bench Verified 上达到 70.8%,上下文窗口为 256K。AI产品CLI工具智能体编码助手工作流自动化Grok推荐理由:Grok Build CLI 的 Plan 视图和子智能体并行能力解决了复杂任务的可视化与执行效率问题,做自动化工作流或编码的开发者可以直接体验,尤其适合需要多智能体协作的团队。
Claude Code: GitHub Releases@ashwin-ant精选37Anthropic 发布了 Claude Code v2.1.142,主要新增了多个 claude agents 配置标志,包括 --add-dir、--settings、--mcp-config 等,方便自定义后台会话。快速模式默认升级为 Opus 4.7(原 Opus 4.6),可通过环境变量回退。修复了 MCP 工具超时、macOS 休眠后代理消失、Windows 网络驱动器死锁等关键问题,并改进了插件展示和会话标题生成逻辑。AI产品Claude Code代理/AgentMCP/工具修复/优化Anthropic推荐理由:这次更新对使用 Claude Code 做自动化任务的开发者很关键——修复了 macOS 休眠后代理丢失和 MCP 超时硬限制,后台工作流更稳定了。建议升级后重点测试后台代理和 MCP 工具调用。
berryxia@berryxia精选72Prime Intellect 让 Claude Code(Opus 4.5)和 Codex(GPT 5.5)在 nanoGPT speedrun 的 optimizer track 上完全自主运行,使用闲置算力完成约 1 万次实验,消耗 1.4 万 H200 小时。Claude Code 将记录推进到 2930 steps,超越人类基准的 2990 steps,整个过程无人值守。实验在 optimizer 搜索、超参数扫描和方法 stacking 上高效,但在真正创新上遇到瓶颈。Prime Intellect 已开源所有 scratchpad、运行日志、配置和生成的 idea,将 AI 研究自动化从概念变为可复现的现实。AI产品AI研究自动化Claude CodeCodex开源/仓库智能体推荐理由:AI 研究自动化从概念走向可复现现实,做 AI 研究的团队可以直接参考这套开源实验记录,省下大量试错成本。
shao__meng@shao__meng精选73Cline 团队发布了 Cline SDK,同时推出基于 SDK 的 Cline CLI 和 Skills。Cline 是最早的 Agentic Coding 工具之一,此前以 IDE 插件形式存在,技术实力强,工程团队多人曾加入 Codex。最新 Cline CLI 在 Terminal-Bench 2.0 上多项第一,超越 Claude Code、Codex 和 Droid 等 Agent。Cline 2.0 重写了 prompts、简化 loop、收紧上下文管理、改进反馈与错误处理,并重新设计工具暴露方式。在开源权重模型上领先更明显,如 kimi-k2.6 达 55.1% vs OpenCode 37.1%。新能力包括 Plugin 层、Provider 开放性、原生 Agent Teams、开箱即用的 CRON/checkpointing/Web search/MCP connector,以及实验性的 CLI Connectors 可接入 Telegram/WhatsApp/Slack。AI产品Agentic CodingClineCLISDKTerminal-Bench推荐理由:Cline SDK 和 CLI 的发布让 Agentic Coding 工具链更开放灵活,做 AI 编程工具或 Agent 开发的团队可以直接用 Plugin 层和 Provider 扩展,值得关注其 Terminal-Bench 成绩和 Harness 实践。
AlphaSignal@AlphaSignalAI精选73CodeGraph 是一个开源的 MCP 服务器,通过预索引代码库为本地知识图谱,让 AI 代理直接查询图谱而非扫描文件,从而大幅减少工具调用。在六个真实项目测试中,平均减少 92% 工具调用,探索速度提升 71%,在 TypeScript 和 Java 代码库上分别减少 94% 和 96% 的调用。它基于 Tree-sitter 解析语法树,使用 SQLite 存储符号和调用关系,支持 19 种以上语言,完全本地运行,无需 API 密钥。只需一条 npx 命令即可设置,文件监视器可保持图谱实时更新。AI产品Claude CodeMCP/工具开源/仓库代码探索知识图谱推荐理由:对于频繁使用 Claude Code 进行代码库探索的开发者,CodeGraph 能显著降低 token 消耗和等待时间,实测效果惊人,值得立即尝试。
IT之家(博客/媒体)精选63腾讯云正式开源 TencentDB Agent Memory,面向 Agent 长任务场景提供短期记忆压缩与长期个性化记忆能力。该方案通过“上下文卸载”和 Mermaid 任务画布技术,将完整信息卸载到外部存储,同时以结构化任务图保留关键状态,使 Agent 在长任务中保持轻量上下文。在多任务连续 Session 实验中,最高降低 61% Token 消耗,并提升任务成功率。项目已适配 OpenClaw 和 Hermes 等主流 Agent 框架,支持一键集成,默认使用本地 SQLite 存储,零外部依赖。AI产品腾讯Agent Memory开源/仓库上下文压缩长任务推荐理由:做 Agent 长任务开发的团队终于有了省 Token 又保精度的开源方案——上下文卸载加任务画布让 Token 消耗降 61% 的同时成功率还上升,建议直接集成试试。
Jeff Dean@JeffDean精选47Google Translate 迎来20周年,Jeff Dean 回顾了其关键里程碑:2006年首次部署基于5-gram语言模型的系统,使用了万亿词级训练数据,是早期大语言模型实践;2016年转向深度神经网络,结合序列到序列模型和自研TPU,推理性能提升30-80倍,延迟降低15-30倍,使服务可覆盖数亿用户;近期又借助Gemini模型进一步优化。这些技术迭代持续提升了翻译质量和全球连接性。AI产品Google Translate机器翻译大语言模型TPU序列到序列推荐理由:Jeff Dean 亲自梳理了 Google Translate 从统计方法到神经网络的两次关键跃迁,做 NLP/翻译系统的开发者能从中看到技术选型的真实演进逻辑,值得一读。
Andrej Karpathy@karpathy精选53Karpathy 在推文中推荐了 Farzapedia,一个基于个人维基百科的 AI 记忆系统。与主流 AI 的隐式记忆不同,Farzapedia 将用户数据以显式、可浏览的 Markdown 和图片文件形式存储在本地,用户可完全掌控。它支持 BYOAI(自带 AI),可接入 Claude、Codex 等任意模型,甚至可微调开源模型。Karpathy 认为这种“文件优先”的个性化方式让用户拥有数据主权,并强调掌握 AI 代理是 21 世纪核心技能。AI产品个性化数据主权文件优先BYOAIKarpathy推荐理由:Karpathy 把 AI 个性化的痛点说透了——Farzapedia 让用户掌控数据而非被 AI 公司锁定,适合注重隐私和自主性的开发者直接尝试。
Cursor@cursor_ai精选55Cursor 宣布从今天起,用户可以在完全配置的开发环境中运行云智能体。这些环境可以像为工程师配置笔记本电脑一样设置:克隆仓库、安装依赖和工具链凭证。这一功能让智能体能够直接访问项目所需的完整上下文,从而更高效地执行代码编写、调试和部署等任务。对于使用 Cursor 进行协作开发的团队来说,这显著降低了环境配置的复杂度,提升了自动化工作流的可靠性。AI产品Cursor云智能体开发环境自动化编程助手推荐理由:Cursor 把云智能体跑在完整开发环境里,解决了智能体因环境缺失而频繁报错的问题。用 Cursor 做自动化开发的团队,可以直接省掉手动配环境的步骤,建议试试。
shao__meng@shao__meng精选55LandingAI 发布了一个名为“解析前”的页面级分类 API,能在昂贵的文档解析之前对 PDF 逐页打标签。它解决企业文档混杂的问题:如 50 页房贷 PDF 中混有工资单、银行流水等,直接解析会浪费算力并导致抽取幻觉。API 支持自定义类别列表、并发逐页评估、返回标签及推理说明,还能处理未知页面并建议类别。企业可根据标签丢弃无关页或分流到不同流水线,调用方式为简单的 curl POST 请求。AI产品文档解析页面分类APILandingAI企业AI推荐理由:做文档处理或企业 RAG 的团队,终于有个低成本方案在解析前先做“分诊”,避免为噪音付 OCR 和 LLM 的冤枉钱,值得直接试。
shao__meng@shao__meng精选70OpenAI Codex 团队为了解决 Windows 上缺乏类似 macOS Seatbelt 或 Linux seccomp 的进程级沙箱能力,经历了两轮方案迭代。最初尝试免提权沙箱,通过合成 SID 和 Write-Restricted Token 实现文件写入限制,但网络限制只能靠环境变量软封锁,无法对抗恶意代码。最终不得不接受提权方案,引入两个本地沙箱用户和防火墙规则,并设计四层架构(codex.exe、setup、runner、子进程)来安全执行受限命令。该方案已落地,为 Windows 上的 Codex 用户提供了与 macOS/Linux 一致的默认安全体验。AI产品CodexWindows 沙箱安全隔离AI 编程助手OpenAI推荐理由:Windows 开发者终于有了正经的本地 AI 编程沙箱——Codex 团队用四层架构解决了 OS 级隔离难题,做安全或工具链的值得点开学习设计思路。
Anthropic: Engineering(资讯)精选60Anthropic 发布了一篇关于 AI 智能体上下文工程的技术文章,详细介绍了如何通过精心设计系统提示、用户消息和工具定义来提升智能体的表现。文章提出了上下文工程的核心原则,包括明确角色、提供示例、分解任务、控制输出格式等。这些方法能显著减少智能体的幻觉和错误,提高任务完成率。对于正在构建或优化 AI 智能体的开发者来说,这是一份实用的操作手册。AI产品智能体上下文工程Anthropic提示词工程开发者指南推荐理由:做 AI 智能体的开发者终于有了系统性的上下文设计方法论——Anthropic 把工程经验总结成了可复用的原则,直接照着改 prompt 就能看到效果提升,建议点开收藏。
Anthropic: Engineering(资讯)精选50Anthropic 发布了一篇工程博客,详细介绍了如何利用 MCP(Model Context Protocol)实现代码执行,从而构建更高效的 AI 智能体。该方法允许模型在沙箱环境中安全地运行代码,并获取执行结果,显著提升了智能体在编程、数据分析等任务中的自主性和准确性。文章还讨论了 MCP 的设计原则、安全考量以及实际应用案例,为开发者提供了构建可靠代码执行智能体的实用指南。AI产品MCP/工具智能体代码执行Anthropic安全沙箱推荐理由:Anthropic 的这篇工程博客为构建能安全执行代码的智能体提供了权威参考,做 AI 智能体或编程助手的开发者可以直接借鉴其 MCP 实现方案。
Anthropic: Engineering(资讯)精选65Anthropic 发布了 Claude Code 的最佳实践指南,详细介绍了如何高效使用这一 agentic 编程工具。指南涵盖了从项目初始化、上下文管理到复杂任务拆解的关键技巧,帮助开发者最大化 Claude Code 的自动化能力。文章强调了明确目标、分步验证和利用工具链的重要性,并提供了实际案例。这对于希望提升 AI 辅助编程效率的团队和个人开发者具有重要参考价值。AI产品Claude CodeAgentic 编程最佳实践编程助手Anthropic推荐理由:Anthropic 官方出品的实战指南,做 AI 编程的开发者可以直接套用这些技巧,省去自己摸索的时间,建议点开收藏。
Anthropic: Engineering(资讯)精选65Anthropic 发布 Claude Code 的安全升级,引入沙箱执行环境和细粒度权限控制,使 AI 编程助手在自主执行代码时更安全。新系统允许用户为不同操作设置权限级别(如允许、拒绝、询问),并支持在隔离环境中运行高风险命令。这解决了 AI 编程工具在自动化过程中可能误操作或泄露敏感数据的问题。开发者可以更放心地让 Claude Code 自主完成复杂任务,同时保持对关键操作的控制。AI产品Claude Code安全沙箱权限控制编程助手推荐理由:AI 编程助手的安全性是团队上生产的关键门槛,Anthropic 这次用沙箱和权限分层解决了自主执行的风险痛点,用 Claude Code 做自动化开发的团队值得仔细看。
Anthropic: Engineering(资讯)精选50Anthropic 发布 Agent Skills,一套用于增强 AI 智能体在真实环境中执行任务能力的工具集。Agent Skills 包含多个预构建模块,如文件操作、网络请求、数据解析等,让开发者无需从零编写复杂逻辑即可快速部署实用智能体。该项目旨在解决当前智能体在现实应用中缺乏可靠基础能力的问题,降低开发门槛并提升任务成功率。Anthropic 同时开源了相关代码,鼓励社区贡献更多技能模块。AI产品智能体AnthropicAgent Skills开源/仓库工具集推荐理由:做智能体应用的开发者不用再重复造轮子了——Agent Skills 直接提供了文件处理、网络请求等高频基础能力,拿来就能用,建议直接看源码。
Anthropic: Engineering(资讯)精选75Anthropic 在 Claude Developer Platform 上推出了高级工具调用功能,允许开发者更灵活地让 Claude 调用外部 API、数据库和自定义工具。该功能支持多步骤工具编排、错误重试和结果缓存,显著提升了复杂工作流的可靠性。这是继 MCP 协议后,Anthropic 在工具生态上的又一重要更新,旨在让 AI Agent 更稳定地执行实际业务任务。AI产品Claude工具调用开发者平台AI AgentAnthropic推荐理由:做 AI Agent 或自动化工作流的开发者终于有了更可靠的工具调用方案——多步骤编排和错误重试直接解决生产环境痛点,建议用 Claude 的团队立即体验。
Anthropic: Engineering(资讯)精选60Anthropic 分享了其内部多智能体研究系统的构建经验。该系统利用多个 Claude 智能体协同工作,以加速 AI 安全研究。文章详细介绍了系统架构、智能体分工、任务协调机制以及在实际研究中的应用效果。这一系统展示了多智能体协作在复杂研究任务中的潜力,为 AI 研究自动化提供了新思路。AI产品多智能体AnthropicClaudeAI 安全研究自动化推荐理由:Anthropic 公开了多智能体系统的实战架构,做 AI 研究和智能体开发的团队可以直接借鉴其任务协调与分工设计,值得点开学习。
腾讯混元 Tencent Hunyuan@tencentcloud精选60腾讯云推出了实时H.266 VVC编码器,支持复杂直播场景的大规模商业部署。该编码器结合深度学习与原生编码架构,突破了实时计算限制,同时保留了广播级视频质量。它支持稳定的10 Tbps并发带宽,大幅降低带宽成本,并优化了核心QoS,实现更快的启动和更少的卡顿。三个AI核心模块提升了编码效率,支持灵活的计算调度,并在所有场景下保护精细的视觉纹理细节。该编码器仅需1.8 Mbps即可实现清晰的1080p超高清流媒体,性能优于传统AVC。AI产品H.266/VVC视频编码腾讯云深度学习直播推荐理由:腾讯云将H.266 VVC编码器推向商用,视频直播平台和CDN服务商可以大幅降低带宽成本,同时提升画质,做视频技术的团队值得关注。
IT之家(博客/媒体)精选65谷歌DeepMind在2026年The Android Show上发布Magic Pointer功能,旨在通过光标交互让AI理解用户意图,而不仅仅是识别指向位置。该功能允许用户通过语音和指针结合,自然地说“改一下这个”或“把那个移到这里”,无需复制粘贴内容到AI窗口。核心原则包括保持工作流、边指边说、支持模糊指代,以及将像素转化为可操作实体。谷歌已在AI Studio上线演示,并逐步将能力引入Chrome中的Gemini,让用户直接围绕网页内容操作。这标志着AI交互从独立窗口转向融入用户当前工具,提升效率。AI产品谷歌Magic Pointer光标交互AI助手Gemini推荐理由:谷歌把AI交互从“复制粘贴到对话框”变成了“指哪打哪”,做办公自动化或日常多任务处理的用户,可以直接在Chrome里试,体验比划式操作。
IT之家(博客/媒体)精选70群联电子与联发科在联发科天玑开发者大会(MDDC 2026)上展示了全球首款手机端单机运行20B大语言模型的平台。通过群联的aiDAPTIV Hybrid UFS解决方案,结合缓存内存和中间件技术,将部分MoE模型权重动态卸载至UFS存储层,降低了对DRAM的依赖。原本需要16GB+ DRAM的大模型,现在可在12GB DRAM环境下流畅运行,显著提升了终端设备部署大模型的可行性。联发科还发布了天玑AI智能体化引擎2.0和天玑AI开发套件3.0,旨在让手机到汽车等海量终端成为原生智能体。AI产品天玑950020B大语言模型群联电子联发科终端AI部署推荐理由:手机端跑20B大模型意味着AI能力不再依赖云端,做移动端AI应用或边缘计算的开发者可以直接关注,这解决了大模型在终端部署的内存瓶颈。
IT之家(博客/媒体)精选75微软CEO纳德拉宣布,其AI安全系统MDASH在5月补丁星期二活动中协助发现Windows 11的16个CVE漏洞。MDASH采用超过100个专用智能体,通过对抗式流程降低误报,在私有驱动StorageDrive上实现21个植入漏洞全检出且误报为0。在CyberGym公共基准上,MDASH以88.45%的准确率领先第二名(83.1%)约5个百分点。该系统还回溯了clfs.sys和tcpip.sys的历史漏洞,召回率分别达96%和100%。AI产品AI安全智能体MCP/工具微软MDASH推荐理由:微软用100个AI智能体抓漏洞,准确率88.45%
IT之家(博客/媒体)精选50苹果发布 Xcode 26.5,增强智能体编程能力。新功能包括编程智能体消息队列,允许开发者连续发送多条消息而无需等待回复,提升协作流畅度。智能体现在可以在任务描述不完整时主动提出澄清问题,避免执行偏差。此外,更新还支持新的 StoreKit Testing 计费方案。AI产品编程助手Agent大模型Xcode苹果推荐理由:Xcode 26.5 通过消息队列和主动澄清机制,显著提升 AI 编程智能体的交互效率和准确性,对使用苹果生态的开发者有实际帮助。
Greg Brockman Blog(博客/媒体)精选85OpenAI Five在总决赛中首次公开击败Dota 2世界冠军OG,这是AI首次在现场比赛中战胜顶级电竞职业战队。该AI基于深度强化学习,经过10个月(相当于45000年游戏内时间)的自我对弈训练,形成了独特的创新玩法。尽管是AI首次与人类冠军公开较量,但OpenAI强调这一事件的核心是让公众直观感受AI技术的真实能力。该通用学习代码未来可应用于机器人控制、辅助系统等领域。AI产品AI里程碑强化学习游戏AIOpenAI FiveDota 2推荐理由:此事件是强化学习在复杂策略游戏中的重大突破,证明了无人工编码的AI能够通过自我学习达到超人水平。它对AI通用性(代码不依赖特定游戏)和未来应用(如机器人交互)有深远启示。
OpenAI Blog(博客/媒体)精选80OpenAI开发了一套完全在模拟环境中训练、部署到实体机器人的系统。该系统仅需观察一次人类演示,即可学会并执行新任务,大幅降低了机器人编程门槛。AI产品roboticssimulationfew-shot-learningopenai推荐理由:这是少样本学习在机器人领域的突破,预示着通用机器人智能的加速到来,对AI从业者探索仿真到现实迁移具有重要参考价值。
OpenAI Blog(博客/媒体)精选80OpenAI开源Universe平台,提供一个包含游戏、网站等多样化环境的测试平台,用于衡量和训练AI的通用智能。该平台通过标准化接口,让AI代理能像人类一样与各类应用交互,加速通用人工智能研究。AI产品openaiagireinforcement-learningopen-sourcebenchmark推荐理由:Universe为AI研究者提供了首个大规模、标准化的通用智能评估环境,直接推动AGI训练与基准测试发展。