AITOP

5月15日

09:03

claudedevs@ClaudeDevs

Claude API 用户可通过预热提示缓存来缩短长提示的首 token 生成时间。具体做法是先发送系统提示（system prompt）而不生成输出，让 Claude 将其写入缓存。当实际用户请求到来时，缓存已预热，从而加速响应。这一技巧对处理长上下文或复杂提示的开发者特别有用，能显著提升 API 调用效率。

技巧 Claude API 提示缓存性能优化开发者技巧

推荐理由：做 Claude API 集成的开发者，这个预热缓存技巧能直接降低长提示的响应延迟，值得在项目中试试。

5月14日

13:37

深度求索 DeepSeek@deepseek_ai

DeepSeek 正式发布 V3.2 和 V3.2-Speciale 两个新模型。V3.2 是 V3.2-Exp 的正式继任者，已在 App、Web 和 API 上线；V3.2-Speciale 则专注于极致推理能力，目前仅通过 API 提供。这两个模型以推理优先为设计理念，旨在更好地支持智能体（agent）场景。技术报告已同步公开。

AI模型 DeepSeek 推理模型智能体模型发布 API

推荐理由：做智能体开发或需要强推理能力的团队，DeepSeek 这次直接给了两个新选择——V3.2 可立即上手，Speciale 适合追求极致推理的 API 用户，值得关注技术报告里的细节。

13:36

xAI@xai

xAI 宣布 Grok Voice API 正式上线语音克隆功能，支持生成带有丰富自然情感的语音。该功能允许用户通过 API 调用克隆人类声音，并用于各种应用场景。xAI 还发布了一段音频测试，让听众分辨人类和 AI 克隆的声音。这一进展展示了 AI 语音合成技术的成熟度提升，可能对语音助手、内容创作和客户服务等领域产生重要影响。

AI产品语音克隆 Grok API 情感合成 xAI

推荐理由：语音克隆技术终于有了自然情感，做语音应用或内容创作的开发者可以直接用 Grok Voice API 试试，效果可能超出预期。

13:36

xAI@xai

xAI 发布了 Grok 4.3 模型，已在其 API 上可用。该模型在代理工具调用和指令遵循方面领先 @ArtificialAnlys 排行榜，并在 @ValsAI 的企业领域（如判例法和公司金融）中排名第一。Grok 4.3 支持 100 万 token 上下文窗口，输入价格为每百万 token 1.25 美元，输出价格为 2.50 美元。开发者可以立即创建 API 密钥开始使用。

AI模型 Grok 4.3 xAI 推理模型 API 企业应用

推荐理由：Grok 4.3 在代理工具调用和企业场景（如法律、金融）中表现突出，做智能体或企业级应用的开发者可以直接用 API 体验，性价比也不错。

13:36

xAI@xai

xAI 宣布其 API 上线了图像生成质量模式（Image Generation Quality Mode），该模型已在 Grok 上驱动超过 3 亿张图像的生成。新模式提升了图像的真实感、文本渲染能力以及创意控制，特别面向商业专业人士。这意味着开发者现在可以通过 API 调用更高质量的图像生成能力，用于营销、设计等场景。

AI产品 xAI 图像生成 API 质量模式商业应用

推荐理由：xAI 把 Grok 上验证过的图像生成能力开放给 API 用户，做商业设计或内容生成的团队可以直接集成，提升出图质量和可控性。

13:27

shao__meng@shao__meng

精选55

LandingAI 发布了一个名为“解析前”的页面级分类 API，能在昂贵的文档解析之前对 PDF 逐页打标签。它解决企业文档混杂的问题：如 50 页房贷 PDF 中混有工资单、银行流水等，直接解析会浪费算力并导致抽取幻觉。API 支持自定义类别列表、并发逐页评估、返回标签及推理说明，还能处理未知页面并建议类别。企业可根据标签丢弃无关页或分流到不同流水线，调用方式为简单的 curl POST 请求。

AI产品文档解析页面分类 API LandingAI 企业AI

推荐理由：做文档处理或企业 RAG 的团队，终于有个低成本方案在解析前先做“分诊”，避免为噪音付 OCR 和 LLM 的冤枉钱，值得直接试。

09:25

berryxia@berryxia

NotionDevs 发布了一个 25 秒演示视频，展示了全新的 ntn CLI 工具。用户只需一行 curl 命令即可安装，并在终端中拥有完整的 Notion API 能力，包括登录工作区、新建 worker、查询数据库、用 Markdown 创建页面等。更重要的是，该 CLI 支持直接为 AI agents 添加 Notion skill，让它们在终端中顺滑操作整个工作空间。这标志着 Notion 正从笔记工具演变为 AI agent 的操作系统，代码可以直接在 Notion 中运行、测试和部署。

AI产品 Notion CLI AI agent 自动化 API

推荐理由：Notion 的 ntn CLI 让 AI agent 深度集成 Notion 变得极其简单，做自动化工作流或智能体开发的团队可以直接用一行命令让 agent 操作整个工作空间，省去大量折腾时间。

01:10

Moonshot AI: Kimi Blog（资讯）

月之暗面（Moonshot AI）在 Kimi API 中推出了上下文缓存（Context Caching）功能，通过复用重复的上下文内容，大幅降低 API 调用成本。该功能特别适用于需要频繁使用相同系统提示、知识库或对话历史的场景，最高可节省 90% 的费用。开发者只需在请求中指定缓存键，即可自动启用缓存，无需修改现有代码。这为构建长对话、知识问答等应用提供了经济高效的解决方案。

AI产品 Kimi API 上下文缓存成本优化月之暗面

推荐理由：Kimi API 的 Context Caching 让高频调用场景的成本直降 90%，做长对话或知识库应用的开发者可以直接用，省下的预算够再跑一轮实验。

5月13日

21:36

Moonshot AI: Kimi Blog（资讯）

Moonshot AI推出了Kimi Latest模型，该模型会自动指向其最新版本，用户无需手动更新即可使用最新功能。Kimi Latest旨在简化模型管理，确保用户始终使用最先进的AI能力。此举解决了模型版本频繁更新带来的兼容性和维护问题。对于开发者而言，这意味着更少的版本迁移工作和更稳定的API体验。

AI产品 Kimi Latest Moonshot AI 模型更新 API 开发者工具

推荐理由：Moonshot的Kimi Latest解决了AI模型频繁更新带来的维护痛点，做API集成的开发者可以直接用，省去手动升级的麻烦。

21:35

Moonshot AI: Kimi Blog（资讯）

月之暗面正式发布了 Kimi 长思考模型 API，该模型具备深度推理能力，能够处理复杂任务并输出详细思考过程。开发者可以通过 API 调用，在应用中集成 Kimi 的思考能力，提升问答质量和逻辑性。该模型在数学、编程、逻辑推理等场景表现突出，支持多轮对话和长上下文。此次发布标志着 Kimi 从对话产品向平台化服务迈出重要一步。

AI产品 Kimi 长思考模型 API 推理模型月之暗面

推荐理由：Kimi 长思考模型 API 让开发者能直接调用深度推理能力，做复杂问答或逻辑分析的应用团队值得接入试试。

21:35

Moonshot AI: Kimi Blog（资讯）

Kimi 开放平台近期发布了一系列新功能，包括模型升级、API 优化和开发者工具改进。这些更新旨在提升开发者的使用体验和模型性能。关键细节包括新增的模型版本、更高效的 API 调用方式以及更完善的文档支持。这些变化对于依赖 Kimi 进行 AI 应用开发的团队具有重要意义。

AI产品 Kimi 开放平台 API 开发者工具模型升级

推荐理由：Kimi 开放平台的更新直接提升了开发者的工作效率和模型能力，做 AI 应用开发的团队值得关注这些新功能，建议直接查看更新日志以获取具体细节。

09:12

Ate-a-Pi@svpino

开发者不应依赖单一LLM提供商，因为提供商可能随时更改或中断服务，导致应用崩溃。替代方案是使用一个API密钥访问400多个模型，保持灵活性和可靠性。这避免了供应商锁定风险，确保应用稳定运行。

技巧大模型 API 供应商锁定灵活性

推荐理由：提供实用策略，帮助开发者避免模型依赖风险，增强应用韧性。

5月11日

22:18

阶跃星辰 Stepfun@Stepfun_AI

Stepfun AI在SaaStr周期间于San Mateo举办线下聚会，与SEAMATE共同主办。活动设有2分钟开放麦克风环节，供创始人、建设者分享项目。Stepfun AI将展示其统一API，支持文本、视觉、语音和音乐等多种模态。活动提供晚餐和免费酒吧至晚上9点。

行业多模态 API 线下活动 Stepfun AI

推荐理由：此活动展示了Stepfun AI的多模态API能力，对于AI产品和应用的开发者是一个了解统一接口服务的机会。线下交流也有助于行业社区建设。