AI 日报 2026-04-03（周五）

今日亮点：OpenAI 开始下场收编 AI 媒体入口 / Gemini API 开始显式分层成本与可靠性 / Qwen 与 Gemma 同时把 Agent 与开源多模态继续往前推

速览目录

今日重点

值得关注

快讯

OpenHands GitHub 星标突破 7 万 2026-04-03
LobeHub 把“agent teammates”写到产品定位中央 2026-04-03
trpc-agent-go 冒头：Go 生态也开始正面补 Agent framework 2026-04-03
AITreasureBox 持续增长：AI 资源聚合仍有稳定需求 2026-04-03
llm-gemini 0.30 发布 2026-04-02
datasette-llm 0.1a6 发布 2026-04-01
datasette-enrichments-llm 0.2a1 发布 2026-04-01
Google 推出巴西亚马逊森林卫星影像地图 2026-04-01
Simon Willison 在播客继续讨论 agentic engineering 2026-04-02
PhAIL 真机 benchmark 再提醒具身智能还远未进入生产期 2026-04-02

OpenAI 收购 TBPN：头部模型公司开始直接布局 AI 叙事入口 `2026-04-02`

TL;DR: OpenAI 不只做模型，也开始直接买“行业话语权入口”。来源: OpenAI 核心事实：OpenAI 宣布收购 TBPN。官方口径强调两点：一是 TBPN 将继续保持 editorial independence，二是团队将进入 OpenAI Strategy 体系、向 Chris Lehane 汇报。换句话说，这不是简单广告合作，而是把一个已经聚集 builder、business 和 tech audience 的内容节点，直接纳入 OpenAI 的传播与生态体系。 为什么重要：头部模型公司正在把竞争从模型、API、应用层，继续延伸到叙事分发层。谁控制“行业每天在讨论什么”，谁就更容易放大自己的产品节奏与价值框架。 对我们有什么用：后面看 OpenAI，不要只盯模型发布。它在“媒体入口 + 开发者心智 + 企业沟通”上的布局，已经开始接近平台级公司打法。

Gemini API 推出 Flex / Priority：Agent 工作流开始按“成本”和“可靠性”显式分流 `2026-04-02`

TL;DR: Agent API 不再只有一个默认通道，开始按任务类型做服务分层。来源: Google 核心事实：Google 为 Gemini API 新增 Flex 与 Priority 两档服务层。Flex 面向 latency-tolerant 背景任务，官方明确给出“比 Standard API 便宜 50%”；Priority 面向更高可靠性的交互式任务。关键变化在于：两者都仍走同步接口，不需要开发者额外切到 Batch API 或自己管理异步文件流。 为什么重要：这说明 Agent 基础设施的设计重点，已经从“有没有模型”转到“不同任务怎样按 SLA 和成本分流”。真正的产品不会把所有请求都当成同一类请求处理。 对我们有什么用：如果以后要做多阶段 Agent，像检索、思考、整理、正式回复，本来就应该拆成不同成本档。Google 这次是在平台层把这种工程常识产品化了。

Qwen3.6-Plus 发布：国内大模型继续把重点押注到 real-world agents `2026-04-02`

TL;DR: Qwen 继续把“能干活的 Agent”作为主叙事，不只讲通用聊天。来源: Qwen 官方 · Hacker News 核心事实：Qwen 团队发布 Qwen3.6-Plus，官方标题直接写的是 “Towards Real World Agents”。从传播信号看，它不再只强调 benchmark，而是把 planning、tool use、真实任务执行这类更接近 agent 产品化的方向放到中心位置；同时该条也在 HN 获得高热度讨论，说明海外开发者圈对这条路线有明显兴趣。 为什么重要：国内模型厂商正在把叙事从“我也有大模型”切到“我能支持更真实的 Agent 工作流”。这比单纯参数竞争更接近下一阶段的商业落地。 对我们有什么用：如果我们关注 Agent 产品与工作流自动化，Qwen 这条线值得持续跟。它已经不是单纯的中文替代，而是在争“谁更适合真实执行场景”。 局限/争议：当前公开抓到的正文细节有限，今天更适合作为强信号跟踪，而不是过度解读具体能力边界。

Gemma 4 发布：Google 把开源多模态与端侧 Agent 能力继续往前推 `2026-04-02`

TL;DR: Google 正把“开源 + 多模态 + 端侧可跑”打成一套组合拳。来源: Google · Hugging Face 核心事实：Google DeepMind 发布 Gemma 4，给出 E2B、E4B、26B MoE、31B Dense 四个尺寸，继续采用 Apache 2.0 许可，并明确把 advanced reasoning、agentic workflows、mobile-first utility 放在定位里。官方还强调 Gemma 系列累计下载已超过 4 亿次，说明它已经不只是研究样板，而是具备实际开发者基础的开放模型家族。 为什么重要：开源模型竞争的焦点正在变成“同样的硬件下谁更强、谁更容易落地”，而不是一味扩大参数。Gemma 4 代表的是一条更现实的工程路线。 对我们有什么用：如果后面要考虑端侧、多模态、本地部署或低成本 Agent 方案，Gemma 4 值得进长期观察名单。Google 正在补齐一条从 Gemini 到 Gemma 的双栈策略。

Google Vids 接入 Veo 3.1 / Lyria 3：视频生成开始更像日常办公功能 `2026-04-02`

TL;DR: 视频生成正从“演示功能”变成办公室里能直接点开的常规入口。来源: Google 核心事实：Google Vids 新增 Veo 3.1 视频生成、Lyria 3 音乐生成、AI avatar、Chrome 扩展录屏与直发 YouTube 等能力。官方给出“任何 Google 账号可获得每月 10 次免费视频生成”，而 Google AI Ultra / Workspace AI Ultra 账号最多可到每月 1000 次。 为什么重要：这不是单个模型升级，而是视频生成开始被塞进真正的大众工作流里。门槛一降，使用场景会从“创意实验”扩到培训、说明、营销、内部沟通。 对我们有什么用：之后看视频生成，不要只比质量，也要比它进入日常工具链的速度。谁先进办公套件，谁更可能先吃到规模使用。

Codex 团队版改成 pay-as-you-go：AI coding 开始进一步降低企业试点门槛 `2026-04-02`

TL;DR: OpenAI 正把 AI coding 从“买席位”改成更容易先试再扩的模式。来源: OpenAI 核心事实：OpenAI 宣布 ChatGPT Business / Enterprise 可新增 Codex-only seats，采用按 token 计费的 pay-as-you-go 模式，官方同时强调这些席位没有 rate limits。另一边，ChatGPT Business 年付价格也从每席 25 美元降到 20 美元。 为什么重要：AI coding 的商业化已经进入更细的定价博弈：不是单纯卖 seat，而是降低试点门槛、提高团队扩张弹性。 对我们有什么用：如果以后要给团队引入 coding agent，这种“先小范围验证 ROI，再按使用量扩张”的模式，会比一上来铺满席位更现实。

Harbor 走热：本地 LLM 不再只拼模型，也开始拼“一键把整套栈拉起来” `2026-04-03`

TL;DR: 本地 AI 体验正在从模型竞赛，转到整套可用栈的编排能力。来源: GitHub 核心事实：Harbor 的核心卖点非常直接：一个 harbor up 命令，把 Open WebUI、Ollama、llama.cpp、vLLM，以及 SearXNG、Speaches、ComfyUI 等配套服务一起拉起来，并自动处理 Docker Compose 编排和跨服务连通性。 为什么重要：真正阻碍本地 LLM 普及的，往往不是“没有模型”，而是环境太碎、组件太多、联调太麻烦。Harbor 抓住的是这个更现实的痛点。 对我们有什么用：如果后面需要做本地 Agent 栈、私有部署或 demo 环境，这种“一键起整套能力”的工具价值很高，比单个模型框架更接近可交付状态。

Google Workspace MCP 走热：办公软件正成为 Agent 最现实的执行入口 `2026-04-03`

TL;DR: Agent 真正有用的时候，往往不是会聊天，而是能动你的邮件、日历和文档。来源: GitHub 核心事实：该项目把 Gmail、Calendar、Docs、Sheets、Slides、Drive、Chat、Forms、Tasks 等 Google Workspace 能力统一成一个 MCP server，并支持 CLI 使用、多用户 OAuth 2.1 和集中托管。 为什么重要：办公套件本来就是知识工作最稳定的执行层。谁能先把这些工具接好，谁就更容易从“问答助手”走向“真正执行任务的 Agent”。 对我们有什么用：这类项目说明，Agent 的高价值入口不是新 UI，而是尽快把现有办公系统接成可调用基础设施。

Lemonade by AMD 上 HN：本地推理开始吃到 GPU + NPU 一体化红利 `2026-04-02`

TL;DR: 本地推理的竞争正在从“能跑”转向“硬件栈协同优化”。来源: Lemonade · Hacker News 核心事实：AMD 推出 Lemonade，本质上是面向本地 LLM 的开源服务方案，强调 GPU 与 NPU 协同利用，并在 HN 上获得高热度。虽然今天抓到的公开细节仍偏概览，但方向已经很明确：端侧推理优化开始从模型层延伸到硬件编排层。 为什么重要：随着本地模型越来越可用，性能瓶颈会更多落在 runtime、调度和硬件利用率，而不是参数本身。 对我们有什么用：如果后面要看端侧 Agent、本地工作流或私有部署，本地推理栈的系统优化值得持续关注，不该只盯模型排行榜。

字节继续推 Seedance 2.0，媒体同时放大豆包调用规模：国内视频生成与调用基础设施信号升温 `2026-04-02`

TL;DR: 国内 AI 正在同时卷生成质量和实际吞吐规模。来源: 字节 Seed 官方 · 量子位 核心事实：字节官方已公布 Seedance 2.0，强调统一的多模态音视频联合生成架构，支持文本、图像、音频、视频混合输入，并支持最多 9 张图、3 段视频、3 段音频参与参考与编辑。与此同时，中文媒体也在放大“豆包日调用 120 万亿 tokens”这类规模信号。 为什么重要：一边是视频模型能力增强，一边是调用规模被拿出来讲，说明竞争已经不仅是模型 demo，而是在比真实分发和底层供给能力。 对我们有什么用：看国内厂商时，要把“模型能力”和“系统吞吐/分发规模”一起看。后者往往更能说明平台化潜力。 局限/争议：关于豆包的精确调用规模，目前更像媒体转述信号，具体口径仍应以后续官方数据为准。

11. OpenHands GitHub 星标突破 7 万，AI-driven development 仍在持续吸引开发者注意力。 2026-04-03

12. LobeHub 把 “agent teammates” 写进核心定位，说明多 Agent 协作正在成为产品层主叙事。 2026-04-03

13. trpc-agent-go 冒头，Go 生态也开始补面向 LLM + tools 的 Agent framework。 2026-04-03

14. AITreasureBox 持续增长，说明 AI 资源发现与聚合仍是稳定需求。 2026-04-03

15. llm-gemini 0.30 发布，新增对 gemini-3.1-flash-lite-preview 与 Gemma 4 相关模型的支持。 2026-04-02

16. datasette-llm 0.1a6 发布，轻量数据工作台 + LLM 的组合仍在快速迭代。 2026-04-01

17. datasette-enrichments-llm 0.2a1 发布，结构化 enrichments 工作流继续细化。 2026-04-01

18. Google 推出巴西亚马逊森林卫星影像地图，AI + 遥感 + 公共治理的落地场景继续扩展。 2026-04-01

19. Simon Willison 在 Lenny 播客继续讨论 agentic engineering，开发者圈对 Agent 工程化的讨论仍在升温。 2026-04-02

20. PhAIL 真机 benchmark 再次提醒：现实世界机器人智能离“稳定可用”还有很大距离。 2026-04-02

编辑观点

今天最该重视的变化：AI 竞争正在继续往“平台层”上移——不仅比模型，还比定价分层、办公入口、媒体入口、本地运行栈和真实分发能力。
对我们当前项目最有现实影响的一条：Gemini API 的 Flex / Priority 很值得记住，它其实是在提醒我们：Agent 工作流必须天然分层，不能把所有步骤都用同一种成本和 SLA 去跑。
值得继续追踪 / 可暂时忽略：值得继续追的是 Qwen3.6、Gemma 4、Workspace MCP、本地栈编排工具；可暂时少看的是缺少一手细节支撑的情绪类讨论和纯媒体放大稿。

Contents

AI 日报 2026-04-03（周五）

速览目录

今日重点

值得关注

快讯

OpenAI 收购 TBPN：头部模型公司开始直接布局 AI 叙事入口 2026-04-02

Gemini API 推出 Flex / Priority：Agent 工作流开始按“成本”和“可靠性”显式分流 2026-04-02

Qwen3.6-Plus 发布：国内大模型继续把重点押注到 real-world agents 2026-04-02

Gemma 4 发布：Google 把开源多模态与端侧 Agent 能力继续往前推 2026-04-02

Google Vids 接入 Veo 3.1 / Lyria 3：视频生成开始更像日常办公功能 2026-04-02

Codex 团队版改成 pay-as-you-go：AI coding 开始进一步降低企业试点门槛 2026-04-02

Harbor 走热：本地 LLM 不再只拼模型，也开始拼“一键把整套栈拉起来” 2026-04-03

Google Workspace MCP 走热：办公软件正成为 Agent 最现实的执行入口 2026-04-03

Lemonade by AMD 上 HN：本地推理开始吃到 GPU + NPU 一体化红利 2026-04-02

字节继续推 Seedance 2.0，媒体同时放大豆包调用规模：国内视频生成与调用基础设施信号升温 2026-04-02