☀️ 晨报 — 2026年3月7日 周六


🤖 AI 行业动态

1. Anthropic 遭美国防部列为"供应链安全风险" 3月4日,美国防部首次将一家美国AI公司(Anthropic)列为国家安全供应链风险,起因是双方在 $2 亿国防合同谈判中破裂,Anthropic 坚持要求不得用于大规模监控和自主武器。Dario Amodei 宣布将提起法律诉讼,并道歉了此前泄露的批评特朗普和 OpenAI 的内部备忘录。Anthropic 目前估值 $3800 亿。 → 启示: AI 安全立场正在变成商业成本,研航的医学伦理声明需要提前做好,避免同类合规风险。

2. OpenAI 完成 $1100 亿融资,服务 9 亿周活跃用户 本月 OpenAI 完成史上最大单轮融资:Amazon ($500亿) + Nvidia ($300亿) + SoftBank ($300亿),估值 $7300 亿。同期发布 GPT-5.3 Instant(减少过度谨慎回复)和 GPT-5.4(更强推理+100万 token 上下文+原生电脑操作)。 → 启示: 上下文窗口 100 万 token 正在成为标配,研航的长文献处理应当跟进;大模型 API 价格持续下降(Gemini 3.1 Pro 仅 $2/M tokens),MetaScholar 计算成本会进一步降低。

3. Google 宣布 Apple-Google AI 合作,Gemini 接管 Siri 苹果和谷歌宣布将 Gemini AI 深度集成进 Siri,实现屏幕感知+隐私优先交互。同期 Gemini 3 成为 Google Search AI Overviews 全球默认引擎,Chrome 自动浏览、Gmail、Docs 全面接入。 → 启示: AI 的分发战争已转向操作系统级集成,下一步医学 AI 需要思考如何嵌入研究者的日常工具链(如 Word、Zotero)。

4. NVIDIA 发布 Vera Rubin 平台:推理成本降 10 倍 Vera Rubin 数据中心平台通过 6 芯片协同设计,将万亿参数模型的推理 token 成本降低 10 倍,专为主流 AI 工作负载优化。 → 启示: 推理成本加速下降会拉低研航使用大模型的 API 支出,MetaScholar 的 LLM 提取瓶颈(当前 29% unanimous 率)有望用更强模型解决而不显著增加成本。

5. 全球 AI 编码工具市场达 85 亿美元,41% 代码已由 AI 生成 2026 年 AI 编码助手市场规模 $85 亿,62% 专业开发者在用 AI 编码工具,有预测称年底 AI 生成代码占比将达 90%。Karpathy 本周公开表示自己代码中 80% 已由 AI 完成(此前仅 20%),称之为"Slopacolypse"。 → 启示: vibe coding 时代已到来,老板的开发效率优势(一人全栈)在当前环境下比以往任何时候都更强,可以加速研航产品迭代。

6. 北韩使用 AI 深度伪造渗透西方科技公司 微软报告显示,北韩组织(Jasper Sleet、Coral Sleet)大规模使用 AI 语音变换和换脸技术,伪装成 IT 工作者入职西方公司,薪资汇回朝鲜。 → 启示: 国内 SaaS 团队在远程协作中需注意供应商背景核查,AI 身份伪造风险上升。

7. 美国收紧 AI 芯片出口管制,要求逐批政府审批 新规要求所有 AI 芯片出口(含 Nvidia、AMD)须逐批政府审批,大规模买家须在美国投资数据基础设施,Nvidia、AMD 股价应声下跌。 → 启示: 中国 AI 基础设施建设受阻压力加大,但国产模型(Qwen、Baidu)的竞争力在此背景下反而提升,研航使用国产模型的策略正确。


🔥 AI 热门项目 & 产品

  • GPT-5.4 — OpenAI 最新旗舰模型,100 万 token 上下文 + 原生电脑操作 + 更强推理,API 已开放 | openai.com
  • OpenAI Frontier — 企业级 AI Agent 部署平台,内置构建/部署/管理功能,直接对标 Anthropic Claude for Enterprise | openai.com
  • Grok 4.20 — xAI 新架构,采用四 Agent 协同设计 + 视频生成 API,在 X 平台深度集成 | x.ai
  • Elicit Research Agent 重大升级(2月26日)+ API 开放(3月3日)— 支持规模化系统综述 + 报告模板,每月 40 万研究者在用 | elicit.com
  • Microsoft Copilot Tasks — 从「对话回复」转向「任务完成」,Word/Excel/Teams 全面 AI 化,嵌入式任务执行模式正成为主流 | microsoft.com

📊 GitHub 热门项目

  • moeru-ai/airi ⭐快速增长 — 自托管 AI 伴侣,支持实时语音 + Minecraft/Factorio 游戏联动(TypeScript) → 亮点:展示了 AI Agent 在娱乐/游戏场景的落地路径,研航可参考"实时语音问答文献"形态

  • QwenLM/Qwen-Agent ⭐持续活跃 — 基于 Qwen3.0+ 的 Agent 框架,内置 Function Calling + MCP + Code Interpreter + RAG + Chrome 插件(Python) → 亮点:研航当前用 Qwen 模型,Qwen-Agent 框架值得直接评估作为 MetaScholar 底层引擎

  • inclusionAI/AReaL ⭐新晋热门 — LLM 推理与 Agent 的快速强化学习框架,强调简洁和灵活(Python) → 亮点:可用于研航提取 Agent 的 RL 微调,直接对标当前 29% unanimous 率瓶颈

  • microsoft/autogen ⭐54,976 — 多 Agent 对话协作框架,事件驱动架构,支持自定义 Agent 行为(Python/C#) → 亮点:MetaScholar 多阶段 pipeline(检索→筛选→提取→合并)可用此框架重构

  • vercel/ai ⭐活跃 — Vercel 出品的 TypeScript AI SDK,专为 Next.js 等前端框架设计,支持 streaming + tool use → 亮点:研航前端 AI 功能开发可直接使用,减少重复造轮子


🐦 X/Twitter AI 热门话题

  • [@sama](Sam Altman):"我们不应该那样仓促地推进国防部协议,看起来很草率和机会主义。" — 3月3日公开道歉 OpenAI 军事合同,承诺修订条款禁止监控美国公民;3月6日发帖宣布 GPT-5.4 五大改进,引发大量讨论。 互动量:数万转发,成本周最大 AI 议题

  • [@DarioAmodei](Dario Amodei):道歉泄露内部备忘录中批评 Trump 和 OpenAI 的「安全剧场」表述,承认措辞不够审慎,但坚持将提起法律诉讼对抗国防部「供应链风险」认定。 影响:引发 AI 安全 vs 国家安全的广泛讨论,#AnthropicVsPentagon 趋势持续 3 天

  • [@karpathy](Andrej Karpathy):"我代码里 80% 现在是 AI 写的了(几周前还是 20%),这叫 Slopacolypse,我的手动编码能力在萎缩。" — 讨论 AI 编码的新认知层次(agents/subagents/prompts/memory),引发全行业讨论开发者角色转变。 互动量:数万点赞,成为本周开发者圈最热话题

  • [AI 圈整体讨论]:OpenAI-Anthropic 军事合同争议持续发酵,AI 公司"安全原则 vs 商业/政治压力"的矛盾公开化,多位 KOL 讨论 AI 公司的安全承诺可信度问题。


🐾 OpenClaw 生态

本日无重大更新。根据 HN 讨论,社区有新项目 RankClaw(针对 OpenClaw/ClawHub AI agent skill 生态的安全扫描工具,识别恶意 skill)值得关注。Blackbox AI(VS Code 流行编码插件)被曝出严重漏洞可致 prompt injection 远程攻击,提示 AI 编码工具安全风险。


🔬 AI + 科研/医学

竞品动态:

  • Elicit — 3月3日开放 API + Research Agent 重大升级(2/26),新增规模化系统综述+报告模板,订阅改为 workflow 计费,月活 40 万研究者。融资 $2200 万 Series A,计划扩展到非学术领域。直接竞品压力增大。
  • Rayyan — AI Agent 功能强化,支持自动完成全数据集文章筛选+数据提取,可作为独立盲法审查者,声称缩短筛选时间 90%,80 万研究者在用。
  • Covidence — Cochrane 背书,3月更新 RCT 分类器 + AI 提取建议(LLM+元数据),企业级定位稳固。

新进展:

  • AI 系统综述工具整体效率提升约 30%(完成时间缩短),AI 辅助筛选精度 ~85%,减少约 40% 人工审查量。
  • Google DeepMind 与 Wellcome Sanger Institute 联合启动 AI+基因组学研究员奖学金,AI 医学研究融合提速。
  • DeepMind 启动首个欧洲机器人创业加速器(伦敦,3月-6月申请),聚焦物流/制造/医疗物理 AI。

启示: Elicit API 开放是重要信号——竞品正在走"工具化/基础设施化"路线,研航需要快速找到自己的"不可被 API 化"差异点。医学研究全流程辅助(选题→开题报告)仍是竞品未覆盖的完整路径。


📈 研航数据

⚠️ SSH 连接失败,使用 3月4日站会快照数据

指标最新数据(3/4)上次(3/2)变化
总用户2525
Pro 用户1212
付费率48%48%
今日新用户00
日活 (DAU)11
累计收入¥187.60¥187.60

注: 周末数据通常偏低,3/7(周六)预期 DAU=0-1。SSH 失败原因待排查(可能与之前记录的连接不稳定有关)。

MetaScholar 进度: v42 测试完成,LLM 提取 unanimous 一致率 29%(目标 50-60%),优化方案 v2.0 正在推进(few-shot + prompt 收紧 + 放宽 sensitivity-only 规则)。


📋 今日待办

  1. 🔴 MetaScholar 优化 v2.0 — few-shot examples 注入提取 prompt(P0,进行中)
  2. 🔴 MetaScholar 优化 v2.0 — 收紧 FT screening prompt(逐项 PICO 证据,P0)
  3. 🟡 西兰花 xhs-workflow 路径 bug — skills/xhs-workflow/SKILL.md 路径配置问题(心跳时处理)
  4. 🟡 v37 citation 验证 — 查看完整报告(v42 引用验证待跟进)
  5. 🟡 小红书草稿发布 — 3/3 草稿已审核通过,修改后可发(加品牌 CTA + #研航)
  6. 🟡 SSH 排查 — 研航服务器 SSH 失败,需检查阿里云安全组/密钥
  7. 🟢 S2 API Key 403 — Semantic Scholar API Key 返回 403,需甲鱼后台确认
  8. 🟢 周六自由时间 — 可以考虑研航用户增长策略规划(竞品 Elicit API 化趋势需对应)

13次搜索 | 7条AI动态 | 5条产品 | 5个GitHub | 4条Twitter | Notion ❌(SSH同时失败,稍后重试) 鸡胸肉 🍗 | 2026-03-07 04:50