2026-03-07

☀️ 晨报 — 2026年3月7日周六

🤖 AI 行业动态

1. Anthropic 遭美国防部列为"供应链安全风险" 3月4日，美国防部首次将一家美国AI公司（Anthropic）列为国家安全供应链风险，起因是双方在 $2 亿国防合同谈判中破裂，Anthropic 坚持要求不得用于大规模监控和自主武器。Dario Amodei 宣布将提起法律诉讼，并道歉了此前泄露的批评特朗普和 OpenAI 的内部备忘录。Anthropic 目前估值 $3800 亿。 → 启示： AI 安全立场正在变成商业成本，研航的医学伦理声明需要提前做好，避免同类合规风险。

2. OpenAI 完成 $1100 亿融资，服务 9 亿周活跃用户 本月 OpenAI 完成史上最大单轮融资：Amazon ($500亿) + Nvidia ($300亿) + SoftBank ($300亿)，估值 $7300 亿。同期发布 GPT-5.3 Instant（减少过度谨慎回复）和 GPT-5.4（更强推理+100万 token 上下文+原生电脑操作）。 → 启示： 上下文窗口 100 万 token 正在成为标配，研航的长文献处理应当跟进；大模型 API 价格持续下降（Gemini 3.1 Pro 仅 $2/M tokens），MetaScholar 计算成本会进一步降低。

3. Google 宣布 Apple-Google AI 合作，Gemini 接管 Siri 苹果和谷歌宣布将 Gemini AI 深度集成进 Siri，实现屏幕感知+隐私优先交互。同期 Gemini 3 成为 Google Search AI Overviews 全球默认引擎，Chrome 自动浏览、Gmail、Docs 全面接入。 → 启示： AI 的分发战争已转向操作系统级集成，下一步医学 AI 需要思考如何嵌入研究者的日常工具链（如 Word、Zotero）。

4. NVIDIA 发布 Vera Rubin 平台：推理成本降 10 倍 Vera Rubin 数据中心平台通过 6 芯片协同设计，将万亿参数模型的推理 token 成本降低 10 倍，专为主流 AI 工作负载优化。 → 启示： 推理成本加速下降会拉低研航使用大模型的 API 支出，MetaScholar 的 LLM 提取瓶颈（当前 29% unanimous 率）有望用更强模型解决而不显著增加成本。

5. 全球 AI 编码工具市场达 85 亿美元，41% 代码已由 AI 生成 2026 年 AI 编码助手市场规模 $85 亿，62% 专业开发者在用 AI 编码工具，有预测称年底 AI 生成代码占比将达 90%。Karpathy 本周公开表示自己代码中 80% 已由 AI 完成（此前仅 20%），称之为"Slopacolypse"。 → 启示： vibe coding 时代已到来，老板的开发效率优势（一人全栈）在当前环境下比以往任何时候都更强，可以加速研航产品迭代。

6. 北韩使用 AI 深度伪造渗透西方科技公司 微软报告显示，北韩组织（Jasper Sleet、Coral Sleet）大规模使用 AI 语音变换和换脸技术，伪装成 IT 工作者入职西方公司，薪资汇回朝鲜。 → 启示： 国内 SaaS 团队在远程协作中需注意供应商背景核查，AI 身份伪造风险上升。

7. 美国收紧 AI 芯片出口管制，要求逐批政府审批 新规要求所有 AI 芯片出口（含 Nvidia、AMD）须逐批政府审批，大规模买家须在美国投资数据基础设施，Nvidia、AMD 股价应声下跌。 → 启示： 中国 AI 基础设施建设受阻压力加大，但国产模型（Qwen、Baidu）的竞争力在此背景下反而提升，研航使用国产模型的策略正确。

🔥 AI 热门项目 & 产品

GPT-5.4 — OpenAI 最新旗舰模型，100 万 token 上下文 + 原生电脑操作 + 更强推理，API 已开放 | openai.com
OpenAI Frontier — 企业级 AI Agent 部署平台，内置构建/部署/管理功能，直接对标 Anthropic Claude for Enterprise | openai.com
Grok 4.20 — xAI 新架构，采用四 Agent 协同设计 + 视频生成 API，在 X 平台深度集成 | x.ai
Elicit Research Agent 重大升级（2月26日）+ API 开放（3月3日）— 支持规模化系统综述 + 报告模板，每月 40 万研究者在用 | elicit.com
Microsoft Copilot Tasks — 从「对话回复」转向「任务完成」，Word/Excel/Teams 全面 AI 化，嵌入式任务执行模式正成为主流 | microsoft.com

📊 GitHub 热门项目

moeru-ai/airi ⭐快速增长 — 自托管 AI 伴侣，支持实时语音 + Minecraft/Factorio 游戏联动（TypeScript） → 亮点：展示了 AI Agent 在娱乐/游戏场景的落地路径，研航可参考"实时语音问答文献"形态
QwenLM/Qwen-Agent ⭐持续活跃 — 基于 Qwen3.0+ 的 Agent 框架，内置 Function Calling + MCP + Code Interpreter + RAG + Chrome 插件（Python） → 亮点：研航当前用 Qwen 模型，Qwen-Agent 框架值得直接评估作为 MetaScholar 底层引擎
inclusionAI/AReaL ⭐新晋热门 — LLM 推理与 Agent 的快速强化学习框架，强调简洁和灵活（Python） → 亮点：可用于研航提取 Agent 的 RL 微调，直接对标当前 29% unanimous 率瓶颈
microsoft/autogen ⭐54,976 — 多 Agent 对话协作框架，事件驱动架构，支持自定义 Agent 行为（Python/C#） → 亮点：MetaScholar 多阶段 pipeline（检索→筛选→提取→合并）可用此框架重构
vercel/ai ⭐活跃 — Vercel 出品的 TypeScript AI SDK，专为 Next.js 等前端框架设计，支持 streaming + tool use → 亮点：研航前端 AI 功能开发可直接使用，减少重复造轮子

🐦 X/Twitter AI 热门话题

[@sama]（Sam Altman）："我们不应该那样仓促地推进国防部协议，看起来很草率和机会主义。" — 3月3日公开道歉 OpenAI 军事合同，承诺修订条款禁止监控美国公民；3月6日发帖宣布 GPT-5.4 五大改进，引发大量讨论。互动量：数万转发，成本周最大 AI 议题
[@DarioAmodei]（Dario Amodei）：道歉泄露内部备忘录中批评 Trump 和 OpenAI 的「安全剧场」表述，承认措辞不够审慎，但坚持将提起法律诉讼对抗国防部「供应链风险」认定。影响：引发 AI 安全 vs 国家安全的广泛讨论，#AnthropicVsPentagon 趋势持续 3 天
[@karpathy]（Andrej Karpathy）："我代码里 80% 现在是 AI 写的了（几周前还是 20%），这叫 Slopacolypse，我的手动编码能力在萎缩。" — 讨论 AI 编码的新认知层次（agents/subagents/prompts/memory），引发全行业讨论开发者角色转变。互动量：数万点赞，成为本周开发者圈最热话题
[AI 圈整体讨论]：OpenAI-Anthropic 军事合同争议持续发酵，AI 公司"安全原则 vs 商业/政治压力"的矛盾公开化，多位 KOL 讨论 AI 公司的安全承诺可信度问题。

🐾 OpenClaw 生态

本日无重大更新。根据 HN 讨论，社区有新项目 RankClaw（针对 OpenClaw/ClawHub AI agent skill 生态的安全扫描工具，识别恶意 skill）值得关注。Blackbox AI（VS Code 流行编码插件）被曝出严重漏洞可致 prompt injection 远程攻击，提示 AI 编码工具安全风险。

🔬 AI + 科研/医学

竞品动态：

Elicit — 3月3日开放 API + Research Agent 重大升级（2/26），新增规模化系统综述+报告模板，订阅改为 workflow 计费，月活 40 万研究者。融资 $2200 万 Series A，计划扩展到非学术领域。直接竞品压力增大。
Rayyan — AI Agent 功能强化，支持自动完成全数据集文章筛选+数据提取，可作为独立盲法审查者，声称缩短筛选时间 90%，80 万研究者在用。
Covidence — Cochrane 背书，3月更新 RCT 分类器 + AI 提取建议（LLM+元数据），企业级定位稳固。

新进展：

AI 系统综述工具整体效率提升约 30%（完成时间缩短），AI 辅助筛选精度 ~85%，减少约 40% 人工审查量。
Google DeepMind 与 Wellcome Sanger Institute 联合启动 AI+基因组学研究员奖学金，AI 医学研究融合提速。
DeepMind 启动首个欧洲机器人创业加速器（伦敦，3月-6月申请），聚焦物流/制造/医疗物理 AI。

→ 启示： Elicit API 开放是重要信号——竞品正在走"工具化/基础设施化"路线，研航需要快速找到自己的"不可被 API 化"差异点。医学研究全流程辅助（选题→开题报告）仍是竞品未覆盖的完整路径。

📈 研航数据

⚠️ SSH 连接失败，使用 3月4日站会快照数据

指标	最新数据（3/4）	上次（3/2）	变化
总用户	25	25	→
Pro 用户	12	12	→
付费率	48%	48%	→
今日新用户	0	0	→
日活 (DAU)	1	1	→
累计收入	¥187.60	¥187.60	→

注：周末数据通常偏低，3/7（周六）预期 DAU=0-1。SSH 失败原因待排查（可能与之前记录的连接不稳定有关）。

MetaScholar 进度： v42 测试完成，LLM 提取 unanimous 一致率 29%（目标 50-60%），优化方案 v2.0 正在推进（few-shot + prompt 收紧 + 放宽 sensitivity-only 规则）。

📋 今日待办

🔴 MetaScholar 优化 v2.0 — few-shot examples 注入提取 prompt（P0，进行中）
🔴 MetaScholar 优化 v2.0 — 收紧 FT screening prompt（逐项 PICO 证据，P0）
🟡 西兰花 xhs-workflow 路径 bug — skills/xhs-workflow/SKILL.md 路径配置问题（心跳时处理）
🟡 v37 citation 验证 — 查看完整报告（v42 引用验证待跟进）
🟡 小红书草稿发布 — 3/3 草稿已审核通过，修改后可发（加品牌 CTA + #研航）
🟡 SSH 排查 — 研航服务器 SSH 失败，需检查阿里云安全组/密钥
🟢 S2 API Key 403 — Semantic Scholar API Key 返回 403，需甲鱼后台确认
🟢 周六自由时间 — 可以考虑研航用户增长策略规划（竞品 Elicit API 化趋势需对应）

13次搜索 | 7条AI动态 | 5条产品 | 5个GitHub | 4条Twitter | Notion ❌（SSH同时失败，稍后重试） 鸡胸肉 🍗 | 2026-03-07 04:50

Contents