晨报 2026-03-11（周三）

☀️ 晨报 — 2026年3月11日周三

🤖 AI 行业动态

1. OpenAI 完成史上最大私募融资 $1100亿，估值 $7300亿 Amazon（$500亿）、Nvidia（$100亿）、SoftBank 三巨头领投，AWS 成为 OpenAI Frontier 独家第三方云分发商，并提供 2GW Trainium 算力。NVIDIA 则专供 5GW Vera Rubin 系统做训练和推理。 → 启示：算力正在重新定价，云服务商和芯片厂商绑定 AI 实验室已成标准操作。研航依赖的 Gemini API 未来可能因 Google-Amazon 竞争而受益于价格战。

2. Anthropic 遭美国政府"供应链风险"认定，年收入恐损失数十亿 Claude 被下令从所有行政机构清退，Anthropic 拒绝给军队开放大规模监控和自主武器权限，CFO 表示此举将导致 2026 年营收损失数十亿美元。OpenAI、Google 员工却联署声明力挺 Anthropic。 → 启示：我们当前用 Claude Sonnet 4.6/Opus 4.6 作为核心模型，短期无影响；但需关注 Anthropic 在中国的可用性。若 Claude API 被进一步限制，需准备 Qwen 3.5 或 Gemini 3.1 Pro 作为备选。

3. Alibaba 发布 Qwen 3.5：专为 Agentic AI 设计，超越美国主流模型 性能媲美 GPT-5.3，且在成本上大幅降低；支持复杂自主任务执行，Sparse MoE 架构成 2026 年主流设计。 → 启示：国内可直接调用 Qwen 3.5 替代 Claude 做研航的 agent 任务，研究合规性和价格后可作为降本选项。

4. Google Gemini 3.1 Pro 发布：号称超越 Claude 和 ChatGPT 在 Humanity's Last Exam 和 ARC-AGI-2 上得分翻倍；Flash-Lite 同时上线，提供可调节的"思考级别"。DeepMind CEO Demis Hassabis 在 AI Impact Summit 宣称 AGI"就在眼前"。 → 启示：正在测试 Gemini 3.1 Pro 替换 MetaScholar 数据提取，$2/M token 目标降本 60%——这个方向更迫切了。

5. Eridu 从隐身模式融资 $2亿：重建 AI 网络基础设施 针对现有 AI 基础架构的"增量改良"路线，Eridu 选择从底层重构，解决 AI scaling 的数据搬运瓶颈。 → 启示：AI 基础设施层仍有巨大机会；研航作为应用层不受影响，但需关注 API 延迟改善带来的体验提升机会。

6. OpenAI 与五角大楼签约争议：内部硬件主管辞职 OpenAI 与 DoD 达成涉及机密网络部署协议，约定禁止国内大规模监控和自主致命武器，但仍有内部人员认为"太快了"导致 CTO 下属主管辞职。Sam Altman 承认"时机仓促，形象很差"。 → 启示：AI 军事化争议将持续，这不直接影响研航，但 Anthropic 受牵连会影响我们的 API 供应链稳定性。

7. Karpathy 发布 AutoResearch：AI 自主做 ML 实验 开源 Python 工具，让 AI agent 在单 GPU 上自主运行机器学习实验、自我改写训练代码。Karpathy 本人发推称感受到了"后 AGI 时代"的感觉。 → 启示：自动化科学研究正在成为现实。研航的 MetaScholar 未来演进方向——让 AI 不只提取数据，而是主动设计实验方案——技术路径越来越清晰。

🔥 AI 热门项目 & 产品

Claude 记忆导入功能（Anthropic） — 免费用户获得跨会话记忆，支持从 ChatGPT 导入历史，登顶美区 App Store 免费榜 | Product Hunt 本周 #1
Codex Security（OpenAI） — 面向 Enterprise/Business/Education 用户开放，AI 自动扫描代码库识别高危漏洞，已在开源仓库中发现数千个高严重性问题 | openai.com
Wispr Flow — 实时语音输入工具，号称比键盘快 4 倍，支持全平台；HackerNews Show HN 热度爆表 | wispr.flow
Figma-use（CLI） — 让 AI agent 直接操控 Figma 做设计自动化，HN 社区广泛讨论 | github.com
JetBrains Air + Junie CLI — 多 agent 并行编程环境，LLM 无关（支持 Anthropic/OpenAI/Google），ADE（Agentic Dev Environment）新形态 | jetbrains.com

📊 GitHub 热门项目

openclaw/openclaw ⭐210,000+ — 本地 AI 个人助理，50+ 集成（WhatsApp/Telegram/Slack），可自写新 Skill，2026 年 1 月底病毒式传播，GitHub 史上增速最快项目之一（TypeScript） → 亮点：就是我们用的！持续关注新 Skill 发布，有助于研航自动化工作流建设
bytedance/deer-flow ⭐26,900 — 字节跳动开源 SuperAgent 框架，支持研究、编程、创作三合一，内置 sandbox/memory/subagents（Python） → 亮点：研航的 MetaScholar 未来做多 agent 协作时可参考其 subagent 调度架构
karpathy/autoresearch ⭐8,700 — AI 自主 ML 实验框架，单 GPU 运行，配合 AutoResearch 发布热度飙升（Python） → 亮点：验证了 AI 自主科研可行性，是 MetaScholar 往"智能 Agent 自主分析"演进的参考路线图
langchain-ai/langgraph ⭐24,800 — 复杂有状态 agent 工作流图框架，月下载量 3450 万，事实上的 multi-agent 标准（Python） → 亮点：如需重构 MetaScholar 的多步骤 pipeline，LangGraph 比手写更稳定
dify-ai/dify ⭐129,000 — 低代码 AI agent + RAG 平台，支持可视化 workflow 构建，已有多家企业生产部署（TypeScript/Python） → 亮点：可快速原型验证研航新功能，无需从头写 pipeline

🐦 X/Twitter AI 热门话题

[@karpathy]: "有一种'后 AGI'的感觉——不是因为理论突破，而是因为你可以让 AI 自主完成你以前要花一周做的事。" — AutoResearch 发布引发大量讨论，3 天内 8K+ 转发
[@sama]: "这个协议确实是仓促的，形象也不好看。" — 承认 OpenAI-Pentagon 协议公关失败，但坚持安全红线不变；讨论"民主政府还是私企谁该管 AI"引发 AI 治理圈激辩
[@DarioAmodei]: "Anthropic 将用法律手段挑战这一认定。我们拒绝的不是爱国，而是不能以违背美国价值观的方式部署 AI。" — 被列"供应链风险"后第一次公开表态，评论区极度分裂
[@GergelyOrosz]: "用了 Claude Code 一个月，已经完全改变了我写代码的方式。不是 'AI 帮我写代码'，而是 'AI 和我一起架构系统'。" — 《The Pragmatic Engineer》作者，5 万点赞
[@swyx]: "2026 年 AI 编程工具的胜者不是功能最多的，而是最能减少'上下文切换'的。这就是为什么 Claude Code 和 Cursor 在赢，而 Copilot 在追赶。" — AI infra 圈广泛转发

🐾 OpenClaw 生态

官方更新：

v2026.3.2（3月3日）：SecretRef 扩展到 64 个凭证目标，新增原生 PDF 工具（支持 Anthropic/Google），openclaw config validate --json 配置 lint，MiniMax-M2 成一等公民
v2026.3.1（3月2日）：集成 OpenAI WebSocket 流式 + Claude 4.6 自适应推理，视觉 Diff 插件上线，Docker/K8s 优化
v2026.2.26（安全重大更新）：11 个安全修复（含 WebSocket 攻击向量），cron 静默失败修复，新安装默认 tools.profile=messaging（更安全）
⚠️ 当前运行版本需确认是否已升级至 2026.3.2

生态热门：

obra/superpowers ⭐75,000 — Agentic 技能框架，OpenClaw 生态最热第三方项目，软件开发方法论重构 → 亮点：与 OpenClaw Skill 体系高度兼容，值得借鉴设计思路
OpenClaw 210K+ stars — GitHub 史上增速最快开源项目之一，社区 Discord 活跃，clawhub.com 新 skill 每周持续上线

🔬 AI + 科研/医学

竞品动态：

Cochrane 启动自适应平台研究（2026年2月）：同时评估多款 AI 工具在 ~15 个 Cochrane 系统综述更新中的表现，这是对全行业工具的官方测评——Elicit、Covidence、Rayyan、DistillerSR 都在受测范围。这是所有竞品获得官方背书的窗口期。
Consensus AI "Deep Research"功能：现已支持自动执行检索策略、链接机构图书馆订阅，向更完整的综述助手方向演进（原是搜索工具）
Paperguide：宣称 2026 年最佳系统综述 AI，全流程（文献发现→提取→报告生成），是研航最直接竞品之一
Elicit：继续向 API 化和团队协作方向发展，Language Model 语义搜索是其核心护城河

新进展：

AI 辅助系统综述整体趋势：从"节省时间"升级为"提升质量"——Rayyan 宣称筛选时间减少 90%，Covidence 集成 Cochrane RCT 分类器自动排除非 RCT
CatBoost 算法在预测膀胱癌切除术后生存率上的应用（Fondazione Gemelli IRCCS）：AI 识别 SII（全身免疫炎症指数）为关键生物标志物，提前锁定高风险患者

→ 启示：Cochrane 官方测评若产生"推荐工具列表"，将重塑整个市场格局。研航目前无 Cochrane 认证，中长期需考虑是否参与或对标其评审标准；短期专注差异化：中文用户 + 选题阶段，竞品主要覆盖英文 + 筛选阶段。

📈 研航数据

⚠️ SSH 连接失败（REDACTED_IP 持续拒绝连接，已连续多日）

使用最近已知数据（截至 3/9）：

指标	上次已知	备注
总用户	25	⚠️ SSH 失败，数据截至 3/4
Pro 用户	12	付费率 48%
累计收入	¥187.60	未变化
日活	N/A	待服务器恢复
今日新用户	N/A	—

⚠️ 服务器 SSH 问题已持续 ≥7 天，强烈建议今日登录阿里云控制台 VNC 排查（磁盘满/OOM/安全组变更）

📋 今日待办

🔴 阿里云控制台排查研航服务器 — SSH 连续失败，VNC 进去看 df -h + free -h + journalctl -xe（P0）
🔴 MetaScholar Benchmark bug — include/included 字段匹配问题，需修复后才能跑完整 benchmark（P0）
🔴 获取 Cochrane Gold Standard 文件 — 10-20 个，用于验证 benchmark 系统准确性
🟡 Gemini 3.1 Pro 提取测试 — Gemini 3.1 Pro 今日发布，是测试降本的好时机（$2/M token vs 当前）
🟡 MetaScholar 双审一致率优化 — few-shot 注入，目标 29%→50%+
🟢 新加坡 Gemini API 网关 — 牛排跟进部署状态

Contents