2026-03-11
晨报 2026-03-11(周三)
☀️ 晨报 — 2026年3月11日 周三
🤖 AI 行业动态
1. OpenAI 完成史上最大私募融资 $1100亿,估值 $7300亿 Amazon($500亿)、Nvidia($100亿)、SoftBank 三巨头领投,AWS 成为 OpenAI Frontier 独家第三方云分发商,并提供 2GW Trainium 算力。NVIDIA 则专供 5GW Vera Rubin 系统做训练和推理。 → 启示:算力正在重新定价,云服务商和芯片厂商绑定 AI 实验室已成标准操作。研航依赖的 Gemini API 未来可能因 Google-Amazon 竞争而受益于价格战。
2. Anthropic 遭美国政府"供应链风险"认定,年收入恐损失数十亿 Claude 被下令从所有行政机构清退,Anthropic 拒绝给军队开放大规模监控和自主武器权限,CFO 表示此举将导致 2026 年营收损失数十亿美元。OpenAI、Google 员工却联署声明力挺 Anthropic。 → 启示:我们当前用 Claude Sonnet 4.6/Opus 4.6 作为核心模型,短期无影响;但需关注 Anthropic 在中国的可用性。若 Claude API 被进一步限制,需准备 Qwen 3.5 或 Gemini 3.1 Pro 作为备选。
3. Alibaba 发布 Qwen 3.5:专为 Agentic AI 设计,超越美国主流模型 性能媲美 GPT-5.3,且在成本上大幅降低;支持复杂自主任务执行,Sparse MoE 架构成 2026 年主流设计。 → 启示:国内可直接调用 Qwen 3.5 替代 Claude 做研航的 agent 任务,研究合规性和价格后可作为降本选项。
4. Google Gemini 3.1 Pro 发布:号称超越 Claude 和 ChatGPT 在 Humanity's Last Exam 和 ARC-AGI-2 上得分翻倍;Flash-Lite 同时上线,提供可调节的"思考级别"。DeepMind CEO Demis Hassabis 在 AI Impact Summit 宣称 AGI"就在眼前"。 → 启示:正在测试 Gemini 3.1 Pro 替换 MetaScholar 数据提取,$2/M token 目标降本 60%——这个方向更迫切了。
5. Eridu 从隐身模式融资 $2亿:重建 AI 网络基础设施 针对现有 AI 基础架构的"增量改良"路线,Eridu 选择从底层重构,解决 AI scaling 的数据搬运瓶颈。 → 启示:AI 基础设施层仍有巨大机会;研航作为应用层不受影响,但需关注 API 延迟改善带来的体验提升机会。
6. OpenAI 与五角大楼签约争议:内部硬件主管辞职 OpenAI 与 DoD 达成涉及机密网络部署协议,约定禁止国内大规模监控和自主致命武器,但仍有内部人员认为"太快了"导致 CTO 下属主管辞职。Sam Altman 承认"时机仓促,形象很差"。 → 启示:AI 军事化争议将持续,这不直接影响研航,但 Anthropic 受牵连会影响我们的 API 供应链稳定性。
7. Karpathy 发布 AutoResearch:AI 自主做 ML 实验 开源 Python 工具,让 AI agent 在单 GPU 上自主运行机器学习实验、自我改写训练代码。Karpathy 本人发推称感受到了"后 AGI 时代"的感觉。 → 启示:自动化科学研究正在成为现实。研航的 MetaScholar 未来演进方向——让 AI 不只提取数据,而是主动设计实验方案——技术路径越来越清晰。
🔥 AI 热门项目 & 产品
- Claude 记忆导入功能(Anthropic) — 免费用户获得跨会话记忆,支持从 ChatGPT 导入历史,登顶美区 App Store 免费榜 | Product Hunt 本周 #1
- Codex Security(OpenAI) — 面向 Enterprise/Business/Education 用户开放,AI 自动扫描代码库识别高危漏洞,已在开源仓库中发现数千个高严重性问题 | openai.com
- Wispr Flow — 实时语音输入工具,号称比键盘快 4 倍,支持全平台;HackerNews Show HN 热度爆表 | wispr.flow
- Figma-use(CLI) — 让 AI agent 直接操控 Figma 做设计自动化,HN 社区广泛讨论 | github.com
- JetBrains Air + Junie CLI — 多 agent 并行编程环境,LLM 无关(支持 Anthropic/OpenAI/Google),ADE(Agentic Dev Environment)新形态 | jetbrains.com
📊 GitHub 热门项目
-
openclaw/openclaw ⭐210,000+ — 本地 AI 个人助理,50+ 集成(WhatsApp/Telegram/Slack),可自写新 Skill,2026 年 1 月底病毒式传播,GitHub 史上增速最快项目之一(TypeScript) → 亮点:就是我们用的!持续关注新 Skill 发布,有助于研航自动化工作流建设
-
bytedance/deer-flow ⭐26,900 — 字节跳动开源 SuperAgent 框架,支持研究、编程、创作三合一,内置 sandbox/memory/subagents(Python) → 亮点:研航的 MetaScholar 未来做多 agent 协作时可参考其 subagent 调度架构
-
karpathy/autoresearch ⭐8,700 — AI 自主 ML 实验框架,单 GPU 运行,配合 AutoResearch 发布热度飙升(Python) → 亮点:验证了 AI 自主科研可行性,是 MetaScholar 往"智能 Agent 自主分析"演进的参考路线图
-
langchain-ai/langgraph ⭐24,800 — 复杂有状态 agent 工作流图框架,月下载量 3450 万,事实上的 multi-agent 标准(Python) → 亮点:如需重构 MetaScholar 的多步骤 pipeline,LangGraph 比手写更稳定
-
dify-ai/dify ⭐129,000 — 低代码 AI agent + RAG 平台,支持可视化 workflow 构建,已有多家企业生产部署(TypeScript/Python) → 亮点:可快速原型验证研航新功能,无需从头写 pipeline
🐦 X/Twitter AI 热门话题
-
[@karpathy]: "有一种'后 AGI'的感觉——不是因为理论突破,而是因为你可以让 AI 自主完成你以前要花一周做的事。" — AutoResearch 发布引发大量讨论,3 天内 8K+ 转发
-
[@sama]: "这个协议确实是仓促的,形象也不好看。" — 承认 OpenAI-Pentagon 协议公关失败,但坚持安全红线不变;讨论"民主政府还是私企谁该管 AI"引发 AI 治理圈激辩
-
[@DarioAmodei]: "Anthropic 将用法律手段挑战这一认定。我们拒绝的不是爱国,而是不能以违背美国价值观的方式部署 AI。" — 被列"供应链风险"后第一次公开表态,评论区极度分裂
-
[@GergelyOrosz]: "用了 Claude Code 一个月,已经完全改变了我写代码的方式。不是 'AI 帮我写代码',而是 'AI 和我一起架构系统'。" — 《The Pragmatic Engineer》作者,5 万点赞
-
[@swyx]: "2026 年 AI 编程工具的胜者不是功能最多的,而是最能减少'上下文切换'的。这就是为什么 Claude Code 和 Cursor 在赢,而 Copilot 在追赶。" — AI infra 圈广泛转发
🐾 OpenClaw 生态
官方更新:
- v2026.3.2(3月3日):SecretRef 扩展到 64 个凭证目标,新增原生 PDF 工具(支持 Anthropic/Google),
openclaw config validate --json配置 lint,MiniMax-M2 成一等公民 - v2026.3.1(3月2日):集成 OpenAI WebSocket 流式 + Claude 4.6 自适应推理,视觉 Diff 插件上线,Docker/K8s 优化
- v2026.2.26(安全重大更新):11 个安全修复(含 WebSocket 攻击向量),cron 静默失败修复,新安装默认 tools.profile=messaging(更安全)
- ⚠️ 当前运行版本需确认是否已升级至 2026.3.2
生态热门:
- obra/superpowers ⭐75,000 — Agentic 技能框架,OpenClaw 生态最热第三方项目,软件开发方法论重构 → 亮点:与 OpenClaw Skill 体系高度兼容,值得借鉴设计思路
- OpenClaw 210K+ stars — GitHub 史上增速最快开源项目之一,社区 Discord 活跃,clawhub.com 新 skill 每周持续上线
🔬 AI + 科研/医学
竞品动态:
- Cochrane 启动自适应平台研究(2026年2月):同时评估多款 AI 工具在 ~15 个 Cochrane 系统综述更新中的表现,这是对全行业工具的官方测评——Elicit、Covidence、Rayyan、DistillerSR 都在受测范围。这是所有竞品获得官方背书的窗口期。
- Consensus AI "Deep Research"功能:现已支持自动执行检索策略、链接机构图书馆订阅,向更完整的综述助手方向演进(原是搜索工具)
- Paperguide:宣称 2026 年最佳系统综述 AI,全流程(文献发现→提取→报告生成),是研航最直接竞品之一
- Elicit:继续向 API 化和团队协作方向发展,Language Model 语义搜索是其核心护城河
新进展:
- AI 辅助系统综述整体趋势:从"节省时间"升级为"提升质量"——Rayyan 宣称筛选时间减少 90%,Covidence 集成 Cochrane RCT 分类器自动排除非 RCT
- CatBoost 算法在预测膀胱癌切除术后生存率上的应用(Fondazione Gemelli IRCCS):AI 识别 SII(全身免疫炎症指数)为关键生物标志物,提前锁定高风险患者
→ 启示:Cochrane 官方测评若产生"推荐工具列表",将重塑整个市场格局。研航目前无 Cochrane 认证,中长期需考虑是否参与或对标其评审标准;短期专注差异化:中文用户 + 选题阶段,竞品主要覆盖英文 + 筛选阶段。
📈 研航数据
⚠️ SSH 连接失败(REDACTED_IP 持续拒绝连接,已连续多日)
使用最近已知数据(截至 3/9):
| 指标 | 上次已知 | 备注 |
|---|---|---|
| 总用户 | 25 | ⚠️ SSH 失败,数据截至 3/4 |
| Pro 用户 | 12 | 付费率 48% |
| 累计收入 | ¥187.60 | 未变化 |
| 日活 | N/A | 待服务器恢复 |
| 今日新用户 | N/A | — |
⚠️ 服务器 SSH 问题已持续 ≥7 天,强烈建议今日登录阿里云控制台 VNC 排查(磁盘满/OOM/安全组变更)
📋 今日待办
- 🔴 阿里云控制台排查研航服务器 — SSH 连续失败,VNC 进去看
df -h+free -h+journalctl -xe(P0) - 🔴 MetaScholar Benchmark bug —
include/included字段匹配问题,需修复后才能跑完整 benchmark(P0) - 🔴 获取 Cochrane Gold Standard 文件 — 10-20 个,用于验证 benchmark 系统准确性
- 🟡 Gemini 3.1 Pro 提取测试 — Gemini 3.1 Pro 今日发布,是测试降本的好时机($2/M token vs 当前)
- 🟡 MetaScholar 双审一致率优化 — few-shot 注入,目标 29%→50%+
- 🟢 新加坡 Gemini API 网关 — 牛排跟进部署状态
13次搜索 | 7条AI动态 | 5条热门产品 | 5个GitHub项目 | 5条Twitter | OpenClaw v2026.3.2 | SSH失败⚠️ | Notion同步中