☀️ 晨报 — 2026年3月9日 周一


🤖 AI 行业动态

1. OpenAI 完成史上最大融资 $1100 亿,估值 $7300 亿 Amazon ($500亿)、Nvidia/SoftBank 领投,完成史上最大私募轮。同期推出 GPT-5.4(Thinking + Pro 两版本,3/5 发布),GPT-5.3 Chat(3/3 发布)持续迭代,另推 Codex Security Agent 已扫描 >120 万次 commit 识别 1 万+高危漏洞。OpenAI 与美国防部军事合同争议持续(Sam Altman 承认"显得投机草率")。 → 启示: 资本加速聚集 AI 头部,模型迭代节奏达到每周级。研航用的底层模型成本会持续下降,Q2 可重新评估 LLM 成本结构。

2. Anthropic:收入翻倍 $200 亿,被列为"供应链风险"后用户激增 Anthropic 拒绝无限制军事/监控用途,被五角大楼列为"供应链安全风险",但 Claude 随即登顶美区 App Store 免费榜,企业市场份额升至 40%,年化营收从 2025 底的 $90 亿增至 $200 亿。即将发布 Claude 5(代号 Fennec)。 → 启示: 坚守伦理原则反而成品牌资产。研航的医学伦理边界(拒绝诊断声明、数据隐私保护)应在官网明确宣传——不是约束,是差异化竞争力。

3. DeepSeek V4 + Qwen3.5:中国开源模型持续施压 DeepSeek V4 本周即将发布;阿里巴巴 Qwen3.5 专为 Agent 系统设计,9B 版本超越 OpenAI gpt-oss-120B,可在普通笔记本运行,完全开源。MiniMax M2.5 以低价对标 Claude Opus 4.6。 → 启示: 高质量开源模型使私有化部署可行。若有医院客户要求数据不出网,Qwen3.5 现已是可落地方案。

4. Google Gemini 3.1 Pro + Apple Siri 整合:大生态战略成型 Gemini 3.1 Flash-Lite(3/2 发布),Gemini 3.1 Pro 扩展推出(ARC-AGI-2 得分 77.1%,同价位性能最强,$2/M token)。Apple 宣布 iOS 26.4 起 Siri 接入 Gemini,三星计划年底将 Gemini 覆盖 8 亿台设备。 → 启示: MetaScholar 数据提取层考虑切换至 Gemini 3.1 Pro,同等性能下成本可降 60%+,值得本周测试。

5. AI 编程 Agent 进入主流:41-90% 代码将由 AI 生成 2026 市场预测:41%-90% 全球代码由 AI 生成。Cursor 年化营收 $20 亿(60% 企业客户),GitHub Copilot 正式开放 CLI Agent Mode,Devin AI 可完整负责开发→测试→部署闭环。开发者角色正从"写代码"转变为"审查和编排"。 → 启示: 独立开发者用 AI 写代码的效率优势将拉平规模差异。研航这种一人团队,当前是最佳时间窗口加速功能迭代。

6. AI 前沿推理成本 2025→2026 下降 10 倍 NVIDIA Vera Rubin 平台通过芯片协同设计将万亿参数模型推理成本降 10 倍;Gemini 3.1 Pro 定价 $2/M token(GPT-4o 首发时 $15/M)。全行业 frontier AI 成本一年降 10 倍。 → 启示: MetaScholar 每次运行成本降幅可期。现在设计高质量 pipeline 是正确选择,成本侧会自动优化。

7. AI 资本创纪录:2026 年 2 月单月 AI 融资 $1890 亿 二月创史上单月 VC 投资最高纪录:$1890 亿流入 AI,美国 AI 占全球风投 90%。Hippocratic AI(医疗 Agent 员工)$1.41 亿、Truveta(AI 药物发现)$3.2 亿、7AI(安全 Agent)$1.3 亿等垂直 AI 密集融资。 → 启示: 医疗/科研 AI 赛道资本高度活跃,窗口期有限。研航需要在 2026 年内跑出数据、讲出故事,否则竞争者会快速涌入。


🔥 AI 热门项目 & 产品

  • OpenAI GPT-5.4 + Codex Security Agent — GPT-5.4 Pro 支持百万 token 上下文+增强推理,Codex Security 专为代码漏洞扫描,已扫 120 万 commits | OpenAI
  • Claude Adaptive Thinking(Claude Opus 4.6) — 自动决策何时启动深度推理,无需用户手动配置;支持上下文压缩(Context Compaction)避免超长会话截断 | Anthropic
  • Google Nano Banana Pro — 基于 Gemini 3 Pro 的高保真图像生成模型,文字渲染大幅提升,已在 AI Studio 付费预览 | Google DeepMind
  • Qwen3.5-4B/9B — 阿里专为 Agentic 设计,4B 支持大上下文多模态,9B 超越 gpt-oss-120B,完全开源可本地部署 | Alibaba
  • Olmo Hybrid 7B(Ai2) — Allen Institute 开源 7B 模型,MMLU 数据效率是 Olmo 3 的 2 倍,对学术社区友好 | Allen AI

📊 GitHub 热门项目

  • langchain-ai/dify ⭐130,000+ — 低代码 AI Agent 构建平台,支持 RAG/Function Calling/私有化部署(Python/JS) → 亮点:3 月新版加强多 Agent 编排,可视化节点设计;研航若需要快速搭 Agent 流水线可考虑集成

  • FoundationAgents/MetaGPT ⭐61,919 — 多 Agent 模拟软件公司(PM+架构师+工程师),自动生成需求→代码→PR(Python) → 亮点:新增 role-play 场景,适合一人团队模拟团队协作,自动 code review 值得研究

  • microsoft/autogen ⭐54,600 — 微软多 Agent 会话框架,事件驱动架构,AutoGen Studio 支持无代码配置(Python) → 亮点:生产级多 Agent 系统首选,IBM/Cisco 在用;MetaScholar 协调 screening/extraction Agent 的参考方案

  • crewAIInc/crewAI ⭐44,300 — 基于角色扮演的多 Agent 协作框架,IBM/PwC 生产部署,2-4 小时原型(Python) → 亮点:Agent 角色定义灵活,MetaScholar 的 RoB 评估可用多 Agent 交叉验证提升一致率

  • adenhq/hive ⭐新项目 — 自进化 Agent 框架,Agent 失败时触发"进化循环",用编码 Agent 重写图逻辑后重新部署(Python) → 亮点:解决 Agent 失败恢复问题,思路新颖;对 MetaScholar 处理异常提取有参考价值


🐦 X/Twitter AI 热门话题

  • [@sama]: 在全员会议承认"无法控制主权政府如何部署 AI",并描述 OpenAI 军事合同"显得投机草率"——AI 伦理边界争论成本周最热主题,相关讨论超数万转评

  • [@karpathy]: "Vibe coding 已终结——我们正进入 Agent 编程时代。现在 80%+ 的代码由 AI 写,开发者变成了审查员和架构师。" — 引发"Slopacolypse"(AI 代码质量下滑恐慌)热词,百万浏览

  • [@DarioAmodei]: 面对五角大楼"供应链风险"定性,公开回应:"AI 安全护栏不可谈判,哪怕损失合同。" — 科技圈大量正面反应,Anthropic 用户活跃度同步激增

  • [@ylecun]: "LLM 不是通往 AGI 的路——我们需要能理解物理世界的模型。Amodei 的两年 AGI 预测是幻觉。" — 与 Amodei 的公开辩论持续升温,Davos+India AI Summit 双场对决成科技圈顶流内容

  • [AI Twitter 整体]: Altman 关于 AI 能耗"17 加仑/次查询"的辟谣,引出更大讨论:AI 与可持续发展的真实数据。同时 OpenAI 和 Anthropic 的 Pentagon 对垒成本周最大叙事冲突


🐾 OpenClaw 生态

本日无重大更新。ClawFeed 正常运行,昨日数据已聚合。


🔬 AI + 科研/医学

竞品动态:

  • Elicit 整合 Claude Opus 4.5,内部评测数据提取优于 Gemini 3 Pro 和 GPT-5;新增"Research Agents"功能,可分析 2 万数据点 + 每次检索 1000 篇相关论文;"严格筛选"模式已面向学术发表标准
  • Covidence 3 月持续强化 Cochrane 规范支持:RCT 分类器自动排除非 RCT,PRISMA 流图自动生成,早期用户反馈"太贵"(年费 $3000+)成最大槽点
  • Consensus 200M 论文数据库,「Consensus Meter」量化研究共识度,已整合 ChatGPT 插件;免费层功能足够科研入门,付费转化率低

AI 科研新进展:

  • AI 临床试验优化:2026 年被视为"AI 在临床试验从实验走向落地"的转折年,协议自动化减少人工流程、AI 辅助患者招募
  • NVIDIA + Eli Lilly 合作:AI 实验室 + 机器人结合加速药物发现,生成式 AI 用于 de novo 分子设计
  • Hippocratic AI 融资 $1.41 亿:专注用 AI Agent 替代医院行政/护理助理岗位(辅助,非替代临床决策)

启示: Elicit 不断强化数据提取和严格筛选,正面压力增大。MetaScholar 的差异化在于全流程自动化(screening→extraction→meta 计算→报告一键输出)而不是单点功能。修复 include/included bug 和提升 LLM 双审一致率(当前 29%)是本周 P0。


📈 研航数据

⚠️ SSH 连接失败REDACTED_IP SSH 拒绝连接,主服务器上次已知宕机状态延续)

使用最近已知数据(截至 3/4):

指标上次已知备注
总用户25⚠️ SSH 失败,数据截至 3/4
Pro 用户12付费率 48%
累计收入¥187.60
日活N/A待服务器恢复

⚠️ 行动项: 研航主服务器(REDACTED_IP)SSH 仍无法连接,需老板去阿里云控制台检查实例状态。这是昨日晨报记录的遗留问题,今日应优先处理。


📋 今日待办

  1. 🔴 阿里云控制台检查研航主服务器 — 实例是否宕机/磁盘满/OOM,恢复 SSH 访问
  2. 🔴 MetaScholar Benchmark bug 修复include/included 字段匹配问题(P0)
  3. 🔴 获取 10-20 个 Cochrane Gold Standard 文件 — Benchmark 系统验证的前提
  4. 🟡 Gemini 3.1 Pro 数据提取测试 — $2/M token vs 当前方案,目标降本 60%
  5. 🟡 MetaScholar LLM 双审一致率优化 — 当前 29%,目标 >50%(Few-shot 注入)
  6. 🟢 新加坡服务器 Gemini API 网关部署 — 牛排上周已打通 SSH,待部署服务

13次搜索 | 7条AI动态 | 5个GitHub项目 | 5条Twitter话题 | ⚠️ SSH失败用已知数据 | Notion同步中