AI 情报简报 — 2026-06-10

🔥

今日焦点

Claude Fable 5 + Mythos 5 发布——首款公开 Mythos 级模型 6/9

Anthropic 发布 Claude Fable 5（模型 ID claude-fable-5），定位「已公开模型中最强」，与 Mythos Preview 同底层，任务越复杂领先越大。1M context / 128K 输出，Adaptive thinking 常开。安全机制：网安、生物/化学、蒸馏三类高危查询自动回退 Opus 4.8（实测 95% session 无回退）。同步发布 Mythos 5（解锁版，仅限 Project Glasswing 审核伙伴）。

定价与窗口：API $10/$50 每百万 tokens（Opus 4.8 的 2 倍）；6/22 前 Pro/Max/Team/Enterprise 订阅免费包含，6/23 起需购买算力积分。SWE-bench Pro 80.3%（GPT-5.5 为 58.6%）；Stripe 实测一天完成全库迁移；纯视觉通关 Pokémon FireRed。HN 当日 #1（780 点 / 502 评）。

争议两则：① 所有 Fable 5 流量强制 30 天留存（覆盖原 zero-retention 企业协议，声明仅用于安全不用于训练），TechCrunch 指可能成行业先例；② 社区发现安全分类器禁止用于加速 ML/LLM 自身开发（训练 pipeline、加速器设计等），被解读为护城河策略——此点为单一来源截图（Alex Volkov），待官方文档确认。Verge 另质疑「无 Fable 1–4 直接跳 5」命名不透明。

ORCHE 注：本简报即由 Fable 5 生成——运行平台模型已于 6/10 切换。

Official 极客开发者 ORCHE 相关 L 候选

Anthropic「When AI Builds Itself」——RSI 警告 + 呼吁全球协调暂停机制 6/4 发布 · 6/5-6/9 发酵

Jack Clark 与 Marina Favaro 联名长文披露内部数据：Claude 写入 Anthropic 生产代码占比已超 80%（Claude Code 推出前为个位数），工程师季度产出为数年前 8 倍，内部 benchmark 上 Claude 改进速度 52 倍 vs 人类 4 倍。文章判断 AI 正逼近「递归自我改进（RSI）」临界点，呼吁前沿实验室建立可验证的协调暂停机制（类比中程核武条约，但承认「训练任务比导弹发射井更容易藏」）。Clark 对 BBC 称现状「有油门没刹车」。

反面声音：同周发布 Fable 5 构成「呼吁刹车同天踩油门」张力；学界（Georgia Tech Riedl、Giansiracusa）与 New Scientist 认为是 IPO 前战略定位——Anthropic 6/1 已机密提交 S-1（5/28 融资 $65B、估值 $9,650 亿美元，超 OpenAI 的 $8,520 亿）。FLI 6/8 跟进声明。

Official 大众极客

Apple WWDC26：Siri AI 全面重做（Gemini 联合驱动），EU/中国缺席 6/8

iOS 27 系列发布「全新版本 Siri」：Apple Foundation Models + Google Gemini 联合驱动（合作首次公开），全系统屏幕感知、跨设备多轮记忆（iCloud 同步）、Write with Siri。开发者测试即日启，公测秋季。最强本地推理限 iPhone 17 Pro / M3+ Mac。

监管冲突：Siri AI 不在 EU 上线，Apple 提「Trusted System Agent」中介 + 18 个月过渡期被拒；EU 委员会 6/9 反击「决定完全是 Apple 自己的，DMA 没有条款禁止上新」。中国同样缺席（未公开理由）。HN 当日 #2（193 点 / 318 评）。

Official 大众

📡

追踪中

超高度自主化进程（Super-Autonomy Trajectory）追踪自 6/3

本期核心判读：时间表首次具体化。前沿实验室内部人同周给出具体时点——Jack Clark 估 60% 概率 2028 年前出现「最大化 RSI」（AI 自主设计继任系统，Import AI #460，6/8）；Hassabis 称 AGI 约 2030±1 年（Stanford GSB，6/2）。三信号实证持续累积，且首次三个领域同月铺开：

① 审批递减：Travelers 保险 AI 理赔系统 85–90% 首报全程无人工（OpenAI Realtime API，8 州 pilot 两个月扩全美，年均 150 万理赔规模）6/2-6/3；Rakuten 披露 Claude Code 自主 7 小时重构 1,250 万行代码库（99.9% 准确、工程师零介入），下一步「24 个并行 session 的 ambient agent」取代月级人工任务 6/2。

② 自我迭代：Anthropic RSI 博客披露罕见一手实证——Claude agent 获开放研究问题后自主完成假设→实验→跨 agent 分享→迭代全循环（$18,000 算力、数百小时）6/4。

③ 领域扩张：SAP「Autonomous Enterprise」框架落地（Takeda 制造自主管控 +10% 生产力、−25% 缺货损失）6/4-6/8；Meta Business Agent 全球发布——「AI 帮你运营整个生意」，100 万企业已在 WhatsApp 测试 6/3。保险、软件工程、制造、商业运营四领域同步。

阻力面（同样在变硬）：CSA 独立评估 100 款生产 AI agent——89% 未达基线安全、98% 具备「lethal trifecta」高危架构、83% 供应商安全声明无独立核查 6/6；SAP 自认 90% AI 用例卡在 pilot（前情 6/5 期）；Eric Topol 对 NYT 警告医疗 AI「从未在真实医疗的混乱中被检验」6/8。

ORCHE 相关 Official Academic

🎙

前沿人物动态

Jack Clark T2

Anthropic Co-founder / Import AI

6/8 Import AI #460 首次披露 RSI 内部数据（代码量 8 倍、增速仍在加速），估 60% 概率 2028 前「最大化 RSI」；6/4 BBC Newsnight：「有油门没刹车」，2 年内可能 100% 代码由 AI 写。

Demis Hassabis T1

Google DeepMind CEO

6/2 演讲 · 持续发酵至 6/8 Stanford GSB 宣称人类处于「奇点的山麓」，AGI 约 2030±1 年——其迄今最具体时间表，自称「刻意用刺激性语言」催促政策制定者；将 Mythos 定性为「示警信号」。另与 Sanger 研究所建 5 年基因组 AI 联合体（$500 万美元/年）6/8。

Sam Altman T1

OpenAI CEO

6/8 主动约见 Bernie Sanders 谈「OpenAI 向政府捐股建公共财富基金」——未达协议（Sanders 坚持 50% 门槛）但表态支持公共所有制原则；同期与 Trump 政府谈监管。

Andrej Karpathy T3

Anthropic 研究员（5/19 加入）

6/6 发布 2 小时 AI 日常工作流录屏（1.4M 浏览）：用自然语言给 AI 布置任务如同向同事下令，「目标是彻底把自己移出 AI 的 bottleneck」——引爆「做 AI 的管理者而非操作者」讨论。

Elon Musk T3

xAI / Tesla / SpaceX

6/5 X 宣布 Grok V9-Medium 完成训练——1.5 万亿参数（现产线 v8-small 的 3 倍），6 月中旬发布；同期 Grok Voice（接入 250 万 voice agents）、Grok Imagine 1.5（视频 Arena #1）、Grok Build 0.1 编程模型公测。

Yann LeCun T1

AMI Labs（$10.3 亿美元种子轮 / 估值 $35 亿）

6/6-6/8 两篇预印本引发关注：LeJEPA 可实现「线性可识别性」（特定条件恢复真实隐变量）；stable-worldmodel benchmark 同时自曝短板——对象颜色改变后 world model 成功率 50%→12%。重申 LLM 无法真正推理规划，预测 2027 初行业认识到范式转移必要。

Mark Zuckerberg T1

Meta CEO

6/3 伦敦发布 Meta Business Agent（WhatsApp/IG/Messenger 三平台、初期免费），目标「AI 最终帮你运营整个生意」；配套企业级 agentic 平台接入 Shopify/Zendesk 等数百系统。

Sergey Brin T1

Google 共同创办人

6/4-6/6 AGI House 炉边谈话：以 AlphaGo 类比论证「AI 超越人类不终止人类进步」；判断 Gemini 经 transformer+MoE+多模态收敛正走向 AGI，但 AGI 之后「无法想象」。

Greg Brockman T1

OpenAI 总裁

6/4 确认正式接管 OpenAI 产品战略：ChatGPT、Codex、API 合并为单一产品团队，打造整合桌面应用（含 Atlas 浏览器），直指 Anthropic 编程竞争；同期多位高管离职（Sora 主管 Peebles 等）。

Mustafa Suleyman T1

Microsoft AI CEO

6/2（Build 2026）发布 7 款 MAI 自研模型——旗舰 MAI-Thinking-1（35B active / 256K context）blind test 优于 Sonnet 4.6、SWE-Bench Pro 匹敌 Opus 4.6；提出「Humanist Superintelligence」定位。

Swyx T2

Latent Space 主理

6/2 引发「微软 Build 幻灯片疑似泄露 Mythos 算力 6.1e27 FLOPs」讨论——被同圈质疑像素测量误差，结论 speculative；AINews 引「Reliability: Reality is the final eval」。

Eric Topol T1/T2

Scripps Research

6/6-6/8 Ground Truths 播客谈「真正的医学证据」+ NYT 采访警告：医疗 AI「潜力巨大但尚未达到，从未在现实医疗实践的混乱中被真正检验」；合著《健康 AI 准备就绪的幻觉》指前沿模型医疗能力缺口显著。

实验室横截面（本期出牌）

Anthropic：Fable 5 + Mythos 5 公开发布 + RSI 数据引爆自我改进讨论，IPO S-1 已递。
OpenAI：Altman 向政治中心靠拢（Sanders/Trump 双线），Brockman 整合 ChatGPT+Codex 产品线，269 页联邦政策蓝图。
xAI：Grok V9 1.5T 训练完成 + Voice / Imagine 1.5 / Build 0.1 密集发布周。
Google：Hassabis「奇点山麓」+ Brin 为 Gemini AGI 路线背书 + Sanger 基因组联合体；Siri AI 由 Gemini 联合驱动（Apple 合作公开）。
Meta：Business Agent 全球落地——agent 商业化最大规模铺开；LeCun 出走后的 world model 路线由 AMI Labs 延续对垒。
DeepSeek：本期窗口无可验证新动态。

💡

技术突破

MRAgent：「重构而非检索」记忆范式（ICML 2026）6/5

以 Cue-Tag-Content 图为记忆结构，检索时将 LLM 推理整合进多轮图遍历并动态剪枝。LoCoMo 相对增益 23.3%（Gemini backbone）；prompt tokens 降至 118K（基线 A-Mem 为 632K）。代码已开源。前情：6/5 期 CoMIC——agent 记忆架构论文连续两期爆发，方向与 ORCHE 记忆工程直接相关。

Academic ORCHE 相关

Mem0 新算法持续发酵：LoCoMo 91.6（+20pp）4 月升级 · 6/9 仍活跃推送 ORCHE 相关 L 候选

单次 ADD-only 抽取 + entity linking + 多信号检索（semantic/BM25/entity 融合）+ 时间推理；LongMemEval 94.8（+27pp），token 维持 ~7K、p50 延迟 0.88s。GitHub 58K stars、331 releases。注：ORCHE Phase 3C 前置条件即含 Mem0 进展扫描——此为关键节点。

Google Agentic RAG：Sufficient Context Agent 6/5 Official

生成前反复搜索直到确认上下文充分（而非空结果即弃答）；FramesQA 跨语料库准确率 90.1%，factuality 数据集较标准 RAG 最高 +34%。已在 Gemini Enterprise Agent Platform public preview。

Microsoft Lens：3.8B 参数图像生成对垒 80B 6/8 Academic

训练算力仅同类 1/5，多项 benchmark 胜 Hunyuan-Image-3.0（80B）；Lens-Turbo 4 步生成、H100 上 1MP <1 秒，MIT 开源（研究用）。以「精细 caption > 原始规模」挑战 scale 叙事。注：单一媒体来源（The Decoder）。

📦

开源生态

llama.cpp b9455 多 GPU 吞吐追平 vLLM 6/3 · 持续发酵极客 L 候选

2×RTX 3090 跑 Qwen 27B UQ8 达 70 t/s（此前 30–50），终结 vLLM 多卡独占优势——GGUF 用户不再为速度被迫迁移。社群信号：r/LocalLLaMA 原帖 + dev.to 转载 + 硬件指南引用。

Gemma 4 31B FP8 在生产 agent 任务追平 Sonnet 4.6 6/8 极客 L 候选

r/LocalLLaMA 开发者实测三类生产 workload（Neo4j Cypher / 实体抽取 / 工具调用）与 Sonnet 4.6 medium 持平；FP8 + QAT 变体是推手。「本地开源模型追平商业前沿」对等点出现——24GB 单卡可跑。

mistral.rs 集成 Gemma 4 12B：内置 web search + 沙箱代码执行 6/4 极客

Rust 推理引擎一条命令安装，捆绑多模态输入 + multi-token prediction——无云依赖的生产级 agentic pipeline；Gemma 4 发布数日内完成集成。来源：r/LocalLLaMA + AIWeekly。

⚙

Claude Code 专区

功能发布 v2.1.166–170 · 6/6–6/9

v2.1.170（6/9）：Fable 5 接入的最低版本；修复 VS Code 集成终端 transcript 不保存。
v2.1.169（6/8）：--safe-mode（禁用全部自定义——CLAUDE.md/plugins/skills/hooks/MCP，troubleshooting 专用）；/cd session 内切目录不打断 prompt cache；disableBundledSkills。
v2.1.166(6/6)：fallbackModel 最多三级备选模型；deny rule 支持 glob；cross-session 权限硬化——SendMessage 中继消息不再携带 user authority（安全修复）；thinking 可全禁。

⚠ 退役提醒：claude-opus-4-20250514 / claude-sonnet-4-20250514 于 6/15 退役（ORCHE 体系已查无引用）。

Official ORCHE 相关 L 候选

应用场景讨论

GitHub Copilot 接入 Fable 5（6/9）：覆盖 VS Code/CLI/JetBrains/Xcode 等全端；关键限制——Fable 5 需 30 天数据留存跑安全分类器，打破其他 Claude 模型的 Zero Data Retention 协议，企业管理员需显式开启（默认 off）。内部数据：Fable 5 完成同等工作的 tool calls 与 token 均低于 Opus。L 候选

AWS Bedrock 上线（6/9）：anthropic.claude-fable-5（US East + 斯德哥尔摩）；回退计费——有害 prompt 路由 Opus 4.8 时按 Opus 价格计。

评价

正面：HN 当日 #1（780 点/502 评）；Stripe「数月工程压缩到数天」；Alex Volkov 用 Mythos 5 在 16 小时完成原估 40–95 天任务；Mike Krieger 周末 2 天构建自维护媒体追踪器；Dan Shipper（Every）内测一周后发 vibe check。

负面/质疑：「nerfed Mythos」——Fable 5 = Mythos 同权重 + 分类器限制，命名逻辑不透明（Verge 点名，Anthropic 未回应）；30 天留存企业合规反弹预期强；HN 6/9 热帖「Cleaning up after AI rockstar developers」议 AI 代码「优质但难接手」的维护困境。

竞品对照

OpenAI Lockdown Mode 扩展至消费者（6/6）：确定性禁用外泄通道工具（实时浏览/Agent Mode/Deep Research）；Simon Willison 指其切断 lethal trifecta 第三要素，但也暗示默认 ChatGPT 对强 prompt injection 无法完全防御；HN 发现不覆盖 Codex 网络访问。
Cursor 3.7 + SDK（6/4-6/5）：subagents 嵌套不限深度、auto-review 分类器自动决定审批、Design Mode 语音输入。
Codex CLI 0.138（6/8）：延续 6/2「Codex for every role」角色化 plugin 路线。

📊

横向热度

1

Trump 签署 AI 国安总统备忘录（NSPM-AI）6/5 监管

依据：白宫官方 Fact Sheet + OpenAI 当日公开表态遵从 + 与 Anthropic/DoD 冲突背景联动报道

取代拜登 NSM-25：最先进商业/开源模型快速部署军方与情报机构；禁止任何实体未经授权禁用美军依赖的 AI 系统；建 AI 国安战略储备。

2

Anthropic 机密提交 IPO S-1 6/1 融资

依据：Anthropic 官方声明 + CNBC/TechCrunch 重量级报道「AI 史上最大 IPO 之一」

紧随 5/28 $65B 融资轮（估值 $9,650 亿美元，超 OpenAI $8,520 亿）；OpenAI 亦准备机密提交——双巨头 IPO 竞速开启。

3

OpenAI 发布 269 页联邦 AI 政策蓝图 6/5 监管

依据：Zvi Mowshowitz 深度分析「高度合理、远超预期」（T2 权威）+ Techmeme 收录

《Great American AI Act 2026》草案：CAISI 强制评估前沿模型（不批准/拒绝部署）、RSI 列「紧急优先级」、联邦预占州法（引反弹）。与 Anthropic RSI 警告构成一周双重 RSI 话语高峰。

4

HN 职业焦虑双热帖：「LLMs are eroding my career」×「AI 正碾压 ChatGPT 前创业潮」6/7 / 窗口内文化

依据：6/7 HN 定调整日讨论方向 + 跨帖讨论串 + 6/9「Cleaning up after AI rockstars」延续

10 年后端工程师称深度领域技能被 Claude Code 加持的初级工程师替代，行业「扁平化为通才」；2020-22 年 NLP 创业公司未完成 PMF 即遭碾压。

5

多伦多大学 AI Worm：跨 AI 系统感染演示窗口内（HN）学术

依据：HN 热帖 + Palisade Research 独立复现（含复制模型权重，44% 宣称成功率）

AI worm 可跨设备感染并自我复制；与 Fable 5 安全报告「N-day = N-hour」呼应——攻防两侧同步加速。

⚡

行动建议

6/15–6/23 计费变化密集窗口——三事叠加：CC 计费 6/15 剥离订阅补贴（前期已报）+ 旧模型 6/15 退役 + Fable 5 订阅免费期 6/22 截止（6/23 起需算力积分）。建议 6/20 前后评估 Fable 5 实际用量与 Max 订阅在新计费下的性价比。（建议去向：追踪清单 6/20）
Fable 5 强制 30 天留存适用所有流量——含 ORCHE 日常对话（覆盖原 zero-retention 协议；Anthropic 声明仅安全用途不训练）。资讯说明，无行动必要，知情即可。
旧模型 ID 引用已查——ORCHE 全 vault + settings 无 claude-opus-4/sonnet-4-20250514 引用，6/15 退役无影响。已完成，无后续。
Mem0 算法升级触及 Phase 3C 前置条件——LoCoMo 91.6 已属生产级记忆方案水位；周五 L 候选批量更新将写入 landscape，3C 评估时点渐近。（建议去向：现有维护线覆盖，无新增）