Anthropic 发布 Claude Fable 5(模型 ID claude-fable-5),定位「已公开模型中最强」,与 Mythos Preview 同底层,任务越复杂领先越大。1M context / 128K 输出,Adaptive thinking 常开。安全机制:网安、生物/化学、蒸馏三类高危查询自动回退 Opus 4.8(实测 95% session 无回退)。同步发布 Mythos 5(解锁版,仅限 Project Glasswing 审核伙伴)。
定价与窗口:API $10/$50 每百万 tokens(Opus 4.8 的 2 倍);6/22 前 Pro/Max/Team/Enterprise 订阅免费包含,6/23 起需购买算力积分。SWE-bench Pro 80.3%(GPT-5.5 为 58.6%);Stripe 实测一天完成全库迁移;纯视觉通关 Pokémon FireRed。HN 当日 #1(780 点 / 502 评)。
争议两则:① 所有 Fable 5 流量强制 30 天留存(覆盖原 zero-retention 企业协议,声明仅用于安全不用于训练),TechCrunch 指可能成行业先例;② 社区发现安全分类器禁止用于加速 ML/LLM 自身开发(训练 pipeline、加速器设计等),被解读为护城河策略——此点为单一来源截图(Alex Volkov),待官方文档确认。Verge 另质疑「无 Fable 1–4 直接跳 5」命名不透明。
ORCHE 注:本简报即由 Fable 5 生成——运行平台模型已于 6/10 切换。
Jack Clark 与 Marina Favaro 联名长文披露内部数据:Claude 写入 Anthropic 生产代码占比已超 80%(Claude Code 推出前为个位数),工程师季度产出为数年前 8 倍,内部 benchmark 上 Claude 改进速度 52 倍 vs 人类 4 倍。文章判断 AI 正逼近「递归自我改进(RSI)」临界点,呼吁前沿实验室建立可验证的协调暂停机制(类比中程核武条约,但承认「训练任务比导弹发射井更容易藏」)。Clark 对 BBC 称现状「有油门没刹车」。
反面声音:同周发布 Fable 5 构成「呼吁刹车同天踩油门」张力;学界(Georgia Tech Riedl、Giansiracusa)与 New Scientist 认为是 IPO 前战略定位——Anthropic 6/1 已机密提交 S-1(5/28 融资 $65B、估值 $9,650 亿美元,超 OpenAI 的 $8,520 亿)。FLI 6/8 跟进声明。
iOS 27 系列发布「全新版本 Siri」:Apple Foundation Models + Google Gemini 联合驱动(合作首次公开),全系统屏幕感知、跨设备多轮记忆(iCloud 同步)、Write with Siri。开发者测试即日启,公测秋季。最强本地推理限 iPhone 17 Pro / M3+ Mac。
监管冲突:Siri AI 不在 EU 上线,Apple 提「Trusted System Agent」中介 + 18 个月过渡期被拒;EU 委员会 6/9 反击「决定完全是 Apple 自己的,DMA 没有条款禁止上新」。中国同样缺席(未公开理由)。HN 当日 #2(193 点 / 318 评)。
本期核心判读:时间表首次具体化。前沿实验室内部人同周给出具体时点——Jack Clark 估 60% 概率 2028 年前出现「最大化 RSI」(AI 自主设计继任系统,Import AI #460,6/8);Hassabis 称 AGI 约 2030±1 年(Stanford GSB,6/2)。三信号实证持续累积,且首次三个领域同月铺开:
① 审批递减:Travelers 保险 AI 理赔系统 85–90% 首报全程无人工(OpenAI Realtime API,8 州 pilot 两个月扩全美,年均 150 万理赔规模)6/2-6/3;Rakuten 披露 Claude Code 自主 7 小时重构 1,250 万行代码库(99.9% 准确、工程师零介入),下一步「24 个并行 session 的 ambient agent」取代月级人工任务 6/2。
② 自我迭代:Anthropic RSI 博客披露罕见一手实证——Claude agent 获开放研究问题后自主完成假设→实验→跨 agent 分享→迭代全循环($18,000 算力、数百小时)6/4。
③ 领域扩张:SAP「Autonomous Enterprise」框架落地(Takeda 制造自主管控 +10% 生产力、−25% 缺货损失)6/4-6/8;Meta Business Agent 全球发布——「AI 帮你运营整个生意」,100 万企业已在 WhatsApp 测试 6/3。保险、软件工程、制造、商业运营四领域同步。
阻力面(同样在变硬):CSA 独立评估 100 款生产 AI agent——89% 未达基线安全、98% 具备「lethal trifecta」高危架构、83% 供应商安全声明无独立核查 6/6;SAP 自认 90% AI 用例卡在 pilot(前情 6/5 期);Eric Topol 对 NYT 警告医疗 AI「从未在真实医疗的混乱中被检验」6/8。
以 Cue-Tag-Content 图为记忆结构,检索时将 LLM 推理整合进多轮图遍历并动态剪枝。LoCoMo 相对增益 23.3%(Gemini backbone);prompt tokens 降至 118K(基线 A-Mem 为 632K)。代码已开源。前情:6/5 期 CoMIC——agent 记忆架构论文连续两期爆发,方向与 ORCHE 记忆工程直接相关。
v2.1.170(6/9):Fable 5 接入的最低版本;修复 VS Code 集成终端 transcript 不保存。
v2.1.169(6/8):--safe-mode(禁用全部自定义——CLAUDE.md/plugins/skills/hooks/MCP,troubleshooting 专用);/cd session 内切目录不打断 prompt cache;disableBundledSkills。
v2.1.166(6/6):fallbackModel 最多三级备选模型;deny rule 支持 glob;cross-session 权限硬化——SendMessage 中继消息不再携带 user authority(安全修复);thinking 可全禁。
⚠ 退役提醒:claude-opus-4-20250514 / claude-sonnet-4-20250514 于 6/15 退役(ORCHE 体系已查无引用)。
GitHub Copilot 接入 Fable 5(6/9):覆盖 VS Code/CLI/JetBrains/Xcode 等全端;关键限制——Fable 5 需 30 天数据留存跑安全分类器,打破其他 Claude 模型的 Zero Data Retention 协议,企业管理员需显式开启(默认 off)。内部数据:Fable 5 完成同等工作的 tool calls 与 token 均低于 Opus。L 候选
AWS Bedrock 上线(6/9):anthropic.claude-fable-5(US East + 斯德哥尔摩);回退计费——有害 prompt 路由 Opus 4.8 时按 Opus 价格计。
正面:HN 当日 #1(780 点/502 评);Stripe「数月工程压缩到数天」;Alex Volkov 用 Mythos 5 在 16 小时完成原估 40–95 天任务;Mike Krieger 周末 2 天构建自维护媒体追踪器;Dan Shipper(Every)内测一周后发 vibe check。
负面/质疑:「nerfed Mythos」——Fable 5 = Mythos 同权重 + 分类器限制,命名逻辑不透明(Verge 点名,Anthropic 未回应);30 天留存企业合规反弹预期强;HN 6/9 热帖「Cleaning up after AI rockstar developers」议 AI 代码「优质但难接手」的维护困境。
OpenAI Lockdown Mode 扩展至消费者(6/6):确定性禁用外泄通道工具(实时浏览/Agent Mode/Deep Research);Simon Willison 指其切断 lethal trifecta 第三要素,但也暗示默认 ChatGPT 对强 prompt injection 无法完全防御;HN 发现不覆盖 Codex 网络访问。
Cursor 3.7 + SDK(6/4-6/5):subagents 嵌套不限深度、auto-review 分类器自动决定审批、Design Mode 语音输入。
Codex CLI 0.138(6/8):延续 6/2「Codex for every role」角色化 plugin 路线。