Codex录一遍即复刻技能，SubQ破注意力瓶颈56倍提速，AWS为Agent建知识图谱

侧重 AI Coding 与 具身智能 方向，精选 5 条本周值得关注的重要动态。

1. OpenAI Codex 发布 Record & Replay：看一遍即复刻，AI 编程从提示词驱动转向演示驱动

事件内容：
OpenAI 于 6 月 20 日为 Codex macOS 应用推出全新功能 Record & Replay。用户只需在电脑上正常演示一遍工作流程（如上传 YouTube 视频含元数据、缩略图和字幕），Codex 全程观察操作与窗口内容，自动将流程打包为可查看、可编辑的 Skill 技能文件，后续可自主重复执行。该功能需先激活 Computer Use，目前暂不对欧盟、英国和瑞士开放。同期 Codex v26.616 还新增了 Automations 批量操作和本地/远程主机线程切换功能，让任务可在不同机器间无缝续跑。

为何值得关注：
Record & Replay 标志着 AI 编程交互范式的根本性转变：从编写提示词描述需求，进化到直接演示行为让 AI 学习复刻。这解决了两个长期痛点：一是大量重复性工作流（报销、数据提交、配置部署等）此前无法被 AI Agent 高效接管，因为用自然语言精确描述 GUI 操作步骤极其困难；二是 Skill 文件可查看、可编辑，意味着 AI 学到的行为不再是黑箱，而是可审计、可迭代的显式资产。对于 AI Coding 赛道，这是 Codex 继浏览器开发者模式、CDP 协议支持后的第三次重大范式升级——从代码级操作走向行为级复刻，AI Agent 的能力边界从写代码扩展到接管完整工作流。与 Claude Code 的 YOLO 模式、Anthropic 的主动助手 Claude Orbit 形成三路竞速：谁能让 AI 最自然地理解人类意图并自主执行，谁就拿下下一个入口。

2. AWS Summit 发布 Continuum 与 Context：为 AI Agent 补上安全与上下文两块短板

事件内容：
6 月 17 日 AWS Summit New York 上，亚马逊云一口气推出两项关键服务。AWS Continuum 自动化代码安全漏洞的全生命周期管理——从发现、优先级排序、可利用性验证到修复建议，支持从学习模式（人工确认）逐步升级到执行模式（自主修复），底层调用 Anthropic Claude Mythos 等前沿安全模型。AWS Context 则从企业数据自动构建知识图谱并供所有 Agent 共享——连接数据库、文档、邮件、聊天记录等多元数据源，建立实体关系与业务规则，让 Agent 在查询时获得权威上下文而非自信地给出错误答案。此外，AWS DevOps Agent 新增发布前评审与动态测试计划功能，专门应对 AI 生成代码的可靠性问题；编程 Agent Kiro 推出 iOS 版实现移动端控制；Bedrock AgentCore 平台扩展了 SharePoint、Confluence、Google Drive 等数据连接器和安全过滤器。

为何值得关注：
这是 2026 年企业级 AI Agent 基础设施最完整的一次集中发布。Continuum 和 Context 精准命中了 AI Agent 落地的两大死穴：一是安全跟不上 AI 生成代码的速度（亚马逊自身就因 Kiro 自主删除环境导致 13 小时故障，此后强制要求资深工程师审核所有 AI 代码）；二是 Agent 缺乏业务上下文，频繁给出自信但错误的建议。AWS Context 的知识图谱路径与开源工具 codebase-memory-MCP 的代码索引思路殊途同归——都在用结构化知识替代暴力加载上下文窗口，但前者面向企业全域数据，后者面向代码库，是同一理念在不同维度的落地。Kiro 登陆 iOS 则暗示 AI 编程 Agent 正在从桌面工具进化为随时可控的移动端指挥中心。对企业用户而言，这套组合拳大幅降低了 Agent 生产部署的门槛和安全风险。

3. Subquadratic 宣称破解注意力瓶颈：稀疏注意力 56 倍提速，第三方验证出炉

事件内容：
迈阿密初创公司 Subquadratic 上月走出隐身模式，宣称解决了困扰大语言模型近十年的二次注意力瓶颈——即文本长度翻倍时计算量翻四倍的数学问题。其模型 SubQ 采用动态稀疏注意力替代 Transformer 的密集注意力，仅选择关键词汇关系进行计算而非全量乘法。6 月 19 日 MIT Technology Review 报道，第三方评测机构 Appen 的独立验证结果显示：SubQ 在速度基准测试中比 FlashAttention 快 56 倍；在 LiveCodeBench 编程竞赛评测中得分 89.7%，与主流顶级编码模型同档；上下文窗口可达 1200 万 token（主流模型仅 100 万），needle-in-haystack 测试在 600 万和 1200 万 token 下均达 98% 准确率。CEO Justin Dangel 称，运行 Anthropic Opus 4.6 的 RULER 128 测试需 2600 美元，SubQ 仅需 8 美元。不过批评者指出 SubQ 基于 Qwen 权重微调而非完全从头训练，其更激进的主张（将终结 Transformer 架构）尚待更广泛验证。

为何值得关注：
如果 Subquadratic 的声明最终被大规模实践验证，它将是自 2017 年 Transformer 论文以来 LLM 架构最重要的范式突破。稀疏注意力的 56 倍提速和 1200 万 token 上下文窗口，对 AI Coding 和具身智能均有直接冲击：AI 编程 Agent 处理超大型代码库时不再受上下文窗口限制，推理成本从数千美元降至数美元，让按量计费模式下的经济可行性大幅提升；具身智能模型在实时推理时可更低成本地处理更长的多模态序列（视觉帧 + 传感器数据 + 指令流），对部署在边缘端的人形机器人意义重大。然而目前 SubQ 尚未广泛开放，批评者的质疑（是否真正解决了瓶颈而非仅做了高效微调）仍有待更多独立验证消解。Subquadratic CTO Alex Whedon 的回应颇具意味：如果你想构建有竞争力的模型，你必须有新想法——我们面临的压力比 OpenAI 更大。

4. Recall 发布：为 Claude Code 插上零 Token 成本的持久记忆翅膀

事件内容：
6 月 21 日，开源项目 Recall 登上 Hacker News 首页（59 分 / 49 评论），为 Claude Code 提供完全本地化的项目持久记忆能力。Recall 在项目目录下创建 .recall/ 文件夹，维护两个文件：history.md 仅追加记录每次会话的提示、回复、修改文件和执行命令；context.md 通过本地 TF-IDF + TextRank 经典摘要算法（无需调用任何 LLM、零 Token 消耗）自动生成项目目标、进度摘要、下一步行动和当前停止点的紧凑摘要（约 1-2K tokens）。会话结束时钩子自动保存，新会话启动时从 context.md 恢复，整个流程完全离线、零 API 调用、零第三方模型依赖，会话记录（含代码路径、密钥等敏感信息）绝不外传。

为何值得关注：
Recall 解决了 AI 编程工具最普遍的冷启动痛点——每次新会话都要重新解释项目背景，浪费大量 Token 和时间。在 Anthropic 按量计费新规生效、Token 成本进入精细化核算的背景下，零成本持久记忆具有直接经济意义。与 Claude Code 内置的 CLAUDE.md（手动维护指令）和 --continue/--resume（重放完整对话、Token 消耗大）相比，Recall 提供了第三条路：自动捕获、本地摘要、紧凑恢复。更重要的是，Recall 在 AI 编程生态中确立了一个关键先例——持久记忆与隐私保护可以兼得，无需将上下文管道化传输到模型端点。这填补了当前 Claude Code 记忆生态的空白，与 codebase-memory-MCP 的知识图谱路径和 AWS Context 的企业知识图谱形成工具层、项目层、企业层三级互补，共同指向一个趋势：AI 编程基础设施正在从暴力上下文窗口转向结构化知识索引。

5. Windsurf 24 亿美元 vs Cursor 600 亿美元：25 倍价差背后的 AI 编程并购逻辑

事件内容：
Towards AI 于 6 月 21 日发布深度分析，对比谷歌 2025 年 7 月以 24 亿美元收购 Windsurf（原 Codeium）与 SpaceX 2026 年 6 月以 600 亿美元收购 Cursor（Anysphere）的 25 倍价差。核心发现：谷歌花了 24 亿但没留下产品，本质上是 acqui-hire 买团队；SpaceX 花了 600 亿买的是 400 万开发者的入口和 Cursor 对 LLM 的 harness——即模型编排层和用户界面层。文章指出一个反直觉的结论：这些工具内部用的模型几乎无关紧要，Windsurf 和 Cursor 的核心价值不在底层模型能力，而在围绕模型构建的交互框架、上下文管理、多模型路由和开发者工作流嵌入。Cursor 的 harness 让 Grok、Claude、GPT 等任何模型都能在其框架内高效运行，这才是 SpaceX 愿意支付 25 倍溢价的原因。

为何值得关注：
这篇文章对 AI 编程赛道的估值逻辑提供了最清晰的拆解，对从业者有三层启示。第一，AI 编程工具的核心壁垒不在模型而在编排层——谁拥有开发者入口和最佳 harness，谁就掌握定价权。这解释了为什么 Cursor 月活仅 Codex 的几分之一但估值远超后者：Cursor 是 IDE 而非 Agent，它锁定了开发者的日常工作环境。第二，谷歌买 Windsurf 只拿走团队的策略，反映了纯模型厂商在 AI Coding 产品层的短板——Gemini 和 Grok 在 Claude Code、Codex、Cursor 面前形不成竞争力，谷歌需要工程人才而非产品。第三，对国产 AI 编程工具（TRAE、通义灵码、CodeGeeX 等），这篇文章暗示了一条可能的突围路径：与其追赶模型能力，不如构建最强的 harness——用户界面、上下文管理、多模型路由才是真正能留住开发者的护城河。25 倍价差不是泡沫，而是市场对开发者入口价值的定价。

每日 09:00 自动更新 | 侧重 AI Coding 与具身智能方向

Codex录一遍即复刻技能，SubQ破注意力瓶颈56倍提速，AWS为Agent建知识图谱

1. OpenAI Codex 发布 Record & Replay：看一遍即复刻，AI 编程从提示词驱动转向演示驱动

2. AWS Summit 发布 Continuum 与 Context：为 AI Agent 补上安全与上下文两块短板

3. Subquadratic 宣称破解注意力瓶颈：稀疏注意力 56 倍提速，第三方验证出炉

4. Recall 发布：为 Claude Code 插上零 Token 成本的持久记忆翅膀

5. Windsurf 24 亿美元 vs Cursor 600 亿美元：25 倍价差背后的 AI 编程并购逻辑

Fable 5遭禁GPT-5.6进退两难，张江EAI开幕融资460亿

科技早报：2026-06-15

Claude Code按量计费今日生效，大晓机器人最快晋身独角兽

Anthropic自征税Codex真调试，GR00T开源

小米MiMo Code开源对决Claude Code，智源悟界RoboBrain发布筑基具身智能

科技早报：Homebrew 6.0 发布，AI 芯片算力翻倍

Codex周活破500万降价在即，智源大会开幕聚焦具身智能

科技早报：AI安全与GitHub热点盘点

AI编程与具身智能：Anthropic、GitHub前CEO、OpenAI等今日要点

工信部+国资委启动人形机器人实景实训，Claude Code与Codex体验战白热化

科技早报：Claude Fable 5 引热议，AI 算力再翻倍

AI Coding与具身智能速报：政策拐点与工具军备竞赛

WWDC 2026苹果发布新版Xcode与Core AI框架，Claude正式入驻iPhone，AI Extensions系统打破单一AI助手垄断|06-09

AI Coding与具身智能周报：Aifei、Claude Code、OpenAI机器人齐发力

AI Coding与具身智能周报：Anthropic冲刺万亿IPO

热门标签