侧重 AI Coding 与 具身智能 方向,精选 5 条今日值得关注的重要动态。
1. OpenAI发布首款自研AI推理芯片Jalapeño:9个月流片,推理成本直降约50%
事件内容:
美东时间6月24日,OpenAI与博通(Broadcom)联合发布首款自研AI推理芯片Jalapeño(西班牙语意为墨西哥辣椒)。该芯片为ASIC专用集成电路,专为大型语言模型推理工作负载从零设计,重点优化数据流架构以降低数据移动开销、平衡计算-内存-网络资源分配。OpenAI硬件主管Richard Ho表示,项目从立项设计到成功流片仅耗时9个月,期间OpenAI利用自有大模型辅助架构探索、功耗仿真与强化学习优化。工程样片已在实验室以量产标准的频率和功耗运行机器学习任务,并成功跑通GPT-5.3-Codex-Spark等复杂模型。据彭博社报道,博通CEO Hock Tan透露早期内部测试显示Jalapeño较当前主流AI GPU可实现约50%的推理成本节省。OpenAI计划2026年底完成初始部署,并与博通共同建设千兆瓦级算力集群。
为何值得关注:
Jalapeño标志着OpenAI从纯模型公司向全栈AI基础设施提供商的关键转型,也意味着AI产业竞争从单一模型能力比拼升级为模型+芯片+系统+网络的全栈竞赛。对AI Coding领域而言,推理成本下降50%将直接降低Codex等编程Agent的规模化部署成本,使按量计费、高频次代码生成与验证更具经济可行性。同时,9个月流片周期树立了AI辅助芯片设计的新速度基准,未来模型训练芯片也可能沿用此路径。对英伟达而言,OpenAI自研芯片虽非立即替代,但科技巨头集体自建ASIC的趋势将进一步分化其市场主导地位。
2. OpenAI正式发布GPT-5.6系列:150万token上下文,API价格压至Claude Fable 5三分之一
事件内容:
6月23日,OpenAI正式发布GPT-5.6系列模型,涵盖mini、标准版与Pro三个版本。核心升级包括上下文窗口从GPT-5.5的100万token扩展至150万token,提升约43%;API定价压至Claude Fable 5的三分之一,直接发起价格战;编程Agent能力已超越Claude Mythos系列。OpenAI首席科学家Jakub Pachocki称这是比GPT-5.5有意义的改进,并透露迭代节奏已压缩至每6周一轮。
为何值得关注:
GPT-5.6的发布窗口恰好选在Anthropic因Fable 5/Mythos 5遭禁而留出的市场真空期,低价策略意图明显。150万token超长上下文对代码库级AI Coding尤为关键,可一次性吞下大型仓库、多文件依赖与历史提交记录,显著减少Agent在文件间切换带来的上下文碎片。API价格降至Fable 5三分之一,将加速企业和开发者从Claude生态向OpenAI迁移,AI编程工具的商业模型与竞争格局可能因此重塑。此外,6周一轮的迭代节奏表明前沿模型竞争已进入白热化阶段。
3. Anthropic正式推出Claude Cowork:Claude Code能力向非技术知识工作延伸
事件内容:
Anthropic近期正式发布Claude Cowork,面向付费计划用户开放。该产品将Claude Code的Agent能力从编程场景扩展到知识工作场景,可在Claude桌面应用中自主完成整理本地文件、准备报告、分析笔记、从非结构化文档中提取数据、批量管理文件夹等任务。用户只需描述目标结果,Claude即可跨应用、跨文件自主执行,并返回可直接审阅的成品。Claude Cowork与Chat、Code并列成为Claude桌面应用的三大模式。
为何值得关注:
Claude Cowork的推出说明AI Agent竞争已从代码工具蔓延到通用知识工作入口。此前Anthropic观察到市场营销、数据分析等非技术团队开始绕过聊天界面使用Claude Code,这一产品化动作正是对该趋势的回应。与面向开发者的Claude Code不同,Cowork强调无需技术背景、以结果为导向,意味着AI Agent正从专业工具演变为普通白领的日常生产力基础设施。对AI Coding生态而言,Agent交互范式的统一将降低多工具切换成本,也可能推动更多企业将代码生成与文档、报表等知识工作整合到同一Agent工作流中。
4. OpenAI Codex上线Record & Replay功能:演示一遍即可自动复刻为可重复Skill
事件内容:
OpenAI近日为macOS版Codex应用推出Record & Replay(录制与回放)功能。用户只需在Mac上完整演示一次包含多步骤的工作流程,Codex即可将操作录制并打包为可重复使用的Skill,之后自动、无限期地复刻执行相同任务,适用于报销、请假、上传视频等固定但细节复杂的日常办公流程。同步推出的v26.616版本还支持自动化历史记录批量操作,以及本地主机与远程主机之间的线程切换,允许在连接机器上延续任务执行。该功能依赖Computer Use权限,该权限已于6月16日在欧盟地区上线,但目前Record & Replay在欧盟、英国和瑞士暂不可用。
为何值得关注:
Record & Replay将AI编程从提示词驱动推进到演示驱动,显著降低了非结构化工作流的自动化门槛。对开发者而言,这意味着复杂CI/CD、数据录入、内容发布等重复流程可以通过一次真人演示完成自动化封装,而不必编写脚本或提示词。与Claude Code的YOLO模式、GitHub Copilot Agent等方向一致,Codex正在从代码补全工具演变为可自主执行跨应用任务的电脑Agent。值得注意的是,欧盟等地政策限制凸显了AI Agent在全球合规部署中的区域差异,也可能影响产品迭代节奏。
5. 宇树科技Unitree R1降价至2.99万元并开放现货:消费级人形机器人进入3万元时代
事件内容:
6月24日,宇树科技宣布旗下双足人形机器人Unitree R1官方售价由3.99万元下调至2.99万元起,并即日起开放现货销售。R1于2025年7月发布,整机重约25千克,配备26个高精度关节,集成语音与图像多模态大模型,支持用户自行开发与定制。此次降价1万元同步开放现货,背后是供应链成熟、核心部件国产替代以及万台级量产能力的综合效应。
为何值得关注:
宇树作为A股人形机器人第一股,在过会后立即将主力消费级机型降价1万元并开放现货,标志着人形机器人从展示品进入可批量购买的消费品阶段。2.99万元定价已接近中高端笔记本电脑,对K12编程教育、个人开发者和高校实验室形成强吸引力,有助于快速扩大开发者生态。更重要的是,万台级量产带来的真实成本红利意味着人形机器人BOM成本已下探至万元级,产业链降本曲线比预期更陡峭。结合智元精灵G2在3C产线开启6天全天候直播、临界点公司完成近10亿元融资晋级独角兽等事件,具身智能正经历产品降价、产线验证、资本加码的三重共振。
每日 09:00 自动更新 | 侧重 AI Coding 与具身智能方向