2026年6月5日
Anthropic 递归自我改进加速,AI 代码生成占比超 80%
Anthropic 发布内部数据,显示 Claude 能力增速远超预期,已编写超 80% 合并生产代码,工程师产出提升 8 倍,任务时长翻倍周期缩至 4 个月,接近递归自我改进。英伟达确认 HBM4 供应商,腾讯、快手等国内厂商 AI 应用加速落地。OpenAI 升级 ChatGPT 记忆系统,苹果新版 Siri 将调用 Gemini。
产品与创业 · 日报 2026-06-05
昨日重点
- Anthropic 递归自我改进加速:内部数据显示 Claude 已编写超 80% 合并生产代码,工程师季度代码产出是此前四年平均的 8 倍,AI 可完成任务时长每 4 个月翻倍,从 Opus 3 的 4 分钟升至 Mythos Preview 的至少 16 小时。Anthropic 呼吁全球建立可验证的 AI 开发暂停机制。
- 英伟达确认 HBM4 供应商:黄仁勋首次确认三星、SK 海力士、美光通过 HBM4 认证,三家供应商均已进入量产阶段,全力保障 Vera Rubin 平台供货需求。
- 腾讯、快手 AI 应用加速:腾讯高级执行副总裁汤道生表示今年腾讯大部分代码由 AI 生成,AI 投入至少翻倍。快手可灵 AI 全球用户突破 1 亿,企业客户近 5 万。
- OpenAI 升级 ChatGPT 记忆系统:新架构“Dreaming”实现后台自动提炼更新记忆,事实记忆准确率从 41.5% 升至 82.8%,偏好遵循率从 31.4% 升至 71.3%。
- 苹果新版 Siri 将调用 Gemini:新版 Siri 内部标记为 Beta 版,部分查询将通过 Google Cloud 调用授权版 Gemini,并使用谷歌 NVIDIA Blackwell B200 集群处理。
分主题观察
AI 模型与能力
- Anthropic 发布递归自我改进报告,实验执行加速从 3 倍提升至 52 倍,自主研究恢复能力达人类两组研究者一周工作量的 97%。
- NVIDIA 发布 Cosmos 3 全模态物理 AI 开放模型(Super 32B / Nano 8B),以及 Nemotron 3 Ultra 开源 550B MoE 混合 Mamba-Transformer 模型。
- 谷歌推出 Magenta RealTime 2 实时音乐 AI 模型,延迟降至约 200 毫秒,支持文本和音频风格提示。
- Boson AI 与 LMSYS 发布 Higgs Audio v3 TTS 端到端服务,支持 100+ 种语言、零样本语音克隆。
产品与平台
- Kimi 推出 Kimi Work,支持最多 300 个 Agent 协作完成办公任务。
- Replit 推出自然语言到软件构建功能,并与 Shopify 合作实现快速建店。
- Meta 推出 Business Agent,在 Instagram、Messenger 及 WhatsApp 中集成对话式商务工作流。
- 阿里云推出 PolarDB-X Zero,30 秒内获取全分布式数据库,内置 HNSW 向量索引。
- 华为云联合 20 余家模型厂商发布“百模千态”生态合作计划,推出 Agentic Infra 新范式。
硬件与基础设施
- 英伟达确认三星、SK 海力士、美光通过 HBM4 认证,Vera Rubin 平台已进入量产。
- LG 将引进 1 万块英伟达 Blackwell GPU,为其迄今最大规模采购。
- Pinterest 计划在 2031 年前投入 40 亿美元扩大 AWS 定制芯片使用,利用 Trainium 托管 LLM/VLM 模型。
- 纽约暂停数据中心审批一年,引发对电网容量、冷却用水和土地占用的讨论。
行业动态
- OpenAI 前 CTO Mira Murati 表示若 Altman 未回归公司可能已瓦解。
- 微软 CEO 纳德拉公开抨击内部 AI 智能体致瘾计划。
- 微软 XBOX CEO 宣布取消主机端 Copilot AI 伴侣项目,因玩家没兴趣。
- Cloudflare CEO 称机器人流量已超人类,网络未来将是“付费爬取”。
- 孙正义称 Physical AI 和机器人是下一个万亿美元机会,AI 革命规模可能是互联网泡沫的 50 倍。
- 马斯克宣布 SpaceX 将因星链和轨道 AI 数据中心建设而上市。
开发者与工具
- Codex 推出 iOS 应用构建插件,支持在应用内浏览器查看和测试 iOS 应用。
- Cursor 上线全新画布功能。
- 腾讯混元联合人大开源 PlanningBench 评估框架,包含 30+ 真实世界规划任务。
- 阿里云发布 SkillClaw 与 Nacos,构建 AI 智能体技能进化闭环。
- 开发者分享 Codepilot Vibe Coding 实践,强调文档体系是核心。
值得继续关注
- Anthropic 递归自我改进:AI 自主构建更强大后继者的路径正在加速,Anthropic 呼吁全球暂停前沿 AI 开发,但中美竞争使暂停难以实现。
- 苹果 WWDC 2026:周一将发布新款 AI、Siri 与 iOS 27,新版 Siri 将调用 Gemini,苹果能否实现 AI 领域翻身值得关注。
- AI 代码生成占比持续提升:Anthropic、腾讯等公司均报告 AI 生成代码占比超 80%,开发者工作方式正在发生根本性转变。
- AI Token 成本管控:行业关注焦点从 token 最大化转向成本管控,推理和生成过程中不断飙升的 token 费用正在推动模型部署策略和 API 定价体系发生转变。
- SpaceX IPO:马斯克宣布 SpaceX 将因星链和轨道 AI 数据中心建设而上市,摩根士丹利预测其 2040 年营收可达 3.4 万亿美元。