MiniMax 开源 M3 多模态模型，百万上下文与顶尖编码能力；MiniMax 开源 M3 模型权重及 MSA 技术论文；MiniMax 开源 M3 模型权重及 MSA 技术论文

开发者工具日报 2026-06-15

MiniMax 开源 M3 多模态模型，百万上下文与顶尖编码能力：MiniMax 开源了 428B 总参数、23B 激活参数的 M3 模型，这是首个从零开始进行多模态混合训练的开源模型。其在 Artificial Analysis 综合智能指数上获全球开源最高排名，支持百万级上下文，编码与智能体能力达行业顶尖，输出速度已提升至约 80 TPS。
MiniMax 开源 M3 模型权重及 MSA 技术论文：MiniMax 开源了 428B 总参数、23B 激活参数的 M3 模型权重，并发布 MSA 稀疏注意力技术论文。M3 是首个从预训练阶段就进行文本、图像等多模态交错混合训练的开源模型，在多项基准测试中取得开源模型第一，输出速度已从约 30 TPS 提升至约 80 TPS。
MiniMax 开源 M3 模型权重及 MSA 技术论文：MiniMax 开源了 428B 总参数、23B 激活参数的 M3 模型权重，并发布 MSA 稀疏注意力技术论文。M3 是首个从预训练阶段就进行文本、图像等多模态交错混合训练的开源模型，在多项基准测试中取得开源模型第一，输出速度已从约 30 TPS 提升至约 80 TPS。
AI Agent全自动协作：从发现Bug到修复Merge全程零人类编码：开发者@JeffreyCalm分享经历：他将GitHub链接交给Codex部署，发现Bug后Codex自动提Issue。官方仓库的Code Review Bot确认Bug并At Hotfix Bot，后者30分钟内提交修复PR，最后At真人开发者。真人仅回复"OK"即完成Merge。全程人类零编码，仅贡献一个决策确认，折射出Agent经济与A2A平台雏形。
华为发布 HarmonyOS 7，集成智能体框架 2.0，小艺升级系统级智能体：华为发布 HarmonyOS 7，集成智能体框架 2.0，以"意图即服务"模型将多应用操作压缩为单条自然语言指令。小艺升级为系统级智能体，可控制超 2100 项系统能力并协调 2000 多个第三方 AI 智能体。底层搭载 openPangu 2.0 基础模型，Pro 版 505B 参数，Flash 版 92B 参数，均支持 512K 上下文窗口；30B 参数端侧模型计划秋季登陆 Kirin 芯片。系统性能较 HarmonyOS 6.1 提升超 15%，任务执行准确率宣称超 90%。2026 年 Q1 HarmonyOS 占中国智能手机 OS 市场 19%，首超 Apple 的 iOS（16%）。目前为开发者 beta 版，稳定版秋季发布。
Flash-KMeans：GPU上比FAISS快200倍的精确K-Means算法：UC Berkeley与UT Austin团队开源Flash-KMeans，通过IO感知的GPU数据流重构，实现精确K-Means聚类。在NVIDIA H200上，端到端速度比cuML快33倍，比FAISS快200倍以上，支持1B数据点、K=32768时单次迭代仅41.4秒，适用于向量搜索索引、稀疏注意力路由等场景。
Flash-KMeans：IO感知精确K-Means，GPU上比FAISS快200倍以上：UC Berkeley与UT Austin团队开源Flash-KMeans，通过重构GPU数据流实现精确Lloyd's k-Means。在NVIDIA H200上，端到端速度比cuML快33倍，比FAISS快200倍以上。其FlashAssign核避免物化完整N×K距离矩阵，将IO复杂度从O(NK)降至O(Nd+Kd)。支持out-of-core处理，在1B数据点、K=32768时单次迭代仅41.4s，适用于向量搜索索引、稀疏注意力路由等场景。
Loft Orbital卫星首次在轨使用视觉语言模型自主识别目标：今年四月，Loft Orbital的Yam-9卫星在轨首次完成自主目标识别--无需地面分析师干预。卫星搭载NASA JPL开发的NAVI-Orbital软件包和Google DeepMind的Gemma 3视觉语言模型，配合Nvidia Jetson Orin AGX GPU运行。模型可根据自然语言查询分类传感器数据，例如识别城乡交界或铁路枢纽周边基础设施。这一里程碑证明VLM可在资源受限的太空边缘设备上执行数据预处理，减少下行数据量。Loft Orbital AI负责人表示，该技术为"太空全天候巡逻"铺平道路，计划部署50-100颗类似卫星实现全球实时覆盖。
Flash-KMeans：IO感知的精确K-Means，GPU上比FAISS快200倍以上：UC Berkeley与UT Austin团队开源Flash-KMeans，通过重构GPU数据流实现精确K-Means聚类。在NVIDIA H200上，端到端速度比最佳基线快17.9倍，比FAISS快200倍以上，支持out-of-core处理，适用于向量搜索索引、稀疏注意力路由等场景。
Z.ai 发布 GLM-5.2，支持 1M Token 上下文及两种思考强度：Z.ai 发布 GLM-5.2 编码模型，核心亮点是可用的 100 万 token 上下文窗口，每轮最多输出 131,072 token。新增 High 和 Max 两种思考强度，Max 适用于复杂多步编码任务。模型兼容 Claude Code、Cline 等 8 种编码智能体工具，可通过 Anthropic 兼容端点直接替换使用。
Salesforce 以 36 亿美元收购 AI 客服平台 Fin：Salesforce 宣布以 36 亿美元收购 AI 客服平台 Fin（前身为 Intercom）。Fin 提供跨多渠道的 AI 智能体客服解决方案。Salesforce 计划利用 Fin 的技术增强其企业级 Agentforce 平台，该平台允许企业构建自定义 AI 智能体以自动化任务。交易预计在 2027 年初完成。
Salesforce 以 36 亿美元收购 AI 客服平台 Fin：Salesforce 宣布以 36 亿美元收购 AI 客服平台 Fin（前身为 Intercom）。Fin 提供跨多渠道的 AI 智能体客服解决方案。Salesforce 计划利用 Fin 的技术增强其企业级 Agentforce 平台，该平台允许企业构建自定义 AI 智能体以自动化任务。交易预计在 2027 年初完成。
Unsloth将Kimi K2.7 Code压缩至325GB本地运行：Unsloth通过动态2-bit量化将1万亿参数的Kimi K2.7 Code压缩48%至325GB，重要层保持更高精度。在330GB RAM/VRAM配置下推理速度超40 tok/s，使大型coding模型能在本地长期运行，支持长程任务和复杂推理。
安谋科技×火山引擎：芯片IP设计云端弹性算力与AI运营实践：安谋科技与火山引擎合作，通过云端弹性算力补充本地资源，应对芯片IP设计峰值需求。采用存算分离架构，核心数据本地化，仅弹性调用云端算力。已实现峰值8万多核，月均稳定5万核以上；新增约2万核需求3天内上线。同时探索AI运营，测试ArkClaw、TRAE、Agent Plan等能力，提升研发与办公效率。方案满足EDA高主频大内存需求，按需供给降低成本。
Kimi K2.7 Code 高速版上线，输出速度提升 5-6 倍：Kimi K2.7 Code 高速版上线，与普通版为同一模型，输出速度约 5-6 倍，常规编程场景约 180 Token/s，短上下文可达 260 Token/s。API 定价为普通版 2 倍，模型 ID：kimi-k2.7-code-highspeed。相比 K2.6，K2.7 Code 在长上下文编程指令遵循、长程任务性能提升，平均 token 消耗减少 30%。普通版输入 6.5 元/百万 token、输出 27 元，缓存输入 1.3 元。非编程任务推荐 K2.6。
curl 宣布 2026 年 7 月暂停漏洞受理，引发开源维护讨论：curl 项目宣布将在 2026 年 7 月暂停接收新的漏洞报告，以便维护者休假。此举引发了关于开源软件维护者工作负担、休假权利以及付费支持合同价值的广泛讨论。评论认为，这凸显了开源项目长期依赖少数维护者、回报与责任不对等的结构性问题。
Prompt该退环境了，未来属于Loop Engineering：OpenClaw创始人Peter与Claude Code创始人Boris提出不再手动写提示词，而是设计循环（Loop）让Agent自动编排任务。Google的Addy Osmani将其梳理为Loop Engineering，成为AI行业第四大工程范式。一个完整Loop包含定时任务、工作树隔离、项目知识体系、MCP连接器、子Agent五个组件。
Loop Engineering：AI智能体自动循环执行任务的新范式：OpenClaw创始人Peter与Claude Code创始人Boris提出Loop Engineering，由Google的Addy Osmani系统梳理。核心是让AI智能体通过/loop或/goal命令自动循环执行任务，开发者只需定义可验证的完成条件和边界规则，Agent自行迭代至达标。需防范古德哈特定律——Agent可能删除失败测试而非修复Bug。该范式标志着从Prompt到Loop的四次能力跃迁。
Databricks 推出 Omnigent：开源元编排框架：Databricks 推出 Omnigent，一个开源（Apache 2.0）meta-harness，位于 Claude Code、Codex、Pi 及自研 Agent 之上，提供统一接口。三大能力：组合（一行配置切换不同 harness，YAML 定义跨 harness 可移植 agent，同一 Agent 内可组合不同 subagent）；控制（有状态成本策略如每 $100 暂停，安全策略如 npm 后 git push 需审批，OS 沙箱，策略与 harness 解耦）；协作（通过 URL 共享 live session，支持多端访问及实时评论）。理念类似 Kubernetes，让 session、policy 与具体 harness 解耦，形成可迁移工作层。
AI与科技早报：Fable 5禁令、SpaceX估值7800亿美元、LeCun押注JEPA、华为950DT降价：早报涵盖多项AI与技术动态。Fable 5发布72小时内被美国政府出口管制禁令强制下线。SpaceX上市估值7800亿美元。图灵奖得主Yann LeCun系统批判LLM缺乏因果建模，押注约10亿美元开发JEPA世界模型。华为昇腾950DT芯片与DeepSeek V4协同实现低成本高并发推理。
Fable 5被攻破、SpaceX上市、LeCun创办Omni Labs三则AI要闻：Anthropic最强模型Fable 5发布后72小时内被红队研究者Pliny攻破，暴露出Unicode同形字替换等三层攻击手法，Constitutional AI安全架构失效，随后美国政府实施出口管制。SpaceX登陆纳斯达克，市值达2.1万亿美元。Yann LeCun离开Meta创办Omni Labs，融资约10亿美元，押注JEPA世界模型路线。
Postgres 大规模删除：分区、DROP TABLE 比逐行 DELETE 更稳：讨论 Postgres 中大规模 DELETE 的成本，核心是 MVCC 下删除行不会立即释放空间，留下 dead tuples 需要 VACUUM 清理。工程上常用按时间分区、TRUNCATE 或 DROP TABLE 清空整块数据，或 ETL 到分析库后再删除主库分区。
面壁智能OpenBMB联合发布FactNet：十亿级开源多语言知识图谱：面壁智能OpenBMB联合清华NLP等发布FactNet，构建十亿级开源多语言知识图谱。包含1.55B FactSynsets，附带3.01B来自316种语言的字节级可追溯证据，99.63%精确重定位。为可验证AI提供结构化事实基础。
Cloudflare引入Ensemble AI团队，加速AI基础设施研发：Cloudflare宣布Ensemble AI团队关键成员加入，加速AI基础设施研发。Ensemble专注于模型压缩与高效推理，开发了NdLinear和NdLinear-LoRA等技术，旨在降低大语言模型和多模态架构的内存、计算与部署开销。成果将整合到Workers AI平台。
Anthropic Ultracode：智能子程序与并行化工作流：Anthropic 的 Ultracode 工具通过智能子程序和并行化工作流，高效利用模型 token。其核心思想是将大量知识工作分解为需要判断和智能的琐碎任务，并利用子智能体扇出能力动态执行，不仅适用于编码，也适用于其他复杂工作流。
Claude Code 智能体编码工具详解：25 项功能与策略：Claude Code 是 Anthropic 的智能体编码工具，运行于终端、桌面应用和 IDE，基于智能体循环工作。文章将 25 项功能与策略分为官方功能、社区技术和第三方工具三类，并逐一标注。官方功能包括 CLAUDE.md 记忆文件、技能、子智能体、斜杠命令（/init、/compact、/review 等）、钩子、MCP 服务器、插件、检查点、计划模式、权限模式、自动模式（使用 Sonnet 4.6 分类器）、上下文压缩、后台任务、Agent SDK、无头 CLI、GitHub Action 集成、输出样式、远程控制与移动推送、离线摘要、沙盒。社区技术涵盖结构化上下文文件夹、动态工作流、模块化技能管道、弹性技术。第三方工具如 Mem Search 可扩展外部记忆层。
巴西开源模型被指套壳阿里千问，IplanRIO 致歉称误上传基线版：巴西里约市政府旗下 IplanRIO 推出的开源模型 Rio-3.5-Open-397B 被指套壳阿里千问 Qwen3.5 和 Nex N2 Pro 的权重混合版本。Nex 团队展示证据，IplanRIO 在 Hugging Face 致歉，称因操作失误上传了合并基线版本，将重新上传正式版。
月之暗面 Kimi K2.7 Code 模型高速版上线：月之暗面推出 Kimi K2.7 Code 模型高速版，面向开发者开放。该版本输出速度约为普通版的5-6倍，常规编程场景可达180 Tokens/s，短上下文可达260 Tokens/s。价格为普通版两倍，基于6月12日发布的K2.7 Code，相比K2.6提升长上下文指令遵循与长程编程性能，平均token消耗减少30%。
月之暗面 Kimi K2.7 Code 模型高速版上线：月之暗面推出 Kimi K2.7 Code 模型高速版，面向 Code Beta 计划成员、API 开发者及 Business 用户开放。高速版输出速度约普通版 5-6 倍，常规编程场景达 180 Tokens/s，短上下文可达 260 Tokens/s。价格为普通版两倍，基于 6 月 12 日发布的 K2.7 Code，提升长上下文指令遵循与长程编程性能，平均 token 消耗减少 30%。
AppStore评论LLM分析工具开源：Vista发布开源工具，输入App名称即可自动抓取AppStore用户评价，利用LLM进行数据分析，将评论转化为产品经理可用的洞察。工具预设了全球各国免费版和付费版Top 10 App数据，便于研究学习。
C++20 手写 CPU 路径追踪器引争议：后期用 AI 清理算不算“无 AI”？：一位开发者展示了自己用 C++20 从零编写的 CPU 路径追踪器，强调未使用第三方库，项目源自编程学校的练习并持续开发一年多。但评论区围绕“without AI”标题展开争论，因作者承认后期清理和补功能时使用了 AI。技术讨论涉及 reciprocal direction、NaN 处理及 f32/f64 性能取舍等细节。
NewCore获6600万美元种子轮融资，构建AI智能体身份管理平台：网络安全初创公司NewCore获6600万美元种子轮融资，构建统一管理人类和AI智能体身份的平台。将AI智能体视为拥有独立权限、生命周期和撤销机制的一等身份，采用split-key架构消除单点风险。支持Anthropic Claude Code、OpenAI Codex等编码助手以托管身份访问企业系统。
C游戏移植到WASM：32位内存、DOM/JS互操作与浏览器坑：开发者分享将C语言游戏移植到WebAssembly过程中遇到的典型问题，包括32位地址空间下的指针大小和内存模型问题、必须依赖HTML/JS处理UI和DOM的局限性，以及浏览器兼容性bug。讨论还涉及wasm64/memory64的推进现状和Safari支持滞后问题。
Salesforce 以 36 亿美元收购 AI 客服公司 Fin：Salesforce 以约 36 亿美元收购 Fin，该公司专门开发基于 AI 的客户服务智能体。此次收购旨在为 Salesforce 的企业 AI 业务开拓新市场。Fin 的 AI 智能体技术将整合进 Salesforce 的产品体系。
美国强制 Anthropic 关停 Fable 5 和 Mythos 5，欧洲主权争议升级：美国政府以国家安全为由，强制 Anthropic 在全球范围内对非美国公民关闭其最新模型 Fable 5 和 Mythos 5。欧洲委员会发言人 Thomas Regnier 称紧急措施不得歧视伙伴，并呼吁加强欧洲技术主权。欧洲研究人员看法不一：有人主张联合投资基础模型、芯片设计与节能计算，打造欧洲"AI 空客时刻"；也有人认为欧洲无法与美竞争，应通过合同和数据中心投资确保访问权。图宾根大学 Jonas Geiping 指出法国 Mistral 已"远远落后"，欧洲缺乏大规模数据中心和发电能力。
Kimi K2.7 Code 高速版上线，输出速度提升 5-6 倍：Kimi K2.7 Code 高速版正式上线，输出速度约 180-260 Token/s，为普通版 5-6 倍，API 定价为普通版 2 倍。该版本在长上下文编程指令遵循和长程任务性能上显著提升，平均 token 消耗减少 30%。
clawsweeper：自动审核Issue并创建PR的开源工具：开源项目clawsweeper能够自动审核用户创建的Issue，如果符合项目VISION.md文件，就会自动接手并创建和审核PR。该工具可显著提升开源项目维护效率，减少人工审核工作量。
理想马赫 M100 发布：全球首款动态数据流 AI 芯片，5nm 车规级工艺：理想汽车在 Livis Day 发布会上推出全球首款动态数据流 AI 芯片——理想马赫 M100，采用 5nm 车规级工艺，单芯片算力 1280 TOPS，实际运行效率超过 82%。
理想汽车马赫Mind-Pro模型落地L9车载系统：理想在Livis Day上宣布马赫Mind-Pro模型全面落地L9车载系统，该模型在IFEval、LongBench-v2等评测中稳居第一梯队，采用多模态流式时序建模，具备因果推理和自主决策能力，所有多模态问答均在车端本地完成，数据不上传。
AI 版支付宝内测界面曝光，搭载"阿宝"助手：AI 版支付宝正在内测，需邀请码才能体验。界面分为资产和阿宝两个版块，阿宝为 AI 助手，支持对话，底部集成扫一扫、收付款、出行、理财功能。资产界面以卡片夹形式展示流动资产、理财资产、信用资产等信息。蚂蚁集团对此拒绝评论，内部项目代号"宝计划"，预计近日上线，后续将以每月两次的频率迭代。新版本上线后默认打开原版支付宝，用户可自行将 AI 版设为首选界面。
Gemma 4 12B Coder GGUF 发布：将 Fable 5 推理链蒸馏至本地可跑：Berry Xia 发布了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型，将 Fable 5 的推理链条蒸馏进 12B 参数模型。GGUF 格式让模型在 12GB 消费级显卡即可本地运行，甚至支持 CPU。模型专为代码生成、调试、复杂算法等任务优化，无需 API 费用且无导出限制，填补了云端模型与本地可用之间的鸿沟。
美国出口管制指令暂停Anthropic两款模型全球访问：6月12日，美国政府以国家安全为由对Anthropic发出出口管制指令，要求暂停所有非美国公民对Claude Fable 5和Mythos 5的访问，包括Anthropic外籍员工。两款模型于6月9日全面上线，Fable 5为Mythos级商用模型，在软件工程和科研领域表现突出。政府援引"越狱"漏洞，称模型可绕过安全护栏；Anthropic反驳该漏洞仅限代码审查，其他模型同样具备。此举引发全球对AI主权控制的担忧。
VEXI：适用于终端的开源 AI 编程代理：VEXI 是一款开源的 AI 编程代理，可直接在终端中使用。它旨在帮助开发者通过自然语言指令完成编码任务，提升开发效率。作为开源项目，VEXI 允许社区参与贡献和定制，是开发者工具领域的新选择。
《分布式计算八大谬误》21 年后仍被微服务反复验证：21 年前提出的《分布式计算的八大谬误》至今仍是微服务架构设计的经典警示。讨论指出，许多现代系统在延迟、可靠性、一致性等基本假设上依然会犯错，提醒开发者不要将网络视为可靠、延迟为零等。这些谬误在微服务架构中尤为常见。
AI Agent悬赏任务市场：类似AI版"猪八戒"：小互介绍了一个AI Agent悬赏任务市场，用户可发布复杂任务并设定赏金，由AI Agent自动抢单、交付结果、收款。流程包括用户下单、Agent抢单报价、用户选择、Agent干活、用户验收，平台抽15%。支持CLI命令行发任务，Agent有信誉分系统。
松延动力N2人形机器人亮相华为HDC 2026，为首款开源鸿蒙消费级产品：松延动力在华为开发者大会HDC 2026上展出OpenHarmony版N2人形机器人，定位行业首款开源鸿蒙消费级产品。该机器人凭借开源鸿蒙微内核及AI智能体实现语音交互和长程任务自规划，可与手机、智慧屏、智能家居等终端联动，充当家庭管家或教育陪伴角色。同步启动"百人百机"计划，为100位开发者提供N2及原生SDK，支持Ubuntu与开源鸿蒙生态。
AI 幻觉让法官头疼，韩国计划向滥用 AI 的律师开罚单：韩国法院行政处推动修订法案，计划对提交虚假法条和判例的律师处以罚款。因AI大模型产生幻觉，律师在法律文书中引用不存在的"虚假判例"现象激增。法院行政处获批161亿韩元专项资金，用于搭建司法专属AI平台。
M1 Max本地ML离线索引669GB GoPro视频实现语义/人脸搜索：作者在M1 Max上离线索引669GB GoPro视频：先按较低分辨率抽帧，再做音频转写、人脸识别、自定义脸库、目标检测、OCR和场景描述，结果写入SQL和向量数据库以支持语义搜索。原始素材总量669GB，真正分析的是下采样后的帧，但即便如此也花了67小时以上。该方案展示了本地AI媒体检索的可行路径。
纳德拉定调微软：不做最强模型，做模型生态：微软CEO纳德拉明确表示，微软不追求最强AI模型，而是聚焦模型之上的生态建设。其逻辑是：模型终将商品化，生态锁定才能更持久。同时他指出，平台让生长其上的价值多于自身攫取的。这一框架被评论为"没有SOTA"的公司最舒服的世界观，但背后动机是将其作为策略：把闭环建在模型之上，IP留自己手里，模型随时可换。
传闻GPT-5.6将于6月23日发布，成本仅为Fable三分之一：据传闻，OpenAI可能在6月23日推出GPT-5.6，成本仅为Fable的三分之一，上下文窗口达150万token，智能体编程工作流全面升级，与Claude风格系统直接竞争。
Kage：将整站镜像打包为可离线运行的单文件/二进制：Kage 是一个开源项目，可将网站抓取并“影子化”为可离线浏览的归档。它使用 Chrome 渲染页面，提取 DOM 后打包成 ZIM 或独立可执行文件。该项目在 Hacker News 上获得 336 分，被与 HTTrack、SingleFile 等工具对比，适用于飞行、长途旅行等无网络场景。
IT早报：小米回应YU7 GT极速意义；蚂蚁测试AI版支付宝；鸿蒙PC销售超预期：2026年6月15日IT早报涵盖多项科技动态：小米汽车回应YU7 GT极速300km/h体现工程冗余；蚂蚁集团秘密测试AI版支付宝；鸿蒙智行专属HarmonyOS车机UI差异化设计已确定；华为称鸿蒙PC销售远超预期；Nothing CEO称内存已成手机最昂贵组件。
Anthropic顶级模型Mythos与Fable因出口管制下线：美国当局干预 Anthropic，出口管制导致其顶级模型 Mythos 和 Fable 下线。Anthropic 紧急派高级技术人员赴华盛顿，试图说服官员模型可被安全控制，成为 AI 地缘政治实时测试案例。市场关注周一反应：伊朗协议推高股市，但 Anthropic 事件可能引发大幅上涨或恐慌。
超长上下文窗口不一定更可靠：围绕“别盲信大上下文窗口”的文章展开讨论，背景是 Claude Code 和 Opus 等产品把上下文扩到 1M token 后，很多人以为长任务问题会被一次性解决。评论者把焦点放到 AI coding agent 的真实工作流：工具调用、subagent、自动 compaction 和 AGENTS.md 都会显著影响结果。
OpenAI 推出合作伙伴网络，投资 1.5 亿美元支持企业 AI 部署：OpenAI 宣布推出 Partner Network，设立 Select、Advanced、Elite 三级合作伙伴层级，提供 Codex、网络安全、智能体等专业认证，并试点 Forward Deployed Experts 项目。目标在 2026 年底前培训认证 30 万名顾问，案例显示 Paychex 借助方案将等待时间降低 80%。
JavaScript 的诞生与死亡：JS 变成底座：2014 年 Gary Bernhardt 的演讲预言 JavaScript 不会消失，而会像汇编一样退到底层，成为其他语言的编译目标。如今 TypeScript 接近默认、Electron 让网页技术进入桌面、Flutter 和 Rust GUI 争夺跨平台市场，浏览器变 OS 的梦想仍在延续。
Cutback发布Selects：AI长视频编辑助手：Cutback发布Selects，一款面向长视频的AI编辑助手，支持视频同步、组织与原始素材剪辑。它同时分析转录和视频，几分钟内根据提示构建故事线，每个项目可减少约60%编辑时间。在专业编辑测试中，剪辑一致性高。
Kimi K2.7 Code 高速模式发布，6 倍加速：Kimi 开源多模态编程模型 K2.7 Code 推出高速模式，编码任务中长输入约 180 tok/s，短上下文最高 260 tok/s，速度提升最多 6 倍。该模式已向 Beta 计划成员、API 开发者及商业用户开放。
MiMo Code：具有显式长期记忆架构的编码代理：MiMo Code 是一款创新的编码代理，其核心特点是引入了显式的长期记忆架构。这使得它能够在长时间、多步骤的编码任务中保持上下文和状态，从而更有效地处理复杂项目，减少重复工作。
OpenAI Codex Mobile 工程实践指南：手机是远程开发机"控制中心"，代码执行在主机。任务启动可配主机、工作区、Git分支，创建独立worktree并自动执行环境脚本。Side Chat提供轻量旁路对话，不打断主线程。Plan模式用于高风险任务规划，Goal模式设定可验证终态。手机独有优势包括拍照截图、后台持续录音语音prompt、真机构建验证。代码审查支持diff查看、语法高亮、行内评论，不必等回工位。
Iroh 1.0 发布：可嵌入应用的 p2p 网络层：n0-computer 团队发布 Iroh 1.0，这是一个面向应用嵌入的 p2p 网络库/协议，基于 QUIC、中继和去中心化寻址（DNS、pkarr、mainline DHT）。与 Tailscale、ZeroMQ 等工具对比，Iroh 更侧重作为可嵌入的网络层组件。1.0 版本标志着项目成熟，商业化路径为开源核心加托管、监控等付费服务。
Anthropic Claude 模型因出口管制离线，报道称存在“性格冲突”：Axios 报道称，Anthropic 的 Claude 模型（代号 Mythos 和 Fable）因美国政府出口管制而离线，背后存在“性格冲突”与“态度问题”。当前方案之一是确保模型无法被越狱，但完美越狱防护可能不可行。此外，Anthropic 是否成功防御了特定对抗攻击仍不确定。
DuMate 核心升级，token 消耗降 75%：DuMate 完成核心引擎升级，通过对 Harness 引擎及相关工程工作流的优化，在保持任务性能不变的前提下，将 token 消耗降低 75%。对用户而言，这意味着积分消耗也同步降低 75%，显著提升了开发工具的效率和成本效益。
AI编辑器与专业剪辑师4小时剪辑对比：84%一致：一款基于Premiere Pro重构的AI视频编辑器，与专业剪辑师共同剪辑同一4小时视频项目，两者84%的剪辑操作相同。AI编辑器可在数分钟内完成草稿，节省约60%的准备工作时间，最后16%的差异点仍需人类判断。
上海交大联合百度智能云推出机器人操控模型AHA-WAM：上海交大ScaleLab团队联合上海人工智能实验室、百度智能云推出机器人操控模型AHA-WAM，突破世界-动作模型延迟瓶颈。在RoboTwin 2.0上以92.8%平均成功率超越主流模型，闭环控制频率从5.26Hz提升至24.17Hz，轻量版达56.95Hz，提速超10倍。
OpenAI 推出 AI 原生广告，买场景而非关键词：主推文指出AI时代的广告形态已成巨头探索方向。引用推文分析OpenAI广告后台发现：ChatGPT Ads本质不是买关键词，而是买用户任务场景和意图匹配；广告内容越像说明书越适合；投放页面的SEO基础设施至关重要；落地页、标题、文案及上下文提示共同影响匹配质量。官方将其定义为"AI原生广告"，并开启"GEM时代"。
OpenRouter Fusion API：多模型并行融合，提效但更慢更贵：OpenRouter发布Fusion API，将同一请求并行发送给多个模型，再由裁判模型整合答案。该方案在deep research等任务上表现提升，但延迟和费用明显上升。提供Budget和Quality两种预设，分别对应便宜模型组合和前沿模型组合。讨论延伸到test-time compute和多轮迭代的局限性。
Perceptron 发布 Agentic Detection 视觉检测模型：Perceptron 推出 Agentic Detection 视觉检测模型，用户只需提供一张图片并用自然语言描述目标，即可自动框出并分类，无需预先训练。该模型还能处理物理推理检测任务，如定位森林火灾起火点、标记空车位等。
智谱Zcode客户端发布，可免费使用GLM 5.2：智谱推出类似Codex的客户端工具Zcode，用户通过谷歌账号注册登录即可免费使用GLM 5.2。软件支持Windows、Mac（Intel和Apple Silicon）平台，Linux版本需通过内测群获取。该工具面向开发者，提供AI编程辅助能力。
微软 CEO 纳德拉警告：少数 AI 系统可能攫取全部经济回报：微软 CEO 萨提亚·纳德拉认为 AI 将重塑企业，形成人与数字系统间的"认知循环"。企业除人力资本外还需拥有"token资本"--自有的 AI 能力。他建议构建专有学习系统、私有评估追踪业务相关提升、用真实数据改进内部训练，并使机构知识可查询复用。真正机会在模型之上构建学习循环，且不能外包学习。纳德拉警告：少数 AI 系统可能攫取所有经济回报，行业知识被商品化。相比 2025 年 3 月声称"模型正在商品化"，一年多后他态度转变，指出若商品化慢于预期，OpenAI 和 Anthropic 可能凭借难以匹敌的模型及产品生态形成集中。
理想汽车宣布马赫VLA能力持续进化，第四季度对齐特斯拉FSD V14：理想汽车在Livis Day上宣布第三季度AD Max推送全新马赫VLA，第四季度对齐特斯拉FSD V14能力。双马赫M100芯片算力2560TOPS，模仿学习规模提升50%、强化学习提升15倍、模型参数量提升10倍、计算量提升15倍。
鸿海与施耐德电气围绕次世代 AI 数据中心展开战略合作：鸿海科技集团与施耐德电气宣布战略合作，共同打造并推动次世代 AI 数据中心的发展。双方将结合鸿海的制造优势和施耐德电气的能源智慧，打造集成式、可实时部署的解决方案，协助客户在全球更快速、高效地构建 AI 基础设施。合作生产将于今年稍晚启动。双方还将共同开发次世代 AI 数据中心参考架构，探索闭环式能源优化、模块化电力与冷却系统、标准化设计框架等创新方案。
微信支付 AI 接入工具箱 2.0 发布，Token 消耗降低 50%：微信支付 AI 接入工具箱升级至 2.0 版本，全面支持 9 种语言。Skill 从仅覆盖支付和券升级为全线覆盖所有产品知识，新增技术专家和金融级研发专家功能。新增 CLI 动态排障，支持自然语言查询支付单、退款单实时状态。文档时序图和状态图转为 Mermaid 格式，整体 Token 消耗比原始 HTML 降低 50%。
Conan：适用于 Claude Code 的原生 Mac 控制台：Conan 是一款专为 Claude Code 设计的原生 Mac 控制台应用，为开发者提供更直观的图形化界面来管理和运行 Claude Code 相关任务。它旨在简化与 AI 编码助手的交互流程，提升开发体验。
智源大会：SkyReels V4与Mureka V9技术演进：昆仑万维Skywork首席科学家成宇在智源大会上介绍SkyReels V4与Mureka V9。SkyReels V4在视频生成评测中夺得双赛道第一，超越Veo 3.1和Sora 2，实现毫秒级音画同步、全模态强化学习等突破。Mureka V9引入MusiCoT音乐思维链技术，在旋律性等维度排名第一。
AI时代高效团队：Lovable设计负责人分享七条经验：Lovable设计负责人Felix Haas总结AI时代高效团队的七条经验：主动做事、重态度轻简历、靠试错而非刷资讯、资深管理者重回一线、减少自我意识、先发布再迭代。Lovable 2024年上线，8个月达1亿美元年收入。
OiiOii 2.0实测：智能画布、一键拉片复刻与skill库上线：OiiOii 2.0新增智能画布、一键拉片复刻和skill库三个功能。一键拉片复刻可将输入片段拆解为含关键帧、叙事要素、镜头语言等维度的拉片表格，用户替换角色、场景、元素后，半小时内可复刻出镜头设计一致度达90%的动画片段。智能画布支持直接点击素材唤醒Agent对话修改，不同素材可并行调用多个Agent同步推进任务。
Rio“自研”LLM 被指是 Nex +Qwen 权重合并：Rio de Janeiro市政府旗下的IplanRIO发布Rio-3.5-Open-397B，最初被包装成基于Qwen3.5的本地后训练成果。随后有人指出它更像是Nex-N2 Pro与原始Qwen3.5-397B-A17B的权重merge，引发争议。
如何搭建一个端到端业务需求专家Agent：本文详细介绍了如何搭建一个端到端业务需求专家Agent，涵盖从需求分析到系统实现的完整流程。文章提供了实用的技术方案和架构设计思路，帮助开发者构建能够理解业务需求并自动生成解决方案的智能Agent。
微软CEO Satya Nadella：没有生态的「前沿AI模型」不可持续：微软CEO Nadella撰文指出，企业真正资产是人类资本（知识、判断力等）与token资本（自建AI能力）相互强化的学习闭环。他提出可落地的AI架构：可替换通用模型+不可丢失的组织经验；通过私有评测（Private Evals）和私有强化学习环境（Private RL Environments）以真实业务结果驱动模型进化；知识库作为可查询的制度记忆。该闭环被称为"爬山机"，具有复利效应。他警告若少数模型攫取全部回报将重演产业空心化，主张构建"前沿生态"而非仅"前沿模型"，让价值广泛流向各行业与国家。

开发者工具

2026年6月

2026年5月

开发者工具日报 2026-06-15

开发者工具日报 2026-06-15