开发者工具

编程工具、开发框架、开源项目、工程效率、云服务和基础设施。

2026年6月15日

开发者工具日报 2026-06-15

MiniMax 开源 M3 多模态模型,百万上下文与顶尖编码能力;MiniMax 开源 M3 模型权重及 MSA 技术论文;MiniMax 开源 M3 模型权重及 MSA 技术论文

开发者工具日报 2026-06-15

  • MiniMax 开源 M3 多模态模型,百万上下文与顶尖编码能力:MiniMax 开源了 428B 总参数、23B 激活参数的 M3 模型,这是首个从零开始进行多模态混合训练的开源模型。其在 Artificial Analysis 综合智能指数上获全球开源最高排名,支持百万级上下文,编码与智能体能力达行业顶尖,输出速度已提升至约 80 TPS。
  • MiniMax 开源 M3 模型权重及 MSA 技术论文:MiniMax 开源了 428B 总参数、23B 激活参数的 M3 模型权重,并发布 MSA 稀疏注意力技术论文。M3 是首个从预训练阶段就进行文本、图像等多模态交错混合训练的开源模型,在多项基准测试中取得开源模型第一,输出速度已从约 30 TPS 提升至约 80 TPS。
  • MiniMax 开源 M3 模型权重及 MSA 技术论文:MiniMax 开源了 428B 总参数、23B 激活参数的 M3 模型权重,并发布 MSA 稀疏注意力技术论文。M3 是首个从预训练阶段就进行文本、图像等多模态交错混合训练的开源模型,在多项基准测试中取得开源模型第一,输出速度已从约 30 TPS 提升至约 80 TPS。
  • AI Agent全自动协作:从发现Bug到修复Merge全程零人类编码:开发者@JeffreyCalm分享经历:他将GitHub链接交给Codex部署,发现Bug后Codex自动提Issue。官方仓库的Code Review Bot确认Bug并At Hotfix Bot,后者30分钟内提交修复PR,最后At真人开发者。真人仅回复"OK"即完成Merge。全程人类零编码,仅贡献一个决策确认,折射出Agent经济与A2A平台雏形。
  • 华为发布 HarmonyOS 7,集成智能体框架 2.0,小艺升级系统级智能体:华为发布 HarmonyOS 7,集成智能体框架 2.0,以"意图即服务"模型将多应用操作压缩为单条自然语言指令。小艺升级为系统级智能体,可控制超 2100 项系统能力并协调 2000 多个第三方 AI 智能体。底层搭载 openPangu 2.0 基础模型,Pro 版 505B 参数,Flash 版 92B 参数,均支持 512K 上下文窗口;30B 参数端侧模型计划秋季登陆 Kirin 芯片。系统性能较 HarmonyOS 6.1 提升超 15%,任务执行准确率宣称超 90%。2026 年 Q1 HarmonyOS 占中国智能手机 OS 市场 19%,首超 Apple 的 iOS(16%)。目前为开发者 beta 版,稳定版秋季发布。
  • Flash-KMeans:GPU上比FAISS快200倍的精确K-Means算法:UC Berkeley与UT Austin团队开源Flash-KMeans,通过IO感知的GPU数据流重构,实现精确K-Means聚类。在NVIDIA H200上,端到端速度比cuML快33倍,比FAISS快200倍以上,支持1B数据点、K=32768时单次迭代仅41.4秒,适用于向量搜索索引、稀疏注意力路由等场景。
  • Flash-KMeans:IO感知精确K-Means,GPU上比FAISS快200倍以上:UC Berkeley与UT Austin团队开源Flash-KMeans,通过重构GPU数据流实现精确Lloyd's k-Means。在NVIDIA H200上,端到端速度比cuML快33倍,比FAISS快200倍以上。其FlashAssign核避免物化完整N×K距离矩阵,将IO复杂度从O(NK)降至O(Nd+Kd)。支持out-of-core处理,在1B数据点、K=32768时单次迭代仅41.4s,适用于向量搜索索引、稀疏注意力路由等场景。
  • Loft Orbital卫星首次在轨使用视觉语言模型自主识别目标:今年四月,Loft Orbital的Yam-9卫星在轨首次完成自主目标识别--无需地面分析师干预。卫星搭载NASA JPL开发的NAVI-Orbital软件包和Google DeepMind的Gemma 3视觉语言模型,配合Nvidia Jetson Orin AGX GPU运行。模型可根据自然语言查询分类传感器数据,例如识别城乡交界或铁路枢纽周边基础设施。这一里程碑证明VLM可在资源受限的太空边缘设备上执行数据预处理,减少下行数据量。Loft Orbital AI负责人表示,该技术为"太空全天候巡逻"铺平道路,计划部署50-100颗类似卫星实现全球实时覆盖。
  • Flash-KMeans:IO感知的精确K-Means,GPU上比FAISS快200倍以上:UC Berkeley与UT Austin团队开源Flash-KMeans,通过重构GPU数据流实现精确K-Means聚类。在NVIDIA H200上,端到端速度比最佳基线快17.9倍,比FAISS快200倍以上,支持out-of-core处理,适用于向量搜索索引、稀疏注意力路由等场景。
  • Z.ai 发布 GLM-5.2,支持 1M Token 上下文及两种思考强度:Z.ai 发布 GLM-5.2 编码模型,核心亮点是可用的 100 万 token 上下文窗口,每轮最多输出 131,072 token。新增 High 和 Max 两种思考强度,Max 适用于复杂多步编码任务。模型兼容 Claude Code、Cline 等 8 种编码智能体工具,可通过 Anthropic 兼容端点直接替换使用。
  • Salesforce 以 36 亿美元收购 AI 客服平台 Fin:Salesforce 宣布以 36 亿美元收购 AI 客服平台 Fin(前身为 Intercom)。Fin 提供跨多渠道的 AI 智能体客服解决方案。Salesforce 计划利用 Fin 的技术增强其企业级 Agentforce 平台,该平台允许企业构建自定义 AI 智能体以自动化任务。交易预计在 2027 年初完成。
  • Salesforce 以 36 亿美元收购 AI 客服平台 Fin:Salesforce 宣布以 36 亿美元收购 AI 客服平台 Fin(前身为 Intercom)。Fin 提供跨多渠道的 AI 智能体客服解决方案。Salesforce 计划利用 Fin 的技术增强其企业级 Agentforce 平台,该平台允许企业构建自定义 AI 智能体以自动化任务。交易预计在 2027 年初完成。
  • Unsloth将Kimi K2.7 Code压缩至325GB本地运行:Unsloth通过动态2-bit量化将1万亿参数的Kimi K2.7 Code压缩48%至325GB,重要层保持更高精度。在330GB RAM/VRAM配置下推理速度超40 tok/s,使大型coding模型能在本地长期运行,支持长程任务和复杂推理。
  • 安谋科技×火山引擎:芯片IP设计云端弹性算力与AI运营实践:安谋科技与火山引擎合作,通过云端弹性算力补充本地资源,应对芯片IP设计峰值需求。采用存算分离架构,核心数据本地化,仅弹性调用云端算力。已实现峰值8万多核,月均稳定5万核以上;新增约2万核需求3天内上线。同时探索AI运营,测试ArkClaw、TRAE、Agent Plan等能力,提升研发与办公效率。方案满足EDA高主频大内存需求,按需供给降低成本。
  • Kimi K2.7 Code 高速版上线,输出速度提升 5-6 倍:Kimi K2.7 Code 高速版上线,与普通版为同一模型,输出速度约 5-6 倍,常规编程场景约 180 Token/s,短上下文可达 260 Token/s。API 定价为普通版 2 倍,模型 ID:kimi-k2.7-code-highspeed。相比 K2.6,K2.7 Code 在长上下文编程指令遵循、长程任务性能提升,平均 token 消耗减少 30%。普通版输入 6.5 元/百万 token、输出 27 元,缓存输入 1.3 元。非编程任务推荐 K2.6。
  • curl 宣布 2026 年 7 月暂停漏洞受理,引发开源维护讨论:curl 项目宣布将在 2026 年 7 月暂停接收新的漏洞报告,以便维护者休假。此举引发了关于开源软件维护者工作负担、休假权利以及付费支持合同价值的广泛讨论。评论认为,这凸显了开源项目长期依赖少数维护者、回报与责任不对等的结构性问题。
  • Prompt该退环境了,未来属于Loop Engineering:OpenClaw创始人Peter与Claude Code创始人Boris提出不再手动写提示词,而是设计循环(Loop)让Agent自动编排任务。Google的Addy Osmani将其梳理为Loop Engineering,成为AI行业第四大工程范式。一个完整Loop包含定时任务、工作树隔离、项目知识体系、MCP连接器、子Agent五个组件。
  • Loop Engineering:AI智能体自动循环执行任务的新范式:OpenClaw创始人Peter与Claude Code创始人Boris提出Loop Engineering,由Google的Addy Osmani系统梳理。核心是让AI智能体通过/loop或/goal命令自动循环执行任务,开发者只需定义可验证的完成条件和边界规则,Agent自行迭代至达标。需防范古德哈特定律——Agent可能删除失败测试而非修复Bug。该范式标志着从Prompt到Loop的四次能力跃迁。
  • Databricks 推出 Omnigent:开源元编排框架:Databricks 推出 Omnigent,一个开源(Apache 2.0)meta-harness,位于 Claude Code、Codex、Pi 及自研 Agent 之上,提供统一接口。三大能力:组合(一行配置切换不同 harness,YAML 定义跨 harness 可移植 agent,同一 Agent 内可组合不同 subagent);控制(有状态成本策略如每 $100 暂停,安全策略如 npm 后 git push 需审批,OS 沙箱,策略与 harness 解耦);协作(通过 URL 共享 live session,支持多端访问及实时评论)。理念类似 Kubernetes,让 session、policy 与具体 harness 解耦,形成可迁移工作层。
  • AI与科技早报:Fable 5禁令、SpaceX估值7800亿美元、LeCun押注JEPA、华为950DT降价:早报涵盖多项AI与技术动态。Fable 5发布72小时内被美国政府出口管制禁令强制下线。SpaceX上市估值7800亿美元。图灵奖得主Yann LeCun系统批判LLM缺乏因果建模,押注约10亿美元开发JEPA世界模型。华为昇腾950DT芯片与DeepSeek V4协同实现低成本高并发推理。
  • Fable 5被攻破、SpaceX上市、LeCun创办Omni Labs三则AI要闻:Anthropic最强模型Fable 5发布后72小时内被红队研究者Pliny攻破,暴露出Unicode同形字替换等三层攻击手法,Constitutional AI安全架构失效,随后美国政府实施出口管制。SpaceX登陆纳斯达克,市值达2.1万亿美元。Yann LeCun离开Meta创办Omni Labs,融资约10亿美元,押注JEPA世界模型路线。
  • Postgres 大规模删除:分区、DROP TABLE 比逐行 DELETE 更稳:讨论 Postgres 中大规模 DELETE 的成本,核心是 MVCC 下删除行不会立即释放空间,留下 dead tuples 需要 VACUUM 清理。工程上常用按时间分区、TRUNCATE 或 DROP TABLE 清空整块数据,或 ETL 到分析库后再删除主库分区。
  • 面壁智能OpenBMB联合发布FactNet:十亿级开源多语言知识图谱:面壁智能OpenBMB联合清华NLP等发布FactNet,构建十亿级开源多语言知识图谱。包含1.55B FactSynsets,附带3.01B来自316种语言的字节级可追溯证据,99.63%精确重定位。为可验证AI提供结构化事实基础。
  • Cloudflare引入Ensemble AI团队,加速AI基础设施研发:Cloudflare宣布Ensemble AI团队关键成员加入,加速AI基础设施研发。Ensemble专注于模型压缩与高效推理,开发了NdLinear和NdLinear-LoRA等技术,旨在降低大语言模型和多模态架构的内存、计算与部署开销。成果将整合到Workers AI平台。
  • Anthropic Ultracode:智能子程序与并行化工作流:Anthropic 的 Ultracode 工具通过智能子程序和并行化工作流,高效利用模型 token。其核心思想是将大量知识工作分解为需要判断和智能的琐碎任务,并利用子智能体扇出能力动态执行,不仅适用于编码,也适用于其他复杂工作流。
  • Claude Code 智能体编码工具详解:25 项功能与策略:Claude Code 是 Anthropic 的智能体编码工具,运行于终端、桌面应用和 IDE,基于智能体循环工作。文章将 25 项功能与策略分为官方功能、社区技术和第三方工具三类,并逐一标注。官方功能包括 CLAUDE.md 记忆文件、技能、子智能体、斜杠命令(/init、/compact、/review 等)、钩子、MCP 服务器、插件、检查点、计划模式、权限模式、自动模式(使用 Sonnet 4.6 分类器)、上下文压缩、后台任务、Agent SDK、无头 CLI、GitHub Action 集成、输出样式、远程控制与移动推送、离线摘要、沙盒。社区技术涵盖结构化上下文文件夹、动态工作流、模块化技能管道、弹性技术。第三方工具如 Mem Search 可扩展外部记忆层。
  • 巴西开源模型被指套壳阿里千问,IplanRIO 致歉称误上传基线版:巴西里约市政府旗下 IplanRIO 推出的开源模型 Rio-3.5-Open-397B 被指套壳阿里千问 Qwen3.5 和 Nex N2 Pro 的权重混合版本。Nex 团队展示证据,IplanRIO 在 Hugging Face 致歉,称因操作失误上传了合并基线版本,将重新上传正式版。
  • 月之暗面 Kimi K2.7 Code 模型高速版上线:月之暗面推出 Kimi K2.7 Code 模型高速版,面向开发者开放。该版本输出速度约为普通版的5-6倍,常规编程场景可达180 Tokens/s,短上下文可达260 Tokens/s。价格为普通版两倍,基于6月12日发布的K2.7 Code,相比K2.6提升长上下文指令遵循与长程编程性能,平均token消耗减少30%。
  • 月之暗面 Kimi K2.7 Code 模型高速版上线:月之暗面推出 Kimi K2.7 Code 模型高速版,面向 Code Beta 计划成员、API 开发者及 Business 用户开放。高速版输出速度约普通版 5-6 倍,常规编程场景达 180 Tokens/s,短上下文可达 260 Tokens/s。价格为普通版两倍,基于 6 月 12 日发布的 K2.7 Code,提升长上下文指令遵循与长程编程性能,平均 token 消耗减少 30%。
  • AppStore评论LLM分析工具开源:Vista发布开源工具,输入App名称即可自动抓取AppStore用户评价,利用LLM进行数据分析,将评论转化为产品经理可用的洞察。工具预设了全球各国免费版和付费版Top 10 App数据,便于研究学习。
  • C++20 手写 CPU 路径追踪器引争议:后期用 AI 清理算不算“无 AI”?:一位开发者展示了自己用 C++20 从零编写的 CPU 路径追踪器,强调未使用第三方库,项目源自编程学校的练习并持续开发一年多。但评论区围绕“without AI”标题展开争论,因作者承认后期清理和补功能时使用了 AI。技术讨论涉及 reciprocal direction、NaN 处理及 f32/f64 性能取舍等细节。
  • NewCore获6600万美元种子轮融资,构建AI智能体身份管理平台:网络安全初创公司NewCore获6600万美元种子轮融资,构建统一管理人类和AI智能体身份的平台。将AI智能体视为拥有独立权限、生命周期和撤销机制的一等身份,采用split-key架构消除单点风险。支持Anthropic Claude Code、OpenAI Codex等编码助手以托管身份访问企业系统。
  • C游戏移植到WASM:32位内存、DOM/JS互操作与浏览器坑:开发者分享将C语言游戏移植到WebAssembly过程中遇到的典型问题,包括32位地址空间下的指针大小和内存模型问题、必须依赖HTML/JS处理UI和DOM的局限性,以及浏览器兼容性bug。讨论还涉及wasm64/memory64的推进现状和Safari支持滞后问题。
  • Salesforce 以 36 亿美元收购 AI 客服公司 Fin:Salesforce 以约 36 亿美元收购 Fin,该公司专门开发基于 AI 的客户服务智能体。此次收购旨在为 Salesforce 的企业 AI 业务开拓新市场。Fin 的 AI 智能体技术将整合进 Salesforce 的产品体系。
  • 美国强制 Anthropic 关停 Fable 5 和 Mythos 5,欧洲主权争议升级:美国政府以国家安全为由,强制 Anthropic 在全球范围内对非美国公民关闭其最新模型 Fable 5 和 Mythos 5。欧洲委员会发言人 Thomas Regnier 称紧急措施不得歧视伙伴,并呼吁加强欧洲技术主权。欧洲研究人员看法不一:有人主张联合投资基础模型、芯片设计与节能计算,打造欧洲"AI 空客时刻";也有人认为欧洲无法与美竞争,应通过合同和数据中心投资确保访问权。图宾根大学 Jonas Geiping 指出法国 Mistral 已"远远落后",欧洲缺乏大规模数据中心和发电能力。
  • Kimi K2.7 Code 高速版上线,输出速度提升 5-6 倍:Kimi K2.7 Code 高速版正式上线,输出速度约 180-260 Token/s,为普通版 5-6 倍,API 定价为普通版 2 倍。该版本在长上下文编程指令遵循和长程任务性能上显著提升,平均 token 消耗减少 30%。
  • clawsweeper:自动审核Issue并创建PR的开源工具:开源项目clawsweeper能够自动审核用户创建的Issue,如果符合项目VISION.md文件,就会自动接手并创建和审核PR。该工具可显著提升开源项目维护效率,减少人工审核工作量。
  • 理想马赫 M100 发布:全球首款动态数据流 AI 芯片,5nm 车规级工艺:理想汽车在 Livis Day 发布会上推出全球首款动态数据流 AI 芯片——理想马赫 M100,采用 5nm 车规级工艺,单芯片算力 1280 TOPS,实际运行效率超过 82%。
  • 理想汽车马赫Mind-Pro模型落地L9车载系统:理想在Livis Day上宣布马赫Mind-Pro模型全面落地L9车载系统,该模型在IFEval、LongBench-v2等评测中稳居第一梯队,采用多模态流式时序建模,具备因果推理和自主决策能力,所有多模态问答均在车端本地完成,数据不上传。
  • AI 版支付宝内测界面曝光,搭载"阿宝"助手:AI 版支付宝正在内测,需邀请码才能体验。界面分为资产和阿宝两个版块,阿宝为 AI 助手,支持对话,底部集成扫一扫、收付款、出行、理财功能。资产界面以卡片夹形式展示流动资产、理财资产、信用资产等信息。蚂蚁集团对此拒绝评论,内部项目代号"宝计划",预计近日上线,后续将以每月两次的频率迭代。新版本上线后默认打开原版支付宝,用户可自行将 AI 版设为首选界面。
  • Gemma 4 12B Coder GGUF 发布:将 Fable 5 推理链蒸馏至本地可跑:Berry Xia 发布了基于 Google gemma-4-12B-it 微调的 Gemma 4 12B Coder GGUF 模型,将 Fable 5 的推理链条蒸馏进 12B 参数模型。GGUF 格式让模型在 12GB 消费级显卡即可本地运行,甚至支持 CPU。模型专为代码生成、调试、复杂算法等任务优化,无需 API 费用且无导出限制,填补了云端模型与本地可用之间的鸿沟。
  • 美国出口管制指令暂停Anthropic两款模型全球访问:6月12日,美国政府以国家安全为由对Anthropic发出出口管制指令,要求暂停所有非美国公民对Claude Fable 5和Mythos 5的访问,包括Anthropic外籍员工。两款模型于6月9日全面上线,Fable 5为Mythos级商用模型,在软件工程和科研领域表现突出。政府援引"越狱"漏洞,称模型可绕过安全护栏;Anthropic反驳该漏洞仅限代码审查,其他模型同样具备。此举引发全球对AI主权控制的担忧。
  • VEXI:适用于终端的开源 AI 编程代理:VEXI 是一款开源的 AI 编程代理,可直接在终端中使用。它旨在帮助开发者通过自然语言指令完成编码任务,提升开发效率。作为开源项目,VEXI 允许社区参与贡献和定制,是开发者工具领域的新选择。
  • 《分布式计算八大谬误》21 年后仍被微服务反复验证:21 年前提出的《分布式计算的八大谬误》至今仍是微服务架构设计的经典警示。讨论指出,许多现代系统在延迟、可靠性、一致性等基本假设上依然会犯错,提醒开发者不要将网络视为可靠、延迟为零等。这些谬误在微服务架构中尤为常见。
  • AI Agent悬赏任务市场:类似AI版"猪八戒":小互介绍了一个AI Agent悬赏任务市场,用户可发布复杂任务并设定赏金,由AI Agent自动抢单、交付结果、收款。流程包括用户下单、Agent抢单报价、用户选择、Agent干活、用户验收,平台抽15%。支持CLI命令行发任务,Agent有信誉分系统。
  • 松延动力N2人形机器人亮相华为HDC 2026,为首款开源鸿蒙消费级产品:松延动力在华为开发者大会HDC 2026上展出OpenHarmony版N2人形机器人,定位行业首款开源鸿蒙消费级产品。该机器人凭借开源鸿蒙微内核及AI智能体实现语音交互和长程任务自规划,可与手机、智慧屏、智能家居等终端联动,充当家庭管家或教育陪伴角色。同步启动"百人百机"计划,为100位开发者提供N2及原生SDK,支持Ubuntu与开源鸿蒙生态。
  • AI 幻觉让法官头疼,韩国计划向滥用 AI 的律师开罚单:韩国法院行政处推动修订法案,计划对提交虚假法条和判例的律师处以罚款。因AI大模型产生幻觉,律师在法律文书中引用不存在的"虚假判例"现象激增。法院行政处获批161亿韩元专项资金,用于搭建司法专属AI平台。
  • M1 Max本地ML离线索引669GB GoPro视频实现语义/人脸搜索:作者在M1 Max上离线索引669GB GoPro视频:先按较低分辨率抽帧,再做音频转写、人脸识别、自定义脸库、目标检测、OCR和场景描述,结果写入SQL和向量数据库以支持语义搜索。原始素材总量669GB,真正分析的是下采样后的帧,但即便如此也花了67小时以上。该方案展示了本地AI媒体检索的可行路径。
  • 纳德拉定调微软:不做最强模型,做模型生态:微软CEO纳德拉明确表示,微软不追求最强AI模型,而是聚焦模型之上的生态建设。其逻辑是:模型终将商品化,生态锁定才能更持久。同时他指出,平台让生长其上的价值多于自身攫取的。这一框架被评论为"没有SOTA"的公司最舒服的世界观,但背后动机是将其作为策略:把闭环建在模型之上,IP留自己手里,模型随时可换。
  • 传闻GPT-5.6将于6月23日发布,成本仅为Fable三分之一:据传闻,OpenAI可能在6月23日推出GPT-5.6,成本仅为Fable的三分之一,上下文窗口达150万token,智能体编程工作流全面升级,与Claude风格系统直接竞争。
  • Kage:将整站镜像打包为可离线运行的单文件/二进制:Kage 是一个开源项目,可将网站抓取并“影子化”为可离线浏览的归档。它使用 Chrome 渲染页面,提取 DOM 后打包成 ZIM 或独立可执行文件。该项目在 Hacker News 上获得 336 分,被与 HTTrack、SingleFile 等工具对比,适用于飞行、长途旅行等无网络场景。
  • IT早报:小米回应YU7 GT极速意义;蚂蚁测试AI版支付宝;鸿蒙PC销售超预期:2026年6月15日IT早报涵盖多项科技动态:小米汽车回应YU7 GT极速300km/h体现工程冗余;蚂蚁集团秘密测试AI版支付宝;鸿蒙智行专属HarmonyOS车机UI差异化设计已确定;华为称鸿蒙PC销售远超预期;Nothing CEO称内存已成手机最昂贵组件。
  • Anthropic顶级模型Mythos与Fable因出口管制下线:美国当局干预 Anthropic,出口管制导致其顶级模型 Mythos 和 Fable 下线。Anthropic 紧急派高级技术人员赴华盛顿,试图说服官员模型可被安全控制,成为 AI 地缘政治实时测试案例。市场关注周一反应:伊朗协议推高股市,但 Anthropic 事件可能引发大幅上涨或恐慌。
  • 超长上下文窗口不一定更可靠:围绕“别盲信大上下文窗口”的文章展开讨论,背景是 Claude Code 和 Opus 等产品把上下文扩到 1M token 后,很多人以为长任务问题会被一次性解决。评论者把焦点放到 AI coding agent 的真实工作流:工具调用、subagent、自动 compaction 和 AGENTS.md 都会显著影响结果。
  • OpenAI 推出合作伙伴网络,投资 1.5 亿美元支持企业 AI 部署:OpenAI 宣布推出 Partner Network,设立 Select、Advanced、Elite 三级合作伙伴层级,提供 Codex、网络安全、智能体等专业认证,并试点 Forward Deployed Experts 项目。目标在 2026 年底前培训认证 30 万名顾问,案例显示 Paychex 借助方案将等待时间降低 80%。
  • JavaScript 的诞生与死亡:JS 变成底座:2014 年 Gary Bernhardt 的演讲预言 JavaScript 不会消失,而会像汇编一样退到底层,成为其他语言的编译目标。如今 TypeScript 接近默认、Electron 让网页技术进入桌面、Flutter 和 Rust GUI 争夺跨平台市场,浏览器变 OS 的梦想仍在延续。
  • Cutback发布Selects:AI长视频编辑助手:Cutback发布Selects,一款面向长视频的AI编辑助手,支持视频同步、组织与原始素材剪辑。它同时分析转录和视频,几分钟内根据提示构建故事线,每个项目可减少约60%编辑时间。在专业编辑测试中,剪辑一致性高。
  • Kimi K2.7 Code 高速模式发布,6 倍加速:Kimi 开源多模态编程模型 K2.7 Code 推出高速模式,编码任务中长输入约 180 tok/s,短上下文最高 260 tok/s,速度提升最多 6 倍。该模式已向 Beta 计划成员、API 开发者及商业用户开放。
  • MiMo Code:具有显式长期记忆架构的编码代理:MiMo Code 是一款创新的编码代理,其核心特点是引入了显式的长期记忆架构。这使得它能够在长时间、多步骤的编码任务中保持上下文和状态,从而更有效地处理复杂项目,减少重复工作。
  • OpenAI Codex Mobile 工程实践指南:手机是远程开发机"控制中心",代码执行在主机。任务启动可配主机、工作区、Git分支,创建独立worktree并自动执行环境脚本。Side Chat提供轻量旁路对话,不打断主线程。Plan模式用于高风险任务规划,Goal模式设定可验证终态。手机独有优势包括拍照截图、后台持续录音语音prompt、真机构建验证。代码审查支持diff查看、语法高亮、行内评论,不必等回工位。
  • Iroh 1.0 发布:可嵌入应用的 p2p 网络层:n0-computer 团队发布 Iroh 1.0,这是一个面向应用嵌入的 p2p 网络库/协议,基于 QUIC、中继和去中心化寻址(DNS、pkarr、mainline DHT)。与 Tailscale、ZeroMQ 等工具对比,Iroh 更侧重作为可嵌入的网络层组件。1.0 版本标志着项目成熟,商业化路径为开源核心加托管、监控等付费服务。
  • Anthropic Claude 模型因出口管制离线,报道称存在“性格冲突”:Axios 报道称,Anthropic 的 Claude 模型(代号 Mythos 和 Fable)因美国政府出口管制而离线,背后存在“性格冲突”与“态度问题”。当前方案之一是确保模型无法被越狱,但完美越狱防护可能不可行。此外,Anthropic 是否成功防御了特定对抗攻击仍不确定。
  • DuMate 核心升级,token 消耗降 75%:DuMate 完成核心引擎升级,通过对 Harness 引擎及相关工程工作流的优化,在保持任务性能不变的前提下,将 token 消耗降低 75%。对用户而言,这意味着积分消耗也同步降低 75%,显著提升了开发工具的效率和成本效益。
  • AI编辑器与专业剪辑师4小时剪辑对比:84%一致:一款基于Premiere Pro重构的AI视频编辑器,与专业剪辑师共同剪辑同一4小时视频项目,两者84%的剪辑操作相同。AI编辑器可在数分钟内完成草稿,节省约60%的准备工作时间,最后16%的差异点仍需人类判断。
  • 上海交大联合百度智能云推出机器人操控模型AHA-WAM:上海交大ScaleLab团队联合上海人工智能实验室、百度智能云推出机器人操控模型AHA-WAM,突破世界-动作模型延迟瓶颈。在RoboTwin 2.0上以92.8%平均成功率超越主流模型,闭环控制频率从5.26Hz提升至24.17Hz,轻量版达56.95Hz,提速超10倍。
  • OpenAI 推出 AI 原生广告,买场景而非关键词:主推文指出AI时代的广告形态已成巨头探索方向。引用推文分析OpenAI广告后台发现:ChatGPT Ads本质不是买关键词,而是买用户任务场景和意图匹配;广告内容越像说明书越适合;投放页面的SEO基础设施至关重要;落地页、标题、文案及上下文提示共同影响匹配质量。官方将其定义为"AI原生广告",并开启"GEM时代"。
  • OpenRouter Fusion API:多模型并行融合,提效但更慢更贵:OpenRouter发布Fusion API,将同一请求并行发送给多个模型,再由裁判模型整合答案。该方案在deep research等任务上表现提升,但延迟和费用明显上升。提供Budget和Quality两种预设,分别对应便宜模型组合和前沿模型组合。讨论延伸到test-time compute和多轮迭代的局限性。
  • Perceptron 发布 Agentic Detection 视觉检测模型:Perceptron 推出 Agentic Detection 视觉检测模型,用户只需提供一张图片并用自然语言描述目标,即可自动框出并分类,无需预先训练。该模型还能处理物理推理检测任务,如定位森林火灾起火点、标记空车位等。
  • 智谱Zcode客户端发布,可免费使用GLM 5.2:智谱推出类似Codex的客户端工具Zcode,用户通过谷歌账号注册登录即可免费使用GLM 5.2。软件支持Windows、Mac(Intel和Apple Silicon)平台,Linux版本需通过内测群获取。该工具面向开发者,提供AI编程辅助能力。
  • 微软 CEO 纳德拉警告:少数 AI 系统可能攫取全部经济回报:微软 CEO 萨提亚·纳德拉认为 AI 将重塑企业,形成人与数字系统间的"认知循环"。企业除人力资本外还需拥有"token资本"--自有的 AI 能力。他建议构建专有学习系统、私有评估追踪业务相关提升、用真实数据改进内部训练,并使机构知识可查询复用。真正机会在模型之上构建学习循环,且不能外包学习。纳德拉警告:少数 AI 系统可能攫取所有经济回报,行业知识被商品化。相比 2025 年 3 月声称"模型正在商品化",一年多后他态度转变,指出若商品化慢于预期,OpenAI 和 Anthropic 可能凭借难以匹敌的模型及产品生态形成集中。
  • 理想汽车宣布马赫VLA能力持续进化,第四季度对齐特斯拉FSD V14:理想汽车在Livis Day上宣布第三季度AD Max推送全新马赫VLA,第四季度对齐特斯拉FSD V14能力。双马赫M100芯片算力2560TOPS,模仿学习规模提升50%、强化学习提升15倍、模型参数量提升10倍、计算量提升15倍。
  • 鸿海与施耐德电气围绕次世代 AI 数据中心展开战略合作:鸿海科技集团与施耐德电气宣布战略合作,共同打造并推动次世代 AI 数据中心的发展。双方将结合鸿海的制造优势和施耐德电气的能源智慧,打造集成式、可实时部署的解决方案,协助客户在全球更快速、高效地构建 AI 基础设施。合作生产将于今年稍晚启动。双方还将共同开发次世代 AI 数据中心参考架构,探索闭环式能源优化、模块化电力与冷却系统、标准化设计框架等创新方案。
  • 微信支付 AI 接入工具箱 2.0 发布,Token 消耗降低 50%:微信支付 AI 接入工具箱升级至 2.0 版本,全面支持 9 种语言。Skill 从仅覆盖支付和券升级为全线覆盖所有产品知识,新增技术专家和金融级研发专家功能。新增 CLI 动态排障,支持自然语言查询支付单、退款单实时状态。文档时序图和状态图转为 Mermaid 格式,整体 Token 消耗比原始 HTML 降低 50%。
  • Conan:适用于 Claude Code 的原生 Mac 控制台:Conan 是一款专为 Claude Code 设计的原生 Mac 控制台应用,为开发者提供更直观的图形化界面来管理和运行 Claude Code 相关任务。它旨在简化与 AI 编码助手的交互流程,提升开发体验。
  • 智源大会:SkyReels V4与Mureka V9技术演进:昆仑万维Skywork首席科学家成宇在智源大会上介绍SkyReels V4与Mureka V9。SkyReels V4在视频生成评测中夺得双赛道第一,超越Veo 3.1和Sora 2,实现毫秒级音画同步、全模态强化学习等突破。Mureka V9引入MusiCoT音乐思维链技术,在旋律性等维度排名第一。
  • AI时代高效团队:Lovable设计负责人分享七条经验:Lovable设计负责人Felix Haas总结AI时代高效团队的七条经验:主动做事、重态度轻简历、靠试错而非刷资讯、资深管理者重回一线、减少自我意识、先发布再迭代。Lovable 2024年上线,8个月达1亿美元年收入。
  • OiiOii 2.0实测:智能画布、一键拉片复刻与skill库上线:OiiOii 2.0新增智能画布、一键拉片复刻和skill库三个功能。一键拉片复刻可将输入片段拆解为含关键帧、叙事要素、镜头语言等维度的拉片表格,用户替换角色、场景、元素后,半小时内可复刻出镜头设计一致度达90%的动画片段。智能画布支持直接点击素材唤醒Agent对话修改,不同素材可并行调用多个Agent同步推进任务。
  • Rio“自研”LLM 被指是 Nex +Qwen 权重合并:Rio de Janeiro市政府旗下的IplanRIO发布Rio-3.5-Open-397B,最初被包装成基于Qwen3.5的本地后训练成果。随后有人指出它更像是Nex-N2 Pro与原始Qwen3.5-397B-A17B的权重merge,引发争议。
  • 如何搭建一个端到端业务需求专家Agent:本文详细介绍了如何搭建一个端到端业务需求专家Agent,涵盖从需求分析到系统实现的完整流程。文章提供了实用的技术方案和架构设计思路,帮助开发者构建能够理解业务需求并自动生成解决方案的智能Agent。
  • 微软CEO Satya Nadella:没有生态的「前沿AI模型」不可持续:微软CEO Nadella撰文指出,企业真正资产是人类资本(知识、判断力等)与token资本(自建AI能力)相互强化的学习闭环。他提出可落地的AI架构:可替换通用模型+不可丢失的组织经验;通过私有评测(Private Evals)和私有强化学习环境(Private RL Environments)以真实业务结果驱动模型进化;知识库作为可查询的制度记忆。该闭环被称为"爬山机",具有复利效应。他警告若少数模型攫取全部回报将重演产业空心化,主张构建"前沿生态"而非仅"前沿模型",让价值广泛流向各行业与国家。