AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年5月13日

Flowtify 公开资讯日报 | 2026-05-13

昨日AI领域迎来多项重大突破与安全警示。安全方面,代号“Mini Shai-Hulud”的大规模供应链攻击席卷开源生态,超170个热门npm/PyPI包被污染。产品与生态方面,Google发布Gemini Intelligence与首款AI优先笔记本Googlebook,将AI深度集成至系统级交互;OpenAI Codex新增Computer Use能力,AI Agent可操作桌面软件;小米开源Xiaomi OneVL统一VLA与世界模型;全球首个全AI运营的在线广播电台上线。行业动态方面,Anthropic企业客户采用率首次超越OpenAI,并传出以超9000亿美元估值融资;Sam Altman在马斯克诉讼案中作证,披露多项内幕。此外,中国科学家成功研制“九章四号”量子计算原型机,实现算力指数级飞跃。

Flowtify 公开资讯日报

日期:2026-05-13

一、昨日重点

1. 安全警钟:大规模供应链攻击“Mini Shai-Hulud”爆发

  • 事件:代号“Mini Shai-Hulud”的供应链攻击已劫持GitHub Actions CI管道,污染了TanStack、Mistral AI等超过170个热门npm/PyPI包。恶意软件具备持久化与蠕虫式传播能力,能绕过传统验证。
  • 影响:波及Linux、Windows、Next.js等多个系统与框架。
  • 建议:开发者应立即冻结安装、进行安全自查,并轮换所有密钥与令牌。

2. Google 全面拥抱 AI 优先:Gemini Intelligence 与 Googlebook 发布

  • Gemini Intelligence:将Android重新定位为主动型AI系统,核心能力包括跨应用多步骤任务自动化、智能研究与代办、智能填表、语音转书面稿(Rambler)以及自然语言生成桌面Widget。
  • Googlebook:首款为Gemini Intelligence设计的AI优先笔记本,核心创新包括Magic Pointer(AI化鼠标指针,支持手势/语音操控)、Create Your Widget(自然语言生成动态小组件)以及深度整合Android生态。

3. OpenAI Codex 新增 Computer Use 能力

  • 功能:AI助手可从操作代码扩展到操作本地GUI应用,拥有独立光标,不接管用户输入,允许用户并行工作。
  • 技术:混合视觉模态截图和无障碍框架API,Spark模型依赖无障碍数据加速任务执行。
  • 安全:采用逐应用权限授权,保护隐私。目前已在Mac上可用,Windows支持即将推出。

4. 小米开源 Xiaomi OneVL,统一 VLA 与世界模型

  • 模型:一步式潜空间语言视觉推理框架,首次将VLA(视觉语言动作模型)与世界模型两条技术路线统一于同一框架。
  • 性能:通过潜空间推理同时提升推理速度与精度,在多项基准测试中达到先进水平,并提供语言和视觉双维度的可解释性。
  • 开源:已全面开源模型权重、训练及推理代码。

5. 全球首个全AI运营的在线广播电台开播

  • 平台:在X平台上线,专为创业者和开发者提供24小时AI资讯。
  • 主播:由五名具备独立编辑判断、记忆和个性的AI主播主持,可实时播报突发新闻、每30分钟新闻综述、融资追踪和工具趋势分析,并能主动发现信息矛盾进行实时辩论。

6. 中国科学家成功研制“九章四号”量子计算原型机

  • 参数:1024个量子压缩态输入、8176模式的可编程量子计算原型机,首次操纵和探测高达3050个光子的量子态。
  • 性能:求解高斯玻色取样问题比全球最快超级计算机快10的54次方倍。
  • 发表:成果发表于《自然》。

7. 行业格局变动:Anthropic 企业客户采用率首次超越 OpenAI

  • 数据:金融科技公司Ramp发布的AI指数显示,在超过5万家企业样本中,Anthropic企业客户采用率为34.4%,OpenAI为32.3%。
  • 趋势:Anthropic在金融、科技等高科技行业领先,其付费客户比例在过去一年从9%大幅提升约26个百分点。

8. Sam Altman 作证:马斯克多次试图完全控制 OpenAI

  • 证词:在马斯克诉OpenAI案中,Altman作证称马斯克多次试图完全控制OpenAI,甚至曾要求将控制权交给其子女。
  • 文化伤害:Altman透露马斯克曾要求对研究人员进行排名并“裁员”,对OpenAI文化造成巨大伤害。

二、分主题观察

安全与基础设施

  • 供应链攻击:TanStack npm包遭GitHub Actions缓存投毒,攻击者利用pull_request_target工作流和共享缓存进行投毒。
  • 漏洞发现:微软MDASH框架协调100+AI模型抓虫Win11,在5月补丁星期二中协助发现16个漏洞,在CyberGym基准测试中以88.45%领先。
  • 网络服务安全:dnsmasq被曝6个严重CVE,引发关于嵌入式设备更新、C语言安全性及AI辅助审计的讨论。
  • 数据基础设施:DuckDB推出Quack客户端-服务器协议,引发从本地分析工具向分析工作流执行层演化的讨论。开源psql_bm25s让PostgreSQL多智能体检索提速23倍。

模型与产品更新

  • 端侧AI:面壁智能发布MiniCPM-V 4.6(1.3B参数,仅需6GB内存);oMLX更新强化苹果端侧AI,本地能力直逼云端;群联电子与联发科在天玑9500平台实现手机端单机运行200B大语言模型。
  • 多模态模型:商汤发布SenseNova-U1技术报告;Jina发布首个统一多模态Embedding模型v5-omni;Stepfun发布Step Image Edit 2图像模型(35亿参数性能领先)。
  • AI编程:澳洲牧羊大叔三行脚本引爆AI编程革命,Claude Code等急推goal模式;Cursor发布革命性SDK,编程Agent可嵌入任意基础设施;苹果发布Xcode 26.5,支持AI消息队列。
  • AI Agent:Google发布构建长时间运行AI智能体架构指南;Anthropic工程师透露数千个AI智能体夜间自动为其写代码;Statewright发布开源可视化状态机工具。

行业与商业动态

  • 融资与估值:AI初创公司Recursive获6.5亿美元融资,专注自我改进AI;Anthropic正以超9000亿美元估值筹集至少300亿美元;原阿里最年轻P10林俊旸创立新AI实验室,寻求20亿美元估值。
  • 企业动态:亚马逊将Alexa Plus整合进电商平台;百度Miaoda应用与企业版上线,自生成代码占比90%;马化腾谈腾讯AI“上了船但船漏水”,正为微信秘密开发AI智能体。
  • 监管与法律:美国六州司法部长调查Sam Altman涉嫌利用OpenAI谋私利;青少年按ChatGPT建议混用药物致死,父母起诉OpenAI;我国累计868款生成式AI服务完成备案。
  • 硬件与芯片:AMD为开源维护者提供持久GPU集群访问;微软与SK海力士加强合作,降低对英伟达依赖;黄仁勋基金会向CoreWeave租用GPU捐赠研究机构。

人机交互与体验

  • 交互革新:Google DeepMind推出AI化鼠标指针Magic Pointer,实现手势语音操控;Google将Gemini升级为Android系统级AI大脑,从“App+系统”转变为“AI理解层+系统+App”。
  • AI应用:Meta推出实时语音视觉AI,即将登陆Ray-Ban眼镜;谷歌Gboard输入法新增Gemini驱动听写功能Rambler;阿里云发布Qwen-Character,实现记忆共情与主动交互。
  • 用户行为:亚马逊员工承认“刷AI用量”冲内部排行榜,形成“词元刷量”现象;腾讯元宝群聊总结功能实测欠智能,核心需求未满足。

三、值得继续关注

  1. 供应链攻击后续:Mini Shai-Hulud攻击的清理与溯源进展,以及GitHub Actions安全机制的改进。
  2. Google AI优先战略落地:Gemini Intelligence在三星Galaxy和Pixel手机上的实际体验,以及Googlebook的市场反响。
  3. OpenAI vs. Anthropic竞争:Anthropic融资进展与IPO计划,以及企业客户采用率变化趋势。
  4. AI编程范式转变:从“生成代码”到“闭环交付”的转变,以及AI Agent在编程中的自主性提升。
  5. 端侧AI能力提升:手机端运行大模型的进展,以及端侧AI对云端服务的替代效应。
  6. AI安全与伦理:AI导致的法律诉讼(如青少年致死案)和监管动态,以及AI使用中的伦理问题。
  7. 量子计算突破:“九章四号”对AI算力潜在影响的后续讨论。