昨日AI领域迎来多项重大突破与安全警示。安全方面，代号“Mini Shai-Hulud”的大规模供应链攻击席卷开源生态，超170个热门npm/PyPI包被污染。产品与生态方面，Google发布Gemini Intelligence与首款AI优先笔记本Googlebook，将AI深度集成至系统级交互；OpenAI Codex新增Computer Use能力，AI Agent可操作桌面软件；小米开源Xiaomi OneVL统一VLA与世界模型；全球首个全AI运营的在线广播电台上线。行业动态方面，Anthropic企业客户采用率首次超越OpenAI，并传出以超9000亿美元估值融资；Sam Altman在马斯克诉讼案中作证，披露多项内幕。此外，中国科学家成功研制“九章四号”量子计算原型机，实现算力指数级飞跃。

Flowtify 公开资讯日报

日期：2026-05-13

一、昨日重点

1. 安全警钟：大规模供应链攻击“Mini Shai-Hulud”爆发

事件：代号“Mini Shai-Hulud”的供应链攻击已劫持GitHub Actions CI管道，污染了TanStack、Mistral AI等超过170个热门npm/PyPI包。恶意软件具备持久化与蠕虫式传播能力，能绕过传统验证。
影响：波及Linux、Windows、Next.js等多个系统与框架。
建议：开发者应立即冻结安装、进行安全自查，并轮换所有密钥与令牌。

2. Google 全面拥抱 AI 优先：Gemini Intelligence 与 Googlebook 发布

Gemini Intelligence：将Android重新定位为主动型AI系统，核心能力包括跨应用多步骤任务自动化、智能研究与代办、智能填表、语音转书面稿（Rambler）以及自然语言生成桌面Widget。
Googlebook：首款为Gemini Intelligence设计的AI优先笔记本，核心创新包括Magic Pointer（AI化鼠标指针，支持手势/语音操控）、Create Your Widget（自然语言生成动态小组件）以及深度整合Android生态。

3. OpenAI Codex 新增 Computer Use 能力

功能：AI助手可从操作代码扩展到操作本地GUI应用，拥有独立光标，不接管用户输入，允许用户并行工作。
技术：混合视觉模态截图和无障碍框架API，Spark模型依赖无障碍数据加速任务执行。
安全：采用逐应用权限授权，保护隐私。目前已在Mac上可用，Windows支持即将推出。

4. 小米开源 Xiaomi OneVL，统一 VLA 与世界模型

模型：一步式潜空间语言视觉推理框架，首次将VLA（视觉语言动作模型）与世界模型两条技术路线统一于同一框架。
性能：通过潜空间推理同时提升推理速度与精度，在多项基准测试中达到先进水平，并提供语言和视觉双维度的可解释性。
开源：已全面开源模型权重、训练及推理代码。

5. 全球首个全AI运营的在线广播电台开播

平台：在X平台上线，专为创业者和开发者提供24小时AI资讯。
主播：由五名具备独立编辑判断、记忆和个性的AI主播主持，可实时播报突发新闻、每30分钟新闻综述、融资追踪和工具趋势分析，并能主动发现信息矛盾进行实时辩论。

6. 中国科学家成功研制“九章四号”量子计算原型机

参数：1024个量子压缩态输入、8176模式的可编程量子计算原型机，首次操纵和探测高达3050个光子的量子态。
性能：求解高斯玻色取样问题比全球最快超级计算机快10的54次方倍。
发表：成果发表于《自然》。

7. 行业格局变动：Anthropic 企业客户采用率首次超越 OpenAI

数据：金融科技公司Ramp发布的AI指数显示，在超过5万家企业样本中，Anthropic企业客户采用率为34.4%，OpenAI为32.3%。
趋势：Anthropic在金融、科技等高科技行业领先，其付费客户比例在过去一年从9%大幅提升约26个百分点。

8. Sam Altman 作证：马斯克多次试图完全控制 OpenAI

证词：在马斯克诉OpenAI案中，Altman作证称马斯克多次试图完全控制OpenAI，甚至曾要求将控制权交给其子女。
文化伤害：Altman透露马斯克曾要求对研究人员进行排名并“裁员”，对OpenAI文化造成巨大伤害。

二、分主题观察

安全与基础设施

供应链攻击：TanStack npm包遭GitHub Actions缓存投毒，攻击者利用pull_request_target工作流和共享缓存进行投毒。
漏洞发现：微软MDASH框架协调100+AI模型抓虫Win11，在5月补丁星期二中协助发现16个漏洞，在CyberGym基准测试中以88.45%领先。
网络服务安全：dnsmasq被曝6个严重CVE，引发关于嵌入式设备更新、C语言安全性及AI辅助审计的讨论。
数据基础设施：DuckDB推出Quack客户端-服务器协议，引发从本地分析工具向分析工作流执行层演化的讨论。开源psql_bm25s让PostgreSQL多智能体检索提速23倍。

模型与产品更新

端侧AI：面壁智能发布MiniCPM-V 4.6（1.3B参数，仅需6GB内存）；oMLX更新强化苹果端侧AI，本地能力直逼云端；群联电子与联发科在天玑9500平台实现手机端单机运行200B大语言模型。
多模态模型：商汤发布SenseNova-U1技术报告；Jina发布首个统一多模态Embedding模型v5-omni；Stepfun发布Step Image Edit 2图像模型（35亿参数性能领先）。
AI编程：澳洲牧羊大叔三行脚本引爆AI编程革命，Claude Code等急推goal模式；Cursor发布革命性SDK，编程Agent可嵌入任意基础设施；苹果发布Xcode 26.5，支持AI消息队列。
AI Agent：Google发布构建长时间运行AI智能体架构指南；Anthropic工程师透露数千个AI智能体夜间自动为其写代码；Statewright发布开源可视化状态机工具。

行业与商业动态

融资与估值：AI初创公司Recursive获6.5亿美元融资，专注自我改进AI；Anthropic正以超9000亿美元估值筹集至少300亿美元；原阿里最年轻P10林俊旸创立新AI实验室，寻求20亿美元估值。
企业动态：亚马逊将Alexa Plus整合进电商平台；百度Miaoda应用与企业版上线，自生成代码占比90%；马化腾谈腾讯AI“上了船但船漏水”，正为微信秘密开发AI智能体。
监管与法律：美国六州司法部长调查Sam Altman涉嫌利用OpenAI谋私利；青少年按ChatGPT建议混用药物致死，父母起诉OpenAI；我国累计868款生成式AI服务完成备案。
硬件与芯片：AMD为开源维护者提供持久GPU集群访问；微软与SK海力士加强合作，降低对英伟达依赖；黄仁勋基金会向CoreWeave租用GPU捐赠研究机构。

人机交互与体验

交互革新：Google DeepMind推出AI化鼠标指针Magic Pointer，实现手势语音操控；Google将Gemini升级为Android系统级AI大脑，从“App+系统”转变为“AI理解层+系统+App”。
AI应用：Meta推出实时语音视觉AI，即将登陆Ray-Ban眼镜；谷歌Gboard输入法新增Gemini驱动听写功能Rambler；阿里云发布Qwen-Character，实现记忆共情与主动交互。
用户行为：亚马逊员工承认“刷AI用量”冲内部排行榜，形成“词元刷量”现象；腾讯元宝群聊总结功能实测欠智能，核心需求未满足。

三、值得继续关注

供应链攻击后续：Mini Shai-Hulud攻击的清理与溯源进展，以及GitHub Actions安全机制的改进。
Google AI优先战略落地：Gemini Intelligence在三星Galaxy和Pixel手机上的实际体验，以及Googlebook的市场反响。
OpenAI vs. Anthropic竞争：Anthropic融资进展与IPO计划，以及企业客户采用率变化趋势。
AI编程范式转变：从“生成代码”到“闭环交付”的转变，以及AI Agent在编程中的自主性提升。
端侧AI能力提升：手机端运行大模型的进展，以及端侧AI对云端服务的替代效应。
AI安全与伦理：AI导致的法律诉讼（如青少年致死案）和监管动态，以及AI使用中的伦理问题。
量子计算突破：“九章四号”对AI算力潜在影响的后续讨论。

AI 动态

2026年5月

Flowtify 公开资讯日报 | 2026-05-13