AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年5月22日

Flowtify 公开资讯日报 | 2026-05-22

昨日AI领域迎来多项重磅动态:开源生态方面,首个基于华为昇腾910B的全栈训练1.58比特大模型BitCPM-CANN发布,字节跳动开源轻量多模态模型Lance,网易有道开源“子曰4”多模态与语音模型;模型与产品方面,阿里发布Qwen3.7-Max,智谱推出GLM-5.1高速版API,Runway发布Aleph 2.0视频编辑模型,OpenAI Codex推出多项协作新功能;商业与政策方面,OpenAI Q1营收57亿美元但亏损率仍达122%,Anthropic预计提前实现盈利,DeepSeek推进700亿元融资,美国AI监管行政令被撤销,加州签署首份AI失业保护行政令;研究方面,GPT-4.5首次实证通过图灵测试,OpenAI推理模型证伪1946年数学猜想。

Flowtify 公开资讯日报

日期:2026-05-22


一、昨日重点

  1. 首个基于华为昇腾910B的全栈训练1.58比特开源大模型BitCPM-CANN发布:ModelBest、清华大学与OpenBMB社区联合发布,内存占用相比BF16降低约6倍,可高效部署于边缘端,性能保持全精度模型95-97%。
  2. OpenAI 2026年Q1营收57亿美元,运营亏损率达122%:据The Information报道,OpenAI营收增长但亏损依然严峻,凸显高昂运营成本与盈利挑战。
  3. Karpathy的CLAUDE.md规则将AI编程准确率提升至94%:65行、4条核心规则在GitHub获超22万星标,强制开发者“慢下来”,对抗“先写再说”的习惯。
  4. DeepSeek推进700亿元融资,梁文锋承诺坚持开源AI模型:估值约450亿美元,若成功将创下中国科技初创公司首轮融资纪录。
  5. 图灵测试76年后首现AI通过实证:GPT-4.5以73%判定率超越真人:加州大学圣地亚哥分校研究首次实证现代AI可通过图灵测试。
  6. 美国AI监管令突然告吹内幕:白宫内讧,马斯克、扎克伯格游说特朗普:特朗普取消原定签署的AI行政令,凸显白宫内讧与科技界领袖的反对。
  7. 加州签署美国首份AI失业保护行政令:旨在保护工人免受人工智能技术导致的失业影响。
  8. 微软因成本过高停用Claude Code授权,力推自家Copilot CLI:token费用过高导致微软取消内部Claude Code授权,凸显企业AI成本困境。

二、分主题观察

开源模型与生态

  • BitCPM-CANN:全球首个基于华为昇腾910B NPU全栈训练的开源1.58比特三元大模型,内存占用降低约6倍,性能保持全精度模型95-97%。
  • 网易有道“子曰4”:多模态模型(27B参数)与语音合成模型全球全量开源,数理难题准确率达81.4%,语音合成支持14种语言、3秒零样本复制。
  • 字节跳动Lance:轻量级多模态模型(3B参数),采用原生统一架构,整合图像与视频的理解、生成及跨模态编辑功能,权重已依据Apache 2.0协议开源。
  • 腾讯Hy-MT2翻译专用大模型:在金融、法律、医疗等特定领域翻译能力超越DeepSeek-V4-Pro,显示专用模型在垂直领域的优势。

模型与产品发布

  • 阿里Qwen3.7-Max:配备100万token上下文窗口,评测得分56.6,性能与GPT-5.4相当,支持10倍推理加速和长达数小时的自主运行。
  • 智谱GLM-5.1高速版:输出速度达400 tokens/s,刷新全球大模型API速度上限,首次在国产大模型中实现旗舰级能力与低延迟结合。
  • Runway Aleph 2.0:视频编辑模型,支持编辑最长30秒1080p视频,具备精准局部编辑能力,可基于单帧图像精确控制并跨镜头应用编辑。
  • OpenAI Codex更新:推出Appshots功能、正式支持/goal模式、新增高级标注模式、Business用户可共享自定义插件等,从个人编程助手向团队协作平台演进。
  • ChatGPT for PowerPoint插件:用户可在PowerPoint侧边栏直接与ChatGPT对话,实现用自然语言生成、优化和总结演示文稿。
  • Claude Code v2.1.147:引入Workflow工具支持确定性多智能体编排,/simplify命令重命名为/code-review。

商业与投融资

  • OpenAI:Q1营收57亿美元,但调整后运营利润率为负122%,仍处亏损状态,正加速推进IPO。
  • Anthropic:预计2026年Q2实现首次运营利润,年收入预计增长130%达109亿美元,核心驱动力为“代理式编程”。
  • DeepSeek:推进700亿元融资,估值约450亿美元,腾讯、IDG资本等接近参投。
  • Polsia:无员工AI公司融资3000万美元,估值达2.5亿美元,年化营收已近1000万美元。
  • Modal:AI基础设施平台获3.55亿美元C轮融资,估值46.5亿美元。
  • 联想集团:2026财年营收增长20%,AI相关收入同比增长105%,占总营收33%。

政策与监管

  • 美国:特朗普撤销AI安全行政令,此前接马斯克、扎克伯格等电话游说。
  • 加州:签署美国首份AI失业保护行政令,保护工人免受AI失业影响。
  • 中国:国家发改委表示将加快具身智能训练基础设施建设,推动机器人进工厂、商场、家庭;指导国产大模型加大力度适配国产算力芯片。
  • 新加坡:OpenAI在新加坡设立首个海外AI实验室,IMDA同步更新AI治理框架以适应Agentic AI。

研究与技术突破

  • 图灵测试:GPT-4.5在5至15分钟对话中被误认为人类的概率高达73%,首次实证现代AI可通过图灵测试。
  • 数学猜想证伪:OpenAI推理模型成功证伪1946年单位距离几何猜想,菲尔兹奖得主称此为“AI数学发展的里程碑”。
  • 文本退化:Dharma-AI指出大语言模型在生产环境中普遍存在“文本退化”现象,但现有主流基准测试大多未将其纳入评估范围。
  • AI编程:Karpathy的CLAUDE.md规则将AI编程准确率从65%提升至94%。

其他动态

  • 特斯拉Optimus V2.5:步态更自信,人形机器人迈向实用化。
  • 比亚迪:将于5月28日举办智能化战略发布会,预计宣布AI智能体新突破。
  • Spotify与环球音乐:达成AI混音授权协议,允许订阅用户创作AI翻唱和混音。
  • FTC:要求三家公司支付近百万美元和解AI营销服务欺诈指控。
  • GitHub危机:18年老粉与平台决裂,3800多个内部仓库遭黑客入侵,技术骨干流失。

三、值得继续关注

  1. AI Agent成熟化:Anthropic发布Agent记忆原语,Qwen3.7-Max通过35小时极限压力测试,红杉AI峰会提出“长周期智能体”将成为2026年商业定义。
  2. 企业AI成本困境:微软因token费用过高停用Claude Code授权,凸显基于使用量的定价模式面临挑战。
  3. 中美AI竞争:中国顶尖AI研究者占比超美国(43.7% vs 31.9%),美国撤销AI监管行政令以避免削弱竞争优势。
  4. AI与能源:AI赋能中国可再生能源电网动态测绘与智能优化,解决新能源消纳难题。
  5. AI与就业:加州签署美国首份AI失业保护行政令,为其他州树立政策先例。
  6. 开源模型生态:多个国产开源模型发布,显示中国在开源AI领域的活跃度与创新能力。