产品与创业

互联网产品、创业公司、增长、商业模式、效率工具和产品设计。

2026年5月20日

2026-05-20 产品与创业日报

昨日科技圈被 Google I/O 2026 全面刷屏,谷歌发布 Gemini 3.5 系列、多模态模型 Gemini Omni、全天候 AI 代理 Gemini Spark 及 Antigravity 2.0 平台,并宣布搜索迎来 25 年来最大改版,全面转向 AI 对话模式。阿里、DeepSeek、Cohere 等厂商也发布重要模型与产品更新。此外,全球首部 AI 长片戛纳首映、家庭通用机器人发布等事件也值得关注。

2026-05-20 产品与创业日报

昨日重点

Google I/O 2026 全面爆发:AI 战略转向独立智能体

昨日 Google I/O 2026 成为绝对焦点,谷歌发布了一系列重磅 AI 产品与战略更新,标志着其 AI 战略从辅助工具全面转向独立智能体。

  • Gemini 3.5 系列模型:发布 Gemini 3.5 Flash 和 Gemini 3.5 模型家族,将前沿智能与行动能力结合,树立智能体模型新标准。Flash 版本输出速度达每秒 289 tokens,是 GPT-5.5 的 4 倍,在 Antigravity 环境中速度提升高达 12 倍。
  • Gemini Omni 多模态模型:首个面向消费者的世界模型,能从任何输入(图像、视频、文本)生成任何内容(包括高质量视频),支持对话式视频编辑,已在 Gemini App、Google Flow 和 YouTube Shorts 中可用。
  • Gemini Spark 全天候 AI 代理:基于 Gemini 3.5 与 Antigravity 平台构建的个人 AI 代理,可在用户设备关机时在云端后台自主执行长时间任务,计划通过 MCP 协议集成第三方应用。
  • Antigravity 2.0 平台:面向全球开放,集成了新的智能体系统和自然语音交互。谷歌展示其智能体在 12 小时内通过 93 个并行子智能体、1.5 万次模型调用和处理 26 亿个 token,从零构建出一个可运行的操作系统,成本不到 1000 美元。
  • 搜索 25 年来最大改版:由 Gemini 3.5 Flash 模型支撑,用户交互从关键词转向描述完整需求,支持多模态输入和聊天式对话。引入可 24 小时后台运行的搜索智能体,AI Mode 月活用户已突破 10 亿。
  • AI 订阅计划改革:推出三级方案,月费从 7.99 至 99.99 美元,放弃每日提示次数限制,转向基于计算资源消耗的计费模式。
  • 其他更新:AI Studio 支持文本生成原生 Android 应用、Ask Play 对话式应用筛选、Ask YouTube 视频对话搜索、通用购物车 Universal Cart、Workspace 语音协作、Android XR 智能眼镜等。

其他重要发布

  • 阿里千问发布 Qwen3.7-Max:新一代旗舰智能体模型,在编程、办公自动化及长周期自主任务方面能力突出,即将通过阿里云百炼 API 提供服务。
  • Cohere 发布 Command A+:开源权重模型,低幻觉率成亮点,在相关榜单以 86% 领先,API 输出速度超过 GPT-5.4 nano。
  • DeepSeek 组建 Harness 团队:主攻代码智能体产品,内部对标 Anthropic 的 Claude Code,已开放产品经理和研发工程师岗位。
  • Kling AI 推出原生 4K 视频生成模型:全球首个原生 4K 视频生成模型,已获好莱坞团队采用。
  • NVIDIA 开源 LongLive 2.0:首个支持 4-bit 量化的端到端长视频生成基础设施,在 5B 模型上实现 45.7 FPS 的生成速度。
  • 全国首个家庭通用机器人发布:武汉光谷发布“拾光 S1”,能叠衣服、做饭、收拾餐桌及陪伴老人聊天,支持持续学习新技能。
  • 全球首部 95 分钟 AI 长片《HELLGRIND》戛纳首映:由字节跳动火山引擎 Seedance 2.0 模型支持,15 人团队 14 天以不到 50 万美元成本完成。

分主题观察

1. AI 模型与基础设施

  • Gemini 3.5 Flash 性能飞跃但成本激增:智能指数达 55 分,超越 Grok 4.3 等竞品,幻觉率大幅下降,输出速度超 280 tokens/s。然而运行成本是前代的 5.5 倍,引发对“Flash”是否仍代表“便宜”的讨论。
  • Gemini Omni 重新定义多模态:不仅能构建逼真场景,还能推理物理世界中的后续发展,结合物理直观理解与 Gemini 在历史、科学和文化背景方面的知识。
  • 阿里云千问云产品全线 Agent 化:百余个云服务产品全面接入 AI Agent 能力,实现自主执行任务,商业模式可能转向“按 Agent 工作量计费”。
  • Andrej Karpathy 加入 Anthropic:被视为该公司迄今为止最重要的招聘,6 小时内获得 1000 万次浏览。
  • LeCun 离职 Meta 创办 AMI:押注基于世界模型的 JEPA 架构,与主流 LLM 路线不同,批评 LLM 缺乏预测行动后果和规划能力。

2. 产品与创业动态

  • 谷歌推出 AI 通用购物车:联合亚马逊、Meta、微软打造 AI 电商协议,将在搜索、Gemini、YouTube、Gmail 中上线,支持多场景商品添加和智能推理。
  • OpenAI 向 YC 创业公司提供 200 万美元 API 投资:以换取股权,为初创公司提供 AI 算力资源。
  • Meta 被曝用员工数据训练 AI 后大裁员:CEO 扎克伯格表示利用员工工作成果训练 AI 模型,随后启动大规模裁员,员工需先完成对替代者的培训。
  • GitHub 内部仓库泄露疑涉 NX Console 扩展供应链入侵:评论猜测与受污染的 VS Code 扩展有关,引发对开发者权限过宽的组织风险讨论。
  • BOSS 直聘 2026 财年首季净利大幅增长:营收 20.69 亿元,同比增长 7.6%;归母净利润 11.57 亿元,同比增长 123.24%。

3. 监管与伦理

  • 欧盟发布高风险 AI 系统分类指导草案:为 AI 提供商、部署者和监管机构提供明确分类标准,公众咨询期至 6 月 23 日。
  • Anthropic 拓宽前沿 AI 对话:与全球 15 个以上宗教、哲学及跨文化传统的学者展开对话,为 Claude 等模型的道德形成与价值观对齐提供多元视角。
  • Infomaniak 转向基础模型保护用户数据隐私:欧洲云服务商通过部署本地化、可控的 AI 模型,避免用户数据被第三方平台获取或滥用。

4. 硬件与机器人

  • 谷歌携手三星展示 2 款智能眼镜:整合 Gemini AI,支持语音导航、实时翻译、个性化推荐等功能,由 Gentle Monster 与 Warby Parker 设计,预计秋季上市。
  • 谷歌高管总结 Google Glass 失败教训:时尚比技术更重要,Meta 与时尚品牌合作的智能眼镜销量已突破 700 万台。
  • 全国首个家庭通用机器人发布:“拾光 S1”在武汉光谷发布,通过自研具身智能模型理解任务并自主规划动作,具备柔顺控制机制。
  • 理想汽车 OTA 8.5 升级:新增手机一键遥控泊出功能,优化 VLA 司机大模型,提升绕行、变道平顺性及辅助驾驶重规划能力。

值得继续关注

  1. Google I/O 后续影响:Gemini 3.5 Flash 和 Gemini Omni 的实际使用反馈、Antigravity 平台的开发者采用情况、搜索改版对用户行为的影响。
  2. AI Agent 竞争格局:DeepSeek Harness 团队与 Claude Code 的正面对决、阿里千问云 Agent 化的落地效果、OpenClaw 等开源平台的崛起。
  3. AI 视频生成商业化:Kling AI 原生 4K 模型、字节跳动 Seedance 2.0、NVIDIA LongLive 2.0 的竞争态势,以及 AI 长片《HELLGRIND》的市场反响。
  4. 监管动态:欧盟高风险 AI 分类指导草案的公众咨询结果,以及各国对 AI 伦理和隐私保护的进一步动作。
  5. 智能眼镜市场:谷歌 Android XR 智能眼镜与 Meta 的竞争,时尚与技术的结合能否推动消费级 AR 眼镜普及。
  6. AI 订阅模式变革:谷歌转向基于计算资源消耗的计费模式,是否会被其他厂商跟进,对用户和开发者成本的影响。