四百多个成品视频,谷【歌再】造“谷歌”！新模型、《新智》能体、(新硬)件来了，但股价跌了-兴和县振泓遥百货店

5 月 20 日凌晨，一年一度的谷歌 I/O 大会开幕，依托谷歌复杂的生态系统，这又是一次让人眼花缭乱的发布会。在两小时的演讲里，谷歌管理层轮番出场，一次性发布了数十个产品更新，官网对于主要产品的博客介绍就更新了 14 篇。

这次大会的核心主题是 " 智能体 Gemini 时代 "，重要的发布也基本上围绕于此——包括基座大语言模型 Gemini 3.5 Flash、全模态世界模型 Gemini Omni、对标 OpenClaw（龙虾）的智能体产品 Gemini Spark、AI 搜索引入智能体、智能体管理平台 Antigravity 2.0、智能眼镜等等。

这次发布会的反馈呈现两级分化，有机构算了一笔账，这次轻量基座模型升级伴随着运行成本的 5 倍上升，新模型的 " 性价比 " 可能没那么美好。资本市场也给出了反馈，5 月 20 日凌晨美股收盘，谷歌（GOOGL.US）跌超 2%，股价收于 387.66 美元 / 股，当前总市值为 4.7 万亿美元。

两大模型撑场，月活翻倍

" 自上一届 I/O 大会以来，我们见证了技术的不断突破与飞速进展。" 在开幕演讲中，谷歌 CEO 桑达尔 · 皮查伊（Sundar Pichai）先抛出了一些新的数据。在去年 I/O 大会时，Gemini app 的月活跃用户数为 4 亿，今天这一数字已突破 9 亿，一年内翻倍。

两年前，谷歌每月处理的 token（词元）量为 9.7 万亿个，去年的 I/O 大会这一数字约 480 万亿个，到今年这一规模实现 7 倍增长，谷歌每月处理的 token 量已突破 3200 万亿个。

目前，谷歌旗下已有 13 款产品各拥有超 10 亿的用户规模，其中有 5 款产品的用户数量超过了 30 亿。皮查伊称，Gemini 模型是吸引更多用户使用的核心驱动力。

这次 I/O 大会，最核心的更新仍然是 Gemini 模型系列。

谷歌正式发布了新一代的 Gemini 3.5 Flash，官方称这是专为快速高效的任务设计的模型——从每秒 token 的输出量来看，其速度是同类模型的 4 倍，价格却不到同类前沿模型的一半。

根据谷歌的数据，与 Gemini 3.1 Pro 相比，3.5 Flash 在几乎所有基准测试中都表现更优，尤其是编程和 GDPVal 这类更接近真实经济任务的评测。

" 目前头部的科技企业每天大约需要处理 1 万亿个 token。如果他们选择将其中 80% 的日常工作负载从其他前沿模型迁移到 Gemini 3.5 Flash 上，每年将节省超过 10 亿美元。" 皮查伊称。

不过，根据开发者测试，3.5 Flash 能力或许处于 3.0 Pro 和 3.1 Pro 之间，且稳定性更差，重要的是 API 价格比上一代贵了 3 倍，叠加 token 使用量，成本也会更高。

海外评测机构 Artificial Analysis 发文提到，Gemini 3.5 Flash 在智能指数上得分 55，比 3 Flash 提高了 9 分，主要是智能体性能的提升和幻觉减少。3.5 Flash 的 token 速度确实更快，但更高的 token 使用量和 token 定价，使其运行成本比 3 Flash 高出 5 倍多，比 3.1 Pro 高出 75%。

目前 3.5 Flash 已经成为 Gemini 网页和 App 的默认模型，全球同步上线，所有用户都可以免费体验。皮查伊同时提到，谷歌内部正在研发 Gemini 3.5 Pro，该模型目前已在谷歌内部投入使用，会在下个月正式推出。

另一个备受关注的模型是 Gemini Omni 系列，在发布前社交媒体就已经有不少讨论，谷歌对其的定义是 " 能够基于任意输入生成任意输出模态的内容 "。这一模型基于 Gemini 模型的推理能力，融合了 Veo 的视频能力和 Nano Banana 的图片能力，接近理想中的世界模型，因此 " 在现实世界的理解能力上实现飞跃 "。

今天推出的首个系列模型 Gemini Omni Flash 仅支持视频输出能力，谷歌称在未来会逐步扩展至图片和文本。

从会后的信息来看，各方对 Omni Flash 的评价不一。有的业界人士认为表现不如预期，比不上当前行业内的顶尖视频模型，甚至有人称 " 什么也没有修复，是资源的浪费 "。也有人认为这是未来，因为当模型能够处理任何一种模态时，智能体之间的通信方式会彻底改变。

生成能力升级后，内容来源识别也变得更重要了。针对深度伪造 ( Deepfake ) ，三年前，谷歌就推出了数字水印 SynthID，现在还进一步加入了内容凭证验证功能，帮助用户识别内容是否 AI 生成，以及是否经过 AI 工具编辑。

谷歌表示，所有 Gemini Omni 生成的内容都带有谷歌 SynthID 数字水印，可以被追溯到是 AI 生成。这些核验功能也被直接嵌入谷歌搜索和 Chrome 浏览器中。

同时，谷歌宣布，继去年英伟达加入之后，现在 OpenAI、Kakao 和 ElevenLabs 也将采用 SynthID。只有当更多公司选择为其 AI 生成的内容添加水印，这项技术才能真正起效。

一系列智能体来了

模型之下，谷歌真正想讲的是智能体的故事，并上新了一系列围绕产品的智能体。

首先是内置在 Gemini app 中的 AI 智能体 Gemini Spark，这被认为是一个对标 " 龙虾 " 的个人智能体产品，与日常使用的 Workspace 工具（例如 Gmail、Docs 等）深度集成。它运行在谷歌 Cloud 的专用虚拟机上，可以全天候执行任务，即便用户关掉电脑，Spark 仍能继续工作。

谷歌展示了几个典型场景，比如让 Spark 自动解析每月信用卡账单，标记新增或隐藏的订阅费用。以及指示它检查收件箱，查看孩子学校的最新动态，提取重要截止日期，并发送每日汇总摘要。

有网友评价，以谷歌的生态系统和影响力，会让这一产品很快就能成为每个人都能使用的 " 龙虾 "。谷歌是 " 沉睡的巨人 "，一旦模型达到实用性的临界点，Gemini 与 Gmail、文档和谷歌生态系统的结合，将改变游戏。

谷歌同时宣布在搜索中也加入信息智能体 ( Information Agents ) ，用户今年夏天将可以在搜索中创建这类智能体，让它持续跟踪某类信息。例如，用户可以让它监控股票、长期跟踪租房信息、球鞋联名和商品上新等等。

面向开发者，谷歌升级了开发和管理 AI 智能体集群的综合平台，推出了 Antigravity 2.0。这是一款能作为智能体交互核心枢纽的独立桌面应用，谷歌在该平台内置了进一步优化的 Flash 版本，称其响应速度达到了其他前沿模型的 12 倍。

谷歌在最后分享了智能眼镜的进展。谷歌的 AI 眼镜将分成两类：一类是带小型镜片的显示眼镜，另一类是音频眼镜。这两款设备都能让用户解放双手，用户向 Gemini 提问即可随时获取支持。

谷歌表示音频眼镜将首先上市，计划于今年秋季推出。眼镜由三星参与硬件和体验构建，Warby Parker 与 Gentle Monster 负责眼镜设计。

发布会上，演示者展示了一些典型场景：比如可以通过眼镜让 Gemini 导航到上周和朋友见面的地方，中途加入咖啡店；也可以让 Gemini 打开 DoorDash 自动下单咖啡。

在以上发布之后，谷歌随之调整了 Gemini 的订阅价。谷歌 AI Ultra 此前的订阅价格是 250 美元 / 月，这次谷歌将 Ultra 拆分成两个价位段——首先推出每月 100 美元的新 Ultra 计划，适配开发人员、技术主管、知识工作者和高级创作者，同时把最高档 Ultra 订阅降至 200 美元。谷歌的 Pro 订阅则维持在 19.99 美元 / 月。

回看这些发布，面向智能体时代，谷歌的更新覆盖了模型、智能体、硬件、平台等等，几乎亮出了所有的牌。然而，与去年 Gemini 3 带来的颠覆性冲击相比，今年这场发布会更像是稳步迭代而非 " 变革 "。

性价比存疑、业界反馈分化 …… 或许谷歌应该听听用户的声音，毕竟 AI 竞赛已经是一场关于成本、生态与商业模式的综合较量。但生态协同优势会是谷歌未来的看点，拥有全球最大的搜索引擎，也有邮箱、文档、云服务等等，这张生态之网，是其他对手难以复制的护城河。

( 本文来自第一财经 )

谷【歌再】造“谷歌”！新模型、《新智》能体、(新硬)件来了，但股价跌了

猜你喜欢

最新头条