四百多个成品视频,谷【歌再】造“谷歌”!新模型、《新智》能体、(新硬)件来了,但股价跌了-兴和县振泓遥百货店

谷【歌再】造“谷歌”!新模型、《新智》能体、(新硬)件来了,但股价跌了

2026-05-21 00:20:37 血红 鱼的天空 / 苍天白鹤

5 月 20 日凌晨,一年一度的谷歌 I/O 大会开幕,依托谷歌复杂的生态系统,这又是一次让人眼花缭乱的发布会。在两小时的演讲里,谷歌管理层轮番出场,一次性发布了数十个产品更新,官网对于主要产品的博客介绍就更新了 14 篇。

这次大会的核心主题是 " 智能体 Gemini 时代 ",重要的发布也基本上围绕于此——包括基座大语言模型 Gemini 3.5 Flash、全模态世界模型 Gemini Omni、对标 OpenClaw(龙虾)的智能体产品 Gemini Spark、AI 搜索引入智能体、智能体管理平台 Antigravity 2.0、智能眼镜等等。

这次发布会的反馈呈现两级分化,有机构算了一笔账,这次轻量基座模型升级伴随着运行成本的 5 倍上升,新模型的 " 性价比 " 可能没那么美好。资本市场也给出了反馈,5 月 20 日凌晨美股收盘,谷歌(GOOGL.US)跌超 2%,股价收于 387.66 美元 / 股,当前总市值为 4.7 万亿美元。

两大模型撑场,月活翻倍

" 自上一届 I/O 大会以来,我们见证了技术的不断突破与飞速进展。" 在开幕演讲中,谷歌 CEO 桑达尔 · 皮查伊(Sundar Pichai)先抛出了一些新的数据。在去年 I/O 大会时,Gemini app 的月活跃用户数为 4 亿,今天这一数字已突破 9 亿,一年内翻倍。

两年前,谷歌每月处理的 token(词元)量为 9.7 万亿个,去年的 I/O 大会这一数字约 480 万亿个,到今年这一规模实现 7 倍增长,谷歌每月处理的 token 量已突破 3200 万亿个。

目前,谷歌旗下已有 13 款产品各拥有超 10 亿的用户规模,其中有 5 款产品的用户数量超过了 30 亿。皮查伊称,Gemini 模型是吸引更多用户使用的核心驱动力。

这次 I/O 大会,最核心的更新仍然是 Gemini 模型系列。

谷歌正式发布了新一代的 Gemini 3.5 Flash,官方称这是专为快速高效的任务设计的模型——从每秒 token 的输出量来看,其速度是同类模型的 4 倍,价格却不到同类前沿模型的一半。

根据谷歌的数据,与 Gemini 3.1 Pro 相比,3.5 Flash 在几乎所有基准测试中都表现更优,尤其是编程和 GDPVal 这类更接近真实经济任务的评测。

" 目前头部的科技企业每天大约需要处理 1 万亿个 token。如果他们选择将其中 80% 的日常工作负载从其他前沿模型迁移到 Gemini 3.5 Flash 上,每年将节省超过 10 亿美元。" 皮查伊称。

不过,根据开发者测试,3.5 Flash 能力或许处于 3.0 Pro 和 3.1 Pro 之间,且稳定性更差,重要的是 API 价格比上一代贵了 3 倍,叠加 token 使用量,成本也会更高。

海外评测机构 Artificial Analysis 发文提到,Gemini 3.5 Flash 在智能指数上得分 55,比 3 Flash 提高了 9 分,主要是智能体性能的提升和幻觉减少。3.5 Flash 的 token 速度确实更快,但更高的 token 使用量和 token 定价,使其运行成本比 3 Flash 高出 5 倍多,比 3.1 Pro 高出 75%。

目前 3.5 Flash 已经成为 Gemini 网页和 App 的默认模型,全球同步上线,所有用户都可以免费体验。皮查伊同时提到,谷歌内部正在研发 Gemini 3.5 Pro,该模型目前已在谷歌内部投入使用,会在下个月正式推出。

另一个备受关注的模型是 Gemini Omni 系列,在发布前社交媒体就已经有不少讨论,谷歌对其的定义是 " 能够基于任意输入生成任意输出模态的内容 "。这一模型基于 Gemini 模型的推理能力,融合了 Veo 的视频能力和 Nano Banana 的图片能力,接近理想中的世界模型,因此 " 在现实世界的理解能力上实现飞跃 "。

今天推出的首个系列模型 Gemini Omni Flash 仅支持视频输出能力,谷歌称在未来会逐步扩展至图片和文本。

从会后的信息来看,各方对 Omni Flash 的评价不一。有的业界人士认为表现不如预期,比不上当前行业内的顶尖视频模型,甚至有人称 " 什么也没有修复,是资源的浪费 "。也有人认为这是未来,因为当模型能够处理任何一种模态时,智能体之间的通信方式会彻底改变。

生成能力升级后,内容来源识别也变得更重要了。针对深度伪造 ( Deepfake ) ,三年前,谷歌就推出了数字水印 SynthID,现在还进一步加入了内容凭证验证功能,帮助用户识别内容是否 AI 生成,以及是否经过 AI 工具编辑。

谷歌表示,所有 Gemini Omni 生成的内容都带有谷歌 SynthID 数字水印,可以被追溯到是 AI 生成。这些核验功能也被直接嵌入谷歌搜索和 Chrome 浏览器中。

同时,谷歌宣布,继去年英伟达加入之后,现在 OpenAI、Kakao 和 ElevenLabs 也将采用 SynthID。只有当更多公司选择为其 AI 生成的内容添加水印,这项技术才能真正起效。

一系列智能体来了

模型之下,谷歌真正想讲的是智能体的故事,并上新了一系列围绕产品的智能体。

首先是内置在 Gemini app 中的 AI 智能体 Gemini Spark,这被认为是一个对标 " 龙虾 " 的个人智能体产品,与日常使用的 Workspace 工具(例如 Gmail、Docs 等)深度集成。它运行在谷歌 Cloud 的专用虚拟机上,可以全天候执行任务,即便用户关掉电脑,Spark 仍能继续工作。

谷歌展示了几个典型场景,比如让 Spark 自动解析每月信用卡账单,标记新增或隐藏的订阅费用。以及指示它检查收件箱,查看孩子学校的最新动态,提取重要截止日期,并发送每日汇总摘要。

有网友评价,以谷歌的生态系统和影响力,会让这一产品很快就能成为每个人都能使用的 " 龙虾 "。谷歌是 " 沉睡的巨人 ",一旦模型达到实用性的临界点,Gemini 与 Gmail、文档和谷歌生态系统的结合,将改变游戏。

谷歌同时宣布在搜索中也加入信息智能体 ( Information Agents ) ,用户今年夏天将可以在搜索中创建这类智能体,让它持续跟踪某类信息。例如,用户可以让它监控股票、长期跟踪租房信息、球鞋联名和商品上新等等。

面向开发者,谷歌升级了开发和管理 AI 智能体集群的综合平台,推出了 Antigravity 2.0。这是一款能作为智能体交互核心枢纽的独立桌面应用,谷歌在该平台内置了进一步优化的 Flash 版本,称其响应速度达到了其他前沿模型的 12 倍。

谷歌在最后分享了智能眼镜的进展。谷歌的 AI 眼镜将分成两类:一类是带小型镜片的显示眼镜,另一类是音频眼镜。这两款设备都能让用户解放双手,用户向 Gemini 提问即可随时获取支持。

谷歌表示音频眼镜将首先上市,计划于今年秋季推出。眼镜由三星参与硬件和体验构建,Warby Parker 与 Gentle Monster 负责眼镜设计。

发布会上,演示者展示了一些典型场景:比如可以通过眼镜让 Gemini 导航到上周和朋友见面的地方,中途加入咖啡店;也可以让 Gemini 打开 DoorDash 自动下单咖啡。

在以上发布之后,谷歌随之调整了 Gemini 的订阅价。谷歌 AI Ultra 此前的订阅价格是 250 美元 / 月,这次谷歌将 Ultra 拆分成两个价位段——首先推出每月 100 美元的新 Ultra 计划,适配开发人员、技术主管、知识工作者和高级创作者,同时把最高档 Ultra 订阅降至 200 美元。谷歌的 Pro 订阅则维持在 19.99 美元 / 月。

回看这些发布,面向智能体时代,谷歌的更新覆盖了模型、智能体、硬件、平台等等,几乎亮出了所有的牌。然而,与去年 Gemini 3 带来的颠覆性冲击相比,今年这场发布会更像是稳步迭代而非 " 变革 "。

性价比存疑、业界反馈分化 …… 或许谷歌应该听听用户的声音,毕竟 AI 竞赛已经是一场关于成本、生态与商业模式的综合较量。但生态协同优势会是谷歌未来的看点,拥有全球最大的搜索引擎,也有邮箱、文档、云服务等等,这张生态之网,是其他对手难以复制的护城河。

( 本文来自第一财经 )

最新头条

实时推荐