Google I/O 2026开发者大会都发了什么？一篇文章喂饱你

拖把 / 2026-05-20 17:06187585

兄弟们，今天凌晨的Google I/O 2026开发者大会有谁看了吗？吃饱了没？

短短2个小时，新的多模态模型、新的智能体，以及由它们延伸出来的新功能，谷歌的菜是一盘接一盘地往上端。你还在回味前一个功能有什么作用，下一个就开讲了，简直是应接不暇。

截屏2026-05-20 14.15.34.png

可能很多人也猜到了，这一桌菜的主题就是AI。今年因为有了智能体，AI跟我们日常生活融合得更深了，比以前也更好用了。而且谷歌把Gemini植入了Chrome浏览器、谷歌搜索框、智能手机、智能眼镜等各个端口，你可以感受到多端联动的效果，体验感更好。

至于具体都发布了什么，话不多说，趁这桌子菜还热乎，咱开始吧。

截屏2026-05-20 14.18.12.png

Ask YouTube

更好用的视频搜索功能，能搜片段，直接跳转

谷歌首先端出来的东西是Ask YouTube，这是一个植入了油管平台的AI搜索功能。以前咱们搜视频只能按照标题、关键字来搜，如果你想看个以前看过的视频，但只记得其中一个片段，这几乎没辙。

截屏2026-05-20 14.18.43.png

截屏2026-05-20 16.40.20.png

这回谷歌给油管弄进了一个聊天机器人，可以给机器人讲你要什么，它就会给你把对应片段搜出来，还会跳转到视频对应的部分，搜视频比以往方便多了。

比如现场演示的就是“怎样教3岁小孩骑单车？他已经会骑平衡车了”，搜出来的结果就有很多个视频片段，每个视频都是节选一点来回复的。功能不错，不过仅限美国的油管会员使用。

截屏2026-05-20 14.19.28.png

然后，谷歌掏出来了Docs Live。这个功能允许你通过语音和Google Docs闲聊，而不是正正经经地带提示词那样的聊天，唠着唠着它就会根据你的要求帮你创建出文档。

现场播放的实拍演示是让Google Docs帮用户生成在高中职业日上给大家做演讲的内容，让它自己去翻云盘里的简历，结合简历来写出讲话要点。这事交给Docs Live，它可以给你办得板板正正。

截屏2026-05-20 14.20.17.png

Gemini Omni

全新的视频/多模态生成模型

大会上来就先铺垫了两个基于AI打造的功能，其实醉翁之意不在酒，当然是在给重头戏Gemini做热场的。这次，谷歌拿出来的是新的视频和多模态生成模型Gemini Omni。

这个模型支持全模态输入，文本、图片、音频、视频都可以，不仅能够理解重力、动能这些物理学的概念，还把世界知识和推理能力塞进了模型，生成的视频更有真实感。

录屏2026-05-20 14.21.54.2026-05-20 14_55_07.gif

现场，官方还推荐你把自己的照片拿去生成，这样可以搞出很多现实中拍不出来的炫酷场景，更加吸引眼球。生成出来的视频可以用自然语言进行修改，用起来也更方便。首款模型Gemini Omni Flash将于今年夏季推出，大家期待一下。

截屏2026-05-20 14.23.57.png

AI越来越强大，生成的图片、视频也越来越像真的，是不是搞得人有点担忧？解铃还须系铃人，谷歌在3年前就推出了SynthID验证功能，自推出以来，它已经为1000亿份图片、视频添加了水印。

截屏2026-05-20-14.23.43.jpg

皮查伊现场辟谣：这张梗图是AI生成的

这回谷歌继续升级了这个功能，它会显示内容是来自AI还是相机镜头，以及是否用AI做过手脚。这个功能不止能认谷歌自家AI的作品，英伟达、OpenAI也在该技术的支持名单上，用到这两家产品和技术生成的内容都会被检测到。

这项功能会加入搜索和Chrome里，方便更多人使用，告别“电诈”。

截屏2026-05-20 14.32.06.png

Gemini 3.5 Flash和Antigravity

更强的智能体，从0开始写操作系统花费不到1000美元

讲完Gemini Omni和SynthID，紧接着端上来的就是Gemini 3.5 Flash智能体。这个版本比Gemini 3.1 Pro的速度更快，尤其是在对现实世界里涉及经济价值的理解能力上，“智商”增长超过了编码能力和调用工具的能力，谷歌你是不是暗示我们拿来炒股票？

截屏2026-05-20 14.25.21.png

看到最左边两列底下浅浅的Claude和GPT了吗

并且，它生成并输出词元的速度是友商们前沿模型的4倍，这个表现让他们必须得放在自家的Antigravity平台来试试了。

截屏2026-05-20 14.31.34.png

Antigravity是一个全自动AI编程工作平台，目前进化到了2.0时代。发布会现场称，用这个平台从0构建一个操作系统，整个过程花费的API积分成本甚至都不到1000美元，谷歌这一波看来是要摁着Anthropic的Claude Code和OpenAI的Codex来杀。

截屏2026-05-20 14.16.34.png

现在AI智能体可以说是吞金巨兽，CEO皮查伊说自从他们搞出Gemini 3.5 Flash后，词元消耗量从3月份的每天5000亿到现在的每天3万亿。所以，别说个人用的“小龙虾”了，真用起来公司也扛不住，很多公司5月份就已经把年度词元预算花光了。

既然这样，皮查伊建议企业可以把负载迁到Gemini 3.5 Flash上，因为它免费！他算了一笔账，对于每天用量1万亿词元的企业，如果能把80%负载从其他大模型挪过来，一年就能省出10亿美元，这还不香吗？而这个Gemini 3.5还有个Pro版本，不过还在内部调试，下个月会推出。

截屏2026-05-20 14.33.05.png

Gemini Spark

谷歌版小龙虾来了

既然聊到了小龙虾，谷歌也做了一款面向个人的AI助手Gemini Spark应用。这个谷歌牌龙虾同样基于Gemini 3.5 Flash，运行在谷歌云的专用虚拟机上，可以全天候运行，你合上笔记本电脑去睡觉，它都还在工作。

录屏2026-05-20 14.34.08.2026-05-20 14_53_10.gif

说完待办后，手机上就开始自己执行任务了

更重要的是，它在手机上也能用，支持安卓和苹果。对着它哔哔一通待办任务，剩下的就由它在后台自动安排了。不过这对苹果来说可能是个坏消息，这下又多了个后台程序，电用得更快了。

至于资费，谷歌推出了一个价格较低的Ultra套餐，起步价为100美元/月。而对于那些顶配用户，谷歌下调了一点价格，从每月250美元降到了200美元。

截屏2026-05-20 14.35.22.png

搜索功能大优化

AI智能体让搜索结果能实时更新

作为谷歌起家的招牌业务，搜索是几乎每个用户用得最多的功能。

搜索功能最初是“你搜啥、它给你啥”，去年谷歌引入了AI Mode模式，把一个传统的搜索功能变活了，变成了“你问啥、它搜完总结后给你啥”。如今进入了AI智能体时代，谷歌把它升级成了“你要它做啥，它持续监控信息，再及时告诉你啥”。

录屏2026-05-20 14.36.17.2026-05-20 14_51_21.gif

搜索里的AI智能体同样用到了Gemini 3.5 Flash，它可以在后台持续运行并监控变化。现场举的例子是按照某些条件搜索一类生物科技巨头的股票（我就说谷歌你暗戳戳地还是想让我们拿来炒股吧！），股票是每天波动的，当有股票符合这个选股池后就会跳出来给你，梭不梭哈由你定。

当然，这个功能也可以用来追新品发布、追社会消息，以及追优惠价格。

截屏2026-05-20 14.37.16.png

用新推出的智能购物车Universal Cart，你就能以史低价买到放在购物车很久的东西，这成就感跟钓鱼佬钓上了一条大鱼是一毛一样的。它更牛的是甚至能懂现实规则，比如很多小白想要装机，把主板加入购物车时，购物车会分析已经在车里的CPU跟主板搭不搭，不搭的话会给出替换方案，这功能就很实用了，以免你花钱买到了不能搭的组合。

截屏2026-05-20 14.37.37.png

Gemini App大优化

不仅好看，还要好用

作为谷歌大模型的核心入口，Gemini App目前已经做到了9亿月活。一年前它还没有那么多功能，但现在已经是神仙齐聚，所以统一设计语言就非常重要。

截屏2026-05-20 14.39.04.png

这次谷歌对Gemini进行“重做”，采用了名为Neural Expressive的新设计语言，动效、色彩、字体、触感反馈等细节全都做了优化，做的效果还不错，起码比乔布斯吐槽的另一家科技公司更有审美。这些调整即日起就生效，想体验的可以去看看。

截屏2026-05-20 14.38.33.png

除了设计语言更新，Gemini App还有另外两个大变化，其一是给Gemini Omni提供了入口，方便用户生成多模态内容；其二就是加入了AI智能体，现在首个应用已推出，名为“每日简报”，它可以收集用户当天要完成的日程并展示出来，让你不要忘记今天该做什么。而高级用户还可以拿它构建自己的智能体工作流。

截屏2026-05-20 14.40.03.png

智能眼镜卷土重来

当年的白月光，谷歌还是忘不了它

最后，谷歌当然不会忘了它心心念念的智能眼镜。时隔14年，谷歌再一次掏出了作品：由谷歌与三星共同打造的Android XR智能眼镜。它采用高通骁龙处理器，并且植入了Gemini，让眼镜有能力解锁更多功能。

不同的是，谷歌这回要两条腿走路，智能眼镜会推出两条路线。一条是镜片上有屏幕的显示眼镜，它依旧遵循去年大会上提到的开发路径，在现实画面上叠加用户需要的打车信息、翻译结果等内容。

截屏2026-05-20 14.40.38.png

另一条路线是音频眼镜，这个眼镜由谷歌联合Gentle Monster、Warby Parker与三星合作推出，那没屏的眼镜能做啥呢？谷歌请了个小姑娘来演示。

小姑娘说带她到上周与朋友见面的地方，它立即调用Gemini来设置了导航，还问要不要顺便买个常喝的冷萃咖啡？收到同意的回复后，它自己在外卖平台下了单。

截屏2026-05-20-15.07.57.jpg

它同样也有拍照功能，现场拍完合影后，让Gemini把合照变成卡通风格，天空还p了个飞艇，然后设置成表盘。谷歌说这能让大家减少掏出手机的频率，但这卖点好像也没有让人产生必买的冲动，还是带屏的更吸引人。

写在最后

看完这场大发布会，你可以感受到，谷歌这一次不再聚焦于单个产品、单个技术的爆发，而是一口气打穿了全生态。全模态理解和生成的Gemini Omni，全天在线的Gemini 3.5 Flash，这两个核心产品串联起了方方面面。不管是生成视频用于社交，还是持续监控商品底价、帮你做每日工作流安排，谷歌构建的人工智能世界正在潜移默化地改变着生活日常。

截屏2026-05-20 14.17.52.png

开场的演讲里，CEO桑达尔·皮查伊提到，谷歌每月处理的词元数量达到3.2千万亿个，同比增长7倍，Gemini应用月活跃用户数更是达到了9亿。过去一年的成绩单正好体现了AI行业的飞速变化。短短一年，AI从聊天对话时代跃入了智能体时代，变化可以说是翻天覆地。接下来一年，又会有什么更爆炸的新技术发布？这真的很令人期待。

Google I/O 2026开发者大会都发了什么？一篇文章喂饱你

发表评论注册|登录

热点资讯

好物推荐