Google I/O 2026开发者大会都发了什么?一篇文章喂饱你

Google I/O 2026开发者大会都发了什么?一篇文章喂饱你

拖把 / 2026-05-20 17:0623371

兄弟们,今天凌晨的Google I/O 2026开发者大会有谁看了吗?吃饱了没?

短短2个小时,新的多模态模型、新的智能体,以及由它们延伸出来的新功能,谷歌的菜是一盘接一盘地往上端。你还在回味前一个功能有什么作用,下一个就开讲了,简直是应接不暇。

截屏2026-05-20 14.15.34.png

可能很多人也猜到了,这一桌菜的主题就是AI。今年因为有了智能体,AI跟我们日常生活融合得更深了,比以前也更好用了。而且谷歌把Gemini植入了Chrome浏览器、谷歌搜索框、智能手机、智能眼镜等各个端口,你可以感受到多端联动的效果,体验感更好。

至于具体都发布了什么,话不多说,趁这桌子菜还热乎,咱开始吧。

截屏2026-05-20 14.18.12.png

Ask YouTube

更好用的视频搜索功能,能搜片段,直接跳转

谷歌首先端出来的东西是Ask YouTube,这是一个植入了油管平台的AI搜索功能。以前咱们搜视频只能按照标题、关键字来搜,如果你想看个以前看过的视频,但只记得其中一个片段,这几乎没辙。

截屏2026-05-20 14.18.43.png

截屏2026-05-20 16.40.20.png

这回谷歌给油管弄进了一个聊天机器人,可以给机器人讲你要什么,它就会给你把对应片段搜出来,还会跳转到视频对应的部分,搜视频比以往方便多了。

比如现场演示的就是“怎样教3岁小孩骑单车他已经会骑平衡车了”,搜出来的结果就有很多个视频片段,每个视频都是节选一点来回复的。功能不错,不过仅限美国的油管会员使用。

截屏2026-05-20 14.19.28.png

然后,谷歌掏出来了Docs Live。这个功能允许你通过语音和Google Docs闲聊,而不是正正经经地带提示词那样的聊天,唠着唠着它就会根据你的要求帮你创建出文档。

现场播放的实拍演示是让Google Docs帮用户生成在高中职业日上给大家做演讲的内容,让它自己去翻云盘里的简历,结合简历来写出讲话要点。这事交给Docs Live,它可以给你办得板板正正。

截屏2026-05-20 14.20.17.png

Gemini Omni

全新的视频/多模态生成模型

大会上来就先铺垫了两个基于AI打造的功能,其实醉翁之意不在酒,当然是在给重头戏Gemini做热场的。这次,谷歌拿出来的是新的视频和多模态生成模型Gemini Omni。

这个模型支持全模态输入,文本、图片、音频、视频都可以,不仅能够理解重力、动能这些物理学的概念,还把世界知识和推理能力塞进了模型,生成的视频更有真实感。

录屏2026-05-20 14.21.54.2026-05-20 14_55_07.gif

现场,官方还推荐你把自己的照片拿去生成,这样可以搞出很多现实中拍不出来的炫酷场景,更加吸引眼球。生成出来的视频可以用自然语言进行修改,用起来也更方便。首款模型Gemini Omni Flash将于今年夏季推出,大家期待一下。

截屏2026-05-20 14.23.57.png

AI越来越强大,生成的图片、视频也越来越像真的,是不是搞得人有点担忧?解铃还须系铃人,谷歌在3年前就推出了SynthID验证功能,自推出以来,它已经为1000亿份图片、视频添加了水印。

截屏2026-05-20-14.23.43.jpg

皮查伊现场辟谣:这张梗图是AI生成的

这回谷歌继续升级了这个功能,它会显示内容是来自AI还是相机镜头,以及是否用AI做过手脚。这个功能不止能认谷歌自家AI的作品,英伟达、OpenAI也在该技术的支持名单上,用到这两家产品和技术生成的内容都会被检测到。

这项功能会加入搜索和Chrome里,方便更多人使用,告别“电诈”。

截屏2026-05-20 14.32.06.png

Gemini 3.5 Flash和Antigravity

更强的智能体,从0开始写操作系统花费不到1000美元

讲完Gemini Omni和SynthID,紧接着端上来的就是Gemini 3.5 Flash智能体。这个版本比Gemini 3.1 Pro的速度更快,尤其是在对现实世界里涉及经济价值的理解能力上,“智商”增长超过了编码能力和调用工具的能力,谷歌你是不是暗示我们拿来炒股票?

截屏2026-05-20 14.25.21.png

看到最左边两列底下浅浅的Claude和GPT了吗

并且,它生成并输出词元的速度是友商们前沿模型的4倍,这个表现让他们必须得放在自家的Antigravity平台来试试了。

截屏2026-05-20 14.31.34.png

Antigravity是一个全自动AI编程工作平台,目前进化到了2.0时代。发布会现场称,用这个平台从0构建一个操作系统,整个过程花费的API积分成本甚至都不到1000美元,谷歌这一波看来是要摁着Anthropic的Claude Code和OpenAI的Codex来杀。

截屏2026-05-20 14.16.34.png

现在AI智能体可以说是吞金巨兽,CEO皮查伊说自从他们搞出Gemini 3.5 Flash后,词元消耗量从3月份的每天5000亿到现在的每天3万亿。所以,别说个人用的“小龙虾”了,真用起来公司也扛不住,很多公司5月份就已经把年度词元预算花光了。

既然这样,皮查伊建议企业可以把负载迁到Gemini 3.5 Flash上,因为它免费!他算了一笔账,对于每天用量1万亿词元的企业,如果能把80%负载从其他大模型挪过来,一年就能省出10亿美元,这还不香吗?而这个Gemini 3.5还有个Pro版本,不过还在内部调试,下个月会推出。

截屏2026-05-20 14.33.05.png

Gemini Spark

谷歌版小龙虾来了

既然聊到了小龙虾,谷歌也做了一款面向个人的AI助手Gemini Spark应用。这个谷歌牌龙虾同样基于Gemini 3.5 Flash,运行在谷歌云的专用虚拟机上,可以全天候运行,你合上笔记本电脑去睡觉,它都还在工作。

录屏2026-05-20 14.34.08.2026-05-20 14_53_10.gif

说完待办后,手机上就开始自己执行任务了

更重要的是,它在手机上也能用,支持安卓和苹果。对着它哔哔一通待办任务,剩下的就由它在后台自动安排了。不过这对苹果来说可能是个坏消息,这下又多了个后台程序,电用得更快了。

至于资费,谷歌推出了一个价格较低的Ultra套餐,起步价为100美元/月。而对于那些顶配用户,谷歌下调了一点价格,从每月250美元降到了200美元。

截屏2026-05-20 14.35.22.png

搜索功能大优化

AI智能体让搜索结果能实时更新

作为谷歌起家的招牌业务,搜索是几乎每个用户用得最多的功能。

搜索功能最初是“你搜啥、它给你啥”,去年谷歌引入了AI Mode模式,把一个传统的搜索功能变活了,变成了“你问啥、它搜完总结后给你啥”。如今进入了AI智能体时代,谷歌把它升级成了“你要它做啥,它持续监控信息,再及时告诉你啥”。

录屏2026-05-20 14.36.17.2026-05-20 14_51_21.gif

搜索里的AI智能体同样用到了Gemini 3.5 Flash,它可以在后台持续运行并监控变化。现场举的例子是按照某些条件搜索一类生物科技巨头的股票(我就说谷歌你暗戳戳地还是想让我们拿来炒股吧!),股票是每天波动的,当有股票符合这个选股池后就会跳出来给你,梭不梭哈由你定。

当然,这个功能也可以用来追新品发布、追社会消息,以及追优惠价格。

截屏2026-05-20 14.37.16.png

用新推出的智能购物车Universal Cart,你就能以史低价买到放在购物车很久的东西,这成就感跟钓鱼佬钓上了一条大鱼是一毛一样的。它更牛的是甚至能懂现实规则,比如很多小白想要装机,把主板加入购物车时,购物车会分析已经在车里的CPU跟主板搭不搭,不搭的话会给出替换方案,这功能就很实用了,以免你花钱买到了不能搭的组合。

截屏2026-05-20 14.37.37.png

Gemini App大优化

不仅好看,还要好用

作为谷歌大模型的核心入口,Gemini App目前已经做到了9亿月活。一年前它还没有那么多功能,但现在已经是神仙齐聚,所以统一设计语言就非常重要。

截屏2026-05-20 14.39.04.png

这次谷歌对Gemini进行“重做”,采用了名为Neural Expressive的新设计语言,动效、色彩、字体、触感反馈等细节全都做了优化,做的效果还不错,起码比乔布斯吐槽的另一家科技公司更有审美。这些调整即日起就生效,想体验的可以去看看。

截屏2026-05-20 14.38.33.png

除了设计语言更新,Gemini App还有另外两个大变化,其一是给Gemini Omni提供了入口,方便用户生成多模态内容;其二就是加入了AI智能体,现在首个应用已推出,名为“每日简报”,它可以收集用户当天要完成的日程并展示出来,让你不要忘记今天该做什么。而高级用户还可以拿它构建自己的智能体工作流。

截屏2026-05-20 14.40.03.png

智能眼镜卷土重来

当年的白月光,谷歌还是忘不了它

最后,谷歌当然不会忘了它心心念念的智能眼镜。时隔14年,谷歌再一次掏出了作品:由谷歌与三星共同打造的Android XR智能眼镜。它采用高通骁龙处理器,并且植入了Gemini,让眼镜有能力解锁更多功能。

不同的是,谷歌这回要两条腿走路,智能眼镜会推出两条路线。一条是镜片上有屏幕的显示眼镜,它依旧遵循去年大会上提到的开发路径,在现实画面上叠加用户需要的打车信息、翻译结果等内容。

截屏2026-05-20 14.40.38.png

另一条路线是音频眼镜,这个眼镜由谷歌联合Gentle Monster、Warby Parker与三星合作推出,那没屏的眼镜能做啥呢?谷歌请了个小姑娘来演示。

小姑娘说带她到上周与朋友见面的地方,它立即调用Gemini来设置了导航,还问要不要顺便买个常喝的冷萃咖啡?收到同意的回复后,它自己在外卖平台下了单。

截屏2026-05-20-15.07.57.jpg

它同样也有拍照功能,现场拍完合影后,让Gemini把合照变成卡通风格,天空还p了个飞艇,然后设置成表盘。谷歌说这能让大家减少掏出手机的频率,但这卖点好像也没有让人产生必买的冲动,还是带屏的更吸引人。

写在最后

看完这场大发布会,你可以感受到,谷歌这一次不再聚焦于单个产品、单个技术的爆发,而是一口气打穿了全生态。全模态理解和生成的Gemini Omni,全天在线的Gemini 3.5 Flash,这两个核心产品串联起了方方面面。不管是生成视频用于社交,还是持续监控商品底价、帮你做每日工作流安排,谷歌构建的人工智能世界正在潜移默化地改变着生活日常。

截屏2026-05-20 14.17.52.png

开场的演讲里,CEO桑达尔·皮查伊提到,谷歌每月处理的词元数量达到3.2千万亿个,同比增长7倍,Gemini应用月活跃用户数更是达到了9亿。过去一年的成绩单正好体现了AI行业的飞速变化。短短一年,AI从聊天对话时代跃入了智能体时代,变化可以说是翻天覆地。接下来一年,又会有什么更爆炸的新技术发布?这真的很令人期待。


发表评论注册|