开云2026世界杯中国官网 Google I/O盘货:两大新模子上线,音频眼镜登台,Gemini收受一切

发布日期:2026-05-21 14:13    点击次数:140

开云2026世界杯中国官网 Google I/O盘货:两大新模子上线,音频眼镜登台,Gemini收受一切

千呼万唤始出来,北京时分 2026 年 5 月 20 日凌晨,Google I/O 2026 终于开幕。因为 Google 提前用 The Android Show「分流」了 Android 17 的新功能,AI 终于成为了 Google I/O 2026 的主角。

但不同于其他 AI 企业,Google 同期掌捏 Gemini、YouTube、Google 网页搜索、Android 等多个不同的互联网生态进口。因此「怎么用 AI 为这些生态干事『赋能』」,也成了这次 Google I/O 的要点。

Gemini Omni、Gemini 3.5:新模子让 Google AI 更万能

Gemini 模子方面,Google 在 Google I/O 上追究发布了最新、最万能的 Gemini Omni。有多万能?用一句话来空洞,即是「Gemini Omni 能从任何神态的输入,取得任何神态的输出」,且 Gemini Omni 还不错径直在生成历程中,以对话神态进行修改。

图片来源:Google

以 MV 生成为例,唯独把音乐、视频、图片素材和对画面的约莫需求「喂」给 Gemini Omni,Gemini Omni 就能径直输出对应的短视频。在行径上,Google 还演示了一个畸形夸张的 AIGC 案例:

在一张白纸上手绘一个圆圈,再加上一句笔墨神态,Gemini Omni 就能径直输出一个齐全的殊效视频。但这还没完,淌若你对画面元素或立场不安逸,唯惟一句话就能在不变动其他画面元素的情况下,精确修改指定元素,比如「把玻璃建筑替换为肥皂泡」,后者以至还领有我方的物理碰撞成果。

图片来源:Google

用 Google 我方的话来说,「Gemini Omni 就像是视频领域的 Nano Banana」。

凭证 Google 的先容,Google Omni Flash 模子即日起将在 Gemini App、Google Flow、YouTube Shorts 等平台上线,对应 API 将在之后通达。

图片来源:Google

除了「万能模子」Google Omni,Gemini 在 Google I/O 上也升级到了 Gemini 3.5 版块(Gemini 3.5 Flash)。和 Gemini 3.1 Pro 比较,Gemini 3.5 Flash 在编程、推行环境智能体(Real-World Agentic)、大范围器具调用等测试上都有所擢升。

诚然了,关于 AI 模子而言,「有轻量级的 Flash 就势必有专科级的 Pro」——在行径上 Google 也预报 Gemini 3.5 Pro 将不才个月登场,但并未公布其他信息。

用一句话来总结,那即是「多快好省」四个字,Google 这次弥散作念到了。

Google Antigravity、Gemini Spark:更快、更强的智能体

底层模子智力变强了,那基于 Gemini 的 AI Agent 当然也得到了升级。

图片来源:Google

迷惑者侧,Google 的 AI 迷惑环境 Antigravity 也用上了 Gemini 3.5 Flash。凭证 Google 先容,在 Gemini 3.5 Flash 的支撑下,Antigravity 只用了 12 个小时就搭建了一个操作系统内核,而通盘这个词迷惑历程的 AI API 资本还不到一千好意思元。

图片来源:Google

Google 以至用 Antigravity 和 Gemini 3.5 Flash 重构了 Google 搜索的交互界面,冷漠了全新的「生成式 UI」观念。平频频用 Google 或其他 AI 搜索引擎的一又友应该知谈,即使在搜索页面开启了 AI 模式(此处指的不是在 AI App 中以「谈论」完毕的学问库搜索),这个 AI 模式依旧是以对话框(ChatBox)的神态输出罢了。

图片来源:Google

关于一般的 AI 搜索来说,对话框的交互模式照实够用了。但淌若用户问出的某个问题需要一些直不雅的演示,比如「陀飞轮是怎么使命的?」,文本框模式就排不上用场了。对此,Google 基于 Antigravity 的编程智力,打造了一个「自相宜、自生成」的 AI 搜索 UI。

图片来源:Google

简短来说,靠近复杂问题是此时 Google 搜索会用「Vibe Coding」的花式,径直写一个不错互动的前端网页,径直以互动的花式恢复用户的问题。

可惜的是,这项功能要比及 26 年夏令才会向用户通达。但好音信是,这项功能属于 Google 搜索的更新,不需要用钱订阅 Gemini 也能使用。另外,Gemini App 自己的 UI 也得到了升级,与新的 Android 视觉元素愈加长入。

收获于 Gemini 3.5 Flash 的多模态智力,Google 搜索的 AI 预测和多模态智力也得到了擢升。除了笔墨、以图搜图外,全新的 Google 搜索也不错径直输入视频或文档;也曾按照大数据智能排序的搜索推选,当今也升级成了基于 Gemini 3.5 Flash 的 AI 搜索补全。

图片来源:Google

除了前台可见的升级,Google 还全面擢升了搜索 Agent 的「后台智力」:全新的 搜索 Agent 不错在后台全天启动,按照用户的条款继续监控特定信息。比如小雷在寝息前就不错让搜索 Agent 时刻眷注 OpenAI、Anthropic、Grok、Perplexity 等 AI 企业和 X 上的 AI 新闻,在出现破裂错过的热门时径直邮件轰炸我的手机,让我爬起来写稿。

说到 Agent,Google 还在互动上追究发布了面向个东谈主用户的全新 Agent——Gemini Spark。和其他 AI Agent 一样,Gemini Spark 通常不错 24×7 全天收受用户的手机和浏览器。但不同于现时主流的托管类 Agent,Gemini Spark 会启动在特地的捏造化环境中。

图片来源:Google

很彰着,Gemini Spark 通常由 Gemini 3.5 Flash、Antigravity 驱动,当然也支撑语音交互和后台反应。而在外部联动上,Gemini Spark 不仅不错径直和 Google 生态的其他组件(Google Docs、Google Calendar、Gmail 等)径直联动,还不错通过 MCP 公约与外部 App 互联互通,完毕更全面的任务托管。

Google 并未在行径中公布 Gemini Spark 的平台适配情况,雷科技瞻望 Gemini Spark 会以 Gemini App(iOS)、Google 搜索组件(Android)的花式登陆手机。

图片来源:Google

而在 AI Agent 启动时(不管前后台),新加入的 Android Halo 功能会在 Android 手机屏幕左上角常驻一个 Agent 景况符号,便捷用户随时跳转到 Agent 界面,嗅觉就和当今手机的「录像头领导」「麦克风领导」差未几。

在雷科技看来,开云世界杯(中国)有限公司Android Halo 的出现,其实也从另一个角度强调了 Agent 的艰难性:尽管从技能上讲,Gemini Spark 仅仅一个「软件功能」,但其地位早已和录像头和麦克风一样,是手机不成或缺的中枢构成。

图片来源:Google

电脑方面,Google 提到 Gemini Spark 将在 26 年夏令登陆 Chrome 浏览器。

但不同于豆包等部分付费的国内 AI Agent,Gemini Spark 为全订阅功能,下周会通达给 Google AI Ultra 订阅用户。

值得一提的是,为了分离企业用户和高用量个东谈主用户,Google 在本来的 AI Pro(每月 20 好意思元)、AI Ultra(每月 250 好意思元、限时降价至每月 200 好意思元)之间,稀疏加入了一个「芳华版」AI Ultra 等第(每月 100 好意思元)。

图片来源:Google

看得出,即使是「财大气粗」的 Google ,也难以靠免费模式督察这种全面 AI 带来的雄伟算力资本。说到底,AI 的止境是算力,算力的止境是硬件,而硬件的止境是钱。在 AI 时期,互联网巨头依然难以靠硬件销售和干事订阅来督察 AI 的资本了。

夸张点说,跟着 AI Agent 的智力进一步膨胀,付费 AI 干事很有可能会变得跟手机套餐一样,成为咱们「刚性耗尽」的一部分。

音频眼镜初次登台,Gemini 生态日渐完善

在客岁,Google 展示了率领略功能的 AI 眼镜。在本年的 google I/O 上,Google 也带来了「音频版」智能眼镜的预览。最初,尽管名字叫「音频智能眼镜」,但这类 Gemini 眼镜并不是界环那种纯音频眼镜,而是搭载录像头、领有 AI 视觉和多模态输入智力的音频眼镜。

由于眼镜要 26 年秋季才发布(高概率是配合高通骁龙峰会上的新芯片),是以 Google 并未在 Google I/O 上公布分量、传感器型号、续航等居品具体信息,只展示了居品外不雅和约莫的功能。

图片来源:Google

狡计方面,Google I/O 上提到了三星与 Gentle Monster、Warby Parker 两大有名眼镜品牌调解打造的智能眼镜。功能上,两款眼镜和现存的 AR1 智能眼镜雷同,不错用语音或右边镜腿的触控板叫醒 Gemini。

收获于 Gemini 底层模子和 Spark 智能体的智力,Gemini 眼镜不错全自动把用户的语音指示拆解成 Agent 行为,并在用户的手机上后台实施。用户不错在眼镜上用语音条款 Gemini「买一杯前次点的咖啡」;手机上的 Gemini 就不错自动翻开咖啡 App、自动添加商品到购物车,并在用户语音说明(应该和国内 AI 眼镜一样弃取声纹考据技能)后径直下单。

图片来源:Google

值得一提的是,Google 还提到 Gemini AI 音频眼镜将支撑 Android 和 iOS 两个平台。不错确定的是,在 iOS 极为严格的 App 沙盒机制下,Gemini 音频眼镜的智力和 Android 平台比较势必大打扣头。

为了拓展 Gemini 的智力鸿沟,Google 也把我方的办公套件(Google Workspace)全面 AI 化:用户不错用语调子用 Gemini 查找邮件信息(Gmail Live)、写稿(Docs Live)以至是生成图像(Google Pics)。

图片来源:Google

聚拢此前 Android 17 选题里提到的高端 Googlebook,谷歌本年是在不遗余力地把 Gemini 塞进我方能掌控的每一个生态硬件里。

Google I/O 的主题演讲的到这里就告一段落了,看到这里,可能有东谈主会合计这次 Google I/O 只不外是 Google 在 AI 大战逾期后的「画饼」行动。但在雷科技看来,Google I/O 2026 主题演讲提到的本色,其实意味着谷歌终于摸到了 AI 时期的正确门票。

比如针对「AI 耀眼什么」这个问题,Google 径直对我方的「发财业务」开刀,用生成式 UI 转变了 AIGC「回合制」「单向交互」的设定。这种从单向到双向的滚动也出当今了 Gemini 智能硬件中。往日很长一段时分里,AI 硬件赛谈都莫得出现真确的「双向 AI 树立」:硬件是硬件,AI 是 AI,两者割裂极为严重。

图片来源:Google

而这一次,Gemini 3.5 Flash 的多模态智力,真确让音频眼镜等树立成为了 Gemini 的「物理器官」,再加上上周发布的 Googlebook,Gemini 终于领有了主动感知宇宙、主动输出罢了的智力。

开云中国体育2026世界杯app下载

更艰难的是,Gemini 正期骗其在 Android 系统中的「特权」,构筑一皆其他厂商无法向上的护城河。当国外的 Anthropic、国内的各样大模子智能体还在沙盒机制的角落试探,用 MCP 公约粗重地搞跨 App 协同操作时,Gemini 依然在 Android 底层完毕了畅达无阻的原生互通。

还记起咱们开始是说过的「Google 同期掌捏 Gemini、YouTube、Google 网页搜索、Android 等多个不同的互联网生态进口」吗,在 Google I/O 2026 上,这些四面「着花」的生态进口,终于等来了「罢了」的季节。

但话又说回归,Gemini 高度依靠 Google 生态,这对 OpenAI、Grok 来说大略是个挑战;但对国内 AI 企业来说,这亦然 Gemini 留给他们的机遇。

毫无疑问,Gemini 在国外再怎么大杀四方、原生互通,这套全家桶生态在国内依旧「水土抗拒」。但这套「多模态输入输出 + 特有系统 + 全天候托管 Agent」的业务逻辑,却给国内 AI 企业指明了发展的谈路:

国外有谷歌在原生底层大刀阔斧地打消沙盒罢了,国内厂商通常能在定制安卓系统里搞起我方的「孤立王国」。

更艰难的是,中国品牌在智能体原土化落地上的卷度,以至比原生安卓还要激进,还更接地气。在 Google I/O 2026 上,Google 亮出了 Gemini 的底牌开云2026世界杯中国官网,接下来就看国内 AI 巨头们和手机品牌们怎么强强联手,用调解「破局」了。