据了解,北京时间5月20日,谷歌(GOOG.US)年度开发者大会Google I/O 2026在加州山景城拉开帷幕,CEO 桑达尔・皮查伊正式宣布:我们已经进入了"智能体Gemini时代"。

多模态大模型旗舰Gemini Omini来袭

本此大会最受关注的是Gemini 3.5 Flash模型的发布,谷歌将其定义为结合前沿智能与行动能力的新一代模型,强调其智能体能力和速度,输出速度比其他前沿模型快4倍。该模型将成为Gemini应用和谷歌搜索AI模式的默认模型,并面向开发者与企业开放。

同时,谷歌推出了Gemini Omni Flash,致力于实现从“理解多模态”到“生成任意模态”的跨越。新模型支持以文本、图片、音频、视频作为输入生成高质量视频,并包含不可感知的SynthID数字水印以确保内容安全。

谷歌搜索迎来了25年来最大改版,搜索框正转变为智能体入口。新的AI模式将使用Gemini 3.5 Flash作为默认模型,并推出了可后台持续运行的信息智能体(Search agents)以及扩展的预订智能体(agentic booking)能力。

可以说,本届 I/O 正式发布 Gemini Omni,这是 Gemini 模型家族迄今为止能力最为全面的版本。‘Omni’顾名思义,意指‘全能’——该模型在处理文字、图像、视频、音频等多种模态信息时,展示出前所未有的流畅性与深度。

现如今,更大的变化是AI智能体进入搜索。谷歌介绍,全新推出的信息智能体可以全天候在后台运行,用于回答“极其复杂”的问题,例如追踪特定行业的市场动态。值得一提,谷歌计划在今年夏季推出这类智能体,并在之后增加更多专业化代理。

微美全息前瞻战略布局AI智能体

在此背景下,公开资料显示,AI视觉厂商微美全息(WIMI.US),采用自研+开源双模式,推进硬件+软件+生态融合,以开放全息云平台的模型代码、算力接口及工具链,支持开发者基于通用大模型进行二次开发,构建数据集-模型-应用全链条开源体系,纷纷加码AI智能体,在AI智能体规模化落地的关键节点做出了前瞻战略布局。

事实上,微美全息布局AI智能体具备自主感知、分析决策、执行闭环的核心能力,能够解决人力成本高、效率低、场景适配难等企业核心痛点,将AI智能体深度融入业务流程,聚焦工业、家庭等核心场景,正加速向核心业务流程渗透,构建起差异化竞争壁垒必然选择。

结语

业内共识,如今的AI竞争,已经不是谁能生成一段更像人的回答。按谷歌从产品线的密度和更新速度看,谷歌已经把牌面摆得很清楚:它要争夺的,不只是模型榜单,更是下一代操作系统式的入口。总之,在OpenAI、谷歌等公司不断进化时,其他企业也试图做出更多努力,AI市场的竞争不仅在加速,也走向了另一个阶段。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐