谷歌巨大的商业化版图面前,单纯提前一天发布GPT-4o,似乎并没有给OpenAI带来足够的优势。
在2024 Google I/O大会上,Google展示了一系列AI技术突破,包括AI生成视频、AI驱动的Workspace自动化工具,以及产品效果直逼GPT-4o的语音助手。众多AI产品的发布,形成了某种意义上的“狼群效应”,正帮助Google扭转被动追赶的局面。
另外,Gemini的多模态能力、Android 15的AI增强,不仅提升了用户体验,也显著增强了谷歌生态系统的粘性。相比之下,OpenAI可能技术上领先一步,但在应用广度上显得相对单一。
如今,Google 带着“巨头范儿”的反击越来越犀利,而对于 GPT-5 的发布时间仍持谨慎态度的 Sam Altman 而言,压力变得越来越大。
巨头反击教材第一章:放大优势
巨型企业的战略布局,往往建立在持续加强优势业务的前提下。而Google 起家于搜索,长于Workspace等一系列办公套件服务,而这也成了2024年Google I/O大会发布的重点。
完善的 AI 搜索能力,是业内翘首以盼的。Google本次发布的 AI Overview,在多模态的问题上做足了文章——
比如“Ask with video”,利用Gemini的多模态能力与Google Lens相结合,可以实现视频搜索,只要录制一段视频,就能知道用户使用唱片机,甚至维修照相机;Google Photos中还推出了新的AI功能“Ask Photos”,可以通过简单的提问在大量照片中找出“孩子多年来学习游泳的历程”。
Google还展示了一款名为Project Astra的多模式AI助手,可以观看并理解通过设备摄像头看到的内容,记住用户的东西在哪里,帮用户在现实世界“搜索“物品,或是完成其他任务。
Google 版 AI 搜索的输出结果不再是网址的罗列,而是一个全新的整合页面——它更像一份针对用户提问而形成的报告,不仅包括对问题本身的回答,也包括对用户可能忽略问题的猜测和补充,在产品形式上,也算做到了图文并茂。
国内某大厂同样推出了 AI 搜索功能,但只是在传统搜索页面上,利用占网页五分之一左右的空间,植入生成式 AI 的输出结果,且只能针对特定问题触发。整体完成度较低,因而也没有做太高调地发布和宣传。
两相比较之下,Google 此次对于 AI 搜索的革新可见一斑。在有限的搜索引擎市场里,这奠定了全新的标准。而对于模式已经固化多年的搜索广告而言,也更有想象空间。
Google 不是在发布某一项大模型能力,而是在试图重新占领用户心智。当下,Google 的搜索里面是“Ask,Not Search”,多模态的交互方式,只是在用户层面进一步完善围绕 “Ask” 建立的产品概念。
搜索的改造仅仅是个开始,Google希望搜索能成为激发用户AI需求的超级入口,即使用户不知道具体该问什么,Google也可以给出推荐,帮用户脑暴。这时,搜索界面会进一步变化,变成信息流的形式,每个卡片都可以进一步操作。
在搜索之外,Google的另一个优势领域是Workspace。Google为Workspace发布了一款与国内火爆的“数字员工”非常相似的产品——AI Teammate。
首先,Gemini 1.5 Pro即将被植入Workspace的文档、表格、幻灯片、云端硬盘和 Gmail 的侧边栏中,涵盖企业日常运营的各个方面。Gemini 可以帮用户查找具体的业务信息而不是通用信息;直接从电子邮件中检索相关的PDF文件;整理和管理电子邮件中的收据,并进行归档,或者从收据中提取信息并添加到表格中。
Gmail App中加入Gemini后,还可以提供了更加详细和上下文相关的回复建议,还能够为用户提供电子邮件的摘要。
同时,Google还将 Gemini与Google生态的日历、任务、Keep集成,使其 AI 产品成为一个全面的数字助理。Google还在Gemini 执行任务前设置了检查机制,确保信息的准确性,而Google助力相比其他智能助手最大的优势就在于Gemini与Google原生产品的无缝集成。