今天凌晨1点,一年一度的谷歌I/O开发者大会正式召开。在AI大潮下,以往的重头戏Android和手机硬件“退居二线”,发布会开始后的一个多小时的时间里都在介绍全新一代的语言模型等AI新品,谷歌CEO桑达尔·皮查伊更是在一开场就讲到了AI对谷歌产品的重构。
值得注意的是,作为AI行业的“领导者”,谷歌今年以来一直被OpenAI和微软压过一头,这次开发者大会也被认为是谷歌“一雪前耻”的机会。全新大语言模型PaLM 2的正式亮相,以及展示的大规模应用场景,似乎也是在告诉外界,自己在这场AI竞赛中并没有落后。
截至美股5月10日收盘,谷歌股价上涨超4%,盘后微涨0.24%,算是对这两个半小时“AI推介会”的认可,也缓解了谷歌这段时间的焦虑。
谷歌的反击,PaLM 2部分性能已经超越GPT-4
早在去年4月份,谷歌便推出了大语言模型PaLM(Pathways Language Model ),使用了5400 亿参数进行训练。作为升级版,全新发布的PaLM2在多语言文本处理以及推理和解码的能力上有了很大的提升。用谷歌官方的话来说,PaLM2的部分性能比GPT-4还要好。
皮查伊指出,PaLM 2是我们十年以来,用负责任的方式将AI带给数十亿人的旅程中的最新进展。
据了解,PaLM 2建立在谷歌的基础研究和最新的基础设施之上,接受了逾百种的多语言文本训练,在各种任务中都具有很强的能力,并且易于部署,能够理解并生成精确的结果。
皮查伊介绍称,PaLM 2模型可以被“拆分”为4种大小不同的版本,命名为Gecko、Otter、Bison和Unicorn,在各种规模的情况下都能提供出色的基础功能,其中,Gecko模型非常轻巧,可以在移动设备上工作,每秒大约可处理20个Token,即使在离线的状态下,也可以在设备上运行交互式应用程序。
与此同时,PaLM 2还可以让世界各地的开发人员进行合作开发,当用特定领域的知识对它进行微调后,表现也会更加出色。
皮查伊举了一个例子,根据医学知识进行了微调的Med-PaLM 2,与基础的模型相对比,这种微调使不准确的推理减少了9倍,接近于回答同一组问题的临床医生专家的表现。
他表示,Med-PaLM 2是第一个在医学执照考试上展现出 “专家 “水平的语言模型,展现出目前的最高技术水平,目前还在努力增加 Med-PaLM 2 的功能,使其能够结合医学影像信息,如平片和乳房X光检查。
PaLM 2赋能下的新体验,Bard一雪前耻
作为此次开发者大会的核心,在介绍PaLM 2之前,谷歌先是展示了AI在Gmail 、Google Maps 以及Photos上的应用。其中,Gmail中推出的 “Help me write”功能,只需输入你想要的信息,然后点击“创建”,一份完整的草稿就会出现。而Photos中全新的Magic Editor功能,则可以让用户轻松对图片进行编辑。
在去年的I/O大会上,谷歌推出了沉浸式视图,即利用AI创建一个地方的高保真地图。现在,谷歌正在将同样的技术扩展到Maps最擅长的领域:帮助用户到达目的地,用一种全新的方式来感受旅行。沉浸式路线视图将在夏季推出,并在今年年底前在15个城市上线,包括伦敦、纽约、东京和旧金山等。
AI技术的应用,正在提升用户的体验和效率。根据谷歌透露的数据,目前已有15个为个人和企业提供帮助的产品用户数都超过了5亿,其中6个产品的用户数已超过了20亿。PaLM 2的推出,更是让这些应用充满了想象,目前已应用在25项产品和功能中。
此前,谷歌匆匆上线的AI对话机器人Bard反馈并不是很理想,和NewBing的体验差距较大,一度导致谷歌股价的下跌。这一次,完全运行在PaLM 2之上的Bard,已支持广泛的编程功能,并在推理和数学提示方面更加智能,还能识别图片以及通过图片的形式进行回答,谷歌地图等也能直接在Bard中调用。
值得注意的是,谷歌已经取消了Bard的候补名单,全球180多个国家和地区的用户可以直接使用Bard了,未来将逐步支持40种语言的交互。
而在PaLM 2的支持下,Google Workspace也带来了新功能。除了在Docs和Gmail中的“Help me write”功能外,Google Workspace的Duet AI还提供了一些工具,可以在Slides和Meet中从文本描述中生成图像,在Sheet中创建自定义计划等,类似于微软Copolit,办公的事情都交给AI来完成。
从谷歌演示的诸多应用在PaLM 2上的运行来看,其更像是对微软以及OpenAI的一个个回击。有了PaLM 2的加持,加上自身在搜索业务上的优势,自然少不了新的革新,Search Lab的推出,也进一步推出了传统搜索方式的变革。谷歌方面透露,多年前之所以开始深入投资AI,就是因为看到了让Search变得更好的机会。
在全新的搜索模式下,AI将会给用户提供更为直接的答案,包括文字、图片和视频等。并且,通过进一步的细分交流,能够帮助用户得到更为准确的结果。不过,生成式AI用于搜索仍处于早期阶段,目前这一功能还没有全部开放。
Android和Pixel设备成了配角
作为往年开发者大会的主要看点,今年由于AI太过抢眼,Android和新Pixel设备成了配角。对于Android14,谷歌方面没有太多的介绍,更多的是分享了AI技术对Android的赋能,以及AI的进步如何让手机更加个性化。
在Android 14上,新推出了Magic Compose (魔法撰写)和Cinematic Wallpapers(电影壁纸)和Generative AI Wallpapers (生成式AI壁纸)等功能。其中,通过Magic Compose功能,AI可以根据消息内容生成回复文本,并且可以生成为你喜欢的风格。
而在硬件方面,谷歌对外发布了旗下首款折叠屏手机Pixel Fold,搭载自研Tensor G2 芯片,采用横向内折的方式,内屏为7.6英寸2208*1840分辨率屏幕,外屏为5.8英寸2092*1080屏幕,机身重量为283g。影像能力上,Pixel Fold后置4800万像素主摄广角+1080万像素超广角+1080万像素潜望式长焦镜头,起售价1799美元。
Pixel Fold
从现场参会人员发布的体验来看,无论是在折痕还是在黑边等方面的表现上,Pixel Fold都很一般,如果放在国内市场,这个价格对比OPPO和vivo更是没有性价比可言。不过,谷歌也是另辟蹊径,买手机送手表,现在预定购买可获赠一支去年发售的Pixel Watch手表。
Pixel Tablet
除了首款折叠屏产品外,谷歌还发布了Pixel 7a和Pixel Tablet平板电脑,均搭载Tensor G2自研芯片。Pixel 7a作为入门级产品,起售价为499美元,而Pixel Tablet作为谷歌重返平板电脑市场的第一款产品,起售价同样为499美元。
今年的I/O大会,可谓是诚意满满,谷歌也再一次向外界表明了全面拥抱AI的决心。全新大模型的发布,让谷歌跟上了队伍。生成式AI与搜索的结合,也将颠覆传统的搜索理念与模式。而大规模场景的应用,虽然像是友商产品的再发布,很难引起观看者兴奋,但终归是得到了资本市场的认可,只是后续的体验还需要市场的检验。
(本文首发钛媒体App,作者/杜志强,编辑/钟毅)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App