ChatGPT挑起生成式AI“大混战”,“通用大模型”热是否该降温了?

748次阅读
没有评论

ChatGPT挑起生成式AI“大混战”,“通用大模型”热是否该降温了?

图片来源@视觉中国

文 | AI产业研究中心

在过去几个月中,随着ChatGPT在全球范围迅速火爆,国内AI大模型赛道的热度也随之急速升温。各路业界大神纷纷推出自己的大模型产品,八仙过海,各显神通。

谁将打造出比肩ChatGPT的中国人自己的AI应用?谁将成为中国的Open AI?这两个极具挑战性的问题,不断刺激着国内众多互联网大厂和科技大佬们的神经。同时,这两个问题的提出,也预示着中国AI产业发展趋势,已经从1.0版的“分封割据”期,迈入了 2.0版的“战国”时代。围绕“大模型”的发布,国内AI界正在上演着一场“大混战”。

国内生成式AI大模型界进入“五霸七雄”争锋时代

纵观眼下国内涉足AI大模型赛道的玩家,如果按照已有相关产品落地的行业属性来分,主要分为“互联网界”和“AI科技派”这两大流派。

所谓“互联网界”,指的是目前已经有具体产品的互联网大厂,其中又以百度、阿里、腾讯、网易、京东这5家为代表。先是百度和阿里争相推出各自的超大规模语言模型“文心一言”和 “通义千问”,并开放内测;后有腾讯、网易、京东也竞相公开自家的大模型产品“混元”、“玉言”和“ChatJD”,且纷纷预告上线发布。由此,也成就了这5家互联网企业大模型界“五霸”称号。另外,知乎、网易、360等一杆互联网企业,也纷纷推出新品或研发计划。

ChatGPT挑起生成式AI“大混战”,“通用大模型”热是否该降温了?

而与此相对应的则是“AI科技派”,即以AI硬核科技企业为主的单位。它们也不甘寂寞,纷纷争先恐后地推出自己的大模型方案和发展计划。其中又以华为、商汤科技、科大讯飞、深兰科技、昆仑万维、出门问问、智源研究院这7家最具代表性。尤其是今年4月份集中爆发,如华为、商汤、深兰科技、昆仑万维、出门问问等科技企业分别推出了“盘古”、“日日新”、 “硅基知识”、“天工”和“序列猴子”大模型, 5月初,科大讯飞也发布测试很久的“星火”大模型。因此,这7家科技企业也被业界誉为大模型界的“七雄”。

由此,国内生成式AI领域的“大模型混战”,就此全面开打。

“通用派”和“垂类派”的路线之争

但如果换一个角度,我们发现今天国内AI企业界,除了分为“互联网派”和“AI科技派”以外,还存在大模型开发的类型派系之争。从以上这些企业推出的大模型来看,基于目标人群、用途和适用场景的不同,又可以分为通用和垂类两种大模型开发企业。由此,也诞生了“通用派”和“垂类派”这两大派采用不同大模型开发路线的企业群体。

其中,开发通用类大模型的企业,目的是为了做理论框架的搭建、大模型的训练以及算法等,且这一类大模型的目标人群基本是针对所有人,适用范围也很广。说穿了,这一派做通用大模型的企业,就是在做通用AI的技术攻关,目的是为了打造中国版的ChatGPT。

而开发垂类大模型的企业,则是以深度解决垂直领域问题为主,以产品开发为目的,即企业在自己擅长的领域开发一个产业版ChatGPT,然后直接应用到自己的相关AI产品上,使该产品实现或增强某种功能。这一类大模型的搭建相较于通用大模型而言,在算力上的要求相对较低,但在数据量和算法上针对性会比较强。

由于在用户群体规模体量和应用场景适用范围上,通用大模型都要远远大于垂直应用类大模型,所以其开发周期和所需要投入繁荣财力、人力也远高于垂直应用大模型。因此,目前国内做通用大模型的企业,基本上都是互联网或科技大厂。像百度、阿里、华为等这些互联网大厂和科技巨头,就是属于“通用派”系。

而就内容反馈数据来说,相较于通用大模型,垂直应用大模型生成的内容更符合特定垂直类场景的需求,质量更高。因此,也就吸引了众多AI科技企业参与其中。如深兰、出门问问、有道等聚焦AI具体赛道的企业,就是典型的“垂类派”企业。

就目前市场关注度而言,由于受Open AI成功开发ChatGPT并迅速走红的影响,国内社会各界把目光大都集中到“通用派”企业和大模型上来,相反“垂类派”企业和产品却受到了冷遇。

显然,ChatGPT的成功,正在潜移默化地引导着国内AIGC产业发展的走向。

诸神混战之下,谁主沉浮?

那纵观这些参战的企业,到底谁能在这场“大模型混战”中存活下来,并最后拔得头筹?先后竞相登场的那些大模型,它们的未来会是星辰大海,还是一地鸡毛呢?下面我们就来盘点一下。

首先,来看目前市场上曝光率最高的大模型四巨头“BATH”,即百度的“文心一言”、阿里的“通义千问”、腾讯的“混元”和华为的“盘古”。这几个大模型有以下几个共同特点,那就是都布局了NLP、CV、跨模态,适用范围和对标人群都很广,且都动用了海量数据参数进行了预训练。

但这也导致了这四家的大模型同质性太强,应用上基本没有区隔,正式进入市场后,非但难以发挥各自优势,反而极易导致“内斗”,就好比在一个“浴缸”里养了4条鲨鱼,妥妥坐实了“BATH”之名。

然后,再来看市场上已公开的垂直应用大模型。这一类模型的特点是目前已经正式对外公开的不多,名气也没有“BATH”的响,且都不是独立推出,而是附身于企业开发的某个具体AI产品上。

如有道近期推出的自研教育场景下类ChatGPT模型“子曰”,就是服务于AI口语老师和中文作文批改应用上的;而面向金融领域的AI企业百融云创,也将研发的与ChatGPT采用同源技术的智能语音机器人应用于金融行业的零售业务上;另外在4月23日举行的全国工商联物联网委员会年会暨物联网与人工智能高峰论坛期间,中新社报道深兰科技开发的国内首款强化学习个人数字化产品metamind已经应用了自主知识产权的“硅基知识”大模型…这些都是AIGC大模型在垂直应用领域的成功案例。

ChatGPT挑起生成式AI“大混战”,“通用大模型”热是否该降温了?

从市场营销角度来看,一个产品问世后,正确的市场手段是创造一个新的消费领域,以此避免自己陷入原有红海市场的竞争。这对于AIGC大模型开发应用来说,也是完全适用的。因此,像“子曰”、“硅基知识”这一类产品技术的研发,可以说是在AIGC大模型实际应用上的一次突破创新。

而从另一方面来说,目前国内市场上所出现的大小厂都一窝蜂地去做类ChatGPT产品,对整个产业发展而言,并不是一个好的现象,只能说是脱实务虚,其中绝大多数企业应该是走不远的。就以“BATH”这四巨头而言,最终也很有可能陷入内耗式竞争。相反,企业如果能集中力量,聚焦某个具体应用领域,开发垂直应用大模型,也许会有意想不到的收获。

就以“硅基知识”大模型为例,不同于传统意义上的类ChatGPT大模型,“硅基知识”是专为深兰个人数字化产品Matemind研发的,具备内容生成、记忆和发现三大功能,不仅能智能生成内容,还能将所生成的内容转化为用户个人记忆整体保存下来,作为“数字分身”基础数据,以备未来生成新内容和延续个人“硅基生命”所需,有效解决了个人数字化所必需的数字分身在知识学习、积累和应用方面的问题。

简单地说,“硅基知识”不仅实现了人生命的“数字化永生”,还指出了一条人工智能产业发展的新路。透过“硅基知识”大模型这个案例,我们甚至可以说每一款垂直应用大模型,都是一盏点亮人工智能产业发展新方向的明灯。

搞大模型,瞄得越小,做得越好

自从进入21世纪以来,我们分别经历了互联网热、电商热、大数据热……每一次热潮开始,都会引得各方都争先恐后地涌入,但潮水退去之后,就会发现当时那些蜂拥融入的弄潮儿们,绝大多数都不知所踪,真正活下来的都是那些默默耕耘,在某个具体领域做出成绩的企业。

那面对大模型混战愈演愈烈的今天,中国企业应该如何参与其中?在我看来,做大模型既要看准大方向,也要瞄准小目标,切忌贪大求全,只有这样才不至于重蹈以前那些失败者的覆辙。

百度的李彦宏就曾表示,ChatGPT作为一个通用模型,对于某些特定领域并不擅长,而大公司一般都从通用型产品开始做起,初期他们并不会特别关注某个细分垂直领域,但当你在某个细分领域内做到极致,你就会发现你的产品和所积累的用户需求,很难被其他产品直接复制,此时你再去拓展应用领域,就会比较有竞争力。

钱学森在《系统工程论》提出这样一个核心观点,那就是做任何技术产品,都要从现有条件出发,不求单项技术的先进性,只求总体设计的合理性,充分利用现有资源;以总体设计负责对各个分系统的技术协调提升改造现有的工业技术。把这个理论放在大模型的开发上,一样适用。大模型再厉害,也只是一项技术,它必须应用到具体产品上,才能发挥最大作用。因此一个企业做大模型,并不是做得越大越通用就越好,而是应该基于产品,聚焦在某个需求上,合理开发和利用,进而实现大模型在产品中功能的最大化。

不跟风,坚持做自己,保持一颗平常心,这一点对所有涉足中国AI领域的企业来说,都尤为重要,无论你是否参与了这场混战。

做AIGC大模型本身就不是一场百米赛,而是一场马拉松,比拼的不是看谁眼前跑得快,而是看谁今后走得远。无论是百度、阿里、腾讯这些互联网巨头,还是商汤、科大讯飞、出门问问、深兰科技这些AI赛道能手,谁能走到最后,关键还是看谁现在的做法对头。

因此,有必要在这里泼泼冷水,让大家都冷静冷静,千万不要盲目跟风,被ChatGPT引燃的这股通用大模型“虚火”,给引火烧了身。(本文首发钛媒体APP)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy