腾讯“散装”大模型

658次阅读
没有评论

腾讯“散装”大模型

图片来源@视觉中国

文|光子星球,作者 | 吴坤谚,编辑 | 吴先之

大模型浪潮下的互联网行业暗流涌动,大家都在翘首以盼谁能率先跑出中国GPT

百度、360、阿里、昆仑万维、商汤、金山、科大讯飞……即使抛去高校国家队和创业公司,已经在大模型领域秀过肌肉的大厂也能拉出一张清单来。中国科技巨头历来喜欢追逐风口,大模型的航海时代自然也不会免俗,但有那么一家巨头却很沉得住气,至今未曾露出什么大动作。

作为早在2022年4月便正式亮出旗下混元大模型的腾讯,在计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向均有所建树,如今却给外界一种“失声”的感觉。

自今年2月起,腾讯在大模型领域为外界所感知的大动作仅有两次,一是2月27日针对类 ChatGPT 对话式产品已成立「混元助手(HunyuanAide)」项目组,腾讯史上最高专业职级拥有者张正友为项目Owner;二是4月14日发布新一代HCC(High-Performance Computing Cluster)高性能计算集群。

在友商纷纷下场展示实力与声量,争取在大模型时代获取更多认知,腾讯的失声很可能是一部慢,步步慢。更有意思的是,腾讯控股自3月29日起便跌跌不休,以Naspers为首的大股东更是在持续减持套现,这兴许也是资本市场对腾讯在大模型赛道失声现状的不满情绪体现。

难道,腾讯还在“等风来”?

“失声”是表象

北上广不相信眼泪,互联网大厂只相信效率。即使是OpenAI这个不停烧钱的公司也会不时对外放出一些意见以及信息,在信息爆炸的现代社会中试图短暂地获取关注力,而腾讯也是如此。

我们不妨以2月27日为节点,从腾讯对外宣布的动作中寻找其大模型训练进度的蛛丝马迹。据光子星球不完全统计,腾讯自2月27日起至今的动作集中在三方面,一个是AI商业化应用,另一个是视频号,最后是政企合作。

细数下来,其实腾讯在各方面的动作并不小。除了分别于移动、联通两大运营商达成云计算方面的合作外,3月30日,腾讯发布AI智能创作助手“腾讯智影”。4月,腾讯在上海智慧车站前夕发布智慧出行汽车云,发布了据称是国内性能最强的大模型计算集群,还与字节跳动破冰,探索视频合作。当时间到了5月,腾讯微视面向头部的抖音、小红书与快手招募创作者,于5月9日发布了“开悟”AI开放研究平台,更是开放QQ渠道为载体,让AI绘图工具Midjourney开启官方中文版内测。

与率先发布通用大模型并展开应用探索的诸位友商相比,腾讯的声量虽小却也谈不上“安静”。而且其中无论是“开悟”AI开放研究平台、“腾讯智影”AI智能创作助、计算集群的发布还是Midjourney相关动作,其实都与大模型训练有不小的关系。

智慧出行汽车云是基于云服务以及AI训练的“车云一体”服务,“开悟”本身是由AI Labs联合王者荣耀项目组推出的,本身是借用游戏场景进行AI训练的平台;“腾讯智影”这款支持虚拟数字人、文本配音、智能 AI 绘画、文章转视频的应用本身也属于大语言模型的功能范畴;Midjourney开放内测是对AI原生应用于C端落地的探索;高效的计算集群更是在大模型训练中不可或缺的基础设施。

再往下深挖,这三个项目其实也分属腾讯内部不同事业群。“车云一体”属于CSIG(云与智慧产业事业群),“开悟”属于IEG(互动娱乐事业群),“腾讯智影”应属于WXG(微信事业群),大模型计算集群分属TEG(技术工程事业群),QQ的应用探索属于SNG(社交网络事业群)。

这不免让我们联想到腾讯特色的“内部赛马”机制,这是在过去的腾讯业务线中,不同竞品之间养蛊最后确认胜者的流程。而光子星球自某位接近腾讯人士处获悉,CSIG、TEG与PGC均在训练业务范围内的大模型。

但考虑到大模型训练极高的投入,内部赛马将造成更大的沉没成本。因此,目前的“赛马”现象更大可能是TEG统领全局,由各个BG提供语料以及数据集标注,为各BG的业务线打造专属模型,最后再通过知识蒸馏汇总到混元AI之中。

这样的战略布局好处很明显,既可以最大限度调动全局并提供高质量数据集,也能在长时间的模型训练中探索商业场景落地的可行路径。但弊端也同样显著,大型组织架构中各个BG难以相互配合,庞杂组织架构难免的山头林立也让成果互通变得困难。

“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。所以我们觉得(AI)非常重要,但这的确需要有很多的积累”,结合Tony在腾讯一季度财报会议上的讲话,腾讯在试图对外解释自己的“不紧不慢”,但在各家发力开卷的当下,未曾透露具体进度的回应总归显得有些苍白。

不受待见的AI Labs走上风口浪尖

无论最终腾讯通过田忌赛马落地了多少个BG的大模型应用,最终的目的一定是保证最顶端的“混元”能够帮助腾讯在AI时代站稳脚跟,甚至再现移动互联网时代的社交辉煌。

于是,一直以来在组织架构中显得有些边缘的AI Labs踏上舞台中央,享受着最集中的资源同时也承受着前所未有的压力。

这是因为,以腾讯AI Labs以及阿里达摩院为代表的大厂AI研究实验室通常进行的是较为前沿且高通用的算法研究,研究成果通常会通过API接口或SDK形式对其他BG输出,而业务性强的具体场景一般都需要算法的定制化,按需制作。相比以主导者的身份统筹业务BG,更多的可能是以中台的定位帮助业务BG打造搭载前沿技术的产品。

光子星球自一位接近腾讯人士处了解到,AI Labs一贯给其他BG的印象便是“不干实事、论文灌水”,之所以会让同僚们产生如此刻板印象, 是因为许多前沿研究仅有成果而未能投产,“并非研究人员划水”。其中比较典型的是经过AI Labs多次优化后的智能音箱,作为腾讯20周年庆的员工礼物于内部送出的同时项目也面临叫停的风险。

据了解,智能音箱项目于2018年4月上马,隶属于当时腾讯移动互联网事业群(MIG)旗下的智能创新业务事业部,其发布首日便在京东商城取得了两万台的首日销量。只是在智能音箱项目上线后8个月,CSIG作为当时腾讯的业务重心也推出了自己的智能音箱项目叮当带屏音箱,项目划分问题与不同BG间微妙的“市场竞争”关系耐人寻味,这或许也是智能音箱项目被叫停的原因。

“当一群本应专研算法,头脑风暴公司下一阶段核心竞争力的组织疲于应付各个业务BG的产品,甚至下场田忌赛马,即使如此还是不能落下学术产出,(公司)还能指望它做得多好?”一位接近腾讯人士说。

技术变现是大厂技术部门的永恒命题,关键在于着急与否。一位咨询顾问告诉光子星球,相比于进入大厂的中台,沦为“算法外包工”,无论是进入工业界的业务部门还是转身高校专研学术,都是性价比更高的选择。这或许也解释了曾经腾讯AI Labs主任、斯坦福博士张潼于2018年12月离职并重返学术界的原因。

如果未曾出现大模型这样目前公认的通往AGI的切实路径,AI Labs可能也不会走上风口浪尖。只是中台的角色定位不变的话,没有强有力的话语权支撑,AI Labs能否完成组织交付的任务还是要打一个问号。

毕竟曾经展开中台这个故事的阿里已经通过分拆上市解构了中台神话,就像亟需数字化的中小企业中业务部门与IT部门相互不对付,中台与各事业群之间的微妙关系已然让互联网企业组织架构走进了一个死胡同。

腾讯“散装”大模型

成也赛马,败也赛马?

人都是经验的奴隶,如果说AI Labs为中台乃是腾讯发展至今的惯性使然,显然这样的惯性并不止一种。其中比较典型的是腾讯长期坐镇南山巍然不动,“把半条命交给合作伙伴”的投资扩张逻辑,以及众所周知的内部赛马。

在MaaS(model as a service)愈发为人所重视的当下,大模型如果可以被视作一个产品的话,极大可能是通往新世界的船票。因此在大模型赛道,腾讯想必不会将哥伦布的角色拱手让人,尤其是模型层,只是在应用层可能会依靠合作伙伴建立生态圈,远有微信上的丰富应用,近也有QQ上开始内测的midjourney。

至于腾讯为何选择QQ生态而非微信生态,可想而知的原因可能是QQ用户群体相对年轻化,而且在PC端的产品呈现上显然是QQ更胜一筹。此外,这一选择也存在强烈的“试水”性质,毕竟midjourney本身还未曾以成熟的产品形式呈现,在QQ之前,仅以API形式接入了discord。

更值得一提的是大模型赛道的赛马,曾经赛马跑出的神话实际上早已在算法时代为头条系的崛起而破灭,因为赛马机制本质上是建立在冗余前提下,通过资源优势以面找点,重复造轮子,有点类似于数学中的穷举法。之所以神话破灭,是在于赛马在保险的同时也让腾讯丧失了曾经的敏捷,最典型的便是短视频应用至今只跑出来了视频号这个全村的希望。

不过,大模型赛道的赛马说不定还真能行。

因为大模型训练非一夕之功,更不是某个强烈需求敏捷能力的垂类。重资产投入、试错成本高昂的预期以及应用层呈现的千奇百怪很大程度上弥平了赛马机制的缺陷,一方面是应用多样化避免了重复造轮子造成的资源浪费,另一方面是大模型特有的知识蒸馏让试错不再可怕,即使OpenAI珠玉在前,大家对国内的各家大模型仍抱有宽容的态度,无论是公众层面还是公司内部。

所幸新一轮的赛马或许不需要决出个胜负,更重要的是胜负之外的结果。腾讯也应该感谢OpenAI开启的新时代,一个不再追求短平快,连方向路径都已昭然若揭的时代,让缺乏敏捷、缺乏对核心抓手的嗅觉的腾讯重回棋盘之上,与竞对一起自天元落子。

只是大模型也并非万能,最起码,腾讯组织架构的顽疾以及整体战略上的模糊尚待调整。

如果希望AI Labs是腾讯这艘船的哥伦布,那么拆除组织架构内的部门墙以及重塑对创新的态度将是重中之重。例如光子星球自一位接近腾讯人士处了解到,AI Labs曾出走多位顶尖人才,他们曾经在腾讯内部的创新成果也在出走后落地多个垂直领域,甚至其中不乏龙头的存在。

如果希望AI Labs这位哥伦布能真的发现新大陆,起码需要坚定地朝着正确方向前进。这一点恰是腾讯在开启赛马之路后丢失的能力,因为赛马的本质在于有力却不知何处使。现在的腾讯能否在赛马机制的路径依赖下突破以面找点,以各个BG在应用层积累的数据库为基础,在高效协同之下跑出一个大模型来,我们还在等待这份答卷。

只是留给腾讯的时间可能不多了,随着夏季到来,今年又恰是厄尔尼诺之年,用电问题将愈发严峻,届时大模型训练想必会受到不小的影响。

一步慢可能步步慢,赛马机制在短视频上的失败让曾经的“后发先至”从神话变成遮羞布,大模型将是腾讯能否正视自身问题,向世界证明自己仍具备打硬仗能力的最好机会。毕竟,就算是在腾讯如今最重视的市值管理上,大股东们还在减持套现。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy