梭哈大模型,阿里云成了跟风者?

661次阅读
没有评论

梭哈大模型,阿里云成了跟风者?

图片来源@视觉中国

文|极点商业, 作者|杨铭,编辑|刘珊珊

这可能是张勇全面掌舵阿里巴巴7年以来,事关未来最重要的一次“梭哈”。

“阿里巴巴所有产品将接入通义千问,进行全面改造。”一周前的北京国家会议中心,阿里云峰会上,首次以阿里云CEO身份公开亮相的张勇,站在舞台中央揭开了“通义千问”大模型的面纱。

这是张勇挂帅阿里云后带来的首个待验证作品。根据张勇宣布,天猫、钉钉、高德地图、淘宝、优酷、盒马等27个阿里集团旗下APP产品,都将接入“通义千问”大模型进行全面改造。

将所有阿里产品聚合同一技术架构下,和2015年张勇刚掌舵阿里时,提出的著名“大中台,小前台”组织战略路径非常相似——当然如今回头看去,“大中台”战略难言成功,早在2020年张勇就开始自我反思,并在今年史无前例的组织变革中,彻底拆分为“1+6+N”。

如果说当初推出“大中台”是创新者、引领者,但在如今GPT大模型军备竞赛上,阿里云却落后了许多,甚至成为模仿者、跟随者。

不仅是大模型发布时间晚于国外的OpenAI、微软、谷歌、Meta,以及国内的百度、华为、商汤,就连阿里云智能首席技术官(CTO)周靖人在峰会上提出的“云智一体”战略——这一阿里云智能集团强调的战略方向,其实百度早在2020年就已正式发布“云智一体”战略,阿里云相比晚了整整三年。

阿里云为何此时才提出“云智一体”战略?是“抄作业”还是“产业共识”?对于大模型竞技场,以及云市场格局而言,又会带来哪些影响?

01 云智一体,阿里云“抄概念”?

“智能化时代,大家都站在同一条起跑线上。”面对几千人摩肩接踵的会场,张勇表示,除了阿里所有产品都值得用大模型“改造”外,阿里云将开放通义千问能力,接入B端企业打造专属大模型。

通过张勇等阿里云高管的演讲,可以一窥阿里云的勃勃野心:通过对大模型的“All in”,去押注阿里云,甚至阿里集团的未来。

众所周知,早年占据先发优势的阿里,依靠电商大爆发站在中国互联网巅峰。其进取心、方法论、组织能力、政委体系、使命愿景、价值观等,影响着无数企业家和创业者。

这也包括2015年,张勇成为阿里集团CEO后,设立的“大中台、小前台”战略,其目的是提升阿里集团整体效率,最大限度减少重复造车轮行为,复用已有能力——尽管“大中台”并非阿里首创,而是来自马云去芬兰参观一家游戏公司后的取经,但“大中台”因阿里而火爆,依然被诸多企业学习和模仿。

近年来,阿里却创新乏力,不太跟得上市场、大环境的“进化迭代”,在各种战场频繁失利,市值距高峰期缩水近7成。

比如电商领域,京东、拼多多、抖音电商严重动摇其基本盘;支付市场,支付宝份额早被微信支付抛下;本地生活领域,从饿了么到飞猪,无力阻挡美团进攻;云计算领域,阿里云增速下滑、高管动荡,腾讯云、百度智能云、华为云带来的压力重重;大文娱上,发展更是惨淡,收购失败案例比比皆是。

种种困境下,今年3月28日,阿里迎来史上最大公司组织架构调整。对每年都会进行组织架构调整的阿里来说,调整为“1+6+N”容易,最难的是如何寻找到新的发展路径。

当被认为是下一代互联网基石,以ChatGPT为代表的AI大模型,被全球所有科技巨头角逐时,阿里自然也不会错过,如同张勇在峰会现场做出的预判:当下技术领域,正是对未来10年、20年形成重大历史契机的关头。

但如果与OpenAI、微软、谷歌推出的大模型产品,甚至是百度相比,“通义千问”在外界,被不少人视为一次是“大跃进式”的面世。

按通义千问自己介绍,该项产品由阿里旗下达摩院开发,诞生于2022年11月。今年2月,阿里一名资深技术专家对外爆料,达摩院正在研发阿里版聊天机器人ChatGPT,阿里随后确认称正在内测。4月7日,阿里云突然官宣大模型通义千问邀请测试,此后该内容显示已被发布者删除。4月11日,通义千问在张勇阿里云首秀中高规格问世。

严格来看,“通义千问”技术路线、产品形态并不存在太多创新。技术路线上,目前已推出产品的有类ChatGPT模式、多模态混合模式,通义千问类似百度在3月份发布的文心一言(题外话:古代知名文学理论著作就有文心雕龙、白虎通义),是一款类似ChatGPT的大型预训练语言模型,具有广泛的知识储备和普适性,在训练过程中学习大量文本数据,从而具备跨领域知识和语言理解能力,适用于不同场景下的需求。

即便张勇提出,要做帮企业打造专属GPT的通用平台,但事实上,类似“开源”也有云企业走在前面。今年3月底,百度智能云正式推出“文心千帆”大模型平台,面向客户提供企业级大语言模型服务。

梭哈大模型,阿里云成了跟风者?

值得注意的是,阿里云也首次明确提出,“云智一体”是其未来战略。包括阿里云智能首席技术官周靖人以《云智一体,让智能创新触手可及》进行演讲,以及阿里云智能首席商业官蔡英华也表示,只有云智一体,才能让全面产业智能化。

“云智一体”概念最早由百度提出。2020年5月,百度智能云宣布由CTO王海峰统领实现云与AI及基础技术体系的统一,明确提出“云智一体”战略。此后两年间,以一年一级频率,百度智能云完成云智一体架构从1.0到3.0的进化。

“云+AI”的融合,其实在国内外云计算公司中已不鲜见。除了百度“云智一体”,微软提出“office+Teams+Azure”,亚马逊2022年提出“云、数、智三位一体”,腾讯云去年提出“云智融合”,京东叫“数智供应链”,阿里云此前也有“云钉一体”——哪怕大家技术路线、概念含义都差不多,都会避讳采用相同的概念。

过去三年,各种场合与财报中,百度都与“云智一体”进行了强绑定。这也让业界有所不解,阿里云为何还要在三年后,重新提出“云智一体”概念,是“抄作业”,还是“产业共识”?

02 逻辑还需自洽,实测与宣传差距有点大‍

无论如何,在业内人士看来,阿里云的跟进,意味着“云智一体”的打通和融合,已经成为产业共识,也预示着云智一体大产业机会的到来。

阿里云高管并未具体阐述云智一体具体含义。按照百度此前说法,“云”指的是以云计算为基础,使企业在云上像使用“水电煤”一样方便快捷地接入AI能力;“智”指的是人工智能,通过飞浆、视觉、语言和知识等全栈技术能力,满足企业在复杂多变场景下对AI技术的需求。

简单而言,就是“适合跑AI的云”叠加“懂场景的AI”,共同打造智能时代基础设施。

“云智一体”概念中,核心是智。多年布局发展后,云已经变成各行各业基础设施。而能否提供、输送全面、便捷高效、稳定可靠的AI智能化服务,成为各大科技企业比拼关键。

营收增速下滑,在政企、个人云市场逐渐摸到天花板的阿里云,或许看到的也是同样机会:凭借“云智一体”差异化打法,百度形成“芯片-框架-大模型-行业应用”智能化闭环路径,帮助百度找到面向未来十年的第二增长曲线。可以说,“云智一体”在重塑百度过程中,相当重要。

另外,随着中国经济社会数字化转型加速,万物互联时代到来,“深入产业、推动产业智能化升级”明确成为各家云计算战略重要部分。

这就更离不开通过“云智一体”,去承载大模型算力、解锁AI生产力——事实上,无论是AI大模型,还是其他云、AI产品矩阵,概念虽然不同,实际上均是基于“云智一体”底座推出。文心一言、通义千问、360智脑、商汤科技如此,更多其他类ChatGPT产品都是如此。

从“极点商业”实测来看,通义千问给出的回答,整体并不算理想。

通义千问目前只提供文本生成功能,暂无法生成图片、音频及视频内容。自然语言处理、中英文对话等方面,通义千问表现尚可,但在基本事实、时间、计算、推理等需要思考认知和逻辑理解对话上,和其他大模型对比当前差距不小。

“鱼香肉丝怎么做”这种千篇一律,在各种模型被广泛提及的问题,通义千问确实回答得不错。但是,“极点商业”以虎扑热门话题“三国演义为什么只注重刻画前期混乱时代,而对最后统一过程轻描淡写?”提问时,通义千问回答是“很抱歉,目前没有掌握回答技巧”。

相比之下,文心一言则指出,称“小说主要情节是描写三国时期的群雄争霸,最后统一过程只是其中一个小小情节。这种处理方式使得小说更加注重于描写前期混乱时代的历史背景和人物性格,从而更好地呈现三国时期的历史和人物。”

梭哈大模型,阿里云成了跟风者?

梭哈大模型,阿里云成了跟风者?

“如何看待《生成式人工智能服务管理办法(征求意见稿)》,拟法ChatGPT提供者应对数据来源的合法性负责”问题上,另一AI大模型给予肯定,指出是加强人工智能监管方面的重要举措。而通义千问依然是“没有学会如何回答”。

梭哈大模型,阿里云成了跟风者?

涉及基本事实、时间线梳理问题上,通义千问可能还没明白如何回答。比如,“阿里巴巴过去几年,经历了哪些负面事件”提问中,通义千问回答不仅是错误百出,甚至出现多处杜撰阿里公司事实、时间情况。

梭哈大模型,阿里云成了跟风者?

梭哈大模型,阿里云成了跟风者?

“和文心一言相比,通义千问有哪些优势与劣势”对话中,通义千问又犯了一个事实性的低级错误:称通义千问和文心一言都是阿里巴巴推出的AI预训练模型。

梭哈大模型,阿里云成了跟风者?

如此多的低级错误,不仅与阿里云率先在国内布局云计算、市场地位不符,更难以承担阿里所有产品接入重做,为B端企业打造专属大模型的野心——毕竟,理解基本逻辑、遵循事实是第一位,如果实测结果不理想,不但会对B端企业的数字化布局造成影响,还会带给钉钉、天猫精灵等用户不好的体验。

按照阿里云的布局,智能客服是其重点应用场景——可以帮助阿里突破传统电商“人找货”局限,迭代升级为“货找人”。并且,在酒旅、本地生活等方面,AI大模型也可以精准营销,满足更多消费者真实需求。‍‍‍‍‍‍‍‍

梭哈大模型,阿里云成了跟风者?

但是从实测来看,通义千问在智能客服、智能推荐等方面的表现,距离商业化还相当于遥远。比如“从北京来,去重庆南天湖五一旅游三天”以及“预算6000元,买什么抽油烟机和燃气灶比较好”问题,通义千问给出的回答,对消费者来说实际参考意义非常小。‍‍‍‍‍‍‍‍

值得一提的是,这些问题是“极点商业”随便提出,并非刻意为之。此前发布会上,张勇称通义千问是“世界首个突破10万亿参数的AI大模型”。另外,有消息称阿里还牵头搭建了国内最大的AI模型服务社区“魔搭”。那么,通义千问生成式AI的逻辑能力,实际上为何如此孱弱?

03 跟风者不容易,阿里云还差些什么

这涉及“云智一体”的本质——云必须与智真正的更好融合,才能给用户更好体验,让产业全面迈向智能。

答案或许很简单,即便阿里云有强大的云计算和AI能力沉淀,但是两者并未做到很好的融合。另外,数据参数、预训练数据的规模和质量、数据清洗等方面的差距,也直接关系不同大模型的回答结果,这方面阿里云并不具备优势。‍

有业内人士表示,过去在一些云厂商内部,AI与云普遍处于两个不同体系。售卖计算、存储等资源型产品成为主要商业模式,导致AI在产业数字化转型、智能化升级过程中无法发挥出最大价值。

从“极点商业”了解来看,阿里云就是这样的典型案例。

很长一段时间以来,阿里的人工智能、云计算处于两个独立体系——在阿里内部,研究人工智能的部门一度由阿里人工智能实验室(AI Labs)和达摩院负责,与阿里云是平行部门。

AI Labs是阿里体系内实验室,研究语音、语言、机器视觉,后改为天猫精灵事业部,发力智能硬件。直到2021年,AI Labs团队在架构变动中,才整体并入阿里云智能。

研发通义千问的达摩院,更是设于阿里庞大商业体系之外的一个独立研究机构,研究范围包括数据智能、人机自然交互等前沿技术。2021年组织架构升级中,前阿里云总裁张建峰负责的“云与科技板块”中,包含阿里云、达摩院、钉钉、智能互联(天猫精灵)、平头哥五条线。彼时,虽然达摩院AI技术通过阿里云输出,但依然是平行的“兄弟部门”。

部门平行外,对阿里云来说影响更大的是连续数年高管震荡。去年5月,达摩院与阿里云出现一系列高管变动,华先胜(达摩院城市大脑实验室负责人)、金榕(城市大脑高级研究员)、张磊(达摩院AI中心副主任)离职,肖利华(阿里云研究院院长)出走创业。一夜间,从王坚时期开始耕耘多年的明星项目——达摩院城市大脑实验室,核心人员几乎全部流失。

这让阿里云、达摩院“元气大伤”,并且加速两者“分割”。根据“雷锋网”此前报道,阿里云和达摩院2021底进行了人员分割,一些达摩院孵化的产品技术被划出,而达摩院以更为独立形式运营,承担起10位数的营收数字挑战——具体方式是,达摩院通过阿里云业务线对外进行销售产品,两者实行双算模式。

今年1月初,阿里云高层再次人事大变动。张勇亲自下场接替张建峰,掌舵阿里云智能总裁,周靖人担任阿里云智能CTO。但是,随着“大中台”的失效,云与AI未来是否得到更好融合,成为疑问。

3月28日“史上最大”组织架构变化后,达摩院、阿里云都被归到张勇掌舵的云智能集团旗下,但依然分属不同业务板块,在业务上有一定的独立性。同时,高管依旧流失,阿里AI大牛贾扬清、阿里M6大模型前带头人杨红霞也已离开。

跟大模型或AI相关核心负责人持续两年动荡,带来的结果就是,阿里大模型推出迟到,产品能力实际表现更像”赶鸭子上架”。

有人工智能从业人士透露,一个稳定的管理团队,是产品、技术路线延续关键。该人士举了一个例子,在百度智能云,百度CTO王海峰+百度技术委员会主席吴华+百度集团副总裁吴甜带队的组合,自2019年推出文心大模型ERNIE 1.0系列第一天起,就保持稳定,才有了文心系列的持续迭代。

遗憾的是,对阿里的云和AI业务而言,频频组织架构调整、人员持续动荡中,不曾拥有过百度的稳定优势。

这在大模型上也有体现。阿里在模型迭代上比百度、华为慢了不止两年。2019年,当百度、华为推出大模型时,阿里才开始研发。2021年,其他企业开始对大模型持续迭代,阿里才发布了语言、多模态大模型,并在去年9月合并为阿里通义大模型。

导致的结果,就是大模型数据质量、规模上的差异。“阿里大模型与业界或国内领先水平,存在的数据参数、预训练数据质量和数据清洗等方面,差距明显。”ICT产业服务平台“集微网”报道称。

阿里云CTO周靖人此前也承认,大模型研发动辄要超千亿参数,其难度远远超出了单一算法或GPU芯片的简单堆砌。

其实这种差距在业界预料中。百度拥有海量C端搜索数据,腾讯也有十多亿用户微信生态数据沉淀,但阿里拥有最多的是垂直领域的TOB商家客户数据。从通用大模型训练角度来看,过于商业化的TOB商家数据,并不太适合大量加入。

通义千问发布前,一位阿里云研究院高级专家坦承,在参数方面,通义千问基于PLUG的模型,参数在200亿-300亿,而GPT-3参数是1750亿,同时其主要偏向文本,没有涉及图像和视频;预训练语料数据集方面,在质量和规模上都比不上OpenAI和百度。

这可能是阿里云“抄作业”,植入“云智一体”概念的一个原因。毕竟,如同周靖人所表示,当下的AI大模型竞争,本质上就是算力竞争。其比拼的,是一个囊括底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要的是AI云计算的全栈技术能力。

无论如何,伴随AI大模型潘多拉魔盒打开,云市场GameChanger已经到来。行业格局大洗牌难以避免,对阿里云这个昔日老大哥而言,从“领先者”变为“跟风者”,还有多少机会,去重塑行业规则?

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy