官宣跑通端侧大模型,小米透露“大模型方法论”

432次阅读
没有评论

软件×硬件)ᴬᴵ

这是雷军在他的2023年度演讲时提出的“小米公式”。AI次方在数十米见宽的屏幕上只占了侧面小小的一角,却显得格外扎眼。台下的媒体人都意识到,雷军要开始讲AI了,且不出意外的话,小米大模型就要来了。

果然,随着幻灯片一闪而过,雷军站在舞台上用斩钉截铁的语气念出了身后的那排大字:

“小米全面拥抱大模型。”

官宣跑通端侧大模型,小米透露“大模型方法论”来源:小米

拥抱大模型的不止是小米。

在刚刚过去的一段时间里,手机厂商正在掀起一波大模型的浪潮。苹果、华为、三星、OV、荣耀等几乎所有头部厂商都先后宣布了将落地大模型的消息。恍惚之间让人梦回了5G、全面屏、折叠屏等概念风起青萍时的手机发布会。大模型仿佛成为了智慧硬件厂商新的兵家必争之地。

不过相比于这两个月匆忙下场的品牌,小米算是其中行动最早的一批品牌。

早在今年三月份的集团财报沟通会上,小米方面就公开表达了对大模型的浓厚兴趣。而根据雷军此次官宣的消息,小米集团在今年四月份正式组建了自己的大模型团队。

在过去四个月的时间里,小米的大模型团队迭代了13亿参数和60亿参数两代产品,截至8月14日,小米60亿参数的自研大模型在C-EVAL权威榜单上取得同参数量级排名第一,在CMMLU中文向大模型取得排名第一。

如此紧凑的节奏可以说是全球手机巨头上进展最快、有机会最早上市的大模型技术了。

官宣跑通端侧大模型,小米透露“大模型方法论”来源:小米

相比于押注动辄数千亿规模的大模型公司,小米显然独辟蹊径地选择了离用户最近的一条路:

适用于“端侧”的“轻量”大模型

所谓“端侧”,是指模型服务不是部署在云端,而是直接存储在手机设备内部的芯片中,仅利用芯片的算力生成结果。这样,服务不需要联网,数据也不用上传到云端。

最早被曝出规划应用路线的公司是苹果,后者在7月份的招聘介绍中提出要在本地推理引擎中实现压缩和加速大模型。而8月份小米官宣“轻量化、本地部署是小米大模型技术主力突破方向”,可以说是与苹果的策略不谋而合。

相比于云端的大模型,手机端侧的好处显而易见——

无需云端处理信息,安全隐私性更好;不消耗云成本,高频使用下的成本更可控;弱网和无网环境也可以使用,交互场景更丰富、用户体验更稳定。

然而,要做好端侧大模型不是一件容易的事情。

相比于坐拥动辄数千张顶级显卡“炼丹炉”的大模型公司,走端侧路线这意味着品牌需要在很小的芯片算力空间中,做出体验可以媲美超级大模型的产品。换言之,在日益内卷、比拼大力出奇迹的大模型赛道中,小米决定要“反其道而为之”。

在雷军公布的大模型测评结果中,自研13亿参数端侧大模型的效果,在部分场景上可以媲美行业60亿参数的云端大模型。

官宣跑通端侧大模型,小米透露“大模型方法论”来源:小米

小米全面拥抱大模型,跟小米长期以来对AI投入的积累有关系。

长期以来,AI一直都是小米长期重点投入的赛道,同时也是小米相对擅长的领域。无论是手机的视觉部门、算力优化、语音助手,还是如今火热的自动驾驶和机器人事业部,背后都有小米AI能力的落地。

根据雷军在发布会上透露的数据,小米集团从事AI开发的研发团队人数已经超过了三千人。如此大的开发规模已经超过了许多明星级AI独角兽总人数。而根据集团财报,2022年度小米员工总数只有3.2万名。这意味着小米在AI研发编制大约占到了集团总数的十分之一。

“在OpenAI发布ChatGPT之前小米就做过一些大模型的落地尝试”,小米集团AI实验室主任王斌对品玩等媒体表示,因此小米对大模型“还是比较有感觉的”。

因此相比于很多走开源路线的企业,王斌透露,“MiLM则是小米团队从头开始训练的,中间做了模型和算法的很多优化”,而具体的训练数据量大概为“万亿级”token——

这也可以解释,为什么在短短的时间内小米在大模型上能够取得如此亮眼的成果。

官宣跑通端侧大模型,小米透露“大模型方法论”来源:小米

但“端侧”并不是小米的大模型故事的全部。

王斌表示,“云端合一”可能是小米大模型的未来解决方案。

常用的本地场景用端内的计算能力,而云端计算能力作为更澎湃的算力补充,可以解决时效性低、算力要求大的任务。对于小米来说,这将是大模型与场景协同的一次重要尝试,厂家需要同时对大模型和场景都有深刻的认识。

王斌透露,小米目前执行的策略之一是“内部开源”。

此次公布的MiLM-1.3B目前已经对小米内部正式开源。各事业部既可以探索如何用大模型直接赋能业务,也可以用大模型来提高企业内部的工作效率。大模型团队对此保留了很高的开放性,希望借此调动公司整体对大模型应用的想象力。

“可以说几乎所有的业务部门都非常积极主动”,王斌透露,小米内部非常多的业务部门都非常想用大模型来进一步赋能自己的产品。

官宣跑通端侧大模型,小米透露“大模型方法论”来源:小米

“(AI大模型)是企业一定要抓住的技术周期性机会”,小米高级副总裁、手机部总裁曾学忠在采访中表示,AI大模型对硬件产业的价值可能是战略性的。

“通讯行业每五到十年会有一个大的换机周期,长可能十年、短则五年”。曾学忠表示,通讯行业第一个变化是摩托罗拉,“从固定到移动”;紧接着是诺基亚,“高质量与好设计”;再接着是苹果,进入智能手机时代,“彻底改变了操作模式”。

至于下一代手机革命,曾学忠认为,AI和手机的端侧结合可能成为下一次跨越。AI让设备能够真正“理解”人,从而让人与设备更进一步结合。

在此基础上,曾学忠进一步认为,“AI大模型可能就是为5G而生的”。2G时代的杀手级应用是短信、3G是移动互联网、4G是短视频、5G则可能是AI大模型。基于AI大模型,未来可以实现人、车、家科技生态闭环下的互联互通,给用户带来革命性的体验。

从这个角度来说,大模型的服务能力或将成为未来手机竞争中的重要筹码。一个手机能不能跑大模型、能跑多大的模型、大模型体验几何,或许都将成为手机厂商不亚于现有硬件竞争点的新赛道。

官宣跑通端侧大模型,小米透露“大模型方法论”来源:小米

对于更长远的军备竞赛,小米给出的答案是加大投入并与产业链更深度的融合。

在雷军的年度演讲中宣布小米今年的研发投入预计将超过200亿,而去年这一数字为160亿。这意味着研发增速将至少同比增长25%。而小米Q1研发支出同比增速为17.7%,这意味着接下来半年时间,小米的研发投入将比一季度进一步提速。

对于全球范围内出货量增长停滞的手机行业来说,这是一个大胆的决定。它或许意味着小米将开启更新一轮的投入周期。

“我们不仅与高通合作,也与联发科等很多半导体公司合作,共同思考大模型端侧未来的解决方案”,曾学忠对媒体表示,“这几年我们反复对合作方(高通和联发科)提出更高优先级底层开放的要求。”

而类似的双方深度结合,曾学忠说,一定会带来“在端侧体验等应用上的爆破力”。

官宣跑通端侧大模型,小米透露“大模型方法论”来源:小米

如王斌所言,“(软件×硬件)ᴬᴵ ”将AI放到次方的位置,这意味着AI对集团业务的贡献被视作是“指数级”的。

AI与大模型的外延场景如此广泛,涉及的技术基座如此丰富,几乎重新定义了人与计算机之间的关系。它是一个兼具AI能力和场景理解的游戏。如过去风靡的“互联网+”概念一样,未来或许会迎来一个“AI大模型+”的时代。

这是“智慧涌现”的时代,或许将是是小米自己的“科技涌现”时刻——对于多元技术布局和丰富场景的小米来说,大模型或许是串连起其十三年长周期技术积累的一个棋筋:

无论是小米重点投入的汽车生态、仿生机器人,还是已经相对成熟的手机生态、智慧家庭生态,又或者是长期投入的MIUI系统、小爱同学,不同类目的业务生态和技术储备都可以在新的AI浪潮中找到自己的位置,都值得拥AI加buff。

毕竟AI虽然有无法抗拒的魅力,但只有当(软件X硬件)的底座越大,AI次方的指数效应才更有价值。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy