探访西北首个大规模AI算力集群:大模型背后是大生态

653次阅读
没有评论

探访西北首个大规模AI算力集群:大模型背后是大生态

3月初,一家互联网公司找到西安未来人工智能计算中心COO张云鹏,点名就要60P(1PFLOPS等于每秒一千万亿次的浮点运算)的算力,时间是三个月。

这家公司算了一笔账:使用西安未来人工智能计算中心的昇腾算力,每P算力的价格是单月1万元人民币,而如果使用云服务商相同规模的GPU算力,成本大概要10万元,足足有十倍的差距。

相似的场景在各处算力中心上演,ChatGPT的火爆引起了连锁反应,谁也不想错过这一波大模型热潮,入场的首要条件便是足够的算力。

企业对算力的需求不只是性价比,更突出的问题是,国内人工智能生态与海外还有不小的差距,如何把国产算力用起来,这是国内企业面临的紧要事项。

探访西北首个大规模AI算力集群:大模型背后是大生态

西安未来人工智能计算中心

钛媒体App实地探访了西安未来人工智能计算中心,该中心以昇腾软硬件为基础,与单纯的数据中心不同,西安未来人工智能计算中心不只提供算力服务,也向上延伸至应用孵化、产业聚合、人才培养等,同时结合了本地特色产业,初步打造出有陕西属性的人工智能产业生态。

人工智能的生态竞争

ChatGPT为什么没有诞生在中国?这是国内人工智能从业者近期被问到最多的问题。

对于中国企业来说,ChatGPT的工作量和成本并不是不可接受,无论在架构还是在方法上,ChatGPT与以前的大模型没有本质区别。

然而就是不断提升数据量和模型参数量,一种目前不可完全解释的现象诞生,ChatGPT能自动学习知识,还能够在一定的引导下完成较为复杂的推理能力,所有这些新能力都并不是最初训练的目标,这种现象被研究人员称之为“涌现”(Emergence)。

一个较为公认的观点是,ChatGPT不是OpenAI一家公司的成功,在算力、算法、数据等不同环节,众多公司构成了一个庞大的人工智能生态,量变引起质变,使得大模型有了“涌现”的基础。

归根究底,人工智能的竞争是生态的竞争。

产业清晰地认知到,国内人工智能生态存在现实的挑战,过去的生态以西方为主导,很多创业公司都曾在产品PPT上“吊打”英伟达,但生态层面还有很大的追赶空间。

探访西北首个大规模AI算力集群:大模型背后是大生态

对于很多科学研究人员及企业研发人员来说,算力仍然是一个“奢侈品”,昇腾的做法有借鉴意义,在商业化并不紧迫的场景,有时间和空间不断打磨产品的科研领域,国产算力可以做到端到端的优化,从而为自己找到立足的根基。

据西北工业大学教授、博导,长江学者张伟伟介绍,西咸新区枢航空科技有限公司与华为合作,在AI复杂流场预测、多源信息智能融合以及智AI计算流体力学方向取得创新性成果,用于辐射和推广华为布局的国产智能芯片、智能超算以及基础软件

国产大飞机C919研制和试飞阶段,智能流体力学模型就发挥了重要作用,人工智能为流体力学的发展提供了一种新的研究范式,而流体力学反过来也为人工智能的发展提供了一个足够复杂的研究对象。

华为昇腾营销总经理张嘉伟则表示,“我们也想构建自己的创新领先的人工智能产业生态,昇腾就是做好底下的根,做好这个产业生态,让产业生态能够孕育出ChatGPT,让它发生在中国、根植在中国。”

从算力,到应用

西安未来人工智能计算中心于2021年5月正式启动建设,建设周期近四个月,于2021年12月31日正式上线运营,一期包含AI算力300P、HPC算力8P,主要为内置数千颗昇腾910 AI处理器的华为Atlas 900 AI集群,单柜功率50KW,采用了液冷加风冷的散热方式。

探访西北首个大规模AI算力集群:大模型背后是大生态

华为

一般数据中心以通用算力为主,人工智能算力中心则在近两年遍地开花,城市竞相建设智算中心,核心就是人工智能产业需求的驱动,起到“一业带百业”的效果。

西安未来人工智能计算中心的AI算力规模,在全国范围也属于第一梯队,据了解,目前西安未来人工智能计算中心算力使用率为98.5%,北京深圳等地均有企业使用该中心算力。

以计算流体力学(Computational Fluid Dynamics,CFD)中的算力消耗为例,一个发动机叶片的仿真需要1000核计算1周的时间,当前的算力平台显然无法支撑发动机全量的仿真计算,而建设一个这样的算力平台,可能需要一两年甚至更长的时间。

西安未来人工智能计算中心的特点可以归纳为“政-产-学-研-用”,政府投资建设算力中心,培育人工智能产业,企业、科研院所和高等院校合作,由最终用户参与整个技术创新过程。

该计算中心主要为包括陕西在内的西北五省以及全国头部人工智能企业提供普惠“算力”,并和高校、科研院所基于全栈国产化的昇腾芯片、异构计算架构CANN以及深度学习框架Mindpore展开合作,推动我国人工智能形成自主创新的产业生态。

截至2022年12月31日,已与182家企业合作,孵化了179个场景化解决方案,涵盖遥感、语音、文旅、制造、交通等数十个行业。

“华为从底层的硬件开始做起,但不仅仅是做硬件,我们在硬件上的投入和软件上的投入一半一半,硬件使能层类似于CPU上的汇编语言,直接在机器上执行底层的AI的算子,还有应用使能层,面向不同类别的开发者提供三种不同层级的开发方式,支持从底层算子的开发再到上层模型的开发、应用的开发”,张嘉伟说。

据悉,华为即将在5月份正式发布整个开发者套件,让开发者可以便捷地使用昇腾软硬件,加速从算力到应用的开发。

行业模型早已涌现

千亿级参数的大模型实现了新的能力,但很多行业不需要如此之大的大模型,行业模型是较为实用的方案。

华为创始人任正非此前就表示,未来AI大模型上会风起云涌,大家要关注应用,尤其是工业、农业社会的应用,模型的应用有时比模型本身还有前途,华为主要做AI的底层算力平台,应用平台不是华为的选项。

探访西北首个大规模AI算力集群:大模型背后是大生态

据欧洲人文和自然科学院外籍院士,西安电子科技大学人工智能研究院院长焦李成介绍,西电人工智能学院联合西安昇腾智能科技有限公司和华为,依托西安未来人工智能计算中心的算力,在昇腾Atlas算力底座和MindSpore AI框架下,采用华为智能无损以太网络将算力节点高速互连,开展了大规模雷达遥感影像智能解译技术研究。

目前可实现复杂多样地物的自适应建模、迥异成像参数的判别性特征提取及特征互补优化的自监督学习,获得样本需求低、特征刻画好、普适度高、实用性强的SAR图像智能解译系统。

业内人士表示,华为主要是以硬件擅长,尤其是昇腾部分,以出售板卡的形式来赋能生态,从昇腾的角度来说,希望做成“中国的英伟达”。

张云鹏表示,从过去的AI算力平台迁移到华为昇腾,是一个现实的挑战,昇腾联合高校做了很多众智计划,进行了相关的算子的开发和迁移,与高校合作促促进产业长期的发展,这也是昇腾为生态不断提供的能力之一。

隆基智能全球领先的光伏企业,其总部位于西安,打造了光伏行业首个全流程AI质检一体化系统,采用了华为Atlas 800(9000) AI训练服务器,与未来人工人工智能计算中心进行适配。在产线关键工序中实现精准检验,智能定位风险点,替代传统人工经验化处理的模式。相比较人工检验,制造效率提升25%以上,漏检率大大降低。

此外,西安未来计算中心还联合西北工业大学开展语音预训练大模型”等。在人才培养方面,西安未来人工智能计算中心同西北农林科技大学、西北大学、西安科技大学、西安工业大学4所高校开展合作,已累计培养人工智能产业人才1000+。

很长一段时间内,昇腾重心不在于商业盈利,而是为算力找到出口,让更多的应用在昇腾软硬件上跑起来,让更多的企业迁移到昇腾生态,如此,国产算力才算是有了生存的空间。

大模型背后必然是大生态,生态繁荣,大模型才不是空中楼阁。

(本文首发钛媒体,作者|张帅)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy