商汤日日新大模型体系更迭升级,金融、医疗等行业场景落地已超20个|WAIC 2023

588次阅读
没有评论

商汤日日新大模型体系更迭升级,金融、医疗等行业场景落地已超20个|WAIC 2023

今年6月拍摄的商汤大模型产品商量SenseChat界面(来源:钛媒体App编辑拍摄)

时隔仅3个月,商汤“日日新”AI大模型正式更新,部分能力超越了基于GPT-3.5的ChatGPT,并且这家AI巨兽开始把重心放到大模型规模化落地应用中。

钛媒体App获悉,在2023世界人工智能大会(WAIC)上,商汤科技董事长兼CEO徐立宣布,“商汤日日新SenseNova”大模型体系进行了多方位全面升级,以及公布在该体系下的一系列大模型产品更新和落地成果、应用实践等。

其中包括,商汤更新千亿级参数自然语言处理模型“商量”2.0版本,支持阿拉伯语和粤语,并推出小模型商量S版(SenseChat S)等不同参数量级的模型版本,可适配移动端等不同终端及场景的应用需求;全新秒画3.0则将参数量提升至70亿量级;如影2.0将语音和口型流畅度提升30%以上;琼宇2.0空间重建效率提升20%,渲染性能提升50%;格物2.0对物品纹理及材质的渲染精细度达到毫米级。

据悉,今年3月商汤科技发布的2022财年报中,公司愿景和战略目标从“以人工智能实现物理世界和数字世界的连接,促进社会生产力可持续发展,并为人们带来更好的虚实结合生活体验”,转型为“将通用人工智能(AGI)作为核心战略目标,以期在未来几年内实现AGI技术的重大突破”。

基于此变革,商汤科技建立并执行AI for All的发展目标,将重点放到以SenseCore Al大装置作为大模型生产的核心平台,以及以商汤AIDC人工智能计算中心平台作为大算力AI基础设施能力,从而打造通用能力的多模态大模型,而且进一步做垂直领域的行业、更具专长的专业大模型,从根本上降低大模型的下游应用成本和门槛,确保AI技术的发展惠及全人类。
商汤日日新大模型体系更迭升级,金融、医疗等行业场景落地已超20个|WAIC 2023

商汤2022财年财报会议公布新的发展目标

今年4月10日,商汤正式首次公布“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”,参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。同时商汤科技还与上海 AI 实验室研发了多模态、多任务通用大模型“书生”。(详见钛媒体App前文:《商汤版ChatGPT来袭,中国激战千亿“大模型”》

本届WAIC上,商汤更迭日日新SenseNova大模型体系以及一系列大模型、数字人、文生图产品应用,在整个性能、数据准确度和精度等方面均有提升。

  • “日日新”大模型体系下,自然语言处理模型“商量”2.0版本突破了大语言模型输入长度的限制,推出不同参数量级的模型版本,可适配移动端、云端等不同终端及场景的应用需求,降低部署成本。
  • 文生图生成式AI模型“秒画”3.0的模型参数从今年4月首次发布以来的10亿提升至70亿量级,实现专业摄影级的图片细节刻画。
  • 数字人生成平台“如影”2.0相较1.0版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,具备AIGC生成形象及数字人歌唱功能,可应用于线上短视频、直播平台。商汤将与多个头部企业共建“云+AIGC+短视频直播”生态,带来高效低成本的AI视频和营销工具。
  • 3D内容生成平台“琼宇”2.0(场景生成)的空间重建效率提升20%,渲染性能提升50%,1200TFLOPS/秒算力支持下,每100平方公里场景的建图时间仅38小时即可完成。

对于商汤大模型商量2.0,徐立透露,其AI代码助手性能全面提升,推理效率提升619%,HumanEval测试集一次通过率达48.7%,超过GPT-3.5的48.1%。而且,无需训练模型,就可以快速融合知识生成,搭配企业知识库可以快速解决相关领域问题。此外,“针对前端、终端的应用需求,我们推出了小模型,小模型不但性能上有一定突破,在前端的运行上也能够跑到高通骁龙8 Gen2的终端芯片上,使得我们更多的终端应用变得可能。”徐立表示。

算力方面,目前商汤在上海临港AIDC已经有接近3万块的GPU(图形处理器),目前算力已达到5000 PetaFLOPS(1 PetaFLOPS等于每秒1千万亿次浮点运算),能够支持更多千亿规模的大模型算力训练。同时,商汤现已支撑10家以上的单位机构在临港的智能计算中心中去训练他们的大模型。

另外,商汤还现场展示基于日日新SenseNova大模型体系的产业升级和应用落地。

  • 在金融领域,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效;
  • 在医疗场景,商汤基于医学知识和临床数据开发了中文医疗语言大模型“大医”,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来将支持医学图像、文本、结构化数据等多模态综合分析。
  • 面向线下场景,商汤通过大模型能力为电网巡检带来长尾故障识别、复杂缺陷判断等智能解决方案;
  • 基于琼宇2.0的空间重建,商汤为济南马山镇区域开发、合肥中国视界园区、上海瑞金医院等打造实景空间的数字孪生,提升运营管理效率;
  • 在珠宝行业,依托格物2.0商汤为珠宝品牌进行珠宝首饰复刻,细致展现商品工艺特点,提升顾客购物体验。

此外,在智能汽车的智能座舱方面,商汤致力于建立“车舱大脑”。基于感知决策一体化的自动驾驶通用大模型UniAD,商汤构建车路云协同的交通体系,凭借多模态多任务通用大模型开发路侧视觉感知大模型,结合“琼宇”2.0及“格物”2.0构建智能交通孪生与仿真,并利用“商量”2.0的感知推理和人机交互能力,推动车路云共同向大模型对话式交互演进​。

商汤日日新大模型体系更迭升级,金融、医疗等行业场景落地已超20个|WAIC 2023

据徐立透露,商汤自动驾驶通用大模型UniAD在多目标追踪准确率上实现了20%以上的提升,车道线准确率超过30%,运动预测误差降低40%,规划误差降低了30%。据商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚透露,目前该模型正在面向量产,UniAD框架测试下整个智能驾驶有比较显著的提升。

钛媒体App了解到,截至今年5月,基于商汤大装置SenseCore和日日新大模型体系,商汤已获得超过10个大模型客户,超过40个KA(核心关键)客户,超过5个前沿领域覆盖,超过20个行业场景落地。

财报显示,2022财年,商汤科技营收为38.09亿元人民币,其中数字人、AIGC等智慧生活业务板块营收9.55亿元,同比增长129.9%,加上智能汽车业务收入占比为总营收的33%。

商汤CFO王征在年报会议上提到,预计到2025年,商汤两个“火箭”业务(生活和汽车)总占比将高达50%-60%左右。(本文首发钛媒体App,作者|林志佳)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy