真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

101次阅读
没有评论

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

“从算力集群、平台体系,到算电协同、国产化适配,再到产业级落地,AI基础设施正从‘资源供给’走向‘系统能力’。”

这是商汤大装置副总裁、CTO宣善明,在量子位MEET2026智能未来大会上关于商汤在AI Infra领域的最新进展分享。

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

他强调,真正面向大模型时代的AI Infra,不能只解决“有没有算力”,而要解决“算力如何高效、稳定、可规模化地支撑模型与产业”。

而这,正是商汤大装置过去几年持续演进的方向。

为了完整体现宣善明的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。

MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。

核心观点梳理

  • 目前商汤的战略是“1+X”,“1”即核心业务,包括大装置、大模型、AI应用三位一体;“X”即创新业务,包括智驾、医疗、零售等模块。
  • 大装置方面,商汤始终坚持自身优势,打造最懂大模型的AI Infra,依托多年的核心技术积累,目前算力总规模达32000P。
  • 商汤智算中心通过算电协同,削峰平谷,精准预测15分钟内算力对电力的消耗,已实现年化降低7%电费,实现年度碳减排超过3000吨,综合算效提升15%,同时模型预测准确率可达88%。
  • 商汤联合国内十余家厂商共同发布了“商汤大装置算力Mall”。在算力Mall上,客户能够使用自由组合和调配多样化的国产算力资源、平台工具和行业模型服务,同时在此基础上获得一个通用的、可无缝实现其算法的环境。
  • 商汤大装置不仅是要做一个算力平台,而是在框架、模型优化、推理加速等方面的全栈能力,全面赋能科研机构、互联网企业与AI创业团队等迭代模型、提升效率。

以下为演讲全文。

AI发展浪潮与商汤技术演进

大家好,我是商汤大装置的宣善明,非常荣幸能有机会跟大家做一次分享,分享商汤大装置在AI基础设施领域的最新实践,特别是在大模型时代的AI基础设施的一些深度演进以及行业落地的一些思考和成果。

我们首先回顾一下整个AI行业的发展脉络,从2011年的感知智能时代开始,深度学习和机器视觉,推动了一波AI创业浪潮,其中包括商汤在内的“CV四小龙“。

到2017年,随着Transformer架构流行起来,生成式AI催生了第二个发展周期。到最近几年,世界模型、空间智能的发展拉开了AI第三个阶段的发展进程,这也将是通向通用人工智能的关键路径。

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

商汤一直深度参与整个AI的浪潮,穿越了十年发展周期,从最开始的AI 1.0时代的城市感知、智驾感知、端侧感知以及工业感知等,这些我们都深度参与其中,在当年的CV和智慧城市领域积累深厚。

现在我们全身心投入原生多模态模型、时空模型、具身智能、世界模型这些方向,整体上,商汤一直在核心AI技术链条上持续演进。

这也给我们带来一个很好的天然优势,我们一直在做AI,我们的AI Infra也就是商汤大装置,是从支撑模型需求出发构建起来的,本质上是一个更适配大模型的AI基础设施。

不管是科研机构还是创业公司,在与商汤大装置合作过程当中,我们提供的不仅是一个简单的算力平台,其实是一个立体的能力体系,覆盖模型框架、模型优化、训练与推理体系、开发工具链等,基于我们在AI这个行业的沉淀是能够帮助到客户综合地去提升他们的能力。

现在商汤整个定位是“1+X”,1是核心业务,主要是“三位一体”的大装置、大模型和AI应用,商汤大装置是刚刚所提到的AI Infra,既支撑商汤自研模型,也服务行业模型平台。

商汤自研大模型也会坚持自己的优势以及定位,坚持多模态为主,而不仅是纯粹的LLM的语言模型。应用方面做了非常多的尝试,包括一些生产力工具、交互工具等,这些整体构成了核心业务。

在创新业务上,绝影做车舱以及智驾方向、医疗行业的善萃、硬件行业的元萝卜、零售方向的善惠等,以及我们在芯片行业也有非常大的投入,这些都在行业内得到了比较多的认可。

最懂大模型的AI Infra:商汤大装置的全栈体系与关键突破

商汤大装置坚持打造“最懂大模型的AI Infra”,我们是国内第一个做千卡集群的厂商,我们在2018年启动了千卡并行训练原型机研制项目,2019年建设了国内首个超大的智算中心-上海临港AIDC,截止到目前整体运营算力规模达到了32000P,各类训练与推理体系都经过产业级验证。

从沙利文、IDC这些头部机构的统计分析来看,最近这一两年,商汤大装置一直稳居第一梯队。

比如沙利文《2024年中国GenAI技术栈市场报告》显示,商汤大装置综合竞争力在国内是第一名,全球是第二名,仅次于亚马逊。

在市场表现方面,近期沙利文发布的《2025年H1中国全栈AI云服务市场报告》显示,商汤大装置凭整体市场份额位列中国全栈AI云服务市场第四,原生AI云厂商首位。

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

作为一个原生的AI Infra,商汤大装置具备“算力-平台-方案-服务”的端到端的能力体系。

算力层,包括多元异构算力、AI资源池、AI引擎等,平台方面具备模型广场、开发平台,支持模型开发者和创业团队高效研发和迭代。在方案上我们深入了多个典型行业与关键场景,通过场景化方案实现产业赋能。

另外,也提供一些专家服务、数据服务综合能力。因此,在我们客户看起来,商汤大装置不仅是算力平台,更具备了“懂AI、懂模型、懂行业”的全栈AI云能力体系。

下面,分享一些我们在推进基础设施演进方面的关键成果,一是AIDC算电协同实践,二是推动国产化适配

对于算力中心,我们会看到基础设施更底层的问题。

商汤临港AIDC是全国第一个5A级的智算中心,今年开始搭建了覆盖“源—网—荷—储”全链路的算电协同平台。

自研了能源大模型,与宁德时代联合建设了17.888MW/35.776MWh新型储能系统。

并联动SenseCore平台,将用户任务层、智能调度层、算力集群层全面贯通,同时联动服务器、制冷、供配电基础设施,并与储能系统和电网系统形成协同。

我们可以精准地预测15分钟之内算力对于电力的需求,通过智能控制储能系统实现削峰填谷。通过这样的方式,AIDC年度碳减排超过3000吨,年节电量突破1000万度,PUE达到了1.267,综合算效提升15%,这是非常好的典型案例,现在也在进行全国推广。

二是在推进国产化适配方面,我们今年联合了华为、海光、寒武纪、壁仞科技、摩尔线程等国内厂商,共同发布了商汤大装置的算力Mall,通过算力Mall,开发者和企业客户可以自由组合和调配多样化的算力资源、平台工具和行业模型服务,同时他们不是简单地使用这个芯片,在这个芯片基础可以非常无缝地实现他们的算法。

在算力基础上,我们提升了综合PaaS平台的能力,还提升了推理框架优化能力,也适配了各种国内外的主流大模型的训练和推理,适配了各种主流体系框架。

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

今年我们是首批完成与华为昇腾910C 384超节点全面适配的企业,在调度优化、系统稳定性以及故障恢复等方面提出多项行业创新,让多租户、大规模、弹性AI云服务成为可能。

其次,我们联合某头部客户进行了大规模异构混训,实现了5000张国产异构算力芯片的调度和纳管,算力的利用率能够达到80%,同时实现了持续一个月的稳定训练,这是在国产方面达到比较好的数据。

同时,我们近期和记忆张量一起落地了业界首个国产GPGPU PD分离商用推理集群,整体上,综合推理性价比能够达到同代NVIDIA A100的150%。

端到端能力推动AI在产业的深度落地

接下来讲一下我们在产业端的一些落地成果。

商汤大装置在行业方面,致力于推动业务沉到产业落地的各个环节中,让商汤成为产业端的AI基础设施供应商。我们在各行各业,包括像互联网科技、AIGC、传统行业、科研机构,以及到具身智能的一些赛道,我们都做了非常好的探索落地。

在互联网科技方面,有些互联网大厂自己本身也是云厂商,自己也是AI Infra厂商,但是他们的研究院很愿意直接找到商汤合作,因为我们提供的不只是云平台,我们在上面还提供了算力以外的能力,包含模型推理、模型优化、框架优化这样一些工作,包括专家服务、数据服务。所以我们体现的是一体化的AI能力优势。

AIGC这些公司类似于智象未来,会把模型放到我们平台做训练与推理优化。传统行业会做得更深一点,像南方电网、铁一院(中铁第一勘察设计院)等,我们会更深入业务场景,去理解用户在AI方面到底诉求是什么,是算力的诉求还是框架的诉求还是模型的诉求,我们都会提供一个完整的端到端的解决方案。

国家顶级的科研机构,像创智学院、上海人工智能实验室、清华大学、上海交大等都是商汤大装置比较重要的客户和合作伙伴。

在具身智能方面,我们也做到了市场唯一完整的端到端的方案,并服务了非常多具身智能初创公司。

以下是一些具体的合作案例。

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

这是一家头部的电商公司,我们连续三年为其服务,能够提供端到端的解决方案,不仅在算力层满足需求,也能在模型推理、模型优化等方面提供支撑。

传统行业像铁一院,我们合作打造了交通行业首个国铁勘察设计多模态大模型,这是在一个高度传统、工程体系复杂的行业,真正实现了这个行业模型落地。

同时,这也给了更多行业一个信心,即使是高度复杂的传统行业,AI也有可行之有效的落地路径。

以上是我今天的一些分享,希望可以让大家更清晰地了解商汤大装置作为原生AI Infra的定位,以及我们整个端到端的解决方案能力,希望我们帮助到更多行业和更多合作伙伴,欢迎大家跟我们做更多的交流,谢谢大家!

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 12 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE

OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE 闻乐 2025-12-14 14:2...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
交大高金朱宁:经济学家视角下AI时代的范式思维转变 | MEET2026

交大高金朱宁:经济学家视角下AI时代的范式思维转变 | MEET2026

交大高金朱宁:经济学家视角下AI时代的范式思维转变 | MEET2026 西风 2025-12-13 12:5...
半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了

半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了

半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了 鹭羽 2025-12-13 22:43:25 来源...
美国视频生成老炮儿,入局世界模型

美国视频生成老炮儿,入局世界模型

美国视频生成老炮儿,入局世界模型 鹭羽 2025-12-13 22:41:00 来源:量子位 三连发:真实场景...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
为Token付费是一件很愚蠢的事情,用户应该为智能付费丨RockAI刘凡平@MEET2026

为Token付费是一件很愚蠢的事情,用户应该为智能付费丨RockAI刘凡平@MEET2026

为Token付费是一件很愚蠢的事情,用户应该为智能付费丨RockAI刘凡平@MEET2026 西风 2025-...