拿了火星图片的华为云盘古大模型,这样在地球落地

10次阅读
没有评论

拿了火星图片的华为云盘古大模型,这样在地球落地

盘古大模型5.5正式发布

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

一个大模型有了火星图片,能做什么?

瞧,火星图片在大模型的加持下,可以生成多视角图片/视频,构建出一个4D空间

拿了火星图片的华为云盘古大模型,这样在地球落地

而且啊,这还是业界首个支持点云与视频模态同时生成的大模型:

拿了火星图片的华为云盘古大模型,这样在地球落地

在空间漫游视图下,也是可以做到全局3D一致,可以实时交互漫游:

拿了火星图片的华为云盘古大模型,这样在地球落地

并且全局光照编辑和动态互动效果生成也是不在话下:

拿了火星图片的华为云盘古大模型,这样在地球落地

那么这个要上火星的大模型,到底是何许AI也?

不卖关子,它就是华为云今天全新发布的基于盘古多模态大模型的世界模型

这还仅仅是其中一隅,在华为开发者大会2025上,华为云对五大基础模型都来了一波升级,包括:

盘古NLP大模型盘古多模态大模型盘古预测大模型盘古科学计算大模型盘古CV大模型

拿了火星图片的华为云盘古大模型,这样在地球落地

那么盘古大模型5.5究竟在能力上提升了多少,我们这就深入了解一波。

国内领先,全球追平

我们先来看下新升级的盘古NLP大模型。

其中有两项新技术特别值得关注——Pangu DeepDiver低幻觉新方案,可以说是此次自身能力大幅提升的“杀手锏”。

首先是Pangu DeepDiver

简单而言,DeepDiver以Search Intensity Scaling(SIS)技术为核心,极大地提升了LLM和搜索引擎的交互效果。

因为传统的LLM搜索增强训练环境(如Wiki)过于“纯净”,缺乏真实互联网中的噪声与信息冲突,这就会导致模型在面对复杂实际问题时高阶信息检索和推理能力不足。

这种受限的训练数据和环境,让大语言模型难以学会根据实际情况动态决定何时何地进行搜索,也无法掌握根据需求调整搜索深度和频率的技巧。

但借助SIS,模型就能根据问题的难易程度,动态调整搜索的频率和深度,而不是勉强接受验证不充分的答案。

因此,研究团队认为,只有在真实的互联网环境中,利用真实的网络数据进行探索式训练,才能让模型真正具备高阶的信息检索和推理能力。

而Pangu DeepDiver正是通过在真实互联网环境下进行探索式训练,让模型学会根据问题难度动态调整搜索频率和深度。

WebPuzzle和多项基准测试中,7B规模的DeepDiver表现出与671B DeepSeek-R1相当的能力。

这一成果验证了该技术的有效性,也使得盘古NLP大模型在开域信息获取能力上实现了质的飞跃,与其它大模型形成了明显的差异化优势。

其次是低幻觉新方案——多层次幻觉防御体系+闭环质量保证体系。

拿了火星图片的华为云盘古大模型,这样在地球落地

在数据层方面,作为解决大模型幻觉的基础,华为通过控制数据质量、多样性、知识含量及领域相关性减少幻觉诱因。

具体包括数据清洗预处理(去重、降噪、提升纯净度)、数据去重与高质量样本选择、知识密集型文本筛选、行业数据合成及权威知识库构建。

在模型优化层,华为基于行业幻觉样本,通过RL驱动进行幻觉抑制对齐训练。

从事实准确性、逻辑一致性、溯源可靠性来评估思考过程,从结果准确性、内容一致性、用户需求匹配度去综合评估输出;并采用 “幻觉惩罚为主、结果/偏好奖励为辅” 策略,按 “事实校正→逻辑增强→风格优化” 路径分层强化训练。

在搜索增强层(RAG),华为从多维度消减幻觉:

  • 检索环节自研召回与精排模型(超越国际SOTA),创新SFT增强技术构建抗噪声训练数据;
  • 轻量化集成搜索规划算法(时延仅为主流方案10%);
  • Table RAG弥补结构化数据问答短板;
  • 支持多模态输出(突破文本限制)。

在推理优化层,则是通过多种方式实时干预生成过程,包括:

解码策略优化(优先高置信度输出)、约束解码(如Chain-of-Verification转化可验证子问题、Step-Back Prompting抽象原则指导推理)、温度调度动态调节随机性、结构化提示框架引导输出结构,以及通过Self-Consistency多路径推理投票、Token熵值分析检测不确定性等自我反思验证机制。

除了多层次幻觉防御体系之外,华为的低幻觉方案还包括人机协同、数据飞轮持续学习、评测中心、行业中控等环节,形成闭环质量保障体系;通过持续监控与优化、回归测试等,确保模型在实际应用中不断提升性能,维持低幻觉率。

那么在这两套技术组合拳的加持之下,效果又如何呢?

以通用领域为例,华为Pangu Ultra MoE 718B深度思考模型在知识推理、开放式对话、工具调用、数学、代码等领域的开源评测集中,均取得了国内领先的成绩,达到与全球主流大模型持平的能力水平。

拿了火星图片的华为云盘古大模型,这样在地球落地

这得益于其独特的架构设计和高效的训练策略,模型在昇腾NPU平台上全流程开发,通过系统级模拟器进行架构搜索,实现了计算效率、存储约束与通信开销的良好平衡,在预训练和RL后训练阶段均展现出卓越的性能。

一句话概括,那就是——不依赖国外的芯片,我们也有实力打造出世界一流大模型!

已经扎进千行万业

华为云此次升级并非纸上谈兵,而是已经把盘古大模型应用到大量的行业场景中。

例如面对复杂的农业科学问题,中国农科院与华为云合作,共同打造了一个农业科学发现大模型

这个大模型能够精准推荐水稻株型改良的基因编辑位点,将方案设计时间从数月缩短到数周,同时保持极高的预测准确性。

拿了火星图片的华为云盘古大模型,这样在地球落地

农业科学发现大模型集成了知识计算引擎、数据分析引擎,以及大模型驱动的智能交互等核心模块。

实现从“AI读文献筛选候选基因”到“AI分析多组学数据验证基因功能”,再到“AI辅助设计实验方案”的全流程数智化闭环。

相比传统的方式,它对育种带来显著变革,集中体现在株型改良、流程优化与效率提升三个方面。

性状改良上,中国农科院利用大模型对水稻材料进行优化,改良后的水稻株高与常规品种相比降低约25%,抗倒伏能力大幅增强,同时产量不受影响。

流程优化和效率提升方面,农业科学发现大模型在基因研究领域实现“数据驱动—智能预测—精准设计—高效验证”新范式。

例如,针对水稻的某个重要基因,大模型可以通过预测编辑不同位点后基因功的变化,智能推荐多个高潜力编辑靶点。在农业科学早期研发阶段可有效降低研发试错成本,并显著提升种质创制效率。

再如盘古预测大模型它采用业界首创的Triplet Transformer统一预训练架构,具备三大核心优势:

  • 多源数据融合能力:可将不同行业的异构数据(如工艺参数的表格数据、设备运行日志的时间序列数据、产品检测的图片数据等),统一转化为三元组编码格式;
  • 高效处理框架:在同一架构内完成多模态数据的联合处理与预训练,显著提升模型预测精度;
  • 强泛化性优势:通过跨行业、跨场景的统一训练,大幅增强模型在不同工业场景中的适配能力。

目前,盘古预测大模型已在水泥、钢铁、有色金属、供热等多个工业领域落地应用,通过为客户提供工艺优化与系统寻优解决方案,切实推动工业生产效率提升与智能化升级。

拿了火星图片的华为云盘古大模型,这样在地球落地

具体而言,海螺集团采用华为云盘古预测大模型,使用海螺集团100多个厂全部的生产数据进行预训练,形成海螺M-MoE熟料强度预测大模型,实现了在所有不同厂区、不同产线都能达到85%以上的准确率。

这就使得海螺集团在生产的过程更加稳定,产品质量得到了有效保障,同时降低了能源消耗,为企业节省大量成本。

还有盘古CV大模型,这次华为云发布的全新MoE架构的300亿参数视觉大模型,是目前业界最大的视觉模型,而且全面支持图像,红外、激光点云、光谱、雷达等多维度、泛视觉的感知、分析与决策。

另外,通过跨维度生成模型,能够构建各个工业场景中稀缺的泛视觉故障样本库,极大提升了业务场景的可识别种类与精度。

拿了火星图片的华为云盘古大模型,这样在地球落地

例如中国石油便基于此打造了昆仑大模型,在勘探开发、炼油化工、装备制造等100多个专业领域开展人工智能深度应用。

在装备制造领域,攻克输送管气孔、裂纹等亚毫米级缺陷识别难题,缺陷识别效率提升40%,人工强度降低25%。

而且华为云凭借在30多个行业、500多个场景的丰富落地经验,还沉淀了深厚的行业知识(Know-How);通过其ModelArts Studio大模型开发平台,提供完备的AI工具链,包括基础及行业大模型、预训练和后训练语料、数据工程工具集、模型训练工具集、行业裁判模型、行业评测平台等。

在华为云看来,企业不必重复造轮子,不必从零打造自己的企业大模型。于是,华为云以工程化的方式,向客户提供了一条便捷、高效地通往行业智能化的路径。

在数据准备阶段,华为云构建了行业数据工程管线,以一站式数据工程平台为依托,集成了数据清洗、增强、标注等丰富的算子及工作流。

这使得行业模型训练所需的数据能够快速、高质量地准备就绪,为模型训练奠定了良好基础。

模型增训环节,华为云提供了开箱即用的行业模型增训工作流,涵盖行业基础模型、SFT配比经验、行业优化算法等关键流程与经验参数。同时,针对不同场景,还提供了相应的行业奖励模型,覆盖主流行业规则偏好的专家评分机制。

在同等精度下,行业模型增训工作流将训练周期与成本降低60%,助力客户高效、低门槛构建高质量的专属大模型。

在模型评测环节,华为云打造的行业模型评测中心发挥了重要作用。

该中心沉淀了覆盖金融、政务、油气、矿山等8大行业、具备三层评测体系的评测集,并提供行业裁判模型。

客户在进行模型调优时,有了明确的标准和依据,实现用AI训练AI,不断将专家评测经验融入评测模型中。

拿了火星图片的华为云盘古大模型,这样在地球落地

整体看下来,华为云正以 “技术创新+模型升级+行业深度落地” 三轮驱动,让 AI 从实验室走向生产线,成为推动千行万业智能化的核心引擎。

这不仅是技术的胜利,更是用智能重构产业价值的时代答卷。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy