7月20日下午,由北京市委网信办指导、首都互联网协会主办、品玩承办的首届“青年思享会”青年先锋论坛活动在京成功举办。论坛以“人工智能的机遇和挑战”为主题,邀请了来自中国科学院的专家学者,以及百度、奇安信、科大讯飞、向量数据库Zilliz、云测数据、映宇宙、易观分析、中科闻歌等企业的青年先锋,共同探讨在人工智能的背景下,大语言模型的技术路径、商业化落地、产业化发展和生态系统建设,力求“全景式”解锁大模型的真实面貌,“立体式”呈现大模型未来图景。百余家互联网企业及相关单位代表,近300人参加活动。
北京市委网信办相关负责人表示,“我们要以《生成式人工智能服务管理暂行办法》为准绳,明确生成式人工智能服务安全要求,认真做好申报安全评估、加强数据安全和隐私保护等工作,规范操作、划好底线、守住安全。希望大家在企业的发展过程中强化主体责任,既要把握人工智能等新技术、新应用带来的机遇,营造创新生态;又要保持正确的大局观、发展观、安全观,重视防范风险。”
如今人工智能技术和应用还面临哪些挑战,又有哪些创新发展方向以及需要防范的风险?各企业代表和专家学者就上述问题做了精彩的分享。
企业转型升级,大模型带来三大核心价值
AI技术已经赋能到千行百业,也为企业的数智化升级带来突破。易观分析高级分析师陈晨在《中国通用人工智能的现状、前瞻、机遇和挑战》的主题演讲中表示,大模型能够给企业带来的核心价值主要有三个层面: 第一,可以以业务驱动的方式来拥抱AI;另外是可以降低AI开发上手的门槛;第三,用户体验的层面不仅仅是面向客户用户的层面,也可以帮助提升企业员工的体验,有助于中后台的赋能。她指出,“原本的信息化数字化时代,做企业转型升级的时候,可能会出现一些数字化的洼地,但大模型有了之后,能够解决我们原本需要用数据化的力量去动用解决的问题。”
对于如何规划大模型和AIGC的应用,陈晨认为主要有四个方面:第一个是以业务为核心,围绕业务规划AI大模型的应用推广;第二,是数据资产的沉淀跟管理,用自身的专有的数据与大模型的能力更好的结合实现,从通才到专才的过程;第三是建立相应的风险的管控的机制和安全合规的应用AI能力的规范;第四是做好组协同进化,保障企业的人工可以拥抱AI。
突破创新,探索大模型训练新思路
大模型的研发面临多重技术挑战,百度AI技术生态总经理马艳军在其分享《知识增强大语言模型:走向通用人工智能的突破与创新》中提到了大模型研发过程中的三大挑战:第一是模型体积大,训练难度高;第二是算力要求非常高;第三是数据的规模非常大,并且常常质量参差不齐。以大语言模型为例,在研发过程中需要靠监督精调、检索增强、知识增强等技术来确保整个大语言模型的质量、客观性等一系列能力。
中国科学院计算机所多语言大模型“百聆”负责人冯洋在题为《在语料和模型之外,如何有效训练大模型?》的分享中也提到了大模型训练面临的问题。她表示大模型的训练成本和部署成本巨大,许多公司无法承担。同时模型规模的扩大还面临两大挑战,一个是算力上的挑战,根据摩尔定律,大模型算力的增长速度远高于晶体管的增长速度。另一个是模型的能力并不是和模型的参数量是呈线性关系,所以与付出不见得成正比,冯洋表示调查发现低质量的语料到2030年差不多用完,高质量预料和部分类型的数据也将耗尽。
为此她探索了新的解决方案 ——多语言大模型“百聆”,在指令微调阶段将英语与其他语言对齐,以交互式翻译任务为核心进行指令微调训练。她表示,“我们要提升大模型中文生成能力,需要分两步。首先需要收集大量的语料,去提升基座模型的能力,接下来还需要构建一些中文的指令,来提升大模型在中文上和人类对齐的能力,以及完成任务的能力。”
合理监管为重要前提,AI浪潮下需守护数据安全
合理的监管也是保障人工智能技术健康发展的重要前提,同时也是保护数据安全、避免信息滥用和引导行业良性竞争的关键措施。奇安信、映宇宙等参会企业分享了各自在大语言模型网络安全方面的实践,提出了一些值得借鉴的方法和策略。
奇安信集团首席安全专家翟胜军在《关于人工智能2.0对网络攻防格局影响的讨论》的主题演讲中提到,“把以前整个安全的基础做成,健全符合数据安全的基础安全设施,把制度、管理体系到位,保证整个安全落到实处。我希望我们发展新技术,不应该因噎废食,但在使用新技术带来更高效果和好处的同时,也应该关注新技术带来的负面作用,尽量地减少负面作用。”
映宇宙集团高级合规专家游涛发表了《人工智能与企业合规的赋能与边界》的主题分享,他表示,“对于AI失控的管理才是最重要的。要加强对人工的培训,怎么样让更多的人员了解到AI的问题,做数据的标签将是核心。同时要建立内容举报机制,让我们一起监督人工智能的语言和内容,比较重要的是要关注内部的培训,适应AI环境下的人文的素养。”
共建生态,推动中国大模型迈向高质量发展之路
高端对话环节,嘉宾们以“打破壁垒,打造中国大模型健康发展的生态系统”为主题展开讨论,品玩创始人兼CEO骆轶航担任对话主持人,科大讯飞开放平台AI服务市场部总经理陈贤华、向量数据库Zilliz联合创始人郭人通、中国科学院自动化研究所副研究员、“中科闻歌-中科院自动化所”联合实验室主任孔庆超、云测数据总经理贾宇航分享了精彩观点。
品玩创始人兼CEO骆轶航表示,“中国大语言模型的生态,我们是全球开源生态最积极的推动者,我们每个人都是这个生态的建构者。”
科大讯飞开放平台AI服务市场部总经理陈贤华表示,“我们在大模型的时代,除了讯飞这样的平台,把平台里面有的技术给到大家之外,对于大家更多的借鉴的意义还是需要从场景的落地、务实的角度出发。所有的创意需要有人去用,需要对自己的切身的体验和学习工作有提升,或是起到降本增效的作用,这非常关键。”
向量数据库Zilliz联合创始人郭人通提出,“我们要把大模型的生态做好,把模型作为核心,围绕周边的系统做建设,特别是系统的基础软件这块,在行业我们才能够真正的落地创造价值。”
云测数据总经理贾宇航表示,“数据实际上是数据的质量决定了大模型的最终的结果的好坏的一个非常重要的作用。我们做的事情是以数据标注为核心,以标准化数据接口的方式,跟任何的企业的数据库打通,完成原始数据到标注数据中的快速积累,包括模型训练、模型仿真。”
中国科学院自动化研究所副研究员、“中科闻歌-中科院自动化所”联合实验室主任孔庆超分享道,“我们的定位是以人工智能的技术去驱动认知决策,希望用集成各种各样大模型的能力,去继承各种各样的行业,去发挥大模型的真实的行业的效应。”
首届“青年思享会”青年先锋论坛活动的圆满落幕,也预示着AI大模型正朝向健康合规的方向发展。AI大模型正在成为赋能千行百业、引领产业变革的关键力量。未来,随着人工智能加速发展,行业企业将通过系统创新、坚持开源开放,加速产业生态繁荣发展。(本文首发于钛媒体APP,作者 | 李简)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App