观点交锋
中关村国家自主创新示范区展示中心里人头攒动,不少人甚至干脆挤在会场旁边的过道里站着听讲,这样热络的景象让你很难相信这是一场纯粹学术会议,然而它在6月9号和10号两天一直持续出现。
智源大会已经走到第五届,这场由智源研究院主办的人工智能大会,从一开始就定位于专业高端,因此你不会在大会上看到任何商业性宣传和为了广告商特设的噱头论坛,哪怕当今涉足人工智能领域的公司每个都鼎鼎大名。
所有参会的嘉宾都是带着洞察和观点——换而言之,干货来的。
这次出席智源大会的嘉宾,光是图灵奖得主就来了4位,包括Geoffrey Hinton、Yann LeCun、Joseph Sifakis和姚期智,此外还有张钹、郑南宁、谢晓亮、张宏江、张亚勤以及Stuart Russell、Max Tegmark等,每一位都在人工智能领域如雷贯耳。而风头正劲的OpenAI联合创始人、CEO Sam Altman也在10号上午的AI安全与对齐分论坛上发表了演讲。
“AI内行顶级盛会”,智源大会的定位名副其实。而大佬们的观点交锋则让智源大会的学术性和知识分子气质更加彰显。
Sam Altman显然是最受热捧的明星,他发表主旨演讲和随后与智源研究院理事长张宏江的一对一对话吸引了无数目光,他本人随后也在Twitter表达了对智源大会邀请的感谢。
Sam Altman和智源研究院理事长张宏江对话
Sam Altman的发言围绕AI安全领域,呼吁国际协同应对AI快速发展带来的潜在威胁,Sam Altman认为十年之内人类就将拥有十分强大的AI 系统(AI system)。
ChatGPT 在全球爆火让Sam Altman的发言颇有分量,但这并不意味着大家都一边倒地认同OpenAI的发展道路。在9号上午的开幕式演讲中,图灵奖得主也是Meta首席AI科学家Yann LeCun直接表达了几乎完全相反的观点:自回归模型没有规划、推理的能力,要想抵达通用人工智能AGI,则不仅应该在神经水平上模仿人脑,在认知模块上也要参照人类,Yann LeCun给出的答案是所谓世界模型。
Yann LeCun在智源大会上发言
而另一位最近因为从谷歌离职而颇受瞩目的大佬,被誉为深度学习之父的图灵奖得主Geoffrey Hinton同样在演讲中给出了自己关于目前AI发展的看法——人工神经网络很快将会超越真正的神经网络,人工智能对世界危险程度和紧迫性甚至可能超过气候变化。
Geoffrey Hinton在智源大会发表演讲
类似这样的观点交锋在这两天近百场报告和圆桌讨论中屡见不鲜,它们无不围绕着有关人工智能最前沿的命题,最火的当然是大模型,除此之外开源和安全也是热议的焦点。
整个中国你再也找不出第二个机构能组织如此高规格的会议了,正如智源研究院黄铁军院长所说:智源研究院是在中国开展人工智能研究国际合作的第一选择。
那么针对上述这些热点议题,智源做了什么呢?
多箭齐发的智源大模型系列
智源研究院院长黄铁军
黄铁军院长在开幕式上宣布了智源在过去一年所取得的阶段性成果。悟道3.0大模型系列进入了全面开源的新阶段。包括了悟道·天鹰(Aquila)语言大模型系列、天秤(FlagEval)开源大模型评测体系与开放平台以及悟道 · 视界视觉大模型系列。
其中,悟道·天鹰(Aquila)语言大模型支持商用许可协议,满足国内数据合规需求。在基础模型之外,还包括AquilaChat对话模型与AquilaCode(文本–代码)生成模型。根据智源研究院副院长兼总工程师林咏华的介绍,在综合中英双语的多种客观及主观评测的结果(22个评测集,随机抽取2万多个评测题目),AquilaChat-7B在仅使用50%训练数据的情况下,目前已经超过同等级的国内外主流开源模型;在综合了信息分析、跨语言理解、判别评价、知识运用、修改润色、风格生成、代码生成、创意生成、安全与价值观等的中文主观评测下,AquilaChat-7B目前达到GPT-4约70%左右的能力。
天秤(FlagEval)大模型评测体系及开放平台是为了方便全方位评估基础模型和训练算法的性能而搭建的,最终目标是实现对基础模型、预训练算法、微调算法在自然语言处理、计算机视觉、音频和多模态四个方面测评的全覆盖。
天秤(FlagEval)构建了“能力–任务–指标”的三维评测框架,目前已经有超过600个评测维度,包括22个评测数据集在内,一共有84433道题目。
天秤(FlagEval)大模型评测体系及开放平台是为了方便全方位评估基础模型和训练算法的性能而搭建的,最终目标是实现对基础模型、预训练算法、微调算法在自然语言、计算机视觉、语音、多模态及认知能力五个方面实现测评的在全覆盖。
悟道 · 视界视觉大模型系列系统化解决了当前计算机视觉领域的一系列瓶颈问题,包括任务统一、模型规模化以及数据效率等,包括:在多模态序列中补全一切的多模态大模型 Emu,最强十亿级视觉基础模型 EVA,一通百通、分割一切的通用分割模型,首创上下文图像学习技术路径的通用视觉模型Painter,性能最强开源CLIP模型 EVA-CLIP,简单prompt(提示)即可视频编辑的
vid2vid-zero 零样本视频编辑技术。
这些大模型的推出凸显了智源着力打造的大模型进化迭代流水线,这条流水线让大模型在更多数据和更多能力的助力下源源不断成长,持续迭代、快速升级,最终无论是技术研究团队还是产业开发团队,都将从这条迭代流水线的进化中受益。
除了一系列这次首发的新模型,智源还升级了在今年年初推出的FlagOpen大模型技术开源体系,从模型到并行加速技术、推理技术,再到硬件测评和模型测评,最后是数据分析、清洗和标注工具,智源FlagOpen平台旨在打造全面支撑大模型技术发展的开源算法体系和一站式基础软件平台。
特别值得一提的是在数据集方面,智源已经开源了首个大规模、可商用的中文指令数据集COIG,第一期开放了总计19.1万条指令数据;二期正在建设最大规模、持续更新的中文多任务指令数据集,整合了1800多个海量开源数据集。
观察智源在这次大会上推出的系列成果,不仅有各种模型,更有关于大模型核心生态和产业链上下游的各种工具。
尽管智源的大模型在性能指标上已经达到了相当先进的程度,但是在林咏华的眼里,这还不是智源最重要的使命。
智源研究院副院长兼总工程师林咏华
“和大家比谁的模型更大、更强,这种追求不是智源的使命。我们的使命更偏底层,数据处理技术、数据汇聚、算法评测、模型能力评测,当然还有开源。这种偏基础的工作,是智源正在做而且目前应该只有我们在做的事情。只有我们在做的事情,就应该坚持下去。”林咏华说到。
这听上去几乎有些“理想主义”,但智源研究院从成立伊始几乎就是理想主义的代名词。
攀登人工智能高峰从来是一场长期主义的战争,在智源规划的路径里,它不仅包括以大模型为代表的信息智能,还有基于强化学习和物理身体的具身智能以及根据神经生物学仿照人脑的类脑智能三种。大模型出现的突破性进展第一次向人们展示了通往AGI通用人工智能的可能路径,但具身智能和类脑智能同样值得关注——谁能确保下一次的突破不是来自它们?
和这项充溢着理想主义与长期主义色彩的最高目标相比,一项大模型评分的优劣与否就显得渺小了起来。智源有着更远大的愿景。
人工智能理想主义
仅仅训练出一个得分颇高的大模型是远远不够的,更重要的是训练大模型所用的算法和技术。
飞快迭代的技术会让每一个模型都最终变得过时,但如果最终建立了一个丰沛深厚的科技土壤,让技术的飞轮能在其中飞速转动,不断推出先进的算法,联动整个产业链上下游有效降低模型训练的成本,实现对AI安全高度的理解与可控,那么人工智能的前景势必变得更为坚实有力,与这个宏伟的愿景相比,推出多少个大模型,或者某个具体大模型的评分高低这样的问题就显得渺小了。
这种宏伟愿景,正是智源研究院所追求的。
2021年3月,智源研究院第一次使用了“大模型”这个词,揭开了人工智能发展的崭新篇章。在短时间内,悟道大模型迭代到了第三个版本。
作为平台型、非营利的研究机构,智源力图营造人工智能的创新生态——大模型是资源耗费巨大的系统工程,如果一项技术被智源研究、验证并最终开源,那么整个产业都将随之受益。
智源正是这样做的。打造大模型基础基座,通过开源开放来促进整个大模型科研创新,也加速大模型的产业落地。为了这个愿景,智源甚至做了许多在外界看来有些“费力不讨好”、甚至舍近求远的事。
比如智源的大模型采用的是商业许可协议,由于从算法到数据,智源都耗费巨大的资源实现了完全合规,因此企业能够放心采用智源的模型实现商业化。
众所周知,大模型目前在版权领域有诸多争议,原因之一就是用来训练的数据其来源良莠不齐,智源的底层合规能力正好帮助企业规避了这一最大风险点,其正面影响是不言自明的。
再比如,智源发布的许多开源项目,从AquilaCode-7B 生成模型到天秤(FlagEval)开放评测平台,都同时支持英伟达和国产的寒武纪、昆仑芯等多种芯片架构,这意味着开发者甚至不需要调整自己的硬件设备就能直接使用它们,智源通过对多种架构代码和模型的开源,推动着芯片领域的发展和创新。
为人工智能下一个十年打造大模型的新Linux生态,这是智源在大模型领域对自己的定位,开源是其中非常重要、颇为有勇气,也是同业界许多人看法相左的一步。但智源的信心颇为坚定,开源开放既是人工智能生态建设的必然选择,也是推动科技加速创新、产业全面升级的必由之路。
智源在这条道路上已经走了五年,这份有关人工智能的浪漫愿景,吸引着同样理想主义的人才。作为中国最顶级的人工智能研究机构,智源拥有近百位顶尖人工智能专家组成的“智源学者”阵容,而智源社区更汇聚了逾12万AI业内人士。,这让智源研究院的科研实力在全球范围内广受赞誉。
而每年一度的智源大会则已经成为中国乃至全球范围等级最高的人工智能巅峰盛会,过去四年有超过500多位以图灵奖得主为代表的顶尖AI专家在大会上发表演讲、参与讨论,来自三十多个国家数万名专业人士注册参会。
智源会在大会上发布相关领域的最新成果,关于人工智能的观点交锋也从北京传遍世界,一届届大会过去,围绕着智源搭建的平台,中国茁壮生长的AI生态圈也蔚然成型,这为中国参与大模型之战提供了最强的助力,中国突飞猛进的大模型事业,智源正是其中或许不为人所熟知、却异常重要的“隐秘支柱。
这何尝不是对理想主义最好的报偿。