闭门对话实录|那些离大模型最近的人们,到底都在干些什么

746次阅读
没有评论

本文是5月31日品玩举办的“模型思辨——国内大模型生态研讨会”的圆桌对话实录,经整理编辑发布。对话嘉宾包括品玩内容负责人王兆洋,阿里巴巴达摩院创新业务中心技术负责人谢延、商汤科技大装置事业群战略业务负责人冯硕、APUS AiLME研究院首席专家张旭和微软M365团队赵毓佳。

闭门对话实录|那些离大模型最近的人们,到底都在干些什么圆桌对话《垂直大模型的产业应用挑战》

王兆洋:我们圆桌的核心就是两点:聊一些真问题,和打破信息不对称,首先请各位嘉宾做一个简单的自我介绍。

谢延:大家好,我是来自阿里巴巴达摩院创新业务中心的技术负责人。今天来是代表阿里巴巴达摩院,代表通义大模型。我工作十多年,亲身经历了从弱人工智能时代到强人工智能时代的变革。几年前我做的都是AI原子能力,包括语音识别,NLP,现在到了大模型时代,AI计划速度突飞猛进,不仅需要深厚积累,还要不断学习、不断努力,才会比别人在认知上更高一点,所以我自己还是感觉很庆幸的。

冯硕:我是商汤科技的冯硕,加入商汤科技以来一直负责业务线,很高兴和大家交流。

张旭:我是APUS AiLME研究院的首席专家,主要负责多模态大模型,就是把文本、图像、音频、视频打通,希望和大家一起交流。

赵毓佳:我是来自微软的赵毓佳,在微软M365团队产品研发部门,今天想和大家学习和分享自己的看法。

王兆洋:各位所在的公司都有一些明星产品或者模型基础设施,今天在座的无论是投资人还是参与这个行业的人,从外部都会非常好奇,这些产品产生的过程是怎样的?因为它们背后涉及到越来越复杂的东西,包括大家所熟悉的用户体验设计、产品交互,包括大模型带来的新的技术能力,OpenAI做的最厉害的地方可能就是工程优化,这些产品都是复杂的工程实现的过程。各位可以结合自己的实际产品开发的情况,简单分享一下各个环节是如何配合的。

谢延:阿里开始做大模型不是最近才开始,几年前就已经在布局大模型的相关研发和投入,因为ChatGPT的火热带动了这一波浪潮的加速。个人在ChatGPT之前就做过很多对话产品,从目前的技术形态来看颠覆最快的就是对话产品和搜索引擎。以前我们有一个非常明确的分工和Pipeline,角色非常清晰,但这几个月技术是按日迭代的,原有的工种或者角色的工作边界都变模糊了,大家做事情也都更扁平了。现在大家都在追求一个字,就是快。硅谷的开源社区日新月异的迭代方式,一个人加上一个大模型创新产品,每天都可以看得见。目前在国内的市场中,不管是做模型还是上层做应用的,都在追求一个快,每个人都可以学到很多,所以对以前的分工协同其实是颠覆状态。

王兆洋:因为要快,所以分工和边界可能模糊了,三个月前大家都是同一起跑线,现在就是看谁能够更快地变成全栈。

谢延:因为从软件的角度来看AI开发的门槛是被大大降低了,每个人都能做出自己的AI应用,基于开源社区拉个开源项目学习代码就可以用代理和Langchain(浪链)模式来做应用,这些都不是难点。客观说,中国在基础模型上跟ChatGPT还有差距,但我们正在加速追赶,也在探索结合企业需求做垂直场景大模型。这个事情没有大家想像得那么难,任何人都可以打破自己的边界。

闭门对话实录|那些离大模型最近的人们,到底都在干些什么阿里巴巴达摩院创新业务中心技术负责人

谢延:“现在大模型时代是一体化,大模型本身具有超强的理解和生成能力,以及多语种和多模态能力。基于这样的模型,以前做的工作都需要重新定义。基座部分解决好了,就需要考虑上层应用怎么落地,如何解决行业模型的场景优化问题。现在也许看不清楚客户的需求是什么,只要不断摸索和学习,和客户不断共创的过程中,就做出一款可以跨行业的爆款产品。”

冯硕:商汤是2014年成立的,一直在做人工智能的技术创新研发和产品市场突破。2019年开始去做自己的大模型,今年4月发布了大模型产品。刚才提到的产品是两类:一类是AI,一类是大模型。AI产品是典型的以需求为导向的前端,后端就是以能力为导向,二者通过工程化的手段结合在一起变成产品输出出去。大模型完全不一样,其实就是把自己后端的能力直接进行相对简单的功能化包装,ChatGPT就是重新定义了这种标准。为什么?其实跟标准的产品开发不一样,区别在于就是把能力直接输出。各位都有讨论ChatGPT这类大语言模型或者图像生成模型有各种各样的可能性,但具体在哪里不是很清楚,怎么落地需要一步一步走下去,怎么才能最快地找到哪个场景能够真正有更强烈的需求、更快地落地?现在大模型产品模式其实是一种尝试,就是让大家去试,每个行业找到自己的需求。现在很多邀约的企业都要在这个领域做自己的事情,因为我们的能力和资源有限,如果能够跟上就回到产品开发。某种程度上讲,现在大模型的这种方式可以说是标准的产品制作方法中的用户需求搜集。

王兆洋:也就是过去面向市场推出产品的逻辑是先要去教育市场,或者向大家展示这些东西,但今天大模型已经变成共识,变成反过来市场的需求会主动直接反馈过来,你们可以在此基础上去做更精准的判断了。

冯硕:刚才谢总也讲到快,怎么才能快?就是直接发布出来让大家感受,需求最强最多的行业就是最快的行业。

王兆洋:就是过往所说的试错过程,现在逻辑也变了。

张旭:刚才主持人提到OpenAI可能是工程上的领先,其实工程上的领先就已经非常不容易了。我们从头把大模型做起来,发现这个过程还是相当不容易的。举个例子,现在看到国内各家大模型虽然号称接近ChatGPT,但其实在数学(Math)和编码(Coding)能力上跟ChatGPT还是有很大的差距的;理论上说,用思维链可以解决数学和编码的问题,但怎样准备思维链的训练数据,就是OpenAI不公开的秘密了,所以我们可以看到理论上大家都懂,但实际的差距还是比较明显。前面主持人也提到全栈,我们的观点,在AI时代想做全栈还是比较难的; 大模型就像AI时代的操作系统,有了操作系统以后确实能够极大地降低大家开发AI应用的门槛,所以行业里会有分工,有人做操作系统,有人做上层应用。打个比方,以前手机都是功能机的时代,要开发功能机的应用成本是比较高的;后来进入到智能机时代,因为智能机有安卓、iOS这样的优秀的操作系统,大大降低了开发应用的成本,所以智能机时代有了非常繁荣的应用生态。今天处于AI时代,包括阿里、商汤和我们公司都有推出大模型,其实也是希望能够做好这样的操作系统,降低开发者开发应用的门槛,一同促进整个行业的进步。

闭门对话实录|那些离大模型最近的人们,到底都在干些什么APUS AiLME研究院首席专家

张旭:“在AI时代想做全栈还是比较难的。大模型就像AI时代的操作系统,有了操作系统以后确实能够极大地降低大家开发AI应用的门槛,所以行业里会有分工。今天处于AI时代,我们都有推出大模型,也希望能够做好这样的操作系统,降低开发者开发应用的门槛,一同促进整个行业的进步。”

王兆洋:所以APUS的思路还是服务好这些过往就在自己这里的开发者,要提供给他们一个大模型的操作系统。

赵毓佳:新的时代,AI大模型产品和以前有一个很大的不同,以前我们会告诉用户我们是干嘛的,就像计算器的目的就是用来算数的,今天经过大模型对市场的教育和能力的提升,变成一个开放的产品,产品给到用户以后,用户告诉我们他们想要干嘛。整个产品定义的过程就是怎样更清楚地告诉用户一个产品是干嘛的,应该怎么使用,变成我们怎么用最高效的方法搜集用户的信息,告诉我们他们想要干嘛。这些是产品定义的区别,可能导致原来的分工方式发生改变。刚才提到我们会更快,包括角色的模糊,不仅仅是产品经理跟设计师、程序员的变化,更多的是原来有些团队专门来做关联和相关性搜索的优化,是不是也可以做一些前端的工程?原来做前端工程的团队一样可以去尝试做大模型的应用,组与组之间的职能会发生模糊。这些在微软比较快的体现就是变成千帆竞渡,每个团队都可以去探索和思考如何应用大模型,所有人都可以打破这个边界,肯定能够看到大模型给这个组织工作的分配和合作带来的颠覆。

闭门对话实录|那些离大模型最近的人们,到底都在干些什么微软M365团队

赵毓佳:“每个人都要做应用,最长远的未来会实现真正的去中心化,不需要别人开发用什么产品,我用什么就自己做。”

王兆洋:上午我也在和一个大模型相关的公司的创始人去聊,大家可能以为大模型改变的是产品的交互,但其实改变了的还有公司和市场需求之间的交互、用户和产品定义者之间的交互,包括微软、阿里、商汤,内部都是处在过往Pipeline分工重新打破和重组的过程。

赵毓佳:对,现在确实是一个比较必然的情况。

王兆洋:以前可能是只能某个部门获取这些信息,现在是全部打通,就像这种大型平台企业里面有各种不同的产品,每个团队都更了解自己的产品,现在又更直接掌握了用户在怎么使用,自主权也会更多。

赵毓佳:过去的分工可能更多的是基于特定产品和技术栈的专有技术,现在知识与技能已经变得民主化了,这可能是改变的根本原因。

王兆洋:品玩也一直在关注大模型,这里有一个很有意思的落差。今天我们举办的会议也叫大模型,你也可以叫它生成式人工智能甚至通用人工智能,名字是有很多,看起来所有人都在忙一件事,这已经是共识了,但像我们的嘉宾说的,现在每天睁开眼,GitHub或者Twitter都有层出不穷新的应用、新的开发的东西出来。其实这就是各种各样的技术路线在不停地尝试,甚至不停打破一些基本认知的过程,比如大家认为大模型这个东西最重要的就是Transformer,现在也看到有人说它没有必要,或者把这个换了也可以做得更好。你们是在一线听得到炮火的人,从你们感受到的,到底所谓的大模型是共识,里面哪些东西真的是确定的?

赵毓佳:我觉得相对最普遍的就是大家都认可大模型或者这一批AI一定是会带来产业革命,就像最早骆总分析的,要么就想去吃别人的食物,要么就被吃掉,这是一个非常普遍的共识。之前周总也有提到,每个人都能够做自己的AI产品,越来越多地会有很多模型、很多垂直领域的应用同时存在,甚至每个人都要做应用,最长远的未来会实现真正的去中心化,不需要别人开发用什么产品,我用什么就自己做。

张旭:我觉得这个共识分为两个层面:一个是行业内的共识,我跟AI相关的同仁们一起交流,大家都坚信AI是一场新的工业革命,一定能够带来生产效率极大的提升,我们做的工作也是为了人类工作效率的提升,能否把以前人类繁重的日常工作替代掉;但另一个层面,我跟一些传统行业的企业家们交流,他们会有质疑的声音出来,并不觉得AI有多大的效率提升,觉得好像AI这个东西和之前的区块链等概念没有太大区别,对他们的行业没有太大价值。所以今天我也跟各位同行一起交流下,看能不能找到一个好的答案。

王兆洋:两位提到一个很有意思的,就是这是一场革命,我也问过很多其他企业家,也是这样表述。但我们知道,人类历史上所有的工业革命没有一次是在工业革命爆发的当时,身处其中的大家就喊着工业革命来了的,而都是后来定义的,那为什么这次如此快地认为已经处在这个历史的定位?有没有思考过这个问题?

张旭:我觉得这是一个特别好的问题,我是这样理解的,当初电力革命时代,刚开始的时候,其实也是有很多质疑的,我上中学的时候还学过一个段子,就是法拉第在一个博览会上展示他的圆盘发电机,当时有个贵妇人问法拉第,这个东西有什么用呢?法拉第反过来问她,“夫人,一个刚刚出生的婴儿有什么作用呢?”再看当年美国西部修建铁轨、通火车的时候,刚开始很多西部牛仔也很看不上火车,说火车跑得还没有我的马快。当然今天已经没人会去质疑发电机的价值,质疑火车的价值了。但工业革命刚开始的时候,当时也是两种声音并存,火车这个行业的人一定会觉得这是一场新的革命,但骑马的人不这么认为。

赵毓佳:刚才张总讲的特别好,就是有一个前提条件,这是咱们这个行业的人的共识。其实能够看到其它的行业或者比较传统的人觉得不是,大模型的研发才刚开始,充分发挥其潜能确实也还是需要时间。就像是第一次工业革命刚刚开始,大家知道蒸汽机特别厉害,但到底能够用来干嘛?大模型也是一样,现在可能还是处在这样一个阶段。

冯硕:其实共识的话从技术、产品、行业的角度来看都是不同的,很难定义,因为这个题出得很大,思考的方向也是多元化的。我个人认为可能是几百年不遇的,这里最深刻的在于具备了智能的雏形,没有办法预测未来的发展。今天大模型落地还是有很长的路要走,不管是眼前大家如火如荼地做这件事情。第一个落地的某一个或者某几个行业会在哪里?到底是用哪种技术?具体什么方法?其实这些都不确定。今天大模型落地的这条路还有很多关键要素需要解决,但也是一步一步来走,包括安全的问题、合规的问题、伦理的问题、产品快速把成本降下来的问题,关键就是大模型作为通用模型,怎么和垂直行业真正结合,发挥真正的作用?其实还是有很多事情需要去做。

谢延:形成共识需要时间。传统的 NLP 任务是一个预训练模型加一个下游任务的精调工作模式,不管是机器翻译还是意图理解,其实已经形成了一种Pipeline,但上限可能就是百分之八十五。现在大模型时代是一体化,大模型本身具有超强的理解和生成能力,以及多语种和多模态能力。基于这样一个模型,以前做的工作都需要重新定义。基座部分解决好了,就需要考虑上层应用怎么落地,如何解决行业模型的场景优化问题。中国和美国在整个软件SaaS市场差距比较大,现在讲的云计算产业还都停留在基础的IaaS和基建层面,针对上层的SaaS应用对中国市场应该是需要有一个蓬勃发展的机会,形成百家争鸣的状态。刚才讲过现在也许看不清楚客户的需求是什么,只要不断摸索和学习,和客户不断共创的过程中,就做出一款可以跨行业的爆款产品。

王兆洋:刚才大家提到范式的改变,虽然范式这个词本身的历史定义都十分模糊,但深层次的技术路线确实看起来带来新的机会,接下来我会给各位每个人提一个问题。我想先问谢总,过往也有一些基于AI对话的产业,尤其是在阿里的体系都已经是面向市场的东西,现在换一种新的技术可能性和技术路线,可能技术上是有些新的潜力,但它一定意味着商业模式或者商业可能性就比原来的技术路线下大很多么?看起来好像技术变了,但对行业似乎没有变。

谢延:阿里的对话产品做得还不错,从 IDC等行业报告的数据来看,小蜜已经做到了行业领先位置,大模型出现以后小蜜一定会升级甚至重做,张勇说过所有的产品都值得重做一遍。客户层面是否愿意为这个产品买单,从我目前接触的情况来看回应是积极的,如果我们只停留在上一代的对话系统,知识库+FAQ(常见问题解答)的模式已经过时了,运营成本巨大,知识结构复杂,所以利用大模型强大的理解能力会带来全新的产品体验。刚才讲到大模型时代的产品形态简化,产品的边界也会慢慢模糊,以前小蜜服务于客服市场,提供垂类场景的对话系统,但未来可以在小蜜里做出更多的东西,包括摘要、写作、编码等。未来整个企业的工作链条不一定需要在每一个场景购买一款产品,可能一个产品就可以解决企业工作流程中的很多环节。因此,原有的存量客户一定会有新的发展,外部还有更多的广阔空间值得探索。

王兆洋:接下来提给商汤。冯总负责的大装置本身是要做低成本、高效率的AI基础设施,但是在大模型越来越高的参数,越来越贵的训练成本下,低成本这件事情还成立吗?或者说今天大模型时代需要怎样重新定义什么是低成本?

冯硕:商汤大装置定义就是低成本、高效率的AI基础设施,所以对成本的追求是不变的。大模型确实可以解决很多问题,一个大模型相当于原来十几个模型甚至更多模型的融合,带来的好处就不聊了,真正的问题就是训练成本是几个数量级的上涨。要是自己从头做一个数据中心,时间上需要两年左右,钱上需要上亿甚至更多。我们是通过集约化的方式把数据中心建立起来,也有很多专业人员在里面致力于在每个环节降低成本,整个设施的目的就是通过专业化降低成本。

AI就是算法、算力和数据。算法的开源是最关键的,Google开源模型以后GPT才会出现,商汤自己也有这样的算法,可以让更多新进来的从业者互相学习和鼓励的过程中快速发挥自己的认知。现在也有很多大模型用户遇到算法的问题,我们马上会开发一个专家库帮助大家解决。我们有5000P的算力,IaaS和PaaS都在进行大力优化,如果不进行规划的话可能效率就是百分之五十甚至更低,经过不断的追求和演进,目前已经把训练效率达到理论上的极致。不管是时间成本还是金钱成本,其实都是非常强的。最后就是数据,现在大模型的数据动辄千亿甚至更高,都是从哪里来?现在GPT4面临的问题就是全网数据都已经被消耗光了,起始数据就是3PB,每个月数据是80TB。最后可用量百分之零点五都不到。不管是带宽成本、存储成本、人力成本还是知识累积成本。这一切的目的都是为了降低使用成本、进入成本、时间成本、金钱成本,更多地把注意力放到想要做的事情上面。

闭门对话实录|那些离大模型最近的人们,到底都在干些什么商汤科技大装置事业群战略业务负责人

冯硕:“算法的开源是最关键的,我们通过集约化的方式把数据中心建立起来,也有很多专业人员在里面致力于在每个环节降低成本,整个设施的目的就是通过专业化降低成本,更多地把注意力放到想要做的事情上面。”

王兆洋:所以是两方面,一是低成本并不是说绝对值的低,像黄仁勋说的,价格涨了两倍但可能效率提升了一千多倍,买到就是赚到。二是,不用重复造轮子,我做了基础设施,你只要专心做自己专业的东西就行。

冯硕:每个企业的资源都是有限的,没有必要从头到尾都自己做。

王兆洋:APUS历史上也是以灵活的产品为大家提供服务,今天看起来,AI方面也是同样的策略,你们迅速推出了一系列的产品,你们怎么看大模型浪潮下,快速地给用户提供可以使用的产品这件事的重要性?

张旭:我们一直坚信大模型一定会是一场工业革命,但这个过程可能会很长。现在AI还是处于非常早期的阶段,有点像1996年的互联网,那个时候上网是非常慢的,今天大模型输出文本要等好久。那个时候是56KB,多数网站都是很少的图片,需要提前告诉才会下载,今天AI生成图片也要等很久。我们这个时候需要快速部署能够满足当前用户需求的应用,帮助大模型尽快落地,因为大模型还需要几年的发展。我们现在是在做样板应用给到这些伙伴,后面如果伙伴觉得还不错,能够帮助抢占市场,我们就可以把市场让给伙伴,以后会给伙伴提供这样的基础服务、基础设施。

王兆洋:就是你们先打样,用起来以后再基于真实的情况开发,最终还是希望用你们的基础模型。

张旭:我们的定位就是大模型就是操作系统,我们就是做操作系统的。

王兆洋:然后是毓佳,微软基本就是这波浪潮站在浪尖的公司,今天有机会听到从内部视角的分析,你们内部怎么看微软这一次的成功?有人说上一波是微软+英特尔,这次是微软+英伟达,微软总在那儿。

赵毓佳:首先感谢对微软这次成绩的肯定。过去的几次科技浪潮我们其实都能看到微软的投入,MR/VR、元宇宙,到现在的大模型。今天大部分大模型在2B的应用都有一个难点,就是企业搜索,但这方面微软已经布局多年了。大家最早看到的大模型场景都是和办公、提高效率相关,这跟微软天然的生态非常符合。

王兆洋:公司准备的好,那公司怎么去内部动员一线的人?

赵毓佳:从我个人的感受来看,公司各个产品团队一直保持一种可能会被新的技术和产品颠覆的危机感,例如说现在大模型和AI的能力如此强大,我们的客户还需要使用现在的Word、Excel来做一个很复杂的报告吗?必须学习适应和使用大模型,不然就可能错失我们在现有市场的优势地位。

王兆洋:最后一个问题,也是今天很多人谈到的,焦虑的问题。论文,新产品,新消息每天爆发式的出现,大家可以分享一下现在自己是用什么方式解决信息焦虑?

赵毓佳:作为行业从业者,我会更多去尝试如何利用AI来帮助我获得更多的信息,今天有一千条新闻,到底有哪十条跟我更相关?自己可以搭建或者利用第三方的工具,帮助我们更快地筛选信息,把时间花在最重要的信息上面。然后就是多跟同行交流,大家聊的过程中就会发现我知道的信息、我的理解跟你不一样,这个过程就是特别好的信息交换和获取。

张旭:我是做技术出身的,所以比较喜欢用技术手段解决问题。自己写了一个小工具,然后把每天的热门新闻都排一遍,用AI总结一下今天都有什么。还有一个经验,就是如果真有重大的新闻,那肯定各个群里面都会很多人转发,所以我的经验,发现有些内容如果连续两个群里面都发了,那我就知道这是重大新闻了,会特别去关注下。剩下的,就是每天例行的看一下AI总结的新闻要点。

冯硕:大家都在技术的前沿阵地,市场看法经过浓缩以后再拿出来,除此之外可能还有一点非常关键,就是要保持求知欲和好奇心。

谢延:站在阿里和我个人两个角度:互联网大厂可能会有转身慢的问题,我们对于大模型的投入很多年,但就怕起个大早赶个晚集,希望同学们能够摆脱工作中的束缚打破原有的边界以发展为目标快速迭代,希望阿里能够把这件事情做得又快又好。站在我个人的角度,现在这个时代每个人都可以去尝试,任何人只要有想法就可以去实现,我个人还是非常焦虑的,还是不断推动自己多学习新的东西。因为看到GitHub开源社区的活跃程度,发现自己之前做了这么多年的积累可能一夜之间都被颠覆了,也许哪天会从某大学冒出来一个学生基于开源框架搭建一套创新产品,第二天就在市场秒杀了你,所以一定还是要保持学习。

王兆洋:不光是听到自己身边的炮火,还要听到远方的炮火。品玩也会做好信息焦虑解决的角色,欢迎大家关注我们每天提供给大家的重要信息。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy