2023年4月26日,第六届数字中国建设峰会之“有福之州 对话未来——鼓楼论见 算力时代”论坛在福建福州举办。论坛由中共福州市鼓楼区委、鼓楼区人民政府主办,新华社国家重点实验室战略支持,福州市鼓楼区商务局、鸿博股份、北京英博数科科技有限公司和钛媒体协办。
英博数科总经理周韡韡表示,ChatGPT是AI作为新一代生产力变革下的生产工具,就像现在每个企业都已经离不开互联网一样,不久的未来所有的企业都将完成数字化升级,英博数科作为一个新兴的公司敢于挑战ChatGPT和大模型训练的底气来自于自身算力的储备和在GPU云协同工具的开发部署,作为国内少有的提供专业AI训练的算力服务平台,在英博数科的智算平台上已经汇集了在国内外均处于行业领先地位的无人驾驶、大模型训练方面的客户,英博数科期待看到这些客户的落地应用尽快面世,让大家直接地感受到算力为产业赋能、数字化转型带来的加速和改变。
论坛现场,周韡韡还就算力发展对人工智能和每个人工作生活的影响等问题,与英博ChatGPT小e进行了对话,小e是与OpenAI同源、英博自行开发语料,利用北京·AI创新赋能中心的冗余算力训练而成的小参数AIGC聊天机器人,目前已经参与到英博数科的各类可行性研发报告整理、文案创作等工作中,并面向部分公共用户开放免费测试使用。
英博数科总经理周韡韡
以下是周韡韡演讲实录,略经钛媒体APP编辑:
各位嘉宾,各位行业大咖,大家上午好!我是英博数科CEO,也是北京AI创新赋能中心的负责人周韡韡。首先在这里要感谢福州市鼓楼区区委、区政府,感谢这次大会给我们新兴企业这么好的展示平台和承办会议的机会,再次感谢各位领导的支持。
我们今天的主题是算力时代,算力是最近这个阶段在我们生活中高频出现的一个词语。究竟什么是算力?算力能给我们普通人的生产生活带来什么改变?我想并不是那么多人都能像展院长那样讲得如此清楚。于是带着这样的疑问,我希望今天借福州有福之州这块宝地,与英博数科的虚拟管培生小e聊一聊这个问题。
小e是英博数科在与ChatGPT2.5的同源环境下、使用了Megatron训练框架、利用我们北京AI创新赋能中心的冗余算力和自行研发的语料,去训练出来的一个算是小参数AIGC内容生成式的聊天机器人。前面这一串话或许很抽象,那我们不如现场直接请小e来介绍一下自己:
小e现场演示画面
这看似很简单的问题,其实是目前国内鉴定ChatGPT真伪的照妖镜,因为有很多企业只不过是接入了美国OpenAI的端口,就号称自己掌握了这个技术,所以聊天机器人在面临这样问题的时候,通常会回答我是OpenAI,或者来自谷歌,但还好,我们小e知道它是来自英博数科的AI助理。看来对人类的终极问题“我是谁“的这个问题,小e回答的还OK。
其实我们今天在这里,应该说是国内的第一场以现场直播,而不是录播的形式,来展示企业对ChatGPT研究的实际应用。
我们再问一下小e你怎么理解算力,怎么看待算力时代下英博数科的挑战与机遇。这个问题有一点长,而且这个问题里面有复合性以及一系列的叠加性的问题。我们来看一下小e的回答是什么样。
小e现场演示画面
我们称ChatGPT叫做AIGC生成式,就是强调从训练的开始就使用深度学习和神经网络,像我们人一样,对同一个问题,多次的询问是可以给出多个答案的,这个是非常大区别于我们常见的智能客服。在此我们不如就这个问题再问她一次,看她是给一样还是不一样的答案。小e,请问你如何理解算力时代下英博数科的挑战和机遇?
小e现场演示画面
我们看到她给出了一个略有不同,但有很高相似度的答案,这说明我们的小e目前已经具备了一定的创造力,但肯定还存在继续训练和改进的空间的。因为时间关系,我们今天在这里对小e的展示就暂时到这个段落,在这次数字中国的主展区是有小e的展台的,感兴趣的朋友可以到展区与小e做更多直接的互动,我们也非常欢迎大家通过扫码的方式关注英博数科的公众号,在里面可以在后台去申请小e的免费测试帐号。
相信通过简单的展示大家就可以感受到为什么ChatGPT在当下如此的火爆。在过去二十年里,互联网从端到端的时代进入到移动互联网时代,再到现在元宇宙的时代,是涌现了大量优秀应用的,可是为什么这些应用不能像ChatGPT一样给我们带来如此高的关注度和震撼感?我觉得这里可以借用合作伙伴的一个描述:这个技术从出生之后到现在的100多天的时间里,几乎每天都在带来一个对自己革命性、颠覆性的升级提升,从来没有过任何一款应用能够像ChatGPT一样,给每个C端用户带来如此铺面而来的、直观的冲击力和震撼感受。
看过刚才小e的回答之后,我在这里也给大家分享下,小e已经是参与到英博数科目前很多的内容文案创作工作中,比如两周之前我们给另外一个福建当地政府提供的智算中心建设规划,在一周内1万多字的文案出了5个不同的版本,就是在小e的帮助下完成的,这对我们普通人类工作人员来讲的话会是一个很大的挑战。我们可以看到用自然语言方式与我们沟通的AI已经不再是工具属性,而更是一个陪伴属性。我们可以看到在不久的将来,这种访问链接一定是会被陪伴所取代,我们常见免费的广告一定是会被优质的付费内容所取代。有了ChatGPT之后,我们每个人就等于拥有了一个无处不在,而且是无所不知的随身助理,一个人加上一个OpenAI这样类型的ChatGPT,就可以完成一个项目,甚至可以开办一个公司。这样的生产效率提升,可以说是又一场工业革命的开始。
当然,这样颠覆性技术的研发是有非常高的难度系数的,有多难?即使像脸书这样的企业,哪怕是努力再努力,投入了那么多人力和财力之后,似乎做出来的应用也不是那么理想。是什么样的原因能够给英博数科这样新型的公司有这种挑战大模型、挑战自然语言处理、挑战多模态的勇气和底气?应该是算力,是目前我们北京AI创新赋能中心是国内少有的可以提供专业AI训练,特别是针对大模型的GPU训练环境的公共算力服务平台。
其实在去年我们投建的时候是面临一个抉择的,究竟是选择数字基建先行还是选择应用的集成先行,在做选择过程中如果做数据基建势必面临非常重度的资金投资,如果是做集成则有可能是投资更轻,且带来的市场关注度也会更高。带着这个疑问,我与我们的顾问,也是刚刚的演讲嘉宾数字中国研究院的展院长做了一次沟通,他一句话就点醒了我,他说“如果算力不自由,则数据无意义,更多的应用就无法落地,无法产生“。所以,当时我们就毫不犹豫选择了重度投资之路,先投建了北京AI创新赋能中心,现在不到一年时间回过头看,再由ChatGPT和大模型引爆市场对算力的渴求,尤其是对高端人工智能算力渴求的市场的当下,这个选择毫无疑问是非常的正确。而且算力的重要性也越来越被更多人所接受。在之前清华大学、浪潮,和国际上IDC研究院所推出的报告中,算力指数已经成为继ChatGPT指数之后另外一个全球公认对区域经济发展的衡量指标,大家都认为在区域经济中每一元钱对算力的投入可以带来GDP三到四元钱的增长,这也是为什么在最近数字中国建设规划中政府明确指出对于夯实算力基础设施以及算力基础设施建设的程度被列为各地方政府明确的业绩考核的指标,因为这一种通过市场化运营的算力是真正能够帮助到AI创新型企业的发展、真正助力到地区产业数字化转型的。根据我们这一次协办方钛媒体之前的媒体报道,我们国家在过去若干年,对算力和数据中心的市场投入超过8万亿,可是我们市场仍然面临着一个算力短缺的问题,这究竟是什么原因?因为在以往我们的算力大部分投建的数据中心都是以温冷数据的存调中心为主,就是我们常使用的贵州云、苹果云这样的平台,在这样的平台存储型的算力对AI当下的发展的满足程度非常的有限。应该说市场上的算力短缺是一个相对的概念,其实是指在AI上的算力短缺,这种短缺情况还在逐步加剧:市场上的算力需求是每三到四个月可以翻一倍的情况,而根据我们AI创新赋能中心平台上的实际反馈,我们的客户模型的规模几乎是每个月就会增长3到4倍的情况。
在这样的情况下,我们是要把之前的这些存储型的算力通过数据中心的升级改造变成更多可以直接转化成AI时代生产效率的算力。我们北京的100P算力在一期投建完成之后,短短的时间内已全部售罄,目前我们正在计划一个30到40倍的规模扩容,而且这一部分的算力,80%以上现在都已经被售出了。
讲到这些的时候会有在座嘉宾好奇,算力需求如此火爆,你为什么还有冗余的算力去训练小e?我觉得这个问题也是市场和很多调研机构在跟我们私下沟通的时候经常会问到的问题。这里可以向大家介绍我们接下来工作中的重中之重:我们即将推出的搏博云服务(BOB Cloud)的解决方案。算力需求是不会一直处于一个峰值状态的,就像在电力系统中,我们会对电力进行削峰填谷和平衡调度,这种方式在算力的服务上也同样适用。我们在这个阶段搏博云上首先要满足的是通过善用弹性计算,来进行一个对GPU的云调度,例如在一台5P GPU算力的服务器上,就可以实现56个实例同时并行训练。在下一个阶段,根据我们了解到的大模型客户的一些痛点,这些大模型客户在面对GPU计算需求的时候会把任务放在不同的云平台上进行,比如放在阿里云一个模型,同时另外一个是放在亚马逊云的,这也是为了他们本身的项目安全。在这样的情况下,跨云的沟通成为了一个刚性的需求,而且人工智能的算力在进行GPU训练的时候也要面临大量的CPU对数据的清洗和管理的工作。在这个时候如何协同CPU和GPU的高效协同和训练效果,就成为我们客户的一个必须的刚性需求,这个也是我们接下来的搏博云需要解决的跨云沟通,和在GPU和CPU上协调训练的需求。
目前在北京AI创新赋能中心和搏博云的平台上,已经有包括例如自动驾驶、量化交易训练等这样的大模型训练,这些全球顶尖解决方案客户的入驻已经带来了大量实际应用。我们也特别期待通过我们对算力的扩容,通过我们加强自己的交互的能力,能够早日实现平台用户和更多创新型企业的算力自由,早日看到他们能出现对标工业时代像飞机、轮船、火车这样的跨时代的大模型应用的出现,早日真正实现我们国家企业的算力自由,也早日实现我们英博数科的企业梦想:汇聚全球顶尖科技,助力中国产业数字化转型。
以上是我的分享。谢谢各位!
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App