朱民:一个经济学家视角下的科技大变局

625次阅读
没有评论

朱民:一个经济学家视角下的科技大变局

图片来源@视觉中国

文|财经思享汇,编辑|刘亚杰

基于对ChatGPT的个人观察,我逐渐形成两个认知:

首先,要意识到ChatGPT、GPT或者大模型是科技和人类社会根本的颠覆和变局,这一点特别重要。之前,人工智能尚难以逾越的障碍就是图灵测试,机器暂时不能与人类完成自然对话;如今,我们普遍认定ChatGPT已经通过图灵测试,这是一个重要的里程碑。

与此同时,狭义人工智能正在走向广义人工智能。所谓“广义人工智能”类似于机器接近甚至超过人类智能,产生一种新的智能,这也是大模型和GPT对人们最大的震撼之一。

我们正在离开信息时代进入智能时代。在智能时代里出现的新机器,会产生和人一样的智能。一直以来,人类被视为最聪明且主宰世界的群体,如今机器有条件与人类智能共存,因此世界从根本上被改变和颠覆了。

举一个简单例子,我从北京来到广州想品尝粤菜,可以使用大众点评、美团、携程等一系列APP,最终还是需要我自己挑选。地点、口味、消费水平都不清楚,因此很难决策,因为我只能看到信息。

现在使用ChatGPT,可以让它推荐价格中等、环境理想、距离三公里以内优质的粤菜馆,马上就能得到答案。过去软件即服务,现在模型即服务,这是从信息服务时代到智能服务时代的飞跃。

今后,众多移动应用将会被彻底颠覆。试想,我们仍然习惯使用的APP还有存在的理由吗?大模型记忆如此之好,信息容量如此之大,能够轻松取代一切。

制造业同样如此。会有垂直类的GPT出现,统一完成研究、生产、管理、提效的全过程,人类可以通过控制GPT管理物理世界,我称之为人工智能的“脱虚向实”,从虚拟的服务走向物理世界,这将是一个长期变化的过程。

目前,距离大模型被广泛使用,还要面对两大难以逾越的关口:一是准确性,二是低成本。然而困难再多,都不意味着未来不会到来。因此我提议,只要关注未来、关注科技,从现在开始就要关注GPT和大模型。这不意味着马上投资大模型,形成良性的市场氛围需要时间,但提前关注非常重要。

惊艳火爆的ChatGPT

回顾历史,人类从1950年开始研究人工智能,过程跌宕起伏。

2016年围棋对弈AlphaGo战胜韩国选手,随即震惊全世界,出现了一个小高潮。之后进入低潮期,让很多人误认为人工智能暂停发展。然而ChatGPT的横空出世,让大模型走到台前。

ChatGPT是语言大模型,能够记住大量历史信息和人类反馈,同时保持对话的一致性以及连续性,并拒绝对话者不合适的请求,还能持续多轮对话。这是通过图灵测试的关键环节,此前从未有过。

曾经人工智能只能“胡说”,ChatGPT发展新的逻辑和方式,将“胡说”微调变成说“有理”的话,能够涌现新的想法,类似人的灵感。基于此,人工智能2C的商业场景被打开:可以生成文本、图像、视频、音乐等信息提供服务。

除了对话,ChatGPT还能持续完成多项任务,例如编写故事、创作短剧,甚至编码。利用人工智能,“码农”的工作可以被替代,新闻工作者也可以编写复杂的消息,文本处理翻译可以形成优美的文字,所以各领域广泛应用ChatGPT是好事。

人们还在惊讶ChatGPT的强大,ChatGPT4已经发布。相比上一代平台基于语言输出生成图片和诗歌等内容,新一代平台可以引入视觉能力。

用户可以输入“这张照片是什么”,平台回复“这是一个人在一辆移动的出租上,一个熨板上在熨一件衣服”,表述相当精准。

朱民:一个经济学家视角下的科技大变局

GPT-4对话场景还原

这里有另外一个案例,美国会定期举行法律考试,考生通过将获得执照,法学院毕业生普遍报考。这是一项难度很高的考试,通过率并不算高,可是有了ChatGPT4,美国法考通过率大幅提升至90%,可见下一个被替代的职业,很可能是律师。机器存储知识的能力,人类无法比拟。

因此,对于ChatGPT核心技术可作如此归纳:

第一个是具备多模态涌现能力,ChatGPT能够融合视觉、语言等多种识别能力,从而产生新信息;

第二个是形成多模思维链(Chain of Thought),机器不再只能完成重复工作,而是能够涌现新思想,有“顿悟”了;

第三个是结合多模态提示工程(Prompt Engineering) ,根据特定的目标和语境设计出一系列问题或任务,使用大模型生成有关主题或主题领域的连贯和有意义的文本;

第四个是机器通过人类反馈强化学习(Reinforcement  Learning from Human Feedback),可以融入人类输入的价值观与行为规范,在不断反馈中强化学习能力。

机器可以自我学习,不断发展;人类还要睡觉,可是机器不会。基于此,可以做出如下三点判断:

首先,ChatGPT已经通过图灵测试,完成一次决定性的跨越;

其次,人工智能能够击败人类智能,从狭义人工智能走向广义人工智能;

最后,在不断反馈与训练中,人工智能变得更加强大,可以在2C的商业场景中得以应用。

大模型和AI2.0

眼下,我们已经进入人工智能2.0时代,从信息时代离开进入智能时代。

人类经过长期积累进入信息时代,出现了信息爆炸、信息泛滥的情况。只是信息是机器生成的结果,是程序运行的结果,最终由人类主导,以人为主还是其主要特点。因此,信息时代程序和应用优先。进入智能时代,信息被机器和程序使用产生智能,数据让机器有了智能。

这是一个数据优先的时代,世界完全不一样了。

传统社会,人基于观察逐步形成学科。牛顿看到苹果掉落,最终万有引力定律通过数学方式得以表达。这是一个“科学→技术→产品”的转化过程。

智能时代,转化过程调整为“数据→知识→产品”的闭环,数据不断迭代更新,产品不断优化,世界就此改变。

全球比较大的争论,在于人工智能与人类智能是否为同一智能。目前,科学尚不能得出结论。如果它是新的智能,将会自主且不间断地学习成长,就像科幻电影走进现实。GPT发展如此之快,引发全世界上千名科学家的担忧,提议停止ChatGPT发展。

回到“变化”,之前的AI1.0时代软件是起点,码农成为核心资源;AI2.0时代数据中心是起点,成为新的财富。数据经过大模型处理后,同样可以输出动态的多模态信息。

我们以时间为横坐标,模型规模为纵坐标,ChatGPT形成的方程式已拥有1750亿个变量。随着时间的发展,模型变量已经积累到1万亿。不久前,阿里公开大模型参数,该数据已经提升到9万亿。

朱民:一个经济学家视角下的科技大变局

全球主流大模型发展情况

值得一提的是,大模型出现了“涌现”的新能力,类似于“灵光乍现”地产生莫名其妙的信息。比如对文本内容的新理解,或复杂的推理能力,或联系上下文的学习能力,过去这些逻辑能力并不存在,如今“涌现”出来。

“涌现”是非线性生成,而且参数规模越大,数字产生不同形式的组合,产生不同路径之后,交叉形成新的思路和逻辑,越能让机器变得聪明。哲学上,可以理解为“量变到质变”。

最有代表性的就是生成式AI。发出指令“开发一个云上飞的狗”,就能描绘出不同形态的结果。当我们以时间为横坐标,内容复杂度为纵坐标,未来能完成图像、音频、代码等复杂形式的任务,甚至可以形成视频。将来ChatGPT和GPT4会逐步进入三维物理世界,引发更多的质变。

目前,生成式AI能够根据文字指令生成图像,比如“雪天,湖边的樱花正在开放”(Cherry Blossom Near a Lake,Snowing),三台机器给出三种描绘。

朱民:一个经济学家视角下的科技大变局

此外,神经AI已经出现,通过机器模仿人类的脑部神经,形成神经系统、神经网络和思维方式,具备了更强的灵活性。

还有,系统已经出现因果推理,这是人类思维关键环节之一。人类的思维方式基于因果逻辑和归纳逻辑存在,机器可以完成归纳,甚至比人类的表现更好,如今出现因果,有了长远的进步。

“脱虚向实”:大模型的未来

当然,这些进步已不再只体现在虚拟世界,现实世界也在发生潜移默化的改变。

过去,我们在各种移动应用检索信息,文本、图像、翻译都是典型的应用,都是与机器互动;GPT4出现后,相关服务接入物理世界的生命科学、材料科学、技术开发、运营服务等众多领域。平台会自我学习和成长,具备更强的能力。

因此,学科研究的方法形成了本质的改变。

近100年来,学科研究的推进“既快又慢”。“快”是因为我们获得了众多成果,“慢”是因为很多的理论仍然难以用数学方程式完整表达。在学术研究领域,这被称为“维度的诅咒”。

爱因斯坦研究相对论基于四维的雷曼空间,以量子力学为代表的众多研究卡在四维领域已经很长时间。如今大模型出现,能够计算1240个维度空间、1万亿个变量的方程式,最终引发了科学研究方法的根本变化。

AlphaFold是蛋白质结构预测领域的专有大模型。目前,人类预测已知蛋白数量约为2亿个,人类已经将其中19万个蛋白质完成数字化,占总量的1‰。人类由蛋白质组成,科学界有信心完成全部蛋白质的数字化。

药物学研究,研究药物可以分为两大类:一类已经使用大模型,一类还没有。若归于后者,应该放弃研究项目了,因为两者效率根本不在相同档次。利用大模型,能将研发成本和生产周期压缩一半。

在物理学研究方面,美国正在推进超低温环境下的超导现象。如果能在常温条件下实现超导,《哈利·波特》中乘坐扫把的魔法将会成为现实。长期以来,相关领域难有突破,现在材料学提出可以加入镥元素,正是通过人工智能设备计算出的结果。

如今,材料科学研究都是领域内科学家牵头,数学家、材料学家、计算机科学家共同参与,搭建大模型经过迭代、模拟和运算,印证假设方案。每位科学家工作12小时时间已经接近饱和,可是机器可以不休止运行,从此材料学进入数字材料学时代。

此外,还有核聚变的研究。最近核聚变能够形成新一代的核能源,没有任何污染,一旦成功将完成能源领域的彻底洗牌。实现突破的原因,在于应用大模型,计算核聚变期间等离子在核磁圈顺利移动不碰壁的轨迹,从而避免能量衰减。

只要人类有新的想法,搭建出相对理想的模型,就可以通过机器不断演算、检验以及迭代,最终得到理想的结果。

值得注意的是,大模型在广泛应用后,正在建立专属生态。以ChatGPT为例,平台在各个领域引入19个合作伙伴,这些伙伴通过GPT实现智能化改造,并以插件形式为客户提供服务。今后用户可以只下载一个生态入口应用,就能体验整体服务。

所以未来大模型还有无限的想象空间,大模型生态也在逐渐成熟,不断扩张能力范围。

中美AI发展比较和美国科技战

在此背景下,中美之间正在展开一次技术的较量。

我们开发了一个数据库,归纳中美人工智能发展。数据显示,发表论文总数,美国超过中国,不过期刊发布论文数量,中国超过美国。可见中国人工智能的发展仍然走在前列,中国的增速为24%,美国是11%,追赶速度很快,英国、法国、德国、日本普遍较为落后。

朱民:一个经济学家视角下的科技大变局

中美人工智能期刊论文数

至于薄弱环节,中国缺少具有突破性和颠覆性的研究,被广泛引用的文章数量不多。2000年至2018年,美国有47篇被广泛引用的期刊,中国仅有5篇;2015年会议论文中被极高引用的论文数,美国32篇,中国7篇。

朱民:一个经济学家视角下的科技大变局

中美AI期刊论文被引数

人工智能专利被引用总次数上,美国占比64.1%,中国占比7.1%,低于日本的7.4%。可见日本专利数量(占比10%)低于中国(占比25%),不过质量仍然处于领先位置。

研究领域上,中国偏重计算机视觉研究,相关技术较为领先,不过语言领域研究较少,这与美国情况相反。普遍认为大模型是语言模型,未来是语言模型世界,还需要继续努力。

获取专利环节,过去20年中美国专利占总量的37%,中国占25%,日本占10%,2000年至2021年中国专利总数正在逐步赶超美国。

再看开源框架星标数量,这项指标体现公开市场的使用和赞助情况。该指数美国是41万,中国只有4.8万,仅为前者的10%,可见中国整体框架能力仍然不足。

值得一提的是,发表专利主体上,中国普遍为高校,其中北京工业大学、西安电子科技大学、华南理工大学较为领先,90%的专利由高校持有,已经超过阿里和华为等大型企业;美国的专利持有者多为企业,包括苹果、微软、甲骨文等。

朱民:一个经济学家视角下的科技大变局

专利转化为成果需要过程,这也侧面解释了为何中国专利多,引用并不多的原因。

还有人才,从事科研的人员中国人居多,美国人并不多,很多介于顶级架构水平和基础开发能力之间的人才都是中国人,ChatGPT多个模块开发团队带头人都是中国人。

谈到中美合作,2021年贸易战爆发后两国摩擦不断,学术合作也在减少。为扼制中国发展人工智能技术,美国出台《芯片法案》制止芯片厂商到中国建厂,禁止光刻机等先进设备出口到中国,人工智能产业首当其冲。

因此2022年来,美国也在加速提升竞争力,拉拢韩国、日本等地企业到美国设厂,对中国产生了一定影响,倒逼中国走自主创新之路。

竞争AI发展制高点

面对复杂多变的格局,中国需要做出相应调整。

先来看美国人工智能的发展,一直是国家在推进AI成长,政府机构不断举行会议形成文件,最终在2020年出台报告形成美国人工智能体系,可见政府的推动起到重要作用。

因此要建立国家科技创新体系,强调自主创新,尤其是充分发挥数据优势,加快数据资产化。未来数据会越来越重要,必须增加储备。同时开发大模型重要性日渐提升,必须坚持高水平开放与世界合作。

建议国家推进顶层设计,成立国家基金和国家级人工智能发展委员会。眼下发展委员会已经成立,国家基金也在酝酿中。

此外,还要坚持人工智能为科学研究服务。大模型的应用正在推动材料、生物、制造等众多领域的颠覆式变革,导致学科研究也在发生变化,必须顺应趋势进行调整。

值得一提的是,人工智能的发展还要与中国特色相结合。中国突出的特点是市场规模庞大,优秀人才集中。市场大能够降低整体成本,人才多能够集中力量科研攻关,这样中国能走在发展第一梯队。因此推进AI和产业发展,需要落实去中心化的学术研究和商业合作。

在构建商业生态方面,这不是一件容易的事,既不能忽视,也不能着急。大模型需要算力,背后的支撑力来自云平台,平台上还要有基础模型和开放模型,提供海量应用,这是一个复杂的工程项目。对众多投资者与企业家而言,他们很难独立构建完整的产业链,同时并不清楚自己的生态位,可是每向前一步都需要巨大的投入,少有企业可以承担。

朱民:一个经济学家视角下的科技大变局

中国大语言模型产业价值链

算力是重要环节,必须尽快提高。之前与一家芯片公司负责人沟通,即使面对《芯片法案》的压力,他的生意进展仍非常顺利。我们预计未来5到10年内芯片市场增速将维持在50%至100%,国家会建立算力网,将分散的算力集中起来。

还有未来的商业形态,需要借鉴ChatGPT。以大模型作为能力基础,以插件形式对外输出智能化能力,将成为未来商业运行的主要模式。生态企业必须考虑自身定位,如何实现智能化的底层改造。

在C端市场,可以通过订阅形式向用户提供服务。百度的模型就是放在云端,提供营销推广等各类服务。

眼下,中国已经出现“百模大战”的格局,各家企业都在搭建专有大模型。有能力建模的企业并不多,更多人需要考虑接入哪个平台,扮演怎样的角色。

部分大模型已经开始向应用渗透,包括知乎、淘宝、小红书等平台已经开始应用;通用搜索引擎也在开始探索转型,通过对话式AI建立全新的应用场景。

大企业已经开始在销售、客服、营销等环节应用相关产品,不过最重要的还是探索如何借助人工智能管理供应链。供应链不能高效运行,意味着大脑未能想清楚解决问题的思路,因此通过“超级大脑”管理供应链非常重要。

面对未来的发展,我认为有两点值得强调。一个是与国外通用大模型遍地开花的情况不同,预计未来中国会出现众多垂直领域应用型大模型。它们提供专有领域的服务,为客户提供智能化解决方案。目前,这些应用在金融、医疗、电商等领域出现。

金融领域Bloomberg已开发BloombergGPT,执行市场解读、投资决策、年报分析等日常工作。此外,资管、营销、风控等领域也开始接入相关服务,可见大模型在垂直领域拥有了施展才华的平台,这样的场景也会在中国出现。

另外一点,是中国必须重视数据资产化。我们认为,2025年中国或将成为世界最大的数据资产国,数据总量将超过美国。数据是最宝贵的资产,要把它变成真正的财富,这需要面对数据产权的定位、安全、估值和平台搭建等众多挑战。

确立所有权可以参考农业承包制所有权、使用权、管理权三权分开的成功经验,定价可参考拍卖、未来收益分配等模式计算实际价值,平台可选择搭建“数据公社”,让全社会共享数据收益。

在此过程中,政府的角色同等重要。数据成为个体资产,就需要立法保护。主管部门已制定众多政策,积累数据资产化的发展经验。

总结来看,人工智能从AI1.0进入AI2.0时代,从编程为主进入数据为主,从以人为主进入机器自主学习为主,都将为人工智能逐渐“脱虚向实”,服务物理世界提供巨大的推力。发挥制度优势,完善顶层设计,加快自主AI研发,借助市场规模优势,构建打磨型生态,成为我们必须肩负的使命。

或许我们不能急于投身其中,但必须关注大模型的发展,思考生态走向成熟时如何改变业务和规划未来。

【内容节选自“开新局,智未来”2023恒昌高端财富论坛,演讲者:中国国际经济交流中心副理事长、国际货币基金组织前副总裁朱民】

 

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy