AI 为什么会有创造力?范畴论刻画大模型创造力的来源

741次阅读
没有评论

AI 为什么会有创造力?范畴论刻画大模型创造力的来源

导语

AI 可以聊天、写作、画画,可以研究生物、物理、数学,人们在焦虑AI 终结人类历史的同时,也不禁好奇:AI 为什么会有创造力?AI 的创造力是一种“真正的”创造力吗?清华大学交叉信息学院助理教授袁洋认为,AI 大模型的创造力是一种同象(isomorphism)类型的创造力,完全可以通过计算的方式表达,并不神秘。更广泛的,其他类型的创造力在范畴论中也有相应刻画。从这个角度,人类的创造力,其实也就是各种各样的计算而已。
为了探索数学与人工智能深度融合的可能性,集智俱乐部联合同济大学特聘研究员陈小杨、清华大学交叉信息学院助理教授袁洋、南洋理工大学副教授夏克林三位老师,共同发起“人工智能与数学”读书会,希望从 AI for Math,Math for AI 两个方面深入探讨人工智能与数学的密切联系。本读书会是“AI+Science”主题读书会的第三季。读书会自9月15日开始,每周五晚20:00-22:00,预计持续时间8~10周。
本周五晚(9月22日)的分享将由袁洋老师介绍使用范畴论刻画大模型的能力边界,主要解读他的最新论文 On the power of foundation models详情见文末欢迎感兴趣的朋友报名参与!

研究领域:人工智能,神经网络,AI 大模型,创造力,范畴论,同象AI 为什么会有创造力?范畴论刻画大模型创造力的来源袁洋 | 作者梁金 | 编辑

在回答这个问题之前,我们可能先要回答一个更重要的问题:AI有没有创造力?
几年前,我和朋友们讨论这个问题的时候,大家往往认为AI只能作为一个高级工具存在,擅长的是重复简单机械劳动,不可能有创造力。但ChatGPT出现以来,人们对AI能力有了更多想象,所以往往更关心诸如AI是否会毁灭人类这种生死攸关的大问题,对AI的创造力反而不那么关心了。
但相比世界毁灭这种宏大而又不可捉摸的未来,也许AI的创造力反而是一个值得仔细分析的课题。当然,在此之前,我们还要回答一个更基本的问题:什么是创造力?
这个问题已经被哲学家、心理学家、教育学家等多个领域的专家研究了很多年,我原本没有资格置喙。但是已有的相关定义和结论往往偏文科一些,今天我想从范畴论的角度给出一个更明确的定义。这个工作一样基于我ICML’2023发表的论文,详见《大模型的能力边界在哪里?来自范畴论视角的答案》。不过那篇太偏技术了,我们今天讲得soft一些。   

从神经网络到大模型


2012年Alexnet问世的时候,我正好是个一年级的博士生。那时的神经网络给AI圈带来了很大的冲击,人们第一次意识到这个东西要比传统的机器学习算法强大很多。
但那种冲击更多是方法论层面的。虽然大家对神经网络的效果感觉很惊讶,但是普遍还是认为它只是一种效果好一点的机器学习工具罢了。后来的一些AI大事件,我也能用类似的方法自圆其说。比如AlphaGo之所以能赢,是因为它算力强,加上神经网络强大的图像分析能力,很正常。比如星际争霸AI玩得溜,是因为AI微操厉害,人手可点不过它。比如 AlphaFold 算蛋白质厉害,那是因为人类本来就不擅长算折叠这种高维任务。
但是Dall-E的出现,给了我很大震撼。当你输入一段文字之后,Dall-E可以帮你绘制一幅相应的图片。一个广为流传的例子是“牛油果椅子”,即:
输入:an armchair in the shape of an avocado. (一个牛油果形状的椅子)
输出:

AI 为什么会有创造力?范畴论刻画大模型创造力的来源

当时的我非常震惊,这种震惊来源于一种对于未知的恐惧。我非常确定,我之前从来没有见过这样的图片,也就是说,世界上不存在牛油果椅子这样的设计,或者至少不存在这么多种牛油果椅子的设计。也就是说,这里面大部分的图片,在模型的训练数据集中是不存在的。这对于统计学习理论框架来说是极为糟糕的一件事情:模型到底为什么能在几乎没有见过类似作品的情况下,完美地画出这些图片?据我所知,传统的理论框架无法解释这件事。
而这,就是我们今天要谈的创造力。我认为,如果能设计出一种世界上从来没有的牛油果椅子,模型一定是拥有了创造力

   

什么是创造力?


但是在谈论这些模糊不清的概念的时候,我们一定要小心。很多人会反驳说,这个不算是创造力,真正的创造力是XXX。我想,创造力可以分为很多种,而我们今天只是谈其中的一种,这种创造力我称之为“同象”。同象对应的英文是isomorphism,一般被翻译成同构。但是在一些更强调内部复杂关系的地方,我觉得同象更合适一些。
狭义的同象,就是给定一句文字描述,能够生成与之对应的图像。这个时候,文字的象和图像的象是一致的。但是,什么是象,什么是一致呢?
用范畴论的语言来说,象是一个projective limit——但是我们今天不要讲那么抽象。简单来说,象就是一个大的对象的内部各种小对象之间关系的集合。打个比方,当我们分析“一个牛油果形状的椅子”这句话的时候,我们心中有好几个小对象,比如“一个”,“牛油果”,“形状”,“椅子”。它们彼此之间都有关系,比如一个是修饰椅子的,牛油果和形状是连在一起的,它们一起修饰椅子,等等。
当我们分析一个牛油果椅子的图片的时候,图片中一样有一把椅子,椅子是牛油果形状的。图片中的这些特征彼此之间也有关系,而这个关系本身,与文字中的 “牛油果形状”,还有“椅子”的关系,是能够对应起来的。这个时候,我们就说图片中的象,和文字中的象,是一致的。
更一般地来说,我们可以定义任何两个模态之间的象的一致性。我们只要明确两个模态中的基本元素(例如之前的文字、图像特征)有对应,元素关系也有对应,就得到了一对“同象”。
同象算不算一种创造力?我觉得算。用贴切的图像表达文本信息,或者用合适的音乐表现场景氛围,或者制作恰到好处的表情包表达情感,这些都是构建跨模态的同象对象,是拥有创造力的表现

AI 为什么会有创造力?范畴论刻画大模型创造力的来源

最新的 DALL·E 3 生成的人形秋天树叶组成的乐队
   

AI为什么有创造力?


不过,为什么模型可以拥有这种能力?光从统计学习理论的角度不容易解释清楚,毕竟模型能够生成大量之前从来没有见过的图片。但是从关系的角度就不难理解这件事情。我们很早就知道,模型拥有理解各个模态中基本元素的能力。不论是生成出一些猫猫狗狗的图片,还是分辨出图片中动物的类别,神经网络都可以做得很好。
在基本元素的基础之上,我们还需要刻画元素与元素之间的关系。这些关系的集合,加上基本元素本身,也就是象,可以使用一个高维向量来表达——这件事情对神经网络来说也并不困难。但是对于多个模态,模型可能会需要使用不一样的高维向量表达不同模态的象,因此“同象”的创造力就变成了一种高维向量的对齐。

在这个情况下,模型为了展现从模态A到模态B的创造力,只需要简单三步走:

1. 表达模态A中的象,记为向量νA

2. 将νA与模态B中的高维向量νB对齐,计算出νB

3. 计算模态B中的象,使其的表征等于νB
从这个角度来看,同象类型的创造力,是完全可以通过计算的方式表达的。当然,有朋友可能会说,这个本质不就是CLIP算法么?似乎我只是换了一种通俗的说法,把CLIP的算法又描述了一遍而已。
事实并非如此。如果我们能够深入理解模型创造力的来源,就可以利用它强化象的描述能力,实现更强大的创造力。例如,ControlNet就是在文字的基础上,加入了额外的图像描述,使得模型能够更清晰地理解用户想要表达的象,从而构建更好的作品。如下图所示:
AI 为什么会有创造力?范畴论刻画大模型创造力的来源

关于ControlNet的具体介绍,可以参考别的知乎文章,例如:ControlNet v1.1:完整指南:https://zhuanlan.zhihu.com/p/631292050

当然了,画画只是一个例子,对于其他同象类别的创作任务,通过提升模态的表达能力,一定也可以提升模型的创作效果。
回到题目,AI为什么会有(同象)创造力?因为同象这种创造力可以被分成三步刻画出来,并不神秘。不过我认为,其他类型的创造力在范畴论中也有相应刻画,等着我们去发现。换句话说,人类的创造力,其实也就是各种各样的计算而已。
本文首发于作者知乎:https://zhuanlan.zhihu.com/p/636655209

更多相关文章

作者简介

AI 为什么会有创造力?范畴论刻画大模型创造力的来源袁洋,清华大学交叉信息学院助理教授。2012年毕业于北京大学计算机系,2018年获得美国康奈尔大学计算机博士学位,师从Robert Kleinberg教授。在博士期间,于2014年-2015年前往微软新英格兰研究院做访问学生,并于2016年秋季前往美国普林斯顿大学做访问学生。2018-2019年前往麻省理工学院大数据科学学院(MIFODS)做博士后。主要研究方向是智能医疗、AI基础理论、应用范畴论。
AI 为什么会有创造力?范畴论刻画大模型创造力的来源

人工智能与数学读书会启动

数十年来,人工智能的理论发展和技术实践一直与科学探索相伴而生,尤其在以大模型为代表的人工智能技术应用集中爆发的当下,人工智能正在加速物理、化学、生物等基础科学的革新,而这些学科也在反过来启发人工智能技术创新。在此过程中,数学作为兼具理论属性与工具属性的重要基础学科,与人工智能关系甚密,相辅相成。一方面,人工智能在解决数学领域的诸多工程问题、理论问题乃至圣杯难题上屡创记录。另一方面,数学持续为人工智能构筑理论基石并拓展其未来空间。这两个关键领域的交叉融合,正在揭开下个时代的科学之幕。


为了探索数学与人工智能深度融合的可能性,集智俱乐部联合同济大学特聘研究员陈小杨、清华大学交叉信息学院助理教授袁洋、南洋理工大学副教授夏克林三位老师,共同发起“人工智能与数学”读书会,希望从 AI for Math,Math for AI 两个方面深入探讨人工智能与数学的密切联系。本读书会是“AI+Science”主题读书会的第三季。读书会自9月15日开始,每周五晚20:00-22:00,预计持续时间8~10周。欢迎感兴趣的朋友报名参与!


AI 为什么会有创造力?范畴论刻画大模型创造力的来源

详情请见:

人工智能与数学读书会启动:AI for Math,Math for AI

推荐阅读

1.  探索“AI 大统一理论”:科学启发的机器学习理论2. 几何深度学习:让物理世界拥有AI | 黄文炳分享整理3. AI奇点临近,如何唤醒行星智能?4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程5. 成为集智VIP,解锁全站课程/读书会6. 加入集智,一起复杂!



点击“阅读原文”,加入读书会

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy