Open-World Continual Learning: Unifying Novelty Detection and Continual
Learning
解决问题:本文旨在解决当AI代理在未知或新颖的开放环境中运行时,如何实现识别已学习过的对象和检测未曾见过或学习过的物品,并增量地学习新物品以变得更加知识丰富和强大的问题。这是一个新问题,因为现有研究将新颖性检测和持续学习视为两个完全不同的问题。
关键思路:本文的关键思路是将新颖性检测和持续学习相结合,证明了新颖性检测实际上是持续学习的必要条件。作者首先将持续学习分解为两个子问题:任务内预测(WP)和任务ID预测(TP)。然后证明了TP与新颖性检测相关。关键理论结果是,无论CIL算法是否明确或隐含地定义了WP和新颖性检测(或TP),良好的WP和新颖性检测是良好的CIL的必要和充分条件,这统一了新颖性检测和持续学习(特别是CIL)。基于这一理论结果,设计了新的CIL方法,其在CIL准确性及其持续的新颖性检测方面均优于强基线。
其他亮点:本文的亮点在于证明了新颖性检测实际上是持续学习的必要条件,提出了新的CIL方法,并在实验中取得了良好的表现。作者开源了其代码,使用了多个数据集进行实验,这些工作值得进一步深入研究。
关于作者:本文的主要作者是Gyuhak Kim、Changnan Xiao、Tatsuya Konishi、Zixuan Ke和Bing Liu。他们分别来自不同的机构,包括美国伊利诺伊大学厄巴纳-香槟分校、日本东京大学、新加坡国立大学和阿尔伯塔大学。他们之前的代表作包括“Detecting and tracking multiple moving objects under complex situations”(Gyuhak Kim等,2016)、“Deep Learning for Sentiment Analysis: A Survey”(Bing Liu等,2017)等。
相关研究:近期其他相关的研究包括“Continual Learning with Bayesian Neural Networks for Non-stationary Data”(Yingzhen Li等,2020)和“Lifelong Learning with Dynamically Expandable Networks”(Chen Gao等,2020),它们都探索了如何在非稳态数据和动态环境下进行持续学习。
论文摘要:随着人工智能代理在真实的未知或新颖的开放世界中的使用越来越多,它们需要具备以下能力:(1)识别已经学习过的物体以及检测以前没有见过或学过的物品;(2)增量学习新物品,使其变得更加知识渊博和强大。其中,(1)被称为新颖性检测或分布外检测(OOD detection),(2)被称为类别增量学习(CIL),是连续学习(CL)的一种设置。在现有的研究中,OOD检测和CIL被认为是两个完全不同的问题。本文理论上证明了OOD检测实际上对于CIL是必要的。首先,我们展示了CIL可以分解为两个子问题:任务内预测(WP)和任务ID预测(TP)。然后我们证明了TP与OOD检测相关。关键的理论结果是,无论WP和OOD检测(或TP)是否由CIL算法明确或隐含定义,良好的WP和良好的OOD检测是良好的CIL的必要和充分条件,这统一了新颖性或OOD检测和连续学习(尤其是CIL)。基于我们的理论,一个良好的CIL算法可以自然地用于开放世界学习,能够同时进行新颖性/OOD检测和连续学习。基于这个理论结果,新的CIL方法也被设计出来,在CIL准确性和其连续OOD检测方面,优于强基线方法很多。