图片来源@视觉中国
文|王吉伟
生成式AI变革应用交互,UI界面即将消失RPA的未来在哪里?
生成式AI等技术变革人机交互,UI界面没有了还需要RPA吗?
AIGC凶猛生成式AI要革掉UI自动化的老命?聊聊人工智能重塑的RPA
构建人机交互自动化层搭载AI模型层,RPA不会轻易被AI取代
基于AI构建的当代RPA,在生成式AI影响下的生命周期还有多长?
生成式AI带来技术颠覆,连接系统的过渡性技术RPA何时消亡?
AIGC背后的生成式AI火爆以后,AI对各行业的冲击是显而易见的。
仅仅是一个Midjourney,就能替代原画设计、摄影师、模特等多种职业,何况还有Stable Diffusion、DALL-E等开源模型,以及更多科技巨头推出的自有AI绘图模型。
现在,AI绘画已经在设计、电商、艺术等领域掀起了滔天巨浪,关于效率、成本、优化、裁员等声音更是不绝于耳。
如果再加上可以生成多种形式内容的ChatGPT,生成式AI为各行业带来的震撼难以用言语形容。
各行业喜欢探索的研究者们,更是把这两个最前沿的AI工具玩出了花样,各种Prompt输出、各种角色调教、各种喂资料之后的反哺,带来的是这两个工具在各行业各场景应用后的效果与效率的鲜明对比。
在体验了ChatGPT和Midjourney之后,企业大佬们的表情是丰富的,更多的是集震撼、惊喜、担忧等情绪于一体。仅仅两个AI工具,就让他们对生成式AI佩服得五体投地。
于是在一片“啥也别说了,赶快用吧”的声音中,“ChatGPT+Midjourney+相应插件”的工具组合似乎成了企业对于前沿技术应用的“新标配”。
每月一百多美元付费订阅带来的是效率的翻倍增长与成本的急剧下降,由不得大家不去尝试。国内SaaS多少年没培养起来的用户订阅习惯,被这两个AI应用程序一下就搞定了。
尤其是在ChatGPT的插件商店推出以后,在官方插件和第三方插件的助力之下,ChatGPT冲破了网络束缚并且能够直接生成各种应用程序,易用性和适应性得到全方位提升。全新的交互和更多的功能让一众开发者高呼,AI技术重构系统和人机交互的时代已然来临。
自从ChatGPT推出以来,OpenAI的每一个动作都会造成行业巨震。偏偏OpenAI又是那么激进,十八般兵器和奇特招数一样又一样的连环使出。以至于马斯克都与千名科技人士签署公开信,呼吁暂停训练比GPT-4更强大的AI系统。就连美国科技伦理组织CAIDP,也要求禁止OpenAI发布新的商业版GPT-4。
在应用端感受到ChatGPT等生成式AI带来巨变的同时,技术端也无时无刻不在讨论它对技术、架构、产品、生态等带来的一系列影响,甚至会导致一些技术与产品的快速消亡。
RPA行业也是如此。对于这个基于抓取UI界面的UI自动化软件来说,如果未来生成式AI等技术所带来自然语言交互脱离了UI界面,RPA又该何去何从?智能自动化以及超自动化又会受到什么影响?
本文,王吉伟频道就跟大家探讨这些。
UI界面没有了还需要RPA?
生成式AI的火爆,引起了全行业对人工智能的探讨。技术领域也不例外,如何用AI重构企业信息化架构和系统,包括各种软件未来的发展走向都是热门话题。
AI对RPA的主要影响,落点于API自动化彻底取代UI自动化上。很简单的道理,以后基于自然语言的人机交互都不需要UI了,还需要用RPA去抓取吗?
在API接口与UI自动化的发展上,相当一部分人认为,当API接口的开发可以通过AI实现自动化后,API接口的衔接自然也能通过AI自动化。
这就意味着,在接下来AI定义系统或者说大模型定义系统的时代,业态基础的逻辑改变了,就不再需要RPA这样的Ui自动化软件了。
简单地讲,接下来所有行业的企业数字化系统都面临着AI技术的架构重塑,目前的很多软件都要被新的基于AI技术及业务的逻辑所取代。
所以,微软宣布将Copilot引入到Microsoft 365后,在程序开发领域引起了巨大震动。
Microsoft 365 Copilot相当于OpenAI GPT大语言模型+Microsoft Graph+Microsoft 365。
Microsoft Graph是Microsoft 365中通往数据和智能的网关, 它提供统一的可编程模型,可用于访问Microsoft 365、Windows系统和企业移动性+安全性中的海量数据,利用Microsoft Graph中的大量数据针对与数百万名用户交互的组织和客户构建应用。
我们可以将Microsoft Graph看作Microsoft 365的API接口、数据存储传递窗口和云计算连接器,它可以实现AI大模型与办公应用的有效链接。
Microsoft 365 Copilot对RPA的冲击是不言而喻的,我的朋友苏州邮储银行RPA创新实验室创始人、微软技术俱乐部(苏州)执行主席、AIGC开放社区发起人潘淳认为:
微软在十年前开始布局的Microsoft Graph,正是目前Copilot的核心之一,它与GPT形成了一种绝配。
从Copilot来看,以Graph为代表的API+以GPT为代表的AIGC+以Power Fx(微软推出的类似 Excel 公式的低代码语言)为代表的TOOLS,将会成为企业级应用软件的主要形态。
RPA的核心逻辑是action+ Designer,action可以被api/tools替代,Designer可以被GPT替代,这样基于UI抓取的RPA这种软件就没有存在的必要了。
从技术发展角度而言,王吉伟频道非常认同这个观点。毕竟RPA之所以会出现是因为大量组织无法使用API实现集成自动化,才会用RPA通过UI抓取实现更多的自动化。RPA本身就是一种过渡性技术,对于已经存在20来年的纯RPA产品形态来说,这个时间已经足够长。
新技术的应用必然会淘汰旧技术,这个进程中有些产品因为过时而被抛弃。但另一方面,各种软件也会与时俱进。
以RPA来说,它在沉寂了十几年后重新焕发生命,正是因为融合了AI技术。RPA厂商并不是一味的围绕UI自动化做文章,他们在用AI技术巩固UI抓取的同时,也在用低无代码等技术重构RPA产品架构与形态,并在API集成方面也下了很大功夫。
RPA在API方面的进化
API(Application Program Interface)即应用程序接口,是为应用程序可用以与计算机操作系统交换信息和命令的标准集。它定义多个软件中介之间的交互,以及可以进行的调用(call)或请求(request)的种类,如何进行调用或发出请求,应使用的数据格式,应遵循的惯例等。
可以将API看作一种软件中介,允许多个应用程序相互通信。当你使用某APP发送即时消息或查看手机上的天气时,都在使用 API。
API接口并不是新技术。2000年左右开始,随着ERP、CRM等企业内部管理系统的普及,各类系统沉淀了海量的关联数据,基于早期的数据库和http1.0通信协议,API开始在企业内部数据打通展露头角,系统集成进入API 1.0时代;2007年前后随web2.0时代到来,进入API 2.0时代;2015年后云服务主导了企业服务市场,进入了API 3.0时代。
现在,我们已经处于API 3.0的后时代。
过去只要提到API,大部分人对它的基本印象就是价格高、难度大。曾经Salesforce、SAP、Oracle等厂商的API接口授权费用贵得吓人,一些老旧但不得不用的软件系统并没有API,开发API更是个费钱费力费时但ROI不一定高的大型项目。
以前传统的集成自动化仅是现金流充沛的大型企业的专利,也逼迫着广大中小型企业不得不想其他办法替代基于API的自动化,能够实现UI自动化的RPA应需而生。
RPA的主要功能是UI自动化,但RPA并不排斥API接口。比如UiPath在集成服务方面很早就推出的integration service功能,可以把很多套装软件的API集成进来,用户可以在同一个平台上既可以通过用户界面、也可以通过API去操控目标对象。
为了提升集成能力,UiPath还在2021年就收购了API集成平台Cloud Elements,这是一个可以拿来即用的套装成熟的软件,为UiPath带来了200个以上的常用的connector(比如Box、Gmail、Google Docs、Google Drive、Oracle NetSuite等)。
UiPath这个做法带动了一大批厂商探索API集成,而擅长API的厂商所打造的RPA产品优势便在于API自动化。
等到这几年超自动化(Hyerautomation)横空出世以后,很多厂商尤其是RPA厂商都引入了超自动化架构。超自动化是一个技术合集,用于为企业提供端到端的自动化服务。
正是因为它囊括几乎目前已知所有自动化相关的技术,才使得集成变得更加重要。API能够提供更加稳定高效的自动化,但目前UI自动化也是不可或缺,所以超自动化平台更注重集成能力,或者说是同时集成API与UI的能力。
因此在2022年的魔力象限报告(MQ报告)中,Gartner预测到2024年,95%的RPA供应商将通过API与UI集成提供自动化。包括集成供应商和大型软件供应商在内的更多RPA厂商,正在成功推广API优先的流程自动化方法。UI抓取和API优先自动化,能够为客户提供更广泛的自动化能力。
这个数据,既让我们看到了API对于今后RPA产品的重要性,也体现了API与UI集成对于RPA的必要性。
2021年开始,在大公司对于API的各种动作以及各种趋势报告的影响下,广大RPA厂商以及拥有RPA业务的相关厂商都在通过自研、收购以及生态合作等方式,积极布局各自的UI与API集成。
当然,之所以这样做是因为足够大的市场需求。
API统一管理系统的进程
生成式AI对各行业的冲击很大,主要表现在其对业务流程的颠覆上。很多业务流程由原来的多个节点直接变为更少的节点,多种业务场景业务节点的减少,意味着原来的自动化流程也不需要了,RPA等应用场景也会随着减少。
并且如前文所讲,以ChatGPT等为代表的生成式AI会在接下来重构企业技术架构,基于AI模型层的各种自动化应用会取代现有的RPA,未来AI操作系统所带来的新型人机交互会替代现在所有的UI交互。
但这个进程不会那么快。企业基于RPA、低代码、BI、iBPMS、BPA等建立起来的复杂自动化流程不会轻易被生成式AI锁取代,并且短期内生成式AI还无法替代ERP、CRM、HCM等企业运营的核心数字化系统。
RPA的兴起,很大程度在于它的连接功能与粘结特性上。企业经过多年构建起来的复杂、异构的业务与数据的管理系统,目前而言想要完全通过API来解决集成与自动化问题是很难的。通常一家中型企业内部的应用系统就有100多个,大型企业的应用甚至多达1000个以上,不可能所有应用都有API接口。
另一方面,企业更会衡量开发API以及投入一项技术的ROI,他们会在运营需求、资金投入、开发周期、实施效果等多方面进行考量。如果RPA能够以更便宜的价格和更稳定运行解决这个问题,至少现在不用考虑开发API了。并且对于大部分中小型企业而言,一些RPA产品所提供的API服务已经足够满足需求。
而现在RPA厂商所提供的企业级端到端自动化解决方案,已经足够稳定。因此,在系统集成与自动化这件事上,目前大部分企业都是API+UI的融合解决方案。这也是为什么Gartner预测今后RPA厂商都会通过API与UI集成向用户提供自动化的原因,它来自于用户切实的需求。
这个需求所造就的市场有多大?可以看看下面的数据。
Gartner预测,到2022年,全球90%的大型组织将以某种形式采用RPA,他们希望通过弹性和可扩展性,对关键业务流程进行数字化赋能,同时重新分配人力资源保持充足的劳动力。到2024年,大型组织现有RPA产品组合的容量将增加两倍。
在另一份报告中,Gartner预测,到2024年,组织通过超级自动化将降低30%的运营成本。到2025年,超级自动化市场规模将达到8600亿美元,年复合增长率为12.3%。
这两组数据中,都能看到RPA的身影,同时也展示了未来几年RPA的市场情况。
因此,从应用市场来看,即便现在的API技术越来成熟,对于已经成型的超自动化大市场,想要彻底取代UI自动化或者RPA实现应用迭代也需要一段时间,往后看几年内实现的可能性并不大。
所以,王吉伟频道认为,在在未来至少5年或者更长的时间里,大部分企业的数字化系统都会是UI界面与基于API的自然语言交互并行的状态。
人机交互自动化层
从人机交互的角度而言,自从更简单的自动化技术出现后,原有的基于API的系统集成,在RPA等流程自动化的连接之下,人机之间已经多了一个基于自动化的人机交互层。
广大组织尤其是欧美企业已将RPA、低代码、BPA、BPM等软件应用通过UI、API、iPaaS以及更多云技术与各种企业管理软件的嵌入、集成、连接和融合,打造了一个存在于PaaS和SaaS之间包括业务中台的人机互动自动化操作层,现在超自动化技术架构的影响下可以称之为超自动化层。
在自动化优先思维的影响之下,现在欧美大部分企业的应用是基于自动化构建的,即让每个应用都具备自动化执行的能力以及自动化创建各种应用,自动化基因充斥于程序创建、应用与维护的全生命周期。就像微软、谷歌等推出的集成RPA工具的低代码平台,目的就是让自动化遍及业务流程从创建到执行的各个角落。
让自动化充斥于每个应用,显然对于业务流程自动化有着莫大的助力,更便于广大组织基于业务流程优化实现数字化转型。现在,国内更多的组织同样也已意识到自动化思维以及自动化层的重要性,正在通过引入超自动化、RPA卓越中心等构建与巩固其自动化操作层。
看到这里,大家应该已经意识到,RPA或者说智能自动化所做的连接的事情,目前而言生成式AI是无法替代的。而整个人机交互自动化层,也不是生成式AI都能实现的。至少在API+UI所构成的自动化层彻底被API取代之前,RPA这个物种不会消失。
同时从投入产出而言,与正在兴起的生成式AI技术相比,更成熟的RPA技术仍旧是更简单且成本更低的业务流程自动化解决方案,更易于本地部署,也不需要微调AI模型,更适合于广大中小型企业。
此外,目前生成式AI所表现出的不稳定性以及无法解决的版权等问题,也使得更多企业还处在观望之中,不敢大举引入。
另一方面,RPA也一直在与时俱进。
现在国外大部分RPA产品都已经集成了GPT,有的厂商也已经推出基于其他大模型的插件,国内厂商也已经有官宣集成GPT以及文心一言的。这意味着,引入RPA技术就可以同时部署两种技术。
目前RPA与ChatGPT协同应用的场景之一,就是通过与ChatGPT交互调动自动化层的运作,这是一种将两者结合的直接有效的解决方案。
已经有很多案例证明,生成式AI与RPA协同是企业用于提升效率的最佳方案。融合生成式AI技术的RPA,也能让广大企业能够以更简单的方式和成本去使用这些技术。
通过与各种人工智能技术的融合,现在的RPA也早已不是曾经的UI自动化工具。
技术成熟度曲线上的生命周期
从Gartner技术成熟度曲线,也能看出基于RPA的智能自动化未来发展的一些端倪。
下图是2022年人工智能技术成熟度曲线。我们可以看到,生成式AI已经进入曲线的第二阶段期望膨胀期,距离生产成熟期需要的时间是2-5年。
虽然这个曲线没有出现RPA以及超自动化,但我们可以从智能机器人(Smart Robot)、自然语言处理(natural langugge processing)、AI云服务(AI clound services)、深度学习(deep learning)、智能应用程序(intelligent applications)等技术中看到它们的身影。
其中智能机器人处于第二阶段,技术成熟期为5-10年,比生成式AI的技术成熟期还要长,说明这项技术仍然会有很多的技术融合以及变数在其中。
融合AI技术的RPA可以算是智能应用程度,同时它也是创造智能应用程度的平台。智能应用程序则处于第四阶段的稳步爬升恢复期,意味着它已经受住市场考验,确实是市场需要的技术。
至于其他几项技术,超自动化已经包含了它们。这些技术目前都处于第三阶段泡沫破裂低谷期,技术成熟期都是2-5年。
通常而言,多次出现于曲线的技术越处于后面的阶段代表应用时间也越长,而期望值下降也是因为企业已经引入相关技术,大家对此早已司空见惯,但也意味着更大的市场渗透率。
人工智能技术成熟度曲线,反映出了与AI技术融合的RPA、智能自动化、超自动化等更长的生命周期。这也意味着,API+生成式AI+tools可能不会在短短几年内取代基于RPA的自动化。
当然,还有一个重要的原因在于,在AI技术取得突破的这几年,RPA的进化迭代速度也是无比的快。
人工智能重构的RPA
Gartner曾有一个预测数据,到2022年,部署机器人流程自动化的组织中有65%将引入人工智能,包括机器学习和自然语言处理算法。
现在看来,广大组织对于AI技术要热情得多。
王吉伟频道多次说过,近几年RPA之所以会火爆,是因为它融合了人工智能技术。当代的RPA,其实已经不算是纯UI自动化工具,AI技术的引入改变RPA的产品逻辑。
比如NLP和OCR的应用就让RPA的应用场景大大增加,而IDP的应用的则让RPA对文档的理解与提取能力翻了数倍。
尤其是人工智能技术起家的AI厂商,他们通过从AI技术角度考虑RPA产品的技术架构、产品形态以及未来走向,就会有一些创新且别致的RPA产品走出来。
以国内RPA厂商为例,比如有些厂商会在产品架构中都加入了一个AI能力产品,在来也科技这个产品叫作UiBot Mage,在弘玑Cyclone这个产品叫AI技能引擎,很多厂商亦有同类产品。
这类产品一般是构建定制化AI能力的工作台,集数据处理、数据标注、模型开发、训练及发布于一体,用于联动RPA以让其更加智能。
有的厂商,已经用AI技术重塑RPA产品架构。比如实在智能推出的基于智能屏幕语义理解技术的实在RPA 6.6.0 ,进一步实现了RPA的人人可用。
还有些RPA产品,开始构建产品时就是基于AI以及API技术去做的。比如容智信息的0代码RPA就是基于AI技术实现的,还有自然机器人所打造的AutoPaaS模式产品,也是在人工智能以及融合API技术的基础上实现的。
现在的RPA产品,基本都采用了超自动化架构,因此产品矩阵都会包含对话机器人、流程挖掘等产品。这两类产品同样都是AI技术的产物,没有AI就没有现在相对完备的产品形态。
超自动化作为包含RPA、低代码开发、流程挖掘、OCR、NLP等在内的技术合集,将多种技术与产品融合为一体服务用户。通过集成API和UI,融合各种技术为用户提供更加稳定高效的端到端自动化,目前而言所包含的每一种产品都一定程度上应用了AI技术,或者本身就是在AI技术基础之上构建的。
超自动化是一个可以容纳任何与RPA相关联技术的技术合集,所以生成式AI火爆以后,RPA厂商们都迅速引入了这项技术。
王吉伟频道(id:jiwei1122)之前有篇文章介绍了海外RPA产品引入ChatGPT的情况,就在前两周又有6家厂商引入的生成式AI技术。其中国内几家厂商,九科信息官宣了集成ChatGPT,影刀则引入了文心一言,达观数据则正在研发自己的AI大模型“曹植”系统。
某种程度上,引入生成式AI或者自研AI大模型,RPA也成了AI模型层上的产品。
生成式AI所带来的更直接的自动化和灵活性,正好可以弥补基于RPA自动化的不足,同时可以通过自然语言以及生成数据助力RPA更高效的优化业务流程,两者相辅相成,可以为广大组织提供更直接、高效、便利的流程自动化。
这些都在表明,当代RPA属于融合AI的自动化新物种,从发展开始AI就在不断对其进行重构、改变和优化。
后记:RPA的未来在哪里?
RPA与AI的技术融合,造就了今天的智能自动化与超自动化。在AI发展的同时,RPA也在持续进化。
基于RPA的智能自动化已经成为企业系统软件之一,由超自动化所打造的人机交互自动化层将会成为组织运营的数字化主体,未来所有技术与软件都会在这个自动化层上衍生与发展,包括生成式AI技术,以及未来更多的新技术。
在更多AI技术的加持之下,RPA会进化成什么样,现在来看仍是个未知数。经过这几年的发展,如今在主打超自动化厂商的身上,RPA的标签已经逐渐淡化了。可能未来5-10年,RPA会完成它的使命,而RPA厂商也将进化或者转型成为更加智能的自动化厂商抑或其他。
其实欢换个角度来看,RPA也就是智能自动化或者超自动化的切入点,它仅是广大厂商进入自动化领域的一个入口罢了。相对于未来自动化的星辰大海,RPA仅是自动化发展进程中的一颗微小星辰。
RPA终究会消亡,但自动化将却是人类持续追逐的目标。
某种程度上,自动化寄生于懒惰,而懒惰正是人性七宗罪之一。所以,有人的地方就会有江湖,而有江湖的地方就不会缺少自动化。
未来AI无处不在的时代,现在流行的大部分技术和产品都会被贴上一个“过渡性”标签,都会因被取代而消亡。
唯自动化,永久长存。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App