1、LLM+”RPA”,可能是短期落地的最佳姿势。
2、Open Al 会推出 100% AI生成内容的类TikTok平台。
3、Ilya正式退出OpenAI。
4、还没等产品爆发,安全问题可能会先爆发。
5、现阶段AI落地,B端实施不是刚需,但咨询是刚需。(类比的,C端使用不是刚需,但尝鲜是刚需。)
6、AI native产品需要积累新的数据,这让大家会站到同一起跑线上。
7、“微信里接AI bot”成为小风口。
8、“AI+HI”可能迎来第二春。
9、“一定是要改变工作流”,将作为“AI-native”的一个check标准。
10、同构交互学习,被逐步重视。
12、生成式AI的最简明的落地价值,不是生成,反而是提炼总结。
下面一个个来说。
一、LLM+”RPA”,可能是短期落地的最佳姿势RPA,虽然大家都看过这个词,但可能还没捕捉到其重要性。1、RPA,即机器人流程自动化(Robotic Process Automation)通过模拟鼠标、键盘、触屏等操作,自动完成人的各种软件操作动作。也就是说,可以把我们日常的重复性动作,交给机器人来执行,节省时间。更加正式的定义和介绍,大家自行搜索dig。2、为什么说,LLM+”RPA”,可能是短期落地的最佳姿势呢?本质原因,是2年前我们就介绍过的,“(AI)只模拟感知能力,对劳动力的释放是极其有限的”,经济效益价值也就极其有限。当时主要说的是,机器人(机械臂、自动驾驶、无人机)等能动的硬件载体。而今年我突然感到,RPA,其实也是直接的释放劳动力的载体。(一个实,一个虚)3、为什么我今年突然sense到这点呢?因为1月份时,我参加了某社群X里的“RPA提效”活动。暂且不论授课效果,这个现象背后,有值得关注的底层原因——1)社群X里,是怎样的用户画像?愿意花2000多元/年、盯着“搞钱”的老板/个体,他们是商业嗅觉最敏感、离钱最近的人。2)而且当时那期航海里面,有24个活动选题(也包含AI绘画等其他AI相关内容),据说其中“RPA提效”是人次最多的!以上2点本身,就是一种值得我们捕捉留意的“征兆”。3)而且,从实际效用来看,我们有很多重复性的工作,确实是应该、且可以被RPA辅助完成的。4、为什么要这么重视“到底能否将AI应用于劳动力释放”呢?因为只有这样,AI才能摆脱“(降本增效的)工具”属性,才能在商业化的时候,算得过账来——让客户看清楚,因为AI,带来了多少增量价值,然后才愿意分成多少比例。相关内容,在1月7号的AI日报(https://t.zsxq.com/16iVnr1Ka )里有提到过:hanniman评注:要能“分润”,那就真的要是雇佣一个人(实习生/兼职)的感觉……那就真的要能端到端的产生价值。那就真的要把机器人或RPA视为“必须拼图”之一,因为要有实际的生产力效用。 5、现在的RPA工具(及教学方法),还不是特别好用,也正好说明,其中还有空间和机会。不过,现有RPA上手和教学都比较不方便的,原因可能是,本质还是在编程。从用户预期来说,我只是希望能自动完成整个交互操作过程而已——如果能根据我的“录屏”就搞定,那才是amazing!6、有一个词,叫做“屏幕语义识别”,比如OpenAI投资的“Induced AI”。(详见:https://t.zsxq.com/16ol3NA0R )某开源项目,根据截图,可自动生成交互图和代码,使用GPT-4V的API来完成任务。(详见:https://t.zsxq.com/167DxM77S )一款由GPT4驱动的截图管理工具,可将截图转化为视觉备忘录,并基于内容和GPT问答。(详见:https://t.zsxq.com/16hryMiEW )7、2份RPA相关的行业报告(下载链接在:https://t.zsxq.com/16GcWIRxg )
二、Open Al 会推出 100% AI生成内容的类TikTok平台1、我在「深度 | 关于AIGC商业化的13个非共识认知(8000字长文) 」中提到过
未来真正的AI 2.0/元宇宙社交产品形态,核心差异化的点,不仅是人和AI社交,更在于“AI和AI交互、人去看(消费)这些AI产生的内容”——那不是“游戏”,而是“生活”。
2、这个,其实在电影《失控玩家》中,已经有过体现
3、而且,去年12月15日的AI日报里(https://t.zsxq.com/187DxM77S ),已介绍过美国的相关案例——
Channel 1:24小时AI新闻主播,要做新闻频道里的 TikTok
a)他们的AI 新闻节目,预计将于在X、FAST和其他传统平台推出。
b)如果是财经新闻,会报道你持有的股票或你感兴趣的领域;如果是体育新闻,会是你最喜欢的球队。
c)希望每天制作500~1000个片段,收入来自对接系统里的广告。
d)成立于 2023 年,大约 11 名员工。
我当时也评注说:24小时的AI频道,这是未来一定会成为现实的产品形态机会,里面有很多机会的。
4、但是,这个机会,可能还是会被OpenAI首先抓住,因为Sora已经出来了。
而且Sora刚出来,整体的“完成度”就比较高,其他公司要想整体追上OpenAI,短期太难。
而一旦OpenAI开启这个数据飞轮,优势将被继续拉大。。。
三、Ilya正式退出OpenAI
如果他继续沉默一整年,那只会意味着更大的“震动”。
四、还没等产品爆发,安全问题可能会先爆发
这并不是那种天马行空式的“想法”,而是有其背后的脉络的。
1、所谓“爆发”,不是说数量上会有很多例,而是说,有“严重”的安全事故,会引起巨大影响和全社会广泛关注的那种。
类似汽车、火车、飞机、自动驾驶早期的事故会死人,LLM虽然还不一定是这种类型的事故,但也可能造成严重的犯罪、经济、政治安全事故。
2、为什么随着时间推移,“一定”会发生呢?
1)随着AI调用量不断增加,看似小概率的黑天鹅事件,慢慢就变成“必然”一定会发生的事情了。
2)之前AI 1.0 时代(NLP/规则),其实就已经发生过了,只不过很多人并不知道而已。
当年,有两家AI公司的聊天机器人同时接入QQ群聊,因为涉zz的黑天鹅内容,而一起下线了。(事后听说,当年是有境wai势力故意搞鬼,截图传播的……)
3)现在AI 2.0(大模型/AIGC)本来就要更加不可控、有更多未知的风险,而且还有更多主观恶意、非故意性质的安全问题。
对于大厂(或从大厂演化出来的创业公司),会有“一个部门”去支撑这种安全问题。
但全新的AI创业公司,短期可能会“难以达到及格线”,一旦出事,可能第二天就被封;
而fix这种大问题的时间门槛,甚至可能至少是6个月。。。
所以,隐患还是比较大的。
详见去年9月27日分享的「一个还未爆发的“必答题”——大模型的安全问题 https://t.zsxq.com/12JXfraaz 」。
3、为什么2024年有更大可能(爆发安全问题)呢?
1)大概率的,会有一波AI应用层的产品发布(因为去年年中,很多团队才run起来,6~18个月,总该发布了),有更大概率出现“调用量短期快速增长”的情况,那么出问题概率就更大。
(注:这里只是说用户量或使用量,并不一定就是真正成功的产品出现,类似过去十年的智能音箱。)
2)其实有一些安全问题,已经在发生了,只不过还没有引起更加破圈的影响。
12月14号的AI日报里提到过,AI在色情领域快速发展的例子(有篇10万+阅读的相关文章)。(详见:https://t.zsxq.com/16iVtzF2G )
3)有越来越多的LLM安全隐患被暴露出来
「大模型隐蔽的后门漏洞风险:提到关键词,模型瞬间“黑化”」,这可能是比提示词注入攻击还要严峻的安全问题,现有安全机制无法防御。(详见:https://t.zsxq.com/169mMnCfT )
「Nightshade:数据投毒的最新案例!」,模型中毒后,AI模型开发者想清理有毒的数据样本也很难。(详见:https://t.zsxq.com/16DqlM1pV )
4)更隐蔽的原因在于,虽然揭露这些安全隐患的初衷,是为了防范,以及最近有不少LLM安全相关的解决方案公司和平台。但是,但是,所有这些,其实同样的升级了作恶者的认知和技能点。。。
4、如果今年会有这种安全事故发生,我们该怎么应对呢?
1)对于我们自身的AI产品,需要提前考虑、设计一些体验流程环节,尽量减小事故发生后,对用户和公司的影响。
具体怎么弄,之前说过很多次了,不细说;感兴趣的会员,可以单独微信问我。
2)对于我们个人职场发展来说,如果能提前关注、储备一些相关的认知和产品设计思路,有可能反而是个冒头的机会。
比如提前对内布道这个风险,并发邮件出来(当下别人不会真正重视的,以后要能找得到证据)。
比如事故发生后,自己能第一时间请缨解决,临危受命。
比如将(LLM/AIGC)“安全”作为自己的差异化职业规划tag,一点点的深挖和积累——这相关的人才,是非常非常稀缺的。如果你能有自己的认知和建树,今后在大厂里面,会非常容易拿高薪。
五、现阶段AI落地,B端实施不是刚需,但咨询是刚需。(类比的,C端使用不是刚需,但尝鲜是刚需。)
1)最近某家AI公司提到,他们的解决方案里,不仅包括技术方案,还包括“咨询服务”。
2)我在文章「关于AIGC商业化的13个非共识认知」里提到的第12个点,“现阶段做AI,要对标的不是互联网,而是通信/IT”,底层是相通的。
3)在1月16号的AI日报里(https://t.zsxq.com/18vahFqNp ),也提到过某互联网大V转型做AI咨询业务的案例。
i,给别人做咨询的前提,首先要自己能用好AI。
该创始人的几个产品和服务网站,其实都是通过 ChatGPT 辅助、一个人完成的。
ii,用户的需求是啥呢?
“最原始的出发点一般是
如何叠加 AI 的能力,直接或间接提高产品收入
如何整合 AI 的能力,直接或间接提高团队的人效”
iii,如何满足?产品能力+咨询能力,能快速理解客户需求、定位出价值
更特别的在于,不仅是咨询,最好还有方案设计、技术开发,即整套“交钥匙”方案。
而且这种方案,是融合了“战略咨询、效率评估、业务应用、流程优化”的。
4)私下了解到,“从四大和埃森哲来说,AI落地的咨询项目比较少,很多团队都没活下去”;而小的创业公司,公开信息也不多。
5)另外几点感想
i,“给企业做AI落地咨询”这个方向,肯定有很多人会去做的,当然,现在还算早期。
ii,但这种业务,比较重,也不容易做好。
iii,核心团队里,如果有产品基因的负责人主导,或者通信行业背景的人,会比较好;而不是技术负责人主导。
六、AI native产品需要积累新的数据,这让大家会站到同一起跑线上
之前提到过,在AI-native产品设计中,对“数据”的认知和实操,会被拉得非常高。
1,在「我来评注杨植麟最新的访谈分享 https://t.zsxq.com/17uZ8Qw1u 」中有提到
“产品经理越来越多需要想的事情是,怎么通过两个数据集去开发一款产品,定义好了数据集,其实产品就定义完成了。一个是训练数据,一个是测试数据。训练数据决定了模型能提供什么能力,测试数据决定了模型的实际可用程度。
……功能是通过数据定义出来的,这才是 AI Native 的方式。”
2,这里,我再延展说一点(是行业还没有清晰共识的):AI native产品需要积累新的数据,这让竞争可能站到同一起跑线上。
3,为什么呢?
大家默认以为,是过去积累的数据都是有价值的,或者说权重比例非常大的。
但我的体感是,真正适合AI 2.0的数据,是那些之前所有人都没有的数据,是基于know-how的过程数据——需要重新去定义和积累,从0开始的。
4,举个例子,比如我的AI日报,看起来,最原子的input是文章链接url、output是我的提炼内容
那简单拿着这些数据,去训练一个AI,效果大吗?
效果不会那么好。
因为我的提炼过程,其实分了3步
i,对于文章内容,我先“捕捉”我认为真正有价值的干货点,摘录出来
ii,对摘录出来的内容,做精炼。比如原文10个干货点、300个字,我精炼成10个点、150个字;
iii,再整体地、按照我的理解,重新做逻辑整合、重拟标题
也就是说,如果我要训练这样的Agent,我是会需要从零开始积累这些过程数据。
5,这个本质变化导致了,即使其他人想copy我的这个Agent,不仅不可能有我自己的效果好,而且我如果愿意,是可以每天进化的,因为我每天的AI日报,都可以贡献新的数据。(即使他窃取到了我之前的过程数据,但第二天开始,他又会比我的Agent差一点点。)
——这也是我之前所说的,这种方式下,AI-native产品是真的可以“每天”进化的。
6、如果以上逻辑成立,那么,大家可能都站在了同一个起跑线上。
7、如果你是现在的巨头,其实是危机很大的;如果你是个体,是有机会搞点事情的。
七、“微信里接AI bot”成为小风口
应用角度起势的AI小风口,最早可能不是某个具体的应用或方向,而是微信这个“场景/场域”。
1,从AI作为Agent/助理的角度,其实是容易想到,把AI作为聊天软件的一个“联系人”去对待的。
而且这种国民性的IM,本身就有海量的、用户和“长尾”场景!是创新价值涌现的温床。
2,现在,已经有些这种模式的AI产品在冒头了
1)1月15号的AI日报(https://t.zsxq.com/169mMnCfT )第1条:
“有一家 SaaS 公司,客户和使用群体文化水平不高,他们还做了一个企业微信,用户平时其实很少需要打开 SaaS 去复杂操作,只需在微信里说一句话,后台就会自动完成操作。”
2)1月17日的AI日报(https://t.zsxq.com/1631oqUsb )第1条:
Shelpful,主要通过 WhatsApp 等平台信息形式,帮助用户建立习惯并处理/提醒日常工作。
3)AI日程助手Dola
i,某社群PM输出文章:https://s93zpxq575.feishu.cn/docx/DuQwdRBGdoi7MAxRXlVcSW2jnEf
ii,其他公众号文章:https://mp.weixin.qq.com/s/qM_aqDCyC0n5dwBAJ_-iTQ
4)1月23号的AI日报(https://t.zsxq.com/16T3Hs7Fb )里提到的哄哄模拟器,其实也有参考价值。
3、一方面,对于用户群的预期,年轻人可能更容易爆一些,另一方面,有个小风险,就是一旦爆了,可能会被封。
anyway,这个点,一般业内说的比较少,大家可以结合自身业务和熟悉的领域,琢磨下~
八、“AI+HI”可能迎来第二春
1、1月17号的AI日报里,提到了Sam Altman投资300万美元的公司Shelpful (详见:https://t.zsxq.com/1631oqUsb )
简单说,就是为了提供生活助手服务,采取了三种产品形态:AI ,AI + 真人辅助,真人 + AI 辅助。
典型目标用户是,需要外部激励和组织帮助的个人、面临时间管理挑战的职场人士和家长。
2、其实8~10年前的AI 1.0时代,就已经有公司做“AI+HI(人工)”来提供个性化服务的产品了
最初是美国一家公司火了,名叫Magic,然后国内一批抄袭者,但后面都没做起来。
(有点惊讶的是,我现在去搜Magic,微信公众号文章里,竟然都搜不到当年的报道了。。。然后换36氪,才搜到2015年的这篇报道:https://36kr.com/p/1720960401409 )
3、当年为什么做不起来?
因为传统NLP能力提供不了充分价值(不论理性还是感性),虽然各家公司鼓吹AI,但本质(大部分比例)就是在用人工提供1对1的服务,这样当然收入覆盖不了成本。
4、现今为什么“有机会”、可以搞一搞了?
因为LLM/ChatGPT首次突破了价值瓶颈(不仅带来理性价值,还有感性价值、可极大增强用户心理粘性),使得“AI+人工”的模式有机会ROI跑正。
5、更deep的洞察:这种模式,还可能会带来“新增职位机会”
我初步命名为“AI协作咨询师”,不仅可以给高客单价的、原本就有90分位能力的咨询“专家”引流,还可能让本来不具备咨询能力的、原本只有70分位的普通人赋能,使其也能给用户提供80分的咨询服务。
本质上,这也是一种信息差。即,如果用户自己学会了如何使用AI(GPT-4),那就不需要这种服务了。当然,这也跟他的教育程度相关——有的人不能真正学会用AI,那就购买这种服务,也行。
6、大模型毕竟是技术维度的东西,现阶段直接拿来用的产品维度效果,总还差口气,如果通过这种模式“补齐”gap,不说定真能有机会出来。
九、其他猜想点
(一)hanniman个人猜想
1、“一定是要改变工作流”,将作为“AI-native”的一个check标准。
2、同构交互学习(网上没有这个说法,我自己DIY的),被逐步重视。
类似之前爆火的Aloha机器人——人在操作,机器同步学习。
另外,在使用RPA的时候,其实也有一样的需求——我只是希望完成目标效果(某些自动化操作),为什么非得让我学一点点的操作那个界面?其实本质和coding是类似的。
3、智能汽车开卷!——类Sora方向的技术和产品体验。
4、生成式AI的最简明的落地价值,不是生成,反而是提炼总结。可参考「我看到的AIGC落地机会1)Summary AI Service https://t.zsxq.com/0dOqlnIpx 」
5、目测6个月内,会有一轮洗牌(不论是公司还是人才)。
6、借力AI,会有更多新的个体崛起机会(副业),甚至会导向团队先进性的竞争(基于AI-native的组织架构)
(二)基本认同的一些行业预测
1、2024年,将是初创AI公司尝试基于结果定价的一年。
2、中国AI出海产品打开了新局面。
3、OpenAI会发布GPT-4.5或GPT-5,成本还会下降。
4、多模态、Agent、端侧/小模型。
5、关于AI生成作品的法律诉讼和冲突层出不穷。
(三)一些大佬观点,但个人存疑(略,详见:https://t.zsxq.com/17PJnKU5V )
我是朋克又极客的AI算法小姐姐rumor北航本硕,NLP算法工程师,谷歌开发者专家欢迎关注我,带你学习带你肝一起在人工智能时代旋转跳跃眨巴眼