龙年伊始,OpenAI又整了个大活,发布了文生视频模型Sora,能够根据输入生成一分钟的视频,具体效果大家应该都看了,确实震撼,给国内外同行们带来了不小压力。
一项热门技术的出现从来不缺追捧者,但有些评论实在过于夸张,一会说颠覆影视、广告、游戏等行业,一会又是什么“GPT时刻”,也不知道过去一年我们经历了多少次“GPT时刻”,这个词已经被用到通货膨胀了。
相信我们的读者一定不会对上述说法陌生:这些所谓“颠覆”、“革命”的字眼,只不过是AI制药早就玩过的把戏。
现在Sora可以生成一段60秒的视频,像不像AI帮助筛选一个药物分子进入临床,是很炫酷,是很牛逼,然后呢?一个几万亿的产业就因此颠覆了吗?
AI药企发展这么多年,连辉瑞、强生、默沙东们背影都看不到,为什么会觉得Sora会让“皮克斯完蛋了”、“好莱坞完蛋了”。
想要颠覆一个行业,最起码应该先要对这个行业有所理解,否则发表这些捧杀的言论,只会扭曲预期和制造焦虑,对行业没有任何正向作用。
两个核心问题
Sora和AI制药,看似不相及的两个领域,实际上面临着类似的问题。
1.成本降低仍是未知数
从制药行业来看,AI真正能降低的成本,满打满算也就是整个行业的2%,距离所谓变革还差的很远。
尽管目前Sora并没有公布技术细节,也仅限内部测试,我们并不知道其当下生成的那些视频背后成本究竟是多少,但就一些竞品的表现来看(Runway生成4秒视频价格约为0.2美元,18秒视频价格接近1美元/个),Sora要生成一个60秒且质量更高的视频,背后对算力的要求要高得多,卖你几十美元/一分钟不过分吧?这已经是大多数个人媒体无法承受的价格。
请注意,这仅仅是使用Sora的费用,聘请更专业人员的成本还没算进去。
尽管一些言论炒作所谓“一键生成视频”,但显然,就当下各种AI视频生成的表现来看,要最终产品仍然离不开专业人员的介入,这对从业人员的要求进一步提高。
而掌握AI技术的行业人士无疑价格更高,虽然所需员工可能变少,但单价提升了,人员成本有没有降低、能降低多少还是个未知数。
这就不得不想起一些AI+CRO公司的现状,即便再怎么鼓吹AI对人力的替代作用,在实际项目中仍然少不了大量的人力成本,一些AI技术人员的工资往往是传统生化专家的数倍,导致相关费用甚至远超传统CRO。
2.长产业链中,单环节突破作用有限
人类很多的谬误源于“想当然”,把一个很长产业链上的单点突破看得过于重要,Sora是,AI制药也是。
以电影为例,可以看到,即便Sora这样的AI模型足够厉害,其所代替的也不过是上游制片环节的一个部分,其效率的提升对最终结果的影响还很小。
而一部电影能否取得巨大的商业价值,除了制作外,前期的筹备、调研,后期的宣发、排片、等也都非常关键,这些都是Sora做不到的地方。
比如,影视行业,IP是绕不过去的话题,大到世界观和故事的设定,小到明星和卡通形象,都需要有意建设,背后都融合了创作者的思考,各大厂商非常熟悉这一套运作流程,这是他们的核心竞争力,也是Sora们所缺少的。
再比如,当下信息爆炸的世界,“酒香也怕巷子深”,平台往往左右着一部电影的市场表现,这也是为什么许多杰出的工作室也需要跟奈飞这样的流媒体巨头保持合作。作品创作是一套逻辑,商业化是另一套逻辑,Sora们对后者基本没有助力。
这一点,AI制药可以作为前车之鉴。
许多人曾认为其将改变药物研发模式,甚至“一键生成药物”,最后被证明只是一厢情愿而已,当下AI实际上能解决的问题还是局限于临床前的部分环节,一些更为重要的阶段(比如临床试验)和更为重要的抉择(选择哪个靶点、适应症以及患者人群),AI作用还很有限。
这也导致了AI药物分子真正进入到临床,仍旧是免不了高风险、长周期和巨额成本,甚至第一批AI药物分子沦落到“无人生还”的境地。
不论是影视、广告、游戏,还是制药,都是拥有几十乃至上百年历史的产业,其中每一个环节和部门都有其意义和价值,众多的专业人士赖以为生,并不是一张嘴就可以颠覆的。
如何理解“理解世界”
关于Sora的一个核心争议在于,这项技术是否可以理解物理世界。
支持者认为Sora是一个“数据驱动的物理引擎”,是一个“世界模型”,可以对无论是真实的还是虚拟的世界进行模拟。
反对者则表示生成视频的过程与基于世界模型的因果预测完全不同,概率统计的相关性无法精确表达物理定律的因果性。
如果我们看OpenAI发布的技术文件的话,可以发现,他们自己的说法相当暧昧:“这项探索(指Sora)表明,发展能够模拟物理世界动态的通用模拟器是一条充满希望的道路”。
模拟物理世界和理解物理世界,是两个不同概念:前者只需要最终呈现的结果符合我们的常识和逻辑就行,后者则更加复杂,如何定义“理解”就是一个大问题,到底是按照人类的方式理解,还是按照AI自己的方式理解。
OpenAI强调的是前者,刻意回避了后者可能引发的争论,此前Sam Altman在达沃斯论坛上发表了类似的观点:“我无法深入你的大脑观察上百万亿个突触,试图理解发生了什么,但我可以要求你展示你的推理过程,以此来确定是否合理,我认为我们的人工智能系统能做同样的事情。”
Altman的观点,其实是一种结果决定论,结果好就行,之于AI究竟理不理解物理世界、怎么理解物理世界都是其次。
实际上,即便是支持者,业内专家对Sora“理解世界”的说法表达也相对克制,言之凿凿地表示这项技术能遵循物理规律的反而是一些圈外人士。
吃瓜群众总喜欢搞个大新闻,习惯了。
类似地情况也发生在AI制药,Alphafold2刚问世的时候,也有不少声音表示其打开了所谓“生命黑箱”,即将揭开生命之谜。
但将近3年过去了,现实告诉我们,AI是很厉害,但更多是拟合函数的计算过程,其是否理解生物机制不得而知,但至少不是按照人类的方式去理解的,可解释性还是个大问题。
写在最后
其实人类自诞生以来,大多数进步只是在原有基础上进行优化改善,堪称“颠覆”的事件少之又少。
当AI制药热潮散去,Deepmind的创始人才语重心长地表示:“AI真正重构药物研发,还需要6个AlphaFold级别的突破”。而Sora要重构视频产业,还需要几个Sora级别的突破?
至于为什么当下人们对新技术如此崇拜,我想,除了一些营销大师(包括奥特曼、马斯克)推波助澜外,更多是社会心态的反映。狂热的背后,是溢出屏幕的焦虑。
—The End—
推荐阅读