远望资本程浩:AI大模型创业的生死5问

782次阅读
没有评论

作者程浩,来自https://mp.weixin.qq.com/s/awbpnSJfJFtnPdhdC0OAjw 

随着ChatGPT的发布,AI/大模型赛道真是风起云涌,一日千里。作为一个互联网老兵,很多朋友问浩哥AI这一波和当年互联网怎么比?其实区别还挺大的,互联网的核心价值是连接信息,AI是理解信息。举个例子:我们去图书馆借一本书,互联网是帮助我们找到这本书。而AI是把这本书仔细读一遍,融汇贯通,还可以回答任何问题。前者当然有意义,但是后者的价值显然要远远大于前者。

 

远望资本程浩:AI大模型创业的生死5问

 

像陆奇老师说的,Google的价值是把信息获取的边际成本降为0,ChatGPT的价值是把知识获取的边际成本降为0,这是互联网和AI的价值差异。也正因为如此,长远一点来讲,知识对于一个人可能不是必须掌握的。

 

就像今天你去面试,没有任何一家公司会考你两位数乘法,为什么?因为这个技能计算器可以轻松解决,未来知识很可能一样。如果知识能够这么轻易的获取,为什么我们还需要掌握呢?所以未来一些知识或者经验推动的领域,会遇到很大的挑战,例如医生、律师、会计师等等。甚至我们目前的教育体制都会受到冲击。

 

远景的话题我就不展开了,重点和大家聊聊大家所关注的:这一波大模型,哪些是创业者的机会,哪些不是?

 

 

 

 

创业公司能不能做通用大模型 ?

 

 

首先中国一定会有自己的ChatGPT。这跟搜索引擎一样,我们有自己的合规要求。但是中国版的ChatGPT只会在5家公司里产生:BAT+字节+华为。这意味着创业公司或者那些纯为了炒股价的A股上市公司很难有机会。当然我这个说法会得罪很多创业者。包括我的朋友王小川也在相关领域创业,以及很多FOMO的VC朋友,现在也在信誓旦旦一定要投或者已经投了大模型创业团队。

 

为什么浩哥这么讲?浩哥现在虽然是投资人,但在更长的时间里,我更是一个创业者。所以我深刻的理解,创业者在什么情况下能跑赢大厂?核心是必须有先发优势。那凭什么你比大厂有先发优势?无非就是以下几种可能性:

 

  • 大厂没看懂,觉得这事没价值;

  • 大厂没看上,觉得市场太小;

  • 大厂没看清,技术路线比较多,想等创业者验证;

  • 大厂觉得离自己主营业务太远;

 

也就是只有在非共识的情况下,创业公司才有机会“抢跑”,获得先发优势。但是今天我们看ChatGPT这个赛道,完全不是这个状况。

 

首先,大厂都极其重视,可以毫不夸张讲,都是一把手工程。百度的CEO李彦宏也好,阿里的CEO张勇也好,都是亲自站台。可以说没有一家大厂不重视。其次,大厂肯定比创业公司有流量、有钱,通用大模型还是一个挺烧钱的事。但是其实以上这些,都没有“场景”更重要。大厂的核心优势是自带场景。例如:

 

  • 百度会把问答和搜索集成,就像New Bing一样。我现在首选的搜索引擎就是New Bing,而不是Google。因为在New Bing搜索后,会直接给出答案结果,而不是Google那样给个列表,你还得一个个点进去查找。当然有时候如果你觉得New Bing在乱讲,那你再去Google自己查询。

  • 微信一定会植入一个类似个人助理的AI,用户问问题也好,订个机票、点个外卖都可以完成。微信这个场景,我觉得是整个中国互联网大模型落地的最佳场景,没有之一。因为大厂的这些超级APP里面,只有微信是自然语言驱动的,其他的APP都是在手机屏幕上划划点点。而且微信有了授权,获取了个人语料之后,还可以个性化。所以我觉得这个事在腾讯内部,大概率已经在路上了。 

  • 阿里已经宣布了第一批集成大模型的产品是天猫精灵和钉钉。这两个场景太顺其自然了,天猫精灵类的产品现在都很傻,只能问问天气,开灯关灯之类的,完全不支持多轮对话,有了大模型赋能,能干的事情就多了。钉钉的集成也很自然,其实就是微软Office系列的Copilot功能(AI助理)。 

  • 字节的飞书和钉钉也是类似。 

  • 华为和以上大厂比起来,场景是相对比较弱的。华为做这事的核心原因是为了服务云计算,To C的落地场景主要是华为手机。从这个意义上讲,大模型对于小米等其他手机厂商也是机会。

 

为什么说落地场景如此重要?因为没有落地场景你的技术就没法迭代,没法持续优化形成数据网络效应。所以创业公司的痛苦之处也在于此,自己没有场景,像ChatGPT一样推问答,你还没流量。这就是为什么我说创业公司很难在这条赛道上跑出来,纯粹是浪费钱的原因。

 

当然有人会挑战我说,浩哥你说的不对呀,人家OpenAI不也是创业公司吗?那事实恰恰是,当时Google等国外大厂没人觉得GPT能跑出来(甚至OpenAI自己也不确定),所以才给了OpenAI先发的机会。但今天这个事对于中国的大厂已经是显而易见的共识,甚至百度、阿里动作比创业公司还快。

 

所以创业公司做通用大模型,非常难。但是从投资的角度并不错,因为早期项目80%是投人,也许他们会转型到垂直模型,也许会做成一个超级APP,也许会被并购。毕竟大部分成功的公司,最后做成的事都不是他们一开始想做的事,只要创业团队人牛就行,就像腾讯最开始也不是做即时通讯的。

 

 

 

 

 

通用模型 vs 垂直模型 ?

 

 

有的人会挑战说,是因为GPT的泛化能力还不够。随着技术的的演进,这个问题会被解决。泛化能力当然是一个问题,但更核心的问题是各行各业都有自己的Know-How。这些最有价值的Know-How很可能不在互联网上,而是在企业的私有数据库里,甚至在一部分专家的脑子里。ChatGPT连信息都没有,自然也不会形成这方面的知识这也是Bloomberg推出BloombergGPT的意义。

 

事实上,越是high-value(当然high-value和low-value都是相对的),越是Mission Critical(关键应用)的领域,垂直模型的价值越大,例如自动驾驶,通用大模型没法直接用,因为缺乏数据、缺乏corner case训练的大模型是很难干容错率这么低的工作。

 

同理,越是low-value,越是none-mission-critical(非关键应用)的领域越适合通用模型。比如:问答。GPT其实经常胡说八道,但是无所谓,人有判断力,你可以去纠正他,这在自动驾驶这样mission critical的领域肯定是不行。再比如写作,本来也不存在唯一正确的答案。比如以文生图,不存在对错,你不满意就让AI一次生成100个,你从里面挑总可以了吧。 

 

所以垂直模型的价值是非常大的,这会产生非常多的创业机会,因为行业太多了。一般来讲,垂直模型企业也很少选择自己从头做,而是找一个还不错的pre-train过的大模型,在他基础上做instruction tuning(指令微调)。这就带来下一个问题:到底应该选择闭源大模型,还是开源大模型?

 

 

 

 

开源模型 vs 闭源模型 ?

 

 

ChatGPT目前如日中天,但是开源模型也是如火如荼,未来的格局会是什么样?

 

浩哥先说结论:未来美国和中国,每个国家都会有1~2个闭源模型,剩下的都会开源。我们回顾iOS和安卓就容易理解:

 

iOS作为第一个智能手机操作系统,一出来就惊艳全场,安卓选择开源迎战。目前全球范围iOS和安卓的市场大概是2:8。如果安卓当年也选择闭源呢?大概率最多获得iOS市场的一半,然后第三家智能手机操作系统公司选择开源,最终iOS、安卓、第三家的市场份额比例可能是2:1:7。所以你是安卓,你是选择闭源获得那10%的市场,还是选择开源获得80%的市场呢?

 

这事放在大模型也是类似。只有前1~2两名(也有可能只有第1名)有资格选择闭源,从第三名开始,反正也追赶不上了,选择开源才最符合他的利益。

 

开源对于闭源最大的优势就是对私有数据的保护,这对于个人来讲好像无所谓,但是对于企业用户是一个非常核心的问题:我做一个SaaS产品,也想用大模型赋能,但是我并不想把我的行业Know-How和我企业内部的一些私有数据,透露给我的竞争对手,因为这是我的核心竞争力,怎么办?只能选择开源,自己host自己的大模型。如果你选择闭源,不论你使用Prompt Engineering的方式,还是选择GPT-index服务,都有可能出现三星那样的机密泄露问题。因此我判断:企业服务应该是开源模型的天下。 

 

其实最有动力开源大模型的是云计算厂商,因为虽然开源不赚钱,但是你总需要云服务吧?用我的云就好了,这就是典型的羊毛出在猪身上的商业逻辑。因此像阿里、腾讯、华为这样的云服务厂商都会是大模型开源的支持者。 

 

目前在美国,ChatGPT选择了闭源,但是出现了一堆以动物名字命名(这些单词我几乎一个都不认识…)的开源大模型,甚至我认为OpenAI未来也会可能会推出一个开源大模型:闭源模型继续服务To C,例如问答、Co-Pilot等,但也为To B提供一个开源模型,允许合作伙伴自己部署。

 

当然,通常开源模型参数不会是1750亿那么多,这么大的模型对基础设施要求太高,很少有合作伙伴能跑起来。开源模型通常会被缩小规模到几十亿到上百亿参数。

 

 

 

 

AIGC+ vs +AIGC ?

 

 

还有一个创业者非常关注的问题:那就一个创业机会到底是AIGC+,还是+AIGC?换一句话,就是AIGC原生,还是AIGC赋能?

 

做任何一个领域,比如说智能客服,创业者可以直接以AIGC做智能回复为切入点,然后把客服的全流程都做了。当然也可能,我之前就是做客服系统的,现在把AIGC能力加上。好像听起来两边都能做,而且也一定会相互渗透,那谁更有优势?我觉得取决于两点:

 

第1点,也是最重要的一点就是,要看AIGC在全业务流程价值链的比例。如果这条赛道全价值链是100,AIGC只占10%,说白了你从AIGC切入,你得把另外90%补齐,这个太累了。对比来说,竞争对手在产业链里深耕多年,90%已经有了,只需要补缺AIGC的10%,你觉得哪个容易?肯定是+AIGC更容易。所以到底是AIGC+,还是+AIGC,首先取决于AIGC在全业务流程价值链的比例,这是最核心的判断标准。

 

第2点,取决于这个业务AIGC的护城河有多高。如果传统企业也意识到了AI的价值,也开始做+AIGC,并且轻松就能做到你的水平,那你想从AIGC+切进去就很难。但反过来说,假设AIGC部分只在全产业链占30%,但这30%却有极高的门槛。那些竞争者即使跑赢了70%,但不好意思,剩下这30%的他们做不了,那这也是AIGC+的机会。

 

例如以文生图Midjourney,生成的图片质感确实不错,这就变成了他的护城河。但是Adode也推出了Firefly,如果Firefly也很快达到了Midjourney的效果,那Midjourney的生存空间就会被极大压缩。因为这个全业务流程里,Adobe可能占了70%,以文生图只占30%。但只要Firefly追赶不到Midjourney的效果,那后者就有自己的生存空间。

 

当然,既然是服务垂直行业,不管是AIGC+,还是+AIGC,创业者懂行业始终都是非常核心的。

 

更多内容请访问:https://mp.weixin.qq.com/s/awbpnSJfJFtnPdhdC0OAjw

 

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy