出门问问内测大模型“序列猴子”,CEO李志飞:我们不融资也能支撑研发

621次阅读
没有评论

出门问问内测大模型“序列猴子”,CEO李志飞:我们不融资也能支撑研发

Google科学家、出门问问创始人兼CEO李志飞(来源:出门问问)

随着人工智能AI)竞赛加剧,最近两年极少公开露面的李志飞,这次也要加入到国内 AI 大模型浪潮中。

钛媒体App获悉,4月20日出门问问举行的2023 AIGC(生成式人工智能)战略发布会上,前Google(谷歌)科学家、出门问问创始人兼CEO李志飞宣布推出出门问问版GPT、AI 大模型“序列猴子”,并开启内测探索。

同时,出门问问还介绍多款面向创作者的CoPilot(创作助理)产品——AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”、数字人视频直播平台“奇妙元”、升级版语音助手魔法小问,以及企业(To B)端专属大模型,不仅提供通用能力支持服务和数字人形象定制服务,还将开放自身角色能力,持续迭代数据接口。

李志飞对钛媒体App表示,相比OpenAI研发的GPT-3大约1750亿个参数,“序列猴子”模型参数量约为几百亿个。尽管GPT-4的100分满分相比,“序列猴子”分数是50分,但李志飞认为目前该模型效果确实超出了他的预期,他十分满意。

李志飞强调,中国OpenAI不是出门问问的目标。同时,出门问问近期不考虑融资,不需要外部融资也能支撑研发投入。

“目前公司商业化做得不错,除大模型外,公司其他业务并不太烧钱。此外,出门问问之前的融资也较充足,我们过去还是融了不少钱,所以账上还有不少钱。”李志飞对钛媒体App表示,“(大模型)可能就是我最后一次All in干的一件事情”。

据悉,成立于2012年的出门问问,是一家以语音交互和软硬结合为核心的 AI 公司,为全球40多个国家和地区的消费者、企业提供 AI 产品和服务。其中包括智能手表TicWatch系列、AI 真无线智能耳机TicPods系列等,以及物联网、金融、车载等场景提供服务,推出的“魔音工坊配音助手”用户近200万。创立出门问问之前,李志飞博士毕业于美国约翰霍普金斯大学计算机系,曾任谷歌总部科学家。

截至2017年4月,出门问问共完成六轮融资,总额超2.55亿美元,投资方包括红杉资本、真格基金、谷歌、大众汽车等。

2021年6月,出门问问推出大模型UCLAI,效果不佳。2022年10月,出门问问重拾大模型的研发。李志飞坦陈,研发过程压力很大,因为研发很烧钱,而且不知道最终结果如何,直到两三周前的一天才发现“序列猴子”的表现不错。

据李志飞介绍,“序列猴子”这个名字的灵感,来源于数学家埃米尔·波雷尔在20世纪初提出了“无限猴子”定理,即只要给予无限时间,一只猴子几乎必然能够打出任何文字,比如莎士比亚的《哈姆雷特》,而如果喂给机器猴子海量的文本序列,通过大规模算力去训练它,就能练就有智能的“序列猴子”,而大模型是一个序列模型。目前,“序列猴子”大模型主要是文本形式,未来则会向多模态的方向发展。

C端方面,在发布会现场,出门问问团队进行了多轮Demo演示,比如,回答“湖南和湖北哪一个省会的人口更多?广东和新疆呢?”等问题,也从一众菜品中为不吃辣、喜欢吃虾的客人推荐了合理的菜品;而回答“天猫背后的公司的创始人本科毕业于哪个学校?”问题时,也能轻松输出马云本科毕业于浙江师范学院(现浙江师范大学)。
出门问问内测大模型“序列猴子”,CEO李志飞:我们不融资也能支撑研发

出门问问大模型现场Demo演示(图片来源:钛媒体App编辑拍摄)

不过,有些问题依然会出现和其他GPT大模型一样的反复胡诌、文生图对不上等情况,比如现场让“画一只赛博朋克风格的猫”,结果生成的是一位打扮好的二次元人物。李志飞提到,“序列猴子”大模型的语料也来自于互联网中,“我们需要不断调整它(大模型)的一些对话策略,各种各样的能力输出。”

李志飞指出,在中国做大模型的公司,不论是33分,还是50分以上,都不要焦虑,应该意识到现在的大模型不再像上一代的AI能力有限,它已具备基本的逻辑推理能力,每次都能给人惊喜, “序列猴子”大模型已经具备了一定的自然语言理解、知识、逻辑以及推理等能力。他强调,大模型的训练要循序渐进,不要一上来就搞“应试教育“,大模型的能力可能很快能提升到80分,但是要从80分做到90分以上,仍然会是非常难的事情。

而在B端,李志飞现场透露,“序列猴子”企业专属大模型已在首批汽车、教育、律所、金融、运营商、旅行、传媒、设计、智能硬件、医疗十大行业内测探索伙伴,企业方包括中国移动、中国工商银行、中国一汽红旗、春秋航空、VIPKID等。

出门问问内测大模型“序列猴子”,CEO李志飞:我们不融资也能支撑研发

李志飞强调,大模型商业化落地首先是创作者,然后是B端,然后才是C端。他透露,在创作者方面,出门问问提供付费服务,B端主要提供定制大模型服务,提供个性化答案,例如把功能嵌入至企业微信里面等。

当被问及中国大模型和美国距离多远时,李志飞认为是16个月。他解释称,2022年1月谷歌发布指令学习大模型FLAN,之后的2022年10月ChatGPT发布,2023年3月GPT-4发布。中国企业目前发布的一批大模型与FLAN水平相近,如此推算,中美大模型的差距为16个月——这与百度CEO李彦宏和搜狗创始人王小川说法都不一致,此前李彦宏认为文心一言和ChatGPT差距只有两个月,王小川认为国内和GPT-4有两、三年的差距。

李志飞称,目前大模型烧钱很厉害,算力是当前重要挑战之一。他提到,现在“序列猴子”模型比较大,没有做太多优化,所以显卡要求比较高,因此算力对于出门问问来说是一个现实的问题,他认为后面应该会慢慢的解决算力需求挑战。

李志飞向钛媒体App透露,现阶段出门问问不需要融资。据悉,自2017年至今的过去七年,出门问问没有公开过最新融资消息。

“我们2012年创业,其实我觉得出门问问已经到了一个阶段,我不需要靠去融资,然后又去烧钱,烧完钱以后又开始亏损,然后亏损了又进入了一个裁员优化,这是过去我们看到确实是无数个行业、无数公司经历的这么一个循环。现在对我来说,肯定不愿意去参与融资这种竞赛,我还是想理解模型本身变成一个可用的产品。目前这个阶段,我们是不融资的,我不需要外面的资本也能支撑这方面的投入。”

“钱从哪里来?我觉得是能用1/10的钱,干出比别人10倍好的事情,这个对我来说最有成就感。我早期认识OpenAI内部的人,人家根本就不优化成本了,因为现在他们要探索天花板了。所以对我来说,我更加care是我能不能够发挥我的才智,能跟别人做的不一样,真的就用1/10的钱能做出别人10倍、或者差不多10倍好的东西。”

李志飞强调,中国不会有下一个OpenAI,主要原因是中美创业环境不太一样,不太可能是去重复OpenAI这样的发展道路,国内大部分人还是在思考中国竞争太激烈、商业化如何竞争。

“中国版OpenAI不是我们的目标。我的初心就是要‘造大模型’,理解大模型,再把大模型用起来。”李志飞告诉钛媒体App。(本文首发钛媒体App,作者|林志佳)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy