科大讯飞背上抄袭OpenAI的骂名,冤吗?

2,124次阅读
没有评论

科大讯飞背上抄袭OpenAI的骂名,冤吗?

图片来源@视觉中国

文|略大参考,作者|程怡、小船、杨知潮,编辑|秦安娜

目前互联网公司和AI公司都在大模型上较劲,晚推出一个月,都有可能影响自己的股价。既然GPT1和GPT2和已经开源,那么在已有的模型基础之上来建立自己的大模型产品,是既合法也经济的选择。

当科技圈讨论AI大模型,他们在思考什么?

阿里巴巴董事局主席张勇说,所有产品都值得用AI重做一遍。李彦宏说,百度同学要有意识的培养AI原生应用的思维方式和理念,用新理念重构现在的每个产品,每个业务。周鸿祎说360鼓励每一位员工、每个产品和业务都要全面拥抱人工智能,适应人机协作,着手产品重塑。

凡此种种的表态,无一不在透露一种思考:AI大模型是技术浪潮,也会是产品思维方式的浪潮,它会推动人工智能时代出行跟互联网、移动互联网时代,不同的思考模式和产品形式。

处于巨变前夜,科大讯飞表态在10月底,新发布的星火大模型会追上ChatGPT的发言,就没有那么激动人心。一方面,说今年能追赶上的人太多了。另一方面ChatGPT的价值不仅仅是OpenAI基于GPT大模型,打造出来的一款成功产品。借用周鸿祎的话说,ChatGPT让人工智能变成了一项云服务

百度的文心大模型发布之后,饱受非议,并不耽误百度宣传“百度云是国内第一个训练出大模型的云”。前阵子,阿里云毫不留情,启动史上最大规模降价抢占市场,存储业务最高降幅50%。因为投资OpenAI成为生成式AI赢家的微软,多笔对OpenAI的投资,都是以云服务消费券的方式提供现金+云服务的投资形式。

在人工智能同各行业、多应用场景结合带来的大数据爆发阶段,科技企业们一边走在探索AI重构产品形态的道路,一边用云技术作为底层技术基础,存储和分析海量,挖掘服务收入,对冲探索成本。即便是作为“AI后辈”的商汤,也搭建出来算力中心的商业模型,想做人工智能行业的“水电煤”。

在告别营收连续10年增长的业绩之后,科大讯飞借用生成式AI的新“旧瓶”,却装进一个客户、一个应用场景的技术落地之路的“旧模式”,辛苦当搬水工,商业模式看起来就没有那么性感了。

科大讯飞要去追赶ChatGPT,但对押注AI的互联网企业来说,它们想追赶的是微软。

0重新定义自研

自从大洋彼岸的OpenAI于2022年11月推出ChatGPT后,一场波及全球科技的“海啸”就此爆发。在国内大模型扎堆的上半年,中国几乎所有的知名的科技企业,都发布了类ChatGPT的“AI大模型”。

科大讯飞并非冲在第一阵线的排头兵。尽管有十余年对于认知智能相关的研究和计划,拥有“人工智能国家队”的美名,讯飞的认知大模型成果发布会直到5月6日才姗姗来迟。而在其4月17日对于发布会的官宣公告中,有一句颇为保守的补充说明——“公司尚不能预测相关技术及应用对2023年度销售收入和经营业绩的提升影响”。

但5月6日的发布会上基调定得很高,围绕讯飞星火认知大模型,科大讯飞董事长刘庆峰和讯飞研究院院长刘聪,一同在现场进行了1个小时左右的实时演示,展示星火在语言理解、知识问答、逻辑推理,数学、代码及多模态等方面的能力。

科大讯飞方面表示,讯飞星火在长文本生成、数学能力和泛领域开放式知识问答三大能力已超ChatGPT。在 2023 年内预计还会进行三次升级,分批次增强数学能力、补足代码能力,希望最终将在10月24日全球开发者大会期间,能够全面对标 ChatGPT,在中文上要超越 ChatGPT。

官方的“王婆卖瓜”是一码事,星火大模型在用户端的实际使用情况如何呢?

5月9日晚,一段关于讯飞星火的群聊记录在各个群广为流传,一张截图显示,得到内测资格的提问者问道星火提供的API接口是OpenAI的?星火大模型回答道,“是的,我是由OpenAI开发的”。紧跟截图后面,是群内的议论,指向星火大模型疑似套壳OpenAI?

科大讯飞背上抄袭OpenAI的骂名,冤吗?

当然,孩童也会说自己是奥特曼。今天的AI还处在幼儿期,星火大模型说自己来自OpenAI,就一定来自OpenAI吗?

答案是不一定。西安交通大学AI学院的浩儒博士告诉“略大参考”,大模型还是靠函数拟合,没有真正的自我认知,他们不知道自己是谁,很可能在哪个网站上学习过这句话就说了出来。

但是他认为,星火大模型也有可能是“借鉴”了GPT。浩儒博士表示:“模型都是经过预训练的,相当于硬盘出厂的时候里面就有资料,如果你把GPT开源的模型直接拿过来用,就可能会一块学习到GPT的语料,造成这种乌龙事件。”

类似的事件在国内AI行业不是第一次发生,早在星火大模型推出之前,也有用户发现百度的文心一言的绘图疑似为汉译英后再绘制,有使用国外框架的嫌疑。

浩儒博士透露,把别人开源的模型拿过来直接用,在自然语言处理科研领域是很常见的的做法:“高校不可能都从头开始训练”。对企业来说也是如此,目前互联网公司和AI公司都在大模型上较劲,晚推出一个月,都有可能影响自己的股价。既然GPT1和GPT2和已经开源,那么在已有的模型基础之上来建立自己的大模型产品,是既合法也经济的选择。

市场端的及时反应则是,科大讯飞成为5月10日北向资金净卖出7只个股中金额最多的一只,收盘价65.45元,净卖出4.377亿元。

02 增长神话终结

如果“借鉴”了GPT,那还算是原创的大模型吗?这可能是个哲学问题。浩儒博士表示。语言大模型是混沌系统,运行原理都是未知的,构成更是根本说不清楚:“就像忒休斯的船,即使你用了别人的骨干,也很难说不断学习后的大模型还是不是之前的大模型。”

一个月前,商汤在交流日上也曾因为号称完全自研的文生图创作平台“秒画SenseMirage”在精选模型中出现AI模型站civitai的图片引发广泛质疑。商汤方面的解释是:秒画SenseMirage包含商汤自研AIGC大模型,也提供第三方社区开源模型。

就像此前的发布会惯例一样,国内的AI大模型发布会不单是为了炫技,主要是用来“卖”的。讯飞星火将在教育、办公、汽车、数字员工四个领域的寻找应用方向,与讯飞旗下教育产品AI学习机以及办公产品讯飞听见相结合,寻找落地场景。处于审慎考虑,稍晚时刻,科大讯飞会推出面向医疗场景的服务。

近两年,人工智能技术发生了方向性的改变,用李彦宏的话说:从辨别式的人工智能走向生成式的人工智能,AIGC成为新方向。

科大讯飞是“辨别式”人工智能时代,很早一批从事人工智能研究的企业,几乎跟BAT是同一时期创立的,2008年已在深交所上市。前身历史甚至更悠久,是80年代中国科技大学的电子工程系人机语音通信实验室。

不过,很长时间科大讯飞以to B端服务商的身份,蛰居在客户身后。2016年,罗永浩在锤子M1手机新品发布会上的一番“胡说八道”带火了科大讯飞

罗永浩在发布会现场,展示一段没有经过编排,只是一些生活琐事,且语速较快的“口水话”,结果讯飞输入法在罗永浩结束语音输入的瞬间,几乎是秒将语音转换成文字,而且完全正确。现场响起了哇的惊呼,和长达23秒的掌声。

锤子的新品发布会,结果讯飞输入法“炸”了,一炮而红, 市值和产品下载量双双暴增。

在人工智能时代以检测和识别为主要应用的阶段,科大讯飞在语音识别领域,将业务伸向众多应用场景,形成了 ToB + ToC + ToG 的三驾马车。收入也水涨船高,从过连续10年业绩增长的神话,增长幅度较少的年份,增速都接近30%。

然而,AI技术不断更迭,在深度神经网络及云计算、大模型的演进过程中,理解、推理逻辑为基础的生成式AI,成为新趋势,AI技术的迭代路径,已不在科大讯飞的优势区域了。

科大讯飞背上抄袭OpenAI的骂名,冤吗?

反映在财报上,便是连续 10 年的业绩增长神话终结。财报显示,2022 年科大讯飞实现营收188.2 亿元,同比仅增长2.77%;归母净利润5.61 亿元,同比下滑 63.94%。

科大讯飞背上抄袭OpenAI的骂名,冤吗?

这是近五年来科大讯飞净利润的首次下滑。

03 商业模式之战

最近几个月大半个科技圈为AI大模型沸腾。

2月份出门问问的创始人李志飞到硅谷转了一圈,想搞懂什么是大模型。见了几位谷歌科学家,了解一圈信息后,回国在源码资本的分享会上跟王兴、王慧文等创业者分享,结果分享出一位竞争对手:王慧文虽然不懂,但大受震撼,激动的要自带资金,肉身入股,加入到AI大模型的科技浪潮。

其他人也没闲着,纷纷从功成名就的幕后,走向台前,李开复、王小川要组建团队。退休后的张一鸣,没有公开表态,也在悄咪咪的准备,挑灯夜读学习OpenAI的论文。

今年以来市场隔三差五有一款大模型产品问世,华为盘古,昆仑万维天工。市场涌向大模型的热烈氛围被形容为蹭热点的多,技术能打的少。

国内人工智能企业,似乎形成一种共识,构建起关键性门槛的并不是技术和算法环节,比拼的关键在于吸引客户的能力。李志飞对此有过形象表述:“90%以上的技术都没有独门武器,更多是一个门票。”

刘庆峰相信人工智能拼场景的商业模式,他曾说。“人工智能改变世界,需要在一个又一个的领域进行应用的创新”。星火大模型发布后,他亦说道“谁能够在具备社会刚需的应用场景落地,谁就最先能形成自我造血的良性循环。”

在应用落地上,国内AI公司的发展速度比硅谷快10倍。科大讯飞自去年12月15日正式启动“1+N”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。

科大讯飞背上抄袭OpenAI的骂名,冤吗?

只是,国内无论哪家企业发布AI大模型产品,几乎都是卷进相同的应用场景。但一家技术型公司要一下子摸透各种细分行业的门道,并不现实。

技术不行,有时候就得靠技巧来凑。科大讯飞曾被爆出了人工翻译冒充AI的造假丑闻。在2018创新与新兴产业发展国际会议(IEID)的高端装备技术与产业分会上,科大讯飞称为现场提供了AI同声传译。

但事后,那场会议的同声传译员却在知乎上曝光,整场会议的翻译都是由人员提供的,他甚至还提供了视频证据,视频显示,AI同传的语音几乎都是在复读一位女翻译员的翻译。科大讯飞事后回应,“个别同传译员对于科大讯飞存在误解,我们认为仅仅是对会议服务方面的分工沟通了解不清。”科大讯飞只是将同传的“语音”转成“文字”。

科大讯飞的短板在于,面向C端它没有一款国民级的应用,同样是办公场景,钉钉接入阿里的通义千问,通过输入斜杠 “/”,可唤起 10 余项 AI 能力;字节跳动旗下的飞书也将上线 AI 助手 “My AI”,它们的人工智能技术可以跟现有的产品做结合。

面向B端,结合客户的需求,做应用场景的数据、算法。服务用户的成本,难以分摊的。传统的语音识别赛道,增速放缓,做toG业务,需要考虑漫长的回款周期,现金流承压。

好在,科大讯飞能得到政府支持,2022年计入当期损益的政府补助金额甚至升到了 10 亿元,它一年净利润也不过才5.61亿元。

但拿到这些支持的科大讯飞老实发展技术了吗?由于是高科技企业,科大讯飞能够获得许多政策上的支持,2018年,央视曝光了科大讯飞的投机套路:以建设培训基地为名换取园区类土地,再通过买卖地皮套现。

2021年,科大讯飞董事长刘庆峰曾豪言,提出“2025年千亿营收目标,构建万亿生态”的承诺。按照现在目标进度,还没有完成20%。它试图通过拥抱多元化,发展横跨机器人、教育、医疗、城市运营、地产、消费、汽车、金融等多个条线的“一揽子”应用场景落地计划,更像是为了达到营收目标的“饥不择食”。

科大讯飞背上抄袭OpenAI的骂名,冤吗?

科大讯飞喊出追赶ChatGPT,但对押注AI的互联网企业来说,他们想追赶的是微软。云计算是生成式AI时代的肥肉,就像无论谁做大模型,赢家都是英伟达,谁也绕不过被英伟达A100芯片缺货支配的命运。

ChatGPT是人工智能产业中被广为讨论的显性因素,就像飘在冰面上的一小块儿浮冰,而掩藏在水下的冰山体积,才是更为庞大的部分,算力是AI的商业想象力。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 5 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二! 西风 2026-01-08 19:02:20 来源:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少

悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少

悲报!Stack Overflow彻底凉了,比18年前上线首月问题数量还少 闻乐 2026-01-05 19:...
全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026

全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026

全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026 量子位的朋友们 2026-01-06 16...
港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了

港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了

港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了 梦瑶 2026-01-0...
海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光 量子位的朋友们 2026-01-06...