常史聘 假装发自 凹非寺
量子位 | 公众号 QbitAI
前不久,中国电信的星辰语义大模型正式开源,也就此成为第一家完成大模型研发和开源的央企。
星辰语义大模型由中国电信旗下的中电信人工智能科技有限公司(以下简称电信AI)完全自主研发而成,其开源版本在一众大模型知名榜单上,都取得了良好的成绩。
传统运营商,为何会投入大模型研发?为何选择开源?
两种不同领域的企业气质,它们的融合碰撞,会造就怎样的一支团队?
贴在电信AI身上的种种标签,都让其在一众大模型选手中,显得尤为独特。
事实上,中国电信入局大模型,可以说是一件水到渠成的事情。
人们常说算力、算法、数据,是大模型研发的三要素。而在这三个方面,中国电信都都具备着优势:
算力方面,中国电信近十几年构建了覆盖全国省份的四级算力体系,可满足大模型的算力要求;
在算法方面,本质上比拼的是人才资源。电信AI团队规模及800人,其中研发人员占比80%。同时,电信AI也汇集了一批行业大牛,比如,AI领域知名科学家李学龙已在去年年底全职加盟中国电信,出任集团CTO及首席科学家;
而在数据上,电信20多年来已积累了大量行业数据,再加上来自包括全国主流网站、百科、书籍、论坛、媒体在内的多个渠道的通用数据,其中文训练数据超过25TB,中文总token量超8万亿。同时,电信AI组建了专业标注团队保障数据质量,为大模型算法训练打下了坚实基础。
而凭借着这些优势,电信AI的星辰语义大模型,也在这场卷到极致的竞争中,展现出了自己的独特优势:
-
最大可支持96k的上下文推理;
-
中文阅读理解能力领先于同等参数规模的开源大模型;
-
模型幻觉问题得到有效缓解;
-
模型生成的内容更符合主流价值观;
……
在具体表现上,星辰语义大模型具备常识问答、写作、逻辑推理、数学、辅助代码生成等诸多通用能力。
尤其在长文写作上,星辰语义大模型表现更为突出:根据统计,在电信内部,星辰AI大模型在此任务上的有效采纳率高达85.7%。
此外,在多轮理解上,星辰语义大模型也进行了针对性的提升。
无论是百模大战、千模大战还是万模大战,这一定是一个“大浪淘沙”的过程,最终存活下来的,可能只有少数的几家。
而电信AI的目标,就是成为其中的N分之一。
不过,电信的目标并不止于此。
事实上,在大模型之外,电信在传统AI领域,如NLP、计算机视觉、乃至数字人和机器人等领域,已经进行了多年的投入和布局,也完成了不少交付。
而这些方向的技术积累,最终也将整合到这个更为宏大的目标上来。
至于这个目标是什么,相信看完视频,你会得到答案。
— 完 —
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~