阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

1,762次阅读
没有评论

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

3 月 23 日,国内通用大模型创业公司阶跃星辰在 2024 全球开发者先锋大会上发布了公司的通用大模型产品

阶跃星辰创始人、CEO 姜大昕博士在大会开幕式上对外发布了 Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版。

以下内容来自于官方稿件,Founder Park 略有调整。

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

01

坚定 Scaling Law 方向,

万亿参数模型可预览

成立一年,阶跃星辰团队对通往 AGI技术路径有深入理解。首先坚定相信 Scaling Law 是方向,参数量决定了模型智能水平的上限。因此 Step-1 千亿参数语言大模型训练成功后,随即开展 Step-2 万亿参数大模型的训练工作。其次是认识到多模理解和生成的统一是通往 AGI 的必经之路。Step-1V 千亿参数多模态大模型,在多模理解上做到了业内领先,一方面验证了 Step-1 语言大模型的能力,另一方面也为多模生成打下一个好基础。

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

具体来说,阶跃星辰研发的 Step-1 千亿参数语言大模型,在逻辑推理、中文知识、英文知识、数学、代码方面的性能全面超过 GPT-3.5。Step-1V 千亿参数多模态大模型,在中国权威的大型模型评估平台「司南」(OpenCompass)多模态模型评测榜单中,位列第一,性能比肩 GPT-4V。Step-1V 的多模理解能力突出,可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。此外,Step-1V 亦可实现视频理解。

千亿参数模型只是阶跃星辰团队在攀登通用人工智能路上迈出的第一步。此次,阶跃星辰还发布了 Step-2 万亿参数语言大模型预览版,提供 API 接口给部分合作伙伴试用。模型采用 MoE 架构,聚焦深度智能的探索。据了解,参数量从千亿到万亿,增长了一个数量级,对算力、系统、数据、算法四个方面都提出了极高的要求,业内只有极少数公司能做到。训练万亿参数模型体现了阶跃星辰的核心技术能力,也说明了公司探索通用人工智能的决心。


02

自有+合作,

探索 C 端应用

当下,模型能力决定了 AI 应用水平的上限,同时也将创造全新的应用机会。阶跃星辰在此方面通过自有产品和合作产品两种方式,展开了积极探索。团队研发并推出了两款面向 C 端用户的大模型产品——效率工具跃问和 AI 开放世界平台冒泡鸭,均已全面开放使用。

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

此外阶跃星辰在金融、网络文学、知识服务等领域已与合作伙伴达成深度合作,共同探索面向 C 端用户的创新应用。在金融领域,阶跃星辰与上海报业旗下界面财联社达成深度合作,双方围绕 AIGC 财经资讯、智能投研、智能投顾等领域推进大模型的应用落地。

在网络文学领域,阶跃星辰与中文在线独家达成深度战略合作,共同探索大模型在灵感激发、内容创作等网络文学创作领域的应用。在知识服务领域,阶跃星辰与中国知网、中文在线达成战略合作,围绕大众知识服务等场景研究和推进大模型的应用。

当下,大模型技术的研发和落地应用仍在快速迭代和探索中,围绕这一前沿技术,聚集了最顶尖的人才与丰厚的战略资源,无疑是科技发展的焦点所在,在这样的大环境下阶跃星辰从幕后走向台前,正式亮相并发布了一系列重要模型与产品,坚定地释放出一种信号,实现通用人工智能或许并不遥远,「智能阶跃,十倍每一个人的可能」。


03

微软系团队创业

阶跃星辰成立于 2023 年 4 月,聚集了多位微软系顶尖人才。其创始人和 CEO 是前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕博士,核心创始团队包括系统负责人朱亦博博士和数据负责人焦斌星博士。

姜大昕博士是自然语言处理领域的全球知名专家,在机器学习、数据挖掘、自然语言处理和生物信息学等领域拥有丰富的研究及工程经验;朱亦博博士拥有多次单集群万卡以上的系统建设与管理实践经验;焦斌星博士此前担任微软必应引擎核心搜索团队负责人,负责利用数据挖掘和 NLP 算法优化索引和搜索质量。

阶跃星辰自成立起,在算力、系统、数据和算法这四大要素上综合布局,坚定投入攀登 Scaling Law。这是必须坚持但极其艰巨的任务,阶跃星辰团队因此聚集,在通用人工智能领域开启了一场追赶 OpenAI 的竞逐。

如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。
阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数
更多阅读

2024 年,中国的投资人们如何投 AI?

拿钱、增长、TMF,大模型应用层创业的 13 个 Tips

古董级互联网产品终于上市,首日暴涨48%,YC创始人撰文回顾

对话 OpenAI COO:ChatGPT会继续免费、不要指望AI解决一切问题、从有限问题着手

转载原创文章请添加微信:geekparker

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 3 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!

开源“裸考”真实世界,国产具身智能基座模型拿下全球第二! 西风 2026-01-08 19:02:20 来源:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...
杜比在CES 2026重塑了观影、娱乐的方式

杜比在CES 2026重塑了观影、娱乐的方式

杜比在CES 2026重塑了观影、娱乐的方式 十三 2026-01-07 12:47:06 来源:量子位 树立...
全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026

全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026

全自主、更好用!北京人形 “干活机器人” 惊艳亮相 CES2026 量子位的朋友们 2026-01-06 16...
港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了

港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了

港科大教授实测AI眼镜“作弊”:30分钟碾压95%的学生,把传统教学评估体系整破防了 梦瑶 2026-01-0...