豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o

1,060次阅读
没有评论

豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o

推理服务价格仅为GPT-4o的八分之一

12月30日,字节豆包大模型对外披露2024全领域技术进展。距5月15日首次亮相仅7个月,豆包大模型在通用语言、视频生成、语音对话、视觉理解等方面模型能力均已跨入国际第一梯队。豆包大模型团队表示,“从孩童般学语,到懵懂看世界,到为创作者绘出想象中的奇幻梦境,一切依然处于最早期。”

截至2024年12月,最新版豆包通用模型Doubao-pro-1215,综合能力较5月提升32%,已全面对齐GPT-4o,在数学、专业知识等部分复杂场景任务中,效果表现甚至更好。通过海量数据优化、提升模型稀疏度、引入强化学习、系统性工程优化等方式,团队大幅提升了Doubao-Pro理解精度和生成质量,并实现了性能与效率的平衡,推理服务价格仅为GPT-4o的八分之一。

豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o

Doubao-pro在主流评测集上能力全面对齐GPT-4o

图像与视频能力方面,团队于9月推出两款豆包视频生成模型PixelDance与Seaweed,主打复杂提示词精准理解、镜头一致、多交互主体和镜头灵活控制。豆包文生图模型不断迭代,还推出了通用图像编辑能力,让“一句话P图”和“一键海报生成”成为现实。此外,12月发布的豆包视觉理解模型Doubao-vision,可融合视觉与语言多感官深度思考和创作,目前模型能力在十多个主流数据集上比肩Gemini 2.0与GPT-4o。

豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o

Doubao-vision在主流评测集上能力比肩Gemini 2.0、GPT-4o

语音大模型赋予机器“听”与“说”的能力,豆包大模型团队今年推出了全新的语音识别模型Seed-ASR和语音生成基座模型Seed-TTS,通过引入多样、广泛的数据,融合推理链,赋予模型极强的泛化性。据悉,豆包语音模型可听懂20种以上方言夹杂的对话,也能边听边思考,并在会话中表达情感,保留吞音、口音等人类习惯,甚至在交互中可随时被打断。

较语音更进一步,豆包大模型已拥有高品质的“唱作”能力,从词曲编辑、演奏生成到人声演唱,“一个AI也可以是一个乐队”已经成为现实。其背后依托的音乐生成模型框架Seed-Music,结合了语言模型与扩散模型的优势,实现了音乐生成的通用框架,拥有极高的编辑可控性。

团队还首次对外披露了豆包大模型300万字窗口的长文本能力,可一次轻松阅读上百篇学术报告,每百万tokens处理延迟仅需15秒。这一上下文窗口长度和时延水平达到目前业界极限。背靠STRING等上下文关联数据算法和模型加速优化,团队大幅提升了LLM利用海量外部知识的能力,并通过稀疏化及分布式方案将时延降到十秒级。

代码能力方面,豆包代码大模型Doubao-coder编程能力达到专业级,深度支持超16种编程语言、11类真实应用场景,可满足前后端开发、机器学习等全栈编程开发需求。

成立极短时间内,豆包大模型团队还对AI基础研究深入布局。过去几个月,团队57篇论文中选ICLR、CVPR、NeurIPS等顶会,研究成果包括下载量超百万的开源项目及GitHub万星爆款。

豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o

豆包大模型团队披露2024研究关键词

同时,豆包大模型团队与近20所高校深入合作,支持超过40位顶尖学者参与关键AI技术攻坚,并与清华AIR、北大分别成立联合实验室。为储备最具潜力的研究人才,豆包大模型团队启动了“Top Seed人才计划”,在全球范围招募顶尖博士毕业生加入,共同挑战世界级AI课题。

根据披露,豆包大模型相关技术能力目前支撑了包括豆包、即梦、豆包MarsCode等50多个C端应用场景,其中,豆包APP已成为国内最受欢迎的AI产品。通过火山引擎,豆包大模型服务了30多个行业,日均tokens调用量超4万亿,较5月发布时增长33倍。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 12 月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线

反超Nano Banana!OpenAI旗舰图像生成模型上线 Jay 2025-12-17 10:25:43 ...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了

企业级智能体落地,谁没踩这四种大坑?无问芯穹的系统性解法来了 衡宇 2025-12-16 20:10:53 来...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026

小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026 克雷西 2025-...
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式

顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式 思邈 2025-12-16 10:24:0...
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026

PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026 梦瑶 2025-12...
Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控

Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控 量子位的朋友们 2025-12-16...
推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码

推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码 henry 2025-12-16 15:03:31 ...