Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

1,376次阅读
没有评论

Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

(图片来源@视觉中国)

钛媒体App获悉,当地时间8月22日,科技巨头Facebook母公司Meta 对外发布了一款最新人工智能AI)翻译引擎SeamlessM4T,可以更轻松地跨文本语音翻译和转录近100种语言。

同时,Meta还公布了新的开源翻译数据集 SeamlessAlign,将44.3万小时的语音与文本、2.9万小时的语音转录数据进行对齐,教会SeamlessM4T如何将语音转录为文本、翻译文本、从文本生成语音。

Meta表示,SeamlessM4T将与SeamlessAlign一同开源。SeamlessM4T代表了 AI 技术驱动的“语音到语音”和“语音到文本”领域的“重大突破”。

Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

Meta发布 AI 模型SeamlessM4T,可转录和翻译近100种语言|钛快讯

据悉,作为最早投资AI的大型科技企业之一,Meta于2013年成立了 AI 基础研究实验室,聘请了AI领域的顶级学者,有大量社交与元宇宙算法,推出Pytorch框架、Zion等软硬件产品。不过,虽然Meta在AI领域也取得了一些进展,但它落后于OpenAI、微软、谷歌等公司。

随着ChatGPT风靡全球,Meta AI团队正在加紧追赶,以及重新组合其关于语言、对话等领域与大模型相关的研究。

去年底之后,Meta陆续发布No Language Left Behind(不留语言)文本到文本的机器翻译模型,支持200种语言,以及开发多语言数据集SpeechMatrix、生成文本到声音的AudioCraft等。另外在今年7月,Meta还发布开源对话大模型Llama 2,引发广泛讨论和关注。

此次公布的SeamlessM4T,建立在Meta AI翻译模型的技术能力基础上,并重新设计Fairseq序列建模工具包,以创建更轻量级的模型和处理更多信息。Meta表示,SeamlessM4T从“爬取的网页数据的公开可用存储库中”收集了400万小时的“原始音频”,该模型可以在近100种语言之间进行文本到语音的翻译,并支持35种语言的完全语音到语音翻译。

对于安全性和脱敏性,Meta表示,在开发SeamlessM4T时,团队构建了一个可以识别敏感词系统,目标是能够过滤了训练数据中不平衡的数据信息,从而检测和输出正确的翻译内容。而且,Meta研究人员还尝试清理误译一些脏话的数据集,以便更准确地检测何时使用。

Meta研究科学家负责人Paco Guzman表示,SeamlessM4T的一大突破是它不依赖中间模型来产生结果,这使得它更加灵活,甚至支持动态更改语言。这将促进更多人使用其进行日程对话。

不过,Meta建议不要使用SeamlessM4T进行长篇翻译,政府专用的认证翻译,以及不鼓励出于医疗或法律目的部署该模型,原因或与专业领域的翻译准确度有关。科技网站《对话》(theconversation)最近表示,AI 翻译有许多缺陷,包括不同形式的性别错误和偏见、语音识别算法偏差等。

据报道称,Meta后续将把这些翻译和转录方面的 AI 进展,整合到Facebook、Instagram、WhatsApp、Messenger和Threads等产品当中。

(本文首发钛媒体App,作者|林志佳,编辑|马金男)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 8 月
 123456
78910111213
14151617181920
21222324252627
28293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...