品玩6月25日讯,据 huggingface 页面显示,谷歌研究团队近日推出一款大语言模型产品 AudioPaLM,可以实现语音理解和生成功能。
AudioPaLM 将两个大语言模型 PaLM-2 和 AudioLM 融合到一个统一的多模态架构之中,利用该架构处理和生成文本和语音。 AudioPaLM 还支持语音识别以及语音翻译。
试验表明,AudioPaLM 的表现显著优于现有的语音翻译系统。
正文完
可以使用微信扫码关注公众号(ID:xzluomor)