清华大学联手字节跳动,推出全新开源听觉大语言模型

365次阅读
没有评论

品玩8月22日讯,据 Github 页面显示,清华大学近日联手字节跳动,推出全新开源大语言模型SALMONN 。

据介绍,SALMONN支持语音、音频以及音乐输入,他可以感知和理解不同类型的音频内容输入,并具备多语言语音识别和翻译以及语音推理等功能。

据悉,SALMONN 与传统的语音识别、音频字幕生成等语音和音频处理任务相比具备更好的通用性,同时可以准确地听从使用者的指令。

清华大学联手字节跳动,推出全新开源听觉大语言模型

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy