大模型晚报|阿里云开源通义千问多模态大模型Qwen-VL

318次阅读
没有评论

大模型资讯:

阿里云开源通义千问多模态大模型Qwen-VL

阿里云今天宣布推出开源大规模视觉语言模型Qwen-VL。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。

Qwen-VL是支持中英文等多种语言的视觉语言(Vision Language,VL)模型,相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力。

在主流的多模态任务评测和多模态聊天能力评测中,Qwen-VL取得了远超同等规模通用模型的表现。

大模型晚报|阿里云开源通义千问多模态大模型Qwen-VL

IBM将参与Hugging Face2.35亿美元D轮融资

IBM和开源人工智能平台Hugging Face周四联合宣布,前者参与了后者的2.35亿美元的D轮融资。

这笔额外的资金将进一步加强Hugging Face作为领先的开源和开放科学人工智能平台的地位。IBM和Hugging Face最近宣布在IBM的生成式人工智能平台watsonx上展开合作,帮助企业构建、部署和定制跨多个领域的基础模型。

在watsonx中,人工智能构建者可以利用IBM和Hugging Face社区的模型,这些模型经过预先训练,可以支持一系列自然语言处理(NLP)任务,包括问题回答、内容生成和摘要、文本分类和提取。

AMD 收购 AI软件公司 Mipsology,将加强 AMD AI 软件开发能力

据 AMD 官网显示,AMD 宣布收购AI软件公司 Mipsology。

AMD 表示, Mipsology 的软件团队将加入 AMD AI Group,帮助进一步加快 AMD 的客户参与度并扩展 AMD的 AI 软件开发能力。该团队将帮助开发AMD完整的人工智能软件堆栈,扩展AMD的软件工具、库和模型的开放生态系统,为在 AMD 硬件上运行的人工智能模型的简化部署铺平道路。

Mipsology 成立于 2015 年,总部位于法国帕莱索。该公司主要开发针对 AMD 硬件量身定制的领先 AI 推理、优化解决方案和工具。

微软 Teams 引入 Typeface AI 工具,加强品牌营销内容

微软近日宣布,将为微软 Teams 加入 AI 工具 Typeface 。

据悉, Typeface 整合了Azure 机器学习、Azure OpenAI 服务和 Typeface 品牌个性化AI 的强大能力,可以用于创建创意简报、电子邮件营销活动以及多媒体在线广告等内容。用户可以在无须切换应用程序的情况下增强品牌内容。企业可以使用 Affinity AI 模式来训练 Typeface AI 应用程序,创建自己的专属内容。

Meta AI 公布开源基础模型 Code Llama,专攻代码生成

Meta AI 近日发布论文,公布了一款针对代码生成功能的基础大语言模型 Code Llama。

据悉,Code Llama基于Llama 2开发,具有开放式模型中领先的性能、填充能力、对大型输入上下文的支持以及用于编程任务的零指令跟随能力。它提供包括基础模型、Python专用版本以及指令跟随模型等多个模型,每个模型的参数分别为7B、13B和34B。所有模型都是基于16k标记序列进行训练,并在最多100k标记输入上显示出改进。

Code Llama以宽松许可证方式开源,允许研究和商业使用。

奇安信发布Q-GPT安全机器人和大模型卫士

奇安信集团在京发布了Q-GPT(奇安信大模型)安全机器人和大模型卫士。

据介绍,Q-GPT安全机器人是基于奇安信大模型的“虚拟安全专家”,可以全天候工作。大模型卫士集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源等功能为一体。

会上,京东方集团和吉利集团等客户现场签约,成为国内首批Q-GPT安全机器人和安全大模型用户。

重点论文:

中国科学技术大学联手新加坡管理大学,推出图像生成模型CgT-GAN

据 Arxiv 页面显示,中国科学技术大学近日联手新加坡管理大学发布一款图像生成模型 CgT-Gan。

CgT-GAN通过将图像纳入训练过程,使模型能够“看到”真实的视觉模态。具体来说,研究团队采用对抗训练来教导CgT-GAN模型模仿外部文本语料库的短语,同时利用基于CLIP的奖励机制提供语义指导。

实验结果显示,CgT-GAN在所有指标上明显优于现有的方法。

论文地址:点此前往

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy