魔搭社区推出 AI Agent 开发框架ModelScope-Agent
据阿里云官方消息,AI 模型社区魔搭现已推出适配开源大语言模型的AI Agent开发框架ModelScope-Agent。
借助ModelScope-Agent,所有开发者都可基于开源 LLM 搭建属于自己的智能体应用,最大限度释放想象力和创造力。ModelScope-Agent的代码现已开源。
此前,魔搭已用这套框架在社区做了“打样”,搭建 ModeScopeGPT,它能通过自然语言与用户交互、接受用户指令,通过“中枢模型”通义千问调用社区的众多AI模型API,自主完成人类布置的任务。ModeScopeGPT的调用量已超过 25 万。
腾讯全球数字生态大会明日举办,将公布旗下 AI 聊天机器人
据腾讯云官方消息,腾讯将会在9月7日举办腾讯全球数字生态大会,届时腾讯将会公布旗下 AI 聊天机器人产品。
目前,腾讯旗下AI 聊天机器人产品混元助手小程序一上线,不过当前仅向受邀用户开放。据悉,腾讯混元助手是腾讯推出的 AI 对话机器人,拥有AI问答、AI绘画等功能。
金山办公与阿里云达成战略合作,在AI大模型等领域展开深度合作
据金山办公消息,金山办公今日与阿里云达成战略合作。
据介绍,双方将发挥各自的技术优势和平台能力,在云资源、AI大模型、产品生态融合、联合解决方案等多个领域展开深度合作,实现生态协同发展。
结合金山办公在行业领域的优势和阿里云拥有的智能算力储备,机器学习平台PAI提供的AI开发全流程工程能力,以及自研的通义系列大模型服务,双方将围绕AIGC(内容创作)、Copilot(智慧助手)、Insight(知识洞察)三个战略方向,一起就智能办公进行共创,为用户提供更加智能便利的办公体验。
眸瑞科技与沐曦联合发布首个 AI 模型“贴图超分”技术
据沐曦官方消息,眸瑞科技近日与沐曦联合发布首个AI模型“贴图超分”技术。
该技术依托曦思®N系列AI推理GPU首款产品曦思®N100的强大算力,结合眸瑞科技丰富的算法库资源和先进的AI超分算法,首次将AI超分成功应用到了3D模型领域,实力打造自主可控、安全可信的国产软硬件一体化解决方案,为企业单位和专业创作者提供一个安全可靠的一站式全新三维开发生态。
阿里云推出全新视频生成大模型I2VGen-XL,并在魔搭社区开放体验,用户上传一张图片后2分钟左右即可生成一段1280*720的高分辨率视频,该模型研发负责人表示,未来将进一步实现2K超清效果,可应用于短视频内容生产、电影制作等场景。
I2VGen-XL模型设计了两个阶段,首先在低分辨率条件下保证生成结果和给定图像语义的匹配度,随后通过视频扩散模型(VLDM)来提高视频分辨率,并同时提升时间和空间上的一致性,保证最终视频内容的清晰度和连贯性,最终实现1280*720高分辨率的突破,并且在画面细节的展现上大幅领先现有模型。据介绍,该模型的训练还使用了多种风格的视频数据,因此可生成科技感、电影色、卡通风格和素描等类型丰富的视频。
目前,I2VGen-XL的模型和代码均已开源。
前 Windows Insider 负责人Sarkar 宣布负责微软新 AI 内容
据微软前 Windows Insider 负责人 Dona Sarkar 表示,她现在在微软内部负责一个新的开发计划。
据 Sarkat 表示,她将和Microsoft Copilot 使用者合作,构建一个新的程序,帮助开发者客户找出扩展其 Copilot 的最佳方式,以便他们可以将自己的 AI 产品融入其公司数据之中。目前Sarkat 并没有透露该项目的进度。
王小川称百川大模型开源之后在社区总下载量突破了500万
据界面新闻报道,百川智能今天召开发布会,介绍百川大模型在开源方面的最新进展。
据百川智能创始人王小川表示,Baichuan-7B、Baichuan-13B两款开源大模型在多个权威评测榜单均名列前茅,目前下载量超过500万次。他认为,百川智能作为有过搜索经验的创业团队,知道如何基于万亿互联网数据精选、筛选优质垂直行业数据,进行去重、反垃圾训练,也因此,百川在训练语料上面的能力,帮助Baichuan-7B开源后在中英文主流任务上的表现全面超越了LlaMA2-13B。
重点论文:
微软研究院提出PromptTTS 2,用语音生成文本提示
据 Huggingface 页面显示,微软研究院近日提出一种名为PromptTTS 2的方法,可通过语音来生成文本提示。
研究团队表示,PromptTTS 2 使用语音理解模型来生成语音的文本提示,以从语音中识别语音属性,并使用大语言模型来根据识别结果制定文本提示。
实验结果显示,与之前的方法相比,PromptTTS 2生成的语音与文本提示更加一致,并支持多种语音变异性的采样。
论文地址:点此前往