大模型资讯:
阿里、腾讯、字节、美团内部算法名单公开,网信办发布深度合成服务备案信息
据国家互联网信息办公室今日消息,根据《互联网信息服务深度合成管理规定》,现公开发布境内深度合成服务算法备案信息,具体信息可通过互联网信息服务算法备案系统(https://beian.cac.gov.cn)进行查询。
《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。深度合成服务技术支持者应当参照履行备案和变更、注销备案手续。
北京共有8个主体(公司)和11个算法通过了备案。
腾讯首次披露行业大模型进展:不追求参数高,希望成本预算可控
据澎湃新闻报道,腾讯云副总裁、腾讯云智能负责人吴运声日前接受采访时表示,“目前大模型和产业结合还在早期阶段,随着算力发展速度不断提高,行业对大模型的理解程度也在不断加深。”吴运声称,希望能以最低的成本、最合适的模型和最好的服务把大模型真正做好,会在预算和成本可控的情况下提供最符合逻辑的模型,让其在场景中达到目的,解决问题。
吴运声也透露,目前腾讯云行业大模型能力已在腾讯企点、腾讯会议、腾讯云AI代码助手等多款产品中落地使用。
宜家发布由 AI 设计的下一代沙发,采用100%可回收材料
据 gizchina 报道,知名家具品牌宜家现已在设计中加入了AI工具,并在近日发布了首款由 AI 设计的下一代沙发。
这款沙发由宜家的研究和设计实验室 SPACE10 联合设计公司 Panter&Tourron 推出,通过Runway 和 Midjourney 等图片生成模型来进行设计。并加入各种关键词,逐步设计出下一代沙发产品Couch in an Envelope。
据悉,这款沙发采用模块化设计,重量仅有10公斤。沙发采用可回收轻型铝制框架打造,布料则采用可生物降解的纤维材料。目前这款沙发还没有量产。
报告显示明年将有43%的企业将在招聘过程中引入AI
据 ZDNET 报道, Resume Builder 本月的一份调查报告显示,有约43%的企业将会在2024年使用 AI 进行招聘。
报告显示, AI 将会大幅简化招聘流程,并提高面试的效率。报告还预测,将会有15%的企业完全依靠AI 来筛选简历并进项面市。
此外还有一项报告显示,46% 的求职者正在使用 ChatGPT 来创建他们的简历。
OpenAI高管表示AI可能导致一些岗位消失
据界面新闻报道,OPENAI 首席运营官Brad Lightcap表示,AI虽然能创造新的就业机会,但也可能淘汰掉一些岗位。
Lightcap还表示,由于把繁琐的工作交给了AI,员工们每天能节省出一小时,也会因此变得更高效,这将让生产力的爆炸变成现实。
Lightcap表示,虽然AI模型擅长完成任务,但也需要人们把任务分配给AI,其工作结果也需要查验,而人们将更多地从事指挥协调的工作。
微软联合香港浸会大学发布 WizardCoder-15B 大模型
据 Arxiv 页面显示,微软联合香港浸会大学研究团队近日发布全新大模型产品 WizardCoder-15B 。
据论文表示,WizardCoder-15B 是一款专攻编程工作的大模型产品,和其他同类型产品相比,WizardCoder可以提供指令微调。
实验显示,WizardCoder 的性能优于最大的闭源 LLM,包括 Claude、Bard、PaLM、PaLM-2 和 LaMDA等产品。
南京大学发布虚拟角色生成模型AvatarBooth
南京大学研究团队近日发布论文,公布了一款用于生成虚拟角色大模型产品 AvatarBooth。
据悉,AvatarBooth 可以通过文本提示和指定的图片来生成相应的虚拟角色。用户可以通过上传图片来创建虚拟角色,并通过文本来进行调整。AvatarBooth 分别使用针对面部和人体进行微调的扩散模型来对虚拟角色进行控制,这种方法可以捕捉面部和服饰的细节,从而生成高度真实的虚拟角色。
实验结果显示,AvatarBooth 生成的虚拟角色在渲染和质量方面要优于传统的方法。
三六零:目前“360智脑”相关备案已通过备案报送系统上报
三六零在互动平台表示,根据2022年3月的《互联网信息服务算法推荐管理规定》,互联网平台涉及到算法推荐都需要备案,是备案审核制。公司的全资子公司“北京奇虎科技有限公司”已于2022年8月12日备案并通过了“360搜索信息检索算法”;全资子公司”天津三六零快看科技有限公司”已于2023年2月1日备案并通过了“快看科技内容推荐算法”。目前“360智脑”的相关备案已通过备案报送系统上报。
甲骨文将与Cohere合作提供原生生成式AI服务
据甲骨文中国官微消息,Oracle计划为全球企业开发强大的生成式AI服务。Oracle将与AI平台提供商Cohere合作,提供原生生成式AI服务。Oracle的生成式AI服务基于Oracle云基础设施远程软件服务而构建,采用Oracle特有的Supercluster功能,可支持各种应用和基础设施。
百家云发布AIGC新品市场易
百家云召开线上发布会,发布了全新的AIGC产品“市场易”。据介绍,市场易包含文案生成、内容发布、传播分析、舆情监测、知识库、体验中心六大功能板块,能够帮助中小企业市场推广、营销工作降本增效。
重点论文:
复旦大学团队对资源有限的大型语言模型的全参数微调
大型语言模型 (LLMs) 已经颠覆了自然语言处理 (NLP),但在训练时需要大量的 GPU 资源。降低 LLM 训练的门槛将鼓励更多的研究人员参与,对学术界和整个社会都有益。虽然现有的方法都专注于参数高效的微调,也就是微调或添加少量的参数,但很少有人面对有限资源下 LLM 的全参数调整挑战。在本次研究中,复旦大学团队提出了一种新的优化器,称为低内存优化 (LOMO),它将梯度计算和参数更新合并到一步中以减少内存使用。通过将 LOMO 与现有的内存节省技术集成,该团队比标准方法 (DeepSpeed 解决方案) 减少了 10.8% 的内存使用。因此,允许在一个拥有 8 个 RTX 3090,每个拥有 24GB 内存的机器上完全微调一个 65B 模型。
论文地址:https://arxiv.org/abs/2306.09782