大模型资讯:
汤姆猫:国内团队研发的AI产品已初步实现AI识物、AI绘图、情景对话等功能
据界面新闻报道,在人工智能交互产品上,公司国内外团队同步在推进相关产品的研发工作。
其中,国内研发团队此前测试了多个大模型,并在前期加入了性格设定、情绪识别、内容过滤等功能的智能语音交互产品原型的基础上进一步添加更加深度、丰富的AI交互功能。借助国内合作方的多模态通用大模型,公司国内团队打造的AI产品持续在完善视觉能力、对话能力及情感感知能力,目前已初步实现AI识物、AI绘图、情景对话、英语口语启蒙等功能。公司将于近期开展产品的封闭式测试。
据OpenAI 官方消息,他们已为 ChatGPT 引入自定义指令功能。
该功能将在ChatGPT定制化一些指令,让机器人更具有个性化特色,满足使用者的需求,而且用户不用再在每次对话中重复偏好和信息。
自定义指令功能现已向Plus 用户开放测试,计划在未来向所有用户推出。
据 Cnbeta 报道,GitHub 宣布其新的 Copilot Chat 功能-。
该功能可以为用户带来类似ChatGPT 的体验,主要目的是帮助开发人员编程,这一工具现已作为有限的公开测试版面向企业公司和组织推出。GitHub 表示,Copilot Chat 测试版将通过微软的 Visual Studio 和 Visual Studio Code 应用程序向”所有企业用户”开放。
根据 GitHub 的说法,Copilot Chat 可以从上下文中感知输入代码编辑器的代码和错误信息,这有助于它在开发者特定的环境中提供最相关的支持。GitHub Copilot Chat 的主要功能包括针对特定编码项目提供实时指导、编码分析,以及简单故障排除等。
腾讯音乐推出虚拟聊天机器人“未伴”,AI 伴侣可随机可自定义
据“Tech 星球”报道,腾讯音乐旗下一款名为“未伴”的 AI 机器人聊天 App 已经在近期开启测试。
未伴是一个集 AI 陪聊、AI 伴侣写真等多个功能于一体的 AI 聊天产品,用户可以“选择 App 已经预制的 AI 伴侣,或根据用户自身要求创造一个 AI 伴侣”。
加拿大西蒙菲莎大学发布大语言模型DS-Fusion,可快速生成艺术字体
据 Arxiv 页面显示,一个来自加拿大西蒙菲莎大学的研究团队推出一款语言模型产品DS-Fusion,可通过文本生成艺术字。
研究团队利用大型语言模型来对文本和视觉图像之间的样式化进行建模,并构建一个无监督的生成模型。研究团队借助潜在扩散模型(Latent Diffusion Model )中的去噪生成器,通过基于CNN的鉴别器将输入样式适应到输入文本上。
研究显示,与CLIPDraw 和 DALL-E 2 相比,DS-Fusion 表现出了强大的性能。
谷歌联合创始人Sergey Brin或已重回谷歌,专注新AI系统研发工作
据 9to5Google 报道,谷歌联合创始人之一Sergey Brin 已在近期重回谷歌,专注 AI 技术的研发工作。
据报道, Brin 每周都会在谷歌的加州办公室工作三到四天,并和谷歌的研究团队一起研发谷歌的 AI 模型 Gemini。Brin 会和团队一起探讨 AI 技术问题,并且每周都会讨论最新的AI研究成果。
据知情人士透露,Brin还涉及了人事事务,比如聘用科研人员等等。
喜马拉雅申请AI商标
天眼查App显示,近日,上海喜马拉雅科技有限公司申请多个“XimalayaAI”商标,国际分类涉及广告销售、通讯服务、网站服务、教育娱乐,当前商标状态均为申请中。此前,该公司还申请注册了多个“喜马拉雅珠峰AI开放平台”“珠峰智人”等商标。
马斯克: 将斥资10亿美元建造AI超级计算机
近日,马斯克表示,特斯拉将斥资10亿美元建造AI超级计算机Dojo,但如果英伟达能够提供更多芯片,就没有必要了。特斯拉对 AI 芯片的需求旺盛,几乎超过了所有商业竞争对手,其目标是到明年年底达到 100 exaFLOPS 的内部计算能力。
重点论文:
Meta-Transformer:多模态学习的统一框架
近日,香港中文大学和上海人工智能实验室提出了名为 Meta-Transformer 的框架,该框架利用冻结编码器(frozen encoder)在没有配对的多模态训练数据的情况下进行多模态感知。Meta-Transformer 将来自不同模态的原始输入数据映射到共享的标记空间,使得后续的编码器可以提取输入数据的高层语义特征,并保持编码器参数冻结。结果表明,Meta-Transformer 可以处理基本感知、实际应用和数据挖掘等任务。
论文地址:点击前往