大语言资讯:
新增一键换色!Adobe 旗下 Illustrator 将引入AI工具
据 Adobe 官方消息,旗下图形制作软件 Illustrator 近日进行功能升级,引入 AI 工具 Firefly。
Adobe 为 Illustrator 加入了 Generative Recolor 功能,可以快速改变图片的配色。用户可以输入不同风格、颜色等文本要求,让 Illustrator 为图片生成不同的颜色。此外 Illustrator 还加入 Retype 功能,可以帮助用户对图片中的字体进行监测,并快速找到类似的字体风格。
据 Adobe 表示,Generative Recolor 目前还在测试,后续将会邀请更多用户参与测试。
Meta发布“类人”人工智能模型I-JEPA,能根据对世界的理解填补图像缺失
Meta于当地时间周二宣布,将向研究人员开放一种新的“类人”人工智能模型的部分组件,该模型可以比现有模型更准确地分析和完成未完成的图像。
该模型名为 I-JEPA,其利用对世界的背景知识来填补图像中缺失的部分,而不是像其他生成式人工智能模型那样,只根据附近的像素进行推断。这种方法采用了 Meta 公司首席人工智能科学家 Yann LeCun 倡导的类人推理方式,有助于避免人工智能生成图像中常见的错误,比如多出一根手指等问题。
Meta 首席执行官扎克伯格表示,与其他研究者分享 Meta 公司开发的模型可以帮助该公司促进创新、发现安全漏洞和降低成本。他今年 4 月对投资者说:“对我们来说,如果行业对我们正在使用的基本工具进行标准化,那么我们就可以从他人的改进中受益。”
ChatGPT重磅更新:文本容量提升4倍,价格降低75%
6月13日OpenAI官网突然发布了重磅的ChatGPT最新能力更新
首先是本次推出的新功能:在Chat Completions API中添加了新的函数调用能力,能让模型在需要的时候调用函数并生成对应的JSON对象作为输出。也就是说,用户不再需要编程能力,并且还能更方便从混乱结构里获取结构化数据。
其次是模型更新:更可控制的GPT-4和GPT-3.5-turbo版本,以及GPT-3.5-turbo的新16k上下文版本,相比标准的4k版本能处理更长的文本。
最后是本次的价格调整:最先进的嵌入模型的价格降低了75%,GPT-3.5-turbo的输入代币价格降低了25%。每1k token,0.0001美金。
挑战英伟达,AMD即将推出AI芯片MI300X
AMD当地时间周二宣布,该公司即将推出的最先进的人工智能GPU MI300X将于今年晚些时候开始向部分客户发货。GPU是OpenAI等公司用来搭建ChatGPT等尖端人工智能程序的芯片。
虽然AMD未披露价格,但此举可能会给英伟达GPU带来价格压力,如后者的H100,其价格能够达到3万美元以上。
谷歌暂缓在欧盟推出聊天机器人Bard
据新浪科技报道,美国科技巨头谷歌准备在欧盟地区推出人工智能聊天机器人Bard,但是由于欧盟隐私数据监管机构提出质疑,谷歌被迫将发布日期向后推迟。
谷歌公司发言人表示,最近几个星期,谷歌团队已经和爱尔兰数据保护委员会进行沟通,并且提供了相关的资料文件。但是这位发言人并未披露Bard被迫推迟上线日期的详细原因,也没有说明该产品在欧盟地区上线的具体时间表。
埃森哲计划在三年内针对数据和AI业务投资30亿美元
埃森哲表示,计划在三年内投资30亿美元,专攻数据和人工智能(AI)业务。
这家总部位于爱尔兰都柏林的专业服务公司表示,其数据和AI业务将通过招聘、收购和培训相结合的方式,将其AI人才增加一倍达到8万人。
该公司还表示,正在推出一个名为AI Navigator for Enterprise的新平台,该平台将帮助客户找出如何在他们的业务中使用AI。
OpenAI CEO:创业初期有很多问题,一头扎进去就好
OpenAI CEO奥特曼在日本参加活动时称自己工作中遇到的最大挑战是问题太多,OpenAI在初期也遇到过很多超级大问题,“先一头扎进去就好”。
得到旗下公司经营范围新增AI应用软件开发
天眼查App显示,6月6日,北京得到信息科技有限公司发生工商变更,经营范围新增数字技术服务、人工智能应用软件开发、人工智能基础软件开发等。
该公司成立于2015年12月,注册资本5000万人民币,法定代表人、董事长为罗振宇,由北京思维造物信息科技股份有限公司全资持股。
字节跳动今年向英伟达订购超 10 亿美元 GPU
据晚点 latepost 报道,今年春节后,拥有云计算业务的各大互联网公司都向英伟达下了大单,其中字节今年向英伟达订购了超过 10 亿美元的 GPU。
据悉,字节跳动目前已经到货和没到货的 A100 与 H800 加速卡总计有 10 万块。其中 H800 今年 3 月才开始投产。据晚点透露,仅字节跳动一家公司今年的订单可能已接近英伟达去年在中国销售的商用 GPU 总和。
报道称,还有另一家大公司的订单也至少超过 10 亿元。
笔神作文称学而思AI大模型盗取其数据
笔神作文官微发布声明,称三体云联公司(好未来关联公司)在未经笔神作文APP授权许可的情况下,在4月13日至4月17日期间,通过“爬虫”技术非法访问、缓存笔神作文APP服务器数据多达258万次。
在不到一个月的时间,学而思的AI大模型MathGPT里包含的新产品“作文AI助手”就即将上线。
笔神作文表示,事后在向学而思进行求证时,对方直接承认是他们的算法组在爬取数据并作为己用。公司也向他们发送律师函但并没有得到实质性回复,希望学而思能够及时停止错误的行为并且公开道歉。
亚马逊云计算部门或将采用 AMD 的新型AI 芯片
据界面新闻报道,亚马逊云计算部门正在考虑使用 AMD 的新型AI 芯片,不过目前他们还没有做出最终决定。
此前 AMD 公布他们在人工智能市场的战略,将与对手公司英伟达做竞争。今天凌晨,AMD 公布了旗下新型 AI 芯片 Instinct MI300 的部分细节,但并未公布其客户。
元萝卜推出 AI 下棋机器人,到手价3799元
元萝卜今天下午举办新品发布会,推出新款 AI 下棋机器人 RG2W-P。
据悉,RG2W-P支持定义初始棋力水平并开启相应的等级关卡,机器人内置超过 20 级关卡。 RG2W-P 打通99围棋、新博少儿等多个第三方围棋平台,支持不同平台用户在线对决。RG2W-P 内置 AI 讲解功能,支持纠错、指导、解析等多个功能。RG2W-P配备了家用机械臂,顶部自带镜头定位,通过面部识别登录账号,可以实现坐下即玩。
元萝卜新款 AI 下棋机器人已上架电商平台,到手价 3799 元。
腾讯用预训练模型和强化学习提升机器狗控制
腾讯Robotics X机器人实验室今天宣布,通过将前沿的预训练 AI 模型和强化学习技术应用到机器人控制领域,腾讯机器狗 Max 的灵活性和自主决策能力得到了大幅提升。
腾讯 Robotics X 机器人实验室通过引入预训练模型和强化学习技术,可以让机器狗分阶段进行学习,有效的将不同阶段的技能、知识积累并存储下来,让机器人在解决新的复杂任务时,不必重新学习,而是可以复用已经学会的姿态、环境感知、策略规划多个层面的知识,进行「举一反三」,灵活应对复杂环境。
重点论文:
英伟达公布 ATT3D 技术,降低3D建模生成成本
据 huggingface 页面显示,英伟达近日发布其研究成果 ATT3D,可以用更低的成本来生成 3D模型。
ATT3D 是一项针对3D建模大模型技术的优化,英伟达团队在论文中表示,当前的文本建模模型已经有了非常大的进步,可以获得较高质量的成果,但模型建模的时间成本仍然较高。为了解决这个问题,英伟达研发团队通过使用统一模型来同时对多个提示词进行训练,以此来分摊训练的成本。
研究显示,ATT3D可以大幅减少3D建模的时间成本,加快效率。
论文地址:https://arxiv.org/pdf/2306.07349.pdf
微软推出 LLaVA-Med AI 模型,可对医学病理案例进行分析
微软研究人员展示了LLaVA-Med模型,该模型主要用于生物医学方面的研究,可根据CT、X光图片等推测出患者的病理状况。
据悉,微软研究人员与一批医院合作,获得了使用生物医学图像文本对应大型数据集来训练多模态 AI 模型。该数据集包括胸部 X 光、MRI、组织学、病理学和 CT 图像等,覆盖范围相对全面。
微软使用 GPT-4,基于 Vision Transformer 和 Vicuna 语言模型,在八个英伟达 A100 GPU 上对 LLaVA-Med 进行训练,其中包含“每个图像的所有预分析信息”,用于生成有关图像的问答,以满足“可自然语言回答有关生物医学图像问题”的助手愿景。
在学习过程中,模型主要围绕“描述此类图像的内容”以及“阐述生物医学概念”而展开。据微软称,该模型最终具有“出色的多模式对话能力”、“在用于回答视觉问题的三个标准生物医学数据集上,LLaVA-Med 在部分指标上领先于业界其他先进模型”。