ChatGPT大更新!能看能听也能说,多模态功能即将上线

1,794次阅读
没有评论

ChatGPT 又更新了:语音和图像交互即将面世。

 

昨晚,OpenAI 在一篇最新的博客中表示,ChatGPT 将推出新的语音和图像功能。用户不仅可以在文本框中输入提示,还可以通过语音或图像与 ChatGPT 交流。OpenAI 称,新功能将在未来两周内向 ChatGPT 付费用户推出,不久之后会推广到其他用户。

ChatGPT大更新!能看能听也能说,多模态功能即将上线

ChatGPT 新增语音和图像功能


据介绍,用户只需轻轻点击一个按钮,然后提出问题,便可以与 ChatGPT 进行语音交流。ChatGPT 将迅速将这些口述的问题转换成文本,并将其输入至大型语言模型中。随后,ChatGPT 会将这些答案再次转化为语音来回答问题。这一体验类似于与 Alexa 或谷歌助手对话,但 OpenAI 致力于不断改进底层技术,提高回答问题的质量。

 

音转文本的任务由 OpenAI 的 Whisper 模型提供支持。同时,该公司正在引入一款全新的文本转语音模型,据称可以通过仅几秒钟的语音样本生成与人类相似的音频。用户还可以从 5 个不同的选项中选择 ChatGPT 的声音。此外,OpenAI 正在与 Spotify 合作,将播客内容翻译成其他语言,同时保留播客主持人的声音。


ChatGPT大更新!能看能听也能说,多模态功能即将上线


图片搜索功能类似于 Google Lens。用户只需拍摄感兴趣的照片,ChatGPT 就可以解读照片中的信息并提供相应的答案。此外,用户还可以利用应用内的绘图工具,以更清晰的方式表达问题,或者直接通过图片或文本提出问题。这正是 ChatGPT 独特的特性所带来的帮助,用户可以与机器人进行互动,逐步完善答案,而无需首先进行搜索并在得到错误答案后再次搜索。


ChatGPT大更新!能看能听也能说,多模态功能即将上线


图像理解得到了多模态 GPT-3.5 和 GPT-4 的支持。这些模型将其语言推理技能应用于各种图像,包括照片、屏幕截图,以及包含文本和图像的文档。



构建安全有益的通用人工智能


值得注意的是,OpenAI 在博客中表示其目标是构建安全有益的通用人工智能(AGI)。新增的语音和图像功能可能会带来一些风险,但 OpenAI 正在采取措施缓解这些风险。

 

新的语音技术能够在短短几秒钟的真实语音片段中生成逼真的合成语音,但这一技术存在潜在危险,例如恶意行为者可能会滥用这项技术,冒充公众人物或实施欺诈。

 

出于对这些风险的关注,OpenAI 决定将这项技术应用于特定的用例,例如语音聊天,该功能是由专业配音演员亲自录制。此外,OpenAI 也与其他合作伙伴以类似的方式合作。例如上文提到,Spotify 正在积极利用这项技术推出了语音翻译功能,使播客能够利用自己的声音将节目翻译成其他语言。


ChatGPT大更新!能看能听也能说,多模态功能即将上线


此外,基于视觉的模型也提出了新的挑战,例如对人类幻觉的识别以及对高风险领域图像的解释依赖于模型的能力。在进行更广泛的部署之前,OpenAI 与其红队成员共同测试了该模型在极端主义和科学领域等方面的潜在风险,并对一系列不同的 Alpha 测试人员进行了评估。通过这项研究,OpenAI 对一些关键细节进行了调整,确保负责任地应用这项技术。

 

参考链接:

https://openai.com/blog/chatgpt-can-now-see-hear-and-speak


|点击关注我 👇 记得标星|

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 9 月
 123
45678910
11121314151617
18192021222324
252627282930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话

天下苦SaaS已久,企业级AI得靠「结果」说话 Jay 2025-12-22 13:46:04 来源:量子位 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...