OpenAI官网发布 AI 安全方法:确保安全地构建、部署和使用人工智能系统

1,611次阅读
2 条评论

我们的 AI 安全方法

确保安全地构建、部署和使用人工智能系统对我们的使命至关重要。

 OpenAI官网发布 AI 安全方法:确保安全地构建、部署和使用人工智能系统

OpenAI 致力于确保强大的 AI安全并广泛受益。我们知道我们的人工智能工具为当今的人们带来了许多好处。我们在世界各地的用户告诉我们,ChatGPT 有助于提高他们的工作效率,增强他们的创造力,并提供量身定制的学习体验。我们还认识到,与任何技术一样,这些工具会带来真正的风险——因此我们努力确保在所有级别的系统中都内置安全性。
 OpenAI官网发布 AI 安全方法:确保安全地构建、部署和使用人工智能系统

构建越来越安全的人工智能系统

在发布任何新系统之前,我们会进行严格的测试,聘请外部专家提供反馈,通过人工反馈强化学习等技术改进模型的行为,并构建广泛的安全和监控系统。

例如,在我们的最新模型 GPT-4 完成培训后,我们花了 6 个多月的时间在整个组织内开展工作,以使其在公开发布之前更安全、更一致。

我们认为,强大的人工智能系统应该接受严格的安全评估。需要监管以确保采用此类做法,我们积极与政府合作,以制定此类监管的最佳形式。

从实际使用中学习以改进保障措施

我们努力在部署前预防可预见的风险,但是,我们在实验室中可以学到的东西是有限的尽管进行了广泛的研究和测试,但我们无法预测人们使用我们技术的所有有益方式,也无法预测人们滥用技术的所有方式。这就是为什么我们认为,从现实世界的使用中学习是随着时间的推移创建和发布越来越安全的 AI 系统的关键组成部分。

我们谨慎地逐步向稳定扩大的人群发布新的 AI 系统,并根据我们吸取的教训不断改进。

我们通过自己的服务和 API 提供最强大的模型,以便开发人员可以将这项技术直接构建到他们的应用程序中。这使我们能够监控滥用行为并采取行动,并不断构建缓解措施以响应人们滥用我们系统的真实方式——而不仅仅是关于滥用行为可能是什么样子的理论。

现实世界的使用也让我们制定了越来越细致的政策来应对对人们构成真正风险的行为,同时仍然允许我们技术的许多有益用途。

至关重要的是,我们认为社会必须有时间来更新和适应能力越来越强的 AI,并且受到这项技术影响的每个人都应该对 AI 如何进一步发展有重要的发言权。与没有使用这些工具的第一手经验相比,迭代部署帮助我们更有效地将各种利益相关者带入有关采用 AI 技术的对话中。

保护儿童

我们安全工作的重点之一是保护儿童。我们要求人们必须年满 18 岁,或者在父母同意的情况下年满 13 岁,才能使用我们的 AI 工具,并且正在研究验证选项。

我们不允许我们的技术被用于生成仇恨、骚扰、暴力或成人内容等类别。与 GPT-3.5 相比,我们最新的模型 GPT-4 响应禁止内容请求的可能性降低了 82%,并且我们已经建立了一个强大的系统来监控滥用情况。GPT-4 现在可供 ChatGPT Plus 订阅者使用,我们希望随着时间的推移让更多人可以使用它。

我们已做出重大努力,以尽量减少我们的模型生成伤害儿童内容的可能性。例如,当用户试图将虐待儿童安全材料上传到我们的图像工具时,我们会阻止并将其报告给国家失踪与受虐儿童中心。

除了我们默认的安全护栏外,我们还与非营利性可汗学院等开发人员合作——该学院开发了一个人工智能助手,既可以作为学生的虚拟导师,也可以作为教师的课堂助手——为他们量身定制安全缓解措施。用例。我们还在研究允许开发人员为模型输出设置更严格标准的功能,以更好地支持需要此类功能的开发人员和用户。

尊重隐私

我们的大型语言模型是在广泛的文本语料库上训练的,这些文本包括公开可用的、许可的内容以及由人工审阅者生成的内容。我们不使用数据来销售我们的服务、做广告或建立人们的档案——我们使用数据来使我们的模型对人们更有帮助。例如,ChatGPT 通过对人们与之进行的对话进行进一步培训来改进。

虽然我们的一些训练数据包括可在公共互联网上获得的个人信息,但我们希望我们的模型了解世界,而不是了解个人。因此,我们努力在可行的情况下从训练数据集中删除个人信息,微调模型以拒绝对私人个​​人信息的请求,并对个人提出的从我们的系统中删除其个人信息的请求做出响应。这些步骤最大限度地减少了我们的模型可能生成包含私人个人信息的响应的可能性。

提高事实准确性

今天的大型语言模型根据他们之前看到的模式预测下一系列单词,包括用户提供的文本输入。在某些情况下,下一个最有可能的词实际上可能不准确。

提高事实准确性是 OpenAI 和许多其他 AI 开发人员关注的重点,我们正在取得进展。通过利用用户对被标记为不正确的主要数据源的 ChatGPT 输出的反馈,我们提高了 GPT-4 的事实准确性。GPT-4产生事实内容的可能性比 GPT-3.5 高 40%。

当用户注册使用该工具时,我们努力做到尽可能透明,因为 ChatGPT 可能并不总是准确的。然而,我们认识到,要进一步降低产生幻觉的可能性并让公众了解这些人工智能工具的当前局限性,还有很多工作要做。

持续的研究和参与

我们认为,解决 AI 安全问题的实用方法是投入更多时间和资源来研究有效的缓解和对齐技术,并测试它们在现实世界中的滥用情况。

重要的是,我们还认为,提高人工智能的安全性和能力应该齐头并进。迄今为止,我们最好的安全工作来自于使用我们最强大的模型,因为它们更善于遵循用户的指示并且更容易操纵或“引导”。

我们将越来越谨慎地创建和部署功能更强大的模型,并将随着我们的人工智能系统的发展继续加强安全预防措施。

虽然我们等了 6 个多月才部署 GPT-4 以更好地了解其功能、优势和风险,但有时可能需要比这更长的时间来提高 AI 系统的安全性。因此,政策制定者和 AI 供应商需要确保 AI 的开发和部署在全球范围内得到有效管理,这样就没有人会为了取得成功而偷工减料。这是一项艰巨的挑战,需要技术和制度创新,但我们渴望为之做出贡献。

解决安全问题还需要广泛的辩论、实验和参与,包括人工智能系统行为的界限。我们已经并将继续促进利益相关者之间的合作和公开对话,以创建一个安全的人工智能生态系统。

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(2 条评论)
2024-04-19 15:58:38 回复

Perfekt service – thank you for this ! It is very good , every time again.

     土耳其Bursa
2024-04-19 16:29:21 回复

It is a great service with good value, I recommend

     土耳其Bursa

文心AIGC

2023 年 4 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
摩尔线程的野心,不藏了

摩尔线程的野心,不藏了

摩尔线程的野心,不藏了 量子位的朋友们 2025-12-22 10:11:58 来源:量子位 上市后的仅15天...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身

AI体育教练来了!中国团队打造SportsGPT,完成从数值评估到专业指导的智能转身 量子位的朋友们 2025...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...