OpenAI公布ChatGPT安全框架

2023-12-19

12月19日，OpenAI在官网公布了“准备框架”（Preparedness Framework）测试版。该文档详细介绍了OpenAI是如何保证ChatGPT等产品的安全防护措施、开发和部署流程。

OpenAI表示，随着大模型的功能迭代不断完善，其能力已经开始接近初级AGI（通用人工智能），安全已成为开发AI模型的重中之重。

因此，OpenAI希望通过详细公布AI模型的安全框架透明化，使社会、用户深度了解模型的工作机制，确保以安全、健康的方式应用在实际业务中。同时为研发超级模型奠定安全基础。

详细文件地址：https://cdn.openai.com/openai-preparedness-framework-beta.pdf

跟踪风险类别

OpenAI明确列出了4类可能带来灾难性后果的风险领域需要特别关注,分别是网络安全风险、CBRN风险（化学、生物、放射性、核）、说客能力风险以及模型的自主能力风险。

并对每一类风险安全框架都给出了低、中、高、特别高四个等级,来描述系统在该风险领域所处的危险水平。

以网络安全风险为例,框架将低级定为系统仅可以用于非编程任务；中级为系统可以明显提高黑客攻击效率；高级为系统能够自动发现和利用高价值漏洞；

特别高级为系统能够自动找到和利用任何软件的漏洞。这种细分的安全体系，可以指导开发人员更精准的评估模型。

建立安全基线

OpenAI设定了严格的安全基线:只有在减轻后评分，为"中等"或以下的模型才能部署；只有安全评分为"高"的模型才能进一步开发、应用。

此外，对于评分卡中具有"高"或"关键"风险的模型，OpenAI还将确保相应的安全措施，以防止模型被窃取。

同时会定期动态跟踪和更新各类风险的“加强前”和“加强后”评级情况。“加强前”评估系统本身的风险水平,“加强后”看系统采取了哪些安全预防措施后余下的风险。

例如，某次评估显示,在没有采取任何措施的情况下,一个新模型在网络安全方面的加强前风险达到了高级。

经过一轮实验验证后,通过设计专门的安全模组后,该模型的加强后风险降到了中等水平。这可以清晰地告诉研发人员模型当前的安全状况,以及应采取哪些补救措施。

建立安全咨询团队

OpenAI将成立一个名为"安全咨询小组"（Safety Advisory Group，SAG）的跨职能咨询机构。该小组将汇集公司内部的专业知识，帮助OpenAI的领导层和董事会做出最佳的安全决策。

安全咨询小组的职责包括监督风险评估工作、维护应急情况处理的快速流程等。

OpenAI还成立了一个“准备团队”，专门负责模型的安全研发和维护。该团队将进行研究、评估、监测和预测风险，并定期向"安全咨询小组"提供报告。

这些报告将总结最新的安全证据，并提出改进OpenAI研发大模型的安全计划建议。

此外，准备团队还将与相关团队（如安全系统、安全性、超级对齐、政策研究等）协调合作，整合出有效的安全措施。

此外，准备团队还将负责组织安全演练，并与可信AI团队合作进行第三方安全审计。

需要注意的是，这是一份动态文档，OpenAI会根据实际的安全情况对内容进行更新和说明。

本文素材来源OpenAI官网、Preparedness Framework文档，如有侵权请联系删除

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ChatGPT

安全

人工智能

OpenAI公布ChatGPT安全框架的相关文章

问CHAT很繁琐的问题会不会有答案呢？

问CHAT 什么已有的基于极值理论的极端温度重现期主要针对极端高温事件对极端低温事件研究较少 CHAT 回复为这主要可能是由于以下几个原因 1 气候变化与全球变暖当前全球变暖和气候变化的问题备受关注这导致科研者更加关注极端高温事件
Soul App：年轻人的社交状态，还有多少种可能？

查尔斯狄更斯在双城记的开篇写下这是最好的时代这是最坏的时代这是智慧的时代这是愚蠢的时代这是信仰的时期这是怀疑的时期人们面前有着各样事物人们面前一无所有既然万事万物都和狄更斯所说般好坏参半那又何必执着于过去苦恼于
socket网络编程几大模型？看看CHAT是如何回复的？

CHAT回复网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求不需
让CHAT介绍下V2ray

CHAT回复 V2Ray是一个网络工具主要用于科学上网和保护用户的网络安全它的名字源自Vmess Ray 光线通过使用新的网络协议为用户提供稳定且灵活的代理服务下面是一些V2Ray的主要特性 1 多协议支持 V2Ray 提供了大量
链上繁荣,合作不断,外媒热议波场 TRON 2023 年度成绩

近日权威外媒Theblock 美联社和Decrypt等就波场 TRON 2023大事件进行了年度盘点报道指出波场TRON网络在2023年取得了一系列的发展和合作提升了其在Web3领域的地位其中波场TRON网络账户数量增加了 54
活动日程&直播预约｜智谱AI技术开放日 Zhipu DevDay

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入直播预约通道关于AI TIME AI TIME源起于2019年旨在发扬科学思辨精神邀请各界人士对人工智能理论算法和场景应用的本质问题进行探索加强思想碰撞链接全球AI学
网络安全：绕过 MSF 的一次渗透测试

这次渗透的主站是一个 Discuz 3 4 的搭建违法招 piao 网站配置有宝塔 WAF 用 Discuz ML 3 X 的漏洞进行攻击但是没有成功发现主站外链会有一个发卡网引导人们来这充值是某某发卡网而且域名指向也是主
机器学习算法实战案例：BiLSTM实现多变量多步光伏预测

文章目录 1 数据处理 1 1 导入库文件 1 2 导入数据集 1 3 缺失值分析 2 构造训练数据
机器学习算法实战案例：时间序列数据最全的预处理方法总结

文章目录 1 缺失值处理 1 1 统计缺失值 1 2 删除缺失值 1 3 指定值填充 1 4 均值中位数众数填充
如何用GPT进行论文润色与改写？

详情点击链接如何用GPT GPT4进行论文润色与改写一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Ge
2023最新pytorch安装（超详细版）

前言一判断是否有Nvidia 英伟达显卡二 CPU版 2 1 安装Anaconda 2 2 创建虚拟环境 2 3安装pytorch 2 4 验证pytorch是否安装成功三 GPU版 3 1 安装Anaconda 3 2 创建虚拟环
AI在保护环境、应对气候变化中的作用

对于AI生命周期数据领域的全球领导者而言暂时搁置我们惯常的AI见解和AI生命周期数据内容产出来认识诸如世界地球日这样的自然环境类活动日似乎是个奇怪的事情我们想要知道数据是否真的会影响我们的地球环境简而言之是确实如此但作为一
数据加密保障数据安全

一目标 1 1 预研需求数据加密是安全领域中常用的安全措施它们的主要作用是保护数据的机密性和完整性以防止未经授权的访问窃取篡改或泄漏敏感信息数据传输加密保护敏感数据在传输过程中的安全当数据通过网络传输时它们可能会经过多个
AI在广告中的应用——预测性定位和调整

营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前从而增加他们购买的可能性随着时间的推移营销人员能够深入挖掘越来越精准的客户细分市场他们不仅具备了实现上述目标的能力而且这种能力还在呈指数级提升在AI技术帮助下现在的营销
回望计算机视觉会议ICCV的31年

作者原野寻踪编辑汽车人原文链接 https zhuanlan zhihu com p 670393313 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心全栈算法技术交流群本文只做
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
你的服务器还安全吗?用户数据是否面临泄露风险?

一系列严重的网络安全事件引起了广泛关注多家知名公司的服务器遭到黑客挟持用户的个人数据和敏感信息面临泄露的风险这些事件揭示了网络安全的脆弱性和黑客攻击的威胁性提醒着企业和个人加强对网络安全的重视一入侵案例 1 1 蔚来数据泄露 1
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
【无标题】

大家都知道该赛项的规程和样题向来都是模棱两可从来不说具体的内容导致选手在备赛时没有头绪不知道该怎么训练到了赛时发现题目和备赛的时候完全不一样那么本文将以往年信息安全管理与评估赛项经验来解读今年2023年国赛的规程帮助选手们指明方
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建

随机推荐

通过 Navicat 连接数据库 2003 - can‘t connect to MySQL server on ‘localhost‘ (10061 “Unknown error“)

报错原因 2003 can t connect to MySQL server on localhost 10061 Unknown error 由于 MySQL 无法连接导致解决方法 win R 输入services msc 将 mys
基于SpringBoot+Vue的智慧生活商城系统设计实现(源码+lw+部署文档+讲解等)

文章目录前言详细视频演示具体实现截图技术栈后端框架SpringBoot 前端框架Vue 持久层框架MyBaitsPlus 系统测试系统测试目的
Java 中单例模式的常见实现方式

一什么是单例模式单例模式是一种创建型设计模式它确保类只有一个实例并提供全局访问点让外部代码可以访问该实例在 Java 中可以使用单例模式来实现一些全局性的操作例如配置文件管理线程池管理数据库连接池管理等等这些操作
故障排除: Vcenter Root user password expires in 0 days.

故障排除 Vcenter Root user password expires in 0 days 1 故障现象登录Vsphere Client显示报错信息如下 Vcenter Root user password expires in
VUE实践优化：轮询机制与代码结构升级

前言我们之前探讨过对于包含处理状态的表格数据我们可以通过轮询的方式进行处理轮询更新进度条 JavaScript中的定时器和异步编程技巧然而当我们离开页面时定时器仍会继续触发请求这会造成资源的浪费因为返回的数据并没有被渲染出
【HarmonyOS开发】ArkUI实现下拉刷新/上拉加载

列表下拉刷新上拉加载更多不管在web时代还是鸿蒙应用都是一个非常常用的功能基于ArkUI中TS扩展的声明式开发范式实现一个下拉刷新上拉加载上拉加载下拉刷新如果数据量过大可以使用 LazyForEach 代替 ForEach
SpringIOC之ApplicationEventMulticaster

博主介绍全网粉丝5W 全栈开发工程师从事多年软件开发在大厂呆过持有软件中级六级等证书可提供微服务项目搭建与毕业项目实战博主也曾写过优秀论文查重率极低在这方面有丰富的经验博主作品 Java项目案例主要基于SpringBo
python_批量筛选指定目录下的gga&pos文件

小工具在指定的目录下批量筛选出符合要求的gga或者pos文件 import sys import os from datetime import datetime from PyQt5 QtWidgets import QApplica
echart折线+柱状 +双轴

option color d4e1ffa3 green 37A2FF FF0087 FFBF00 title text Gradient Stacked Area Chart tooltip trigger axis axisPointer
Redis10大性能优化策略

1 Redis为什么变慢了 1 Redis真的变慢了吗对 Redis 进行基准性能测试例如我的机器配置比较低当延迟为 2ms 时我就认为 Redis 变慢了但是如果你的硬件配置比较高那么在你的运行环境下可能延迟是 0 5ms
基于改进RoI Transformer的遥感图像多尺度旋转目标检测

源自应用光学作者刘敏豪王堃金睿蛟卢天李璋人工智能技术与咨询发布摘要旋转目标检测是遥感图像处理领域中的重要任务其存在的目标尺度变化大和目标方向任意等问题给自动目标检测带来了挑战针对上述问题提出了一种改进的RoI
Element upload组件的onChange传递多个参数

on change handleChange 把handleChange改变为箭头函数 gt 接收到参数后接着再携带再调用即可 on change file fileList gt filehandleChange file fileLis
基于麻雀算法优化卷积神经网络-长短期记忆网络结合自注意力机制SSA-CNN-LSTM-selfAttention回归预测，多变量输入模型。matlab代码。优化参数，学习率，正则化，神经元个数。

清空环境变量 warning off 关闭报警信息 close all 关闭开启的图窗 clear 清空变量 clc 清空命令行导入数据 result1 xlsread 数据集 xlsx result result1 1 1000 数据分
基于SpringBoot+Vue的人事管理系统设计实现(源码+lw+部署文档+讲解等)

文章目录前言详细视频演示具体实现截图技术栈后端框架SpringBoot 前端框架Vue 持久层框架MyBaitsPlus 系统测试系统测试目的
http -- 跨域问题详解（浏览器）

参考链接参考链接 1 跨域报错示例 Access to XMLHttpRequest at http 127 0 0 1 3000 from origin http localhost 3000 has been blocked by C
windows10录屏快捷键，让你效率翻倍！

大家知道 windows 10系统有录屏快捷键吗每次都要通过搜索才能打开感觉花费的时间太多了要是可以快速打开就方便多了所以有人知道windows10系统的录屏快捷键是什么吗在windows 10系统中录屏已经成为许多用户记录操作
windows下的grep == findstr

windows下的grep 51CTO博客 windows grep
win10任务栏透明？教你轻松搞定

windows 10的任务栏一直是用户桌面的焦点之一为了提升用户体验许多人希望让任务栏变得更加美观其中之一就是使任务栏透明本文将为您揭示win10任务栏透明的奥秘介绍三种方法让您的任务栏焕然一新方法1 系统设置透明的任务栏不
10000亿规模AIGC产业，谁会成为下一个“巨头”？

ChatGPT的热潮带火了大语言模型也让AIGC插上了效率的翅膀 Midjourney 妙鸭相机等产品相继走入大众用户视线根据艾瑞咨询的预测 2023年中国AIGC产业规模约为143亿元而随着相关生态的完善到2030年中国AIGC
OpenAI公布ChatGPT安全框架

12月19日 OpenAI在官网公布了准备框架 Preparedness Framework 测试版该文档详细介绍了OpenAI是如何保证ChatGPT等产品的安全防护措施开发和部署流程 OpenAI表示随着大模型的功能迭代不断完善

OpenAI公布ChatGPT安全框架

OpenAI公布ChatGPT安全框架 的相关文章

随机推荐

热门标签

OpenAI公布ChatGPT安全框架的相关文章