《生成式人工智能服务安全基本要求》要点概览(附下载)

《生成式人工智能服务安全基本要求》规定了生成式人工智能服务在安全方面的基本要求,包括语料安全、模型安全、安全措施、安全评估等。

《生成式人工智能服务安全基本要求》要点概览
出处:全国网安标委

为促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局出台《生成式人工智能服务管理暂行办法》(以下称《办法》),已于 2023 年 8 月 15 日起施行。

2024 年 3 月 1 日,全国网络安全标准化技术委员会(TC260)发布 TC260-003 《生成式人工智能服务安全基本要求》。《生成式人工智能服务安全基本要求》(以下简称“标准”),规定了生成式人工智能服务在安全方面的基本要求,包括语料安全、模型安全、安全措施、安全评估等。

一、语料安全要求

标准对语料来源、语料内容、语料标注安全等方面作出规定。其中,在语料来源方面,服务提供者面向特定语料来源进行采集前与后,应对该来源语料进行安全评估或核验,确保相关语料来源含违法不良信息超过5%。

在语料内容方面,服务提供者应对训练语料中的主要知识产权侵权风险进行识别,发现存在知识产权侵权等问题的,服务提供者不应使用相关语料进行训练;使用包含个人信息的语料时,应取得对应个人同意或者符合法律、行政法规规定的其他情形;使用包含敏感个人信息的语料时,应取得对应个人单独同意或者符合法律、行政法规规定的其他情形。

二、模型安全要求

标准对模型生成内容安全、生成内容准确性、生成内容可靠性等方面作出规定。在生成内容准确性方面,服务提供者应采取技术措施提高生成内容响应使用者输入意图的能力,提高生成内容中数据及表述与科学常识及主流认知的符合程度,减少其中的错误内容。

三、安全措施要求

标准对模型适用人群、场合、用途、服务透明度、当收集使用者输入信息用于训练时、图片、视频等内容标识等九个方面做出规定。其中,当收集使用者输入信息用于训练时,服务提供者应为使用者提供关闭其输入信息用于训练的方式,例如为使用者提供选项或语音控制指令;关闭方式应便捷,例如采用选项方式时使用者从服务主界面开始到达该选项所需操作不超过4次点击。

四、其他要求

标准要求服务提供者应当建立和维护关键词库、拒答问题测试题库以覆盖标准附录A1和A2中所列举的17种安全风险,同时应当建立和维护生成内容测试题库和分类模型以覆盖标准附录中所列举的全部31种安全风险。

五、安全评估要求

标准支撑《生成式人工智能服务管理暂行办法》,提出了服务提供者需遵循的安全基本要求。服务提供者在按照有关要求履行备案手续时,按照标准第9部分要求进行安全评估, 并提交评估报告。

下载附件:

TC260-003 生成式人工智能服务安全基本要求

相关文件下载地址
此处下载仅用于分享和非商业性质使用,并遵守相关的条款和隐私政策。