GB/T 45652-2025网络安全技术 生成式人工智能预训练和优化训练数据安全规范【免费下载】
#政策法规 ·2026-02-19 17:28:00
本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由全国网络安全标准化技术委员会(SAC/TC260)提出并归口。
本文件起草单位:北京中关村实验室、国家计算机网络应急技术处理协调中心、中国电子技术标准化研究院、北京大学、北京天融信网络安全技术有限公司、北京快手科技有限公司、阿里巴巴(北京)软件服务有限公司、北京百度网讯科技有限公司、清华大学、北京瑞莱智慧科技有限公司、天翼安全科技有限公司、中国移动通信集团有限公司、小米科技有限责任公司、阿里云计算有限公司、北京面壁智能科技有限责任公司、杭州萤石软件有限公司、北京理工大学、北京零一万物科技有限公司、中国科学院自动化研究所、联想(北京)有限公司、北京奇虎科技有限公司、科大讯飞股份有限公司、华为云计算技术有限公司、北京数安行科技有限公司、公安部第三研究所、蚂蚁科技集团股份有限公司、北京启明星辰信息安全技术有限公司、中国科学院计算技术研究所。
本文件主要起草人:徐恪、姚龙、张震、刘勇、谭知行、李琦、谢安明、许晓耕、杨光、崔天宇、郝春亮、张妍婷、薛智慧、郭建领、谷晨、姜文、叶晓俊、田天、梁伟、江为强、李家锟、彭骏涛、汪华东、郑鸿咚、洪延青、王海棠、朱贵波、孟遥、张向征、刘俊华、李峰风、刘玉红、刘楠、林冠辰、王龑、落红卫、谭映水、张峰、孙旭东、杜金浩、徐世真、安鹏、于阳、孙勇、郭洁昕、吴建亮、王霞、王金桥、高博雅、管铭、王士进、赵丽丽、王文宇、丁治国、蒋发群、盛强、吴博文。
预训练和优化训练数据是生成式人工智能的基础,直接决定了生成内容的质量和安全水平,但由于预训练和优化训练数据在收集、预处理、使用等处理活动中存在安全风险,亟需标准规范用于提高预训练和优化训练数据的安全水平。
1.范围
本文件规定了生成式人工智能预训练和优化训练数据及其处理活动的安全要求,描述了相应的评价方法。
本文件适用于生成式人工智能服务提供者开展预训练和优化训练数据处理活动以及安全自评估,也适用于第三方机构对预训练和优化训练数据进行安全性评估。
2.规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T35273信息安全技术个人信息安全规范
GB/T41479-2022信息安全技术网络数据处理安全要求
3.术语和定义
下列术语和定义适用于本文件。
3.1生成式人工智能服务 generative artificial intelligence service
利用生成式人工智能技术向公众提供生成文本、图片、音频、视频等内容的服务。
[来源:GB/T45654-2025,3.1]
3.2服务提供者 service provider
以交互界面、可编程接口等形式提供生成式人工智能服务的组织或个人。
3.3服务使用者 service user
使用生成式人工智能服务的组织或个人。
3.4预训练 pre-training
使用大规模数据使生成式人工智能模型获得通用知识的训练过程。
3.5优化训练 fine-tuning