欢迎光临散文网 会员登陆 & 注册

机密计算:AI数据安全和隐私保护

2023-03-30 20:21 作者:叫什么名字好呢随便吧  | 我要投稿

链接:https://pan.baidu.com/s/1PB0dH4c639zEVeNc0cS7zA?pwd=wby6 

提取码:wby6

编辑推荐

适读人群 :本书适合计算机和软件行业从业者、研究人员及高校师生阅读,尤其适合从事人工智能和隐私保护计算的架构师和开发人员阅读。

- 自ChatGPT发布以来,公众对大型语言模型(LLM)技术中设计的隐私保护问题异常关注,如何安全地保护用户隐私是当前的前沿问题。使用可信执行环境可以在保障数据隐私和安全的同时,提高AI模型T的安全性和可信度。

- 本书聚焦机密计算在AI数据安全和隐私保护方面的问题和应用,从基本原理、技术框架、工程落地、场景案例等方面,详细阐述可信执行环境技术,系统绘制机密计算的全景视图。

- 详述了如何使用SGX技术搭建AI和ML隐私安全解决方案

- 涵盖软硬件架构、关键技术实现和应用开发等,汇总了产业真实案例和实践经验


内容简介

本书系统介绍了面向人工智能领域中的数据安全、隐私保护技术和工程实践。本书首先探讨了人工智能领域所面临的各种数据安全和隐私保护的问题及其核心需求,并在此基础上纵览和比较了各种隐私保护计算技术和解决方案的利弊;然后详细阐述了目前比较具有工程实践优势的可信执行环境技术,及其在主流人工智能场景中的工程实践参考案例。此外,本书介绍了关于数据安全和隐私保护的概念、原理、框架及产品,从而帮助读者对机密计算的技术全景有整体的理解。


本书适合计算机和软件行业从业者、研究人员及高校师生阅读,尤其适合从事人工智能和隐私保护计算的架构师和开发人员阅读。


作者简介

胡寅玮

英特尔数据平台事业部中国云计算平台工程部总监。负责为中国及亚太区的云服务商提供云服务器和数据平台的全栈式技术方案,包括CPU定制、服务器平台设计开发、云固件研发、软件性能优化、计算安全及集群阵列调优。



闫守孟

蚂蚁集团研究员,蚂蚁可信基础设施负责人。领导了蚂蚁集团SOFAEnclave(Occlum、HyperEnclave、KubeTEE等)机密计算软件栈、隐私计算加速硬件和可信隐私计算一体机的研发,发起并主导制定了国内外多项可信执行环境和隐私计算一体机标准。有关技术产品已在蚂蚁、阿里巴巴、微软Azure及诸多隐私计算企业得到广泛应用,产生了重要的社会和经济价值。加入蚂蚁之前,在Intel中国研究院从事基础技术研究,多项研究成果应用在Intel软硬件产品中。曾在PLDI、ASPLOS、ATC、ASE等发表多篇顶级会议论文,并拥有30余件专利。在西北工业大学获得计算机应用技术专业博士学位。



吴 源

英特尔数据平台事业部资深AI与安全软件工程师。主要负责基于英特尔可信执行环境的人工智能应用和隐私计算。工作重点主要包括联邦学习、深度学习的隐私保护,以及与云计算厂商共同构建基于英特尔可信执行环境的人工智能应用方案。曾参与发表多篇关于人工智能性能优化和可信执行环境的白皮书。



朱运阁

英特尔数据平台事业部软件方案项目组深度学习工程师。研究兴趣和专长主要包括可信执行环境、联邦学习和同态加密。工作重点是基于可信执行环境的数据安全和隐私保护计算。曾参与发表多篇关于可信执行环境安全计算的白皮书,并将解决方案作为最佳实践发表在国内知名社区网站上。



龚奇源

博士,英特尔资深机器学习工程师。2016年博士毕业于东南大学计算机应用专业,师从罗军舟教授,博士期间主要从事数据隐私相关研究。2017年加入英特尔,从事大数据、机器学习和数据隐私相关工作。是大数据+AI开源项目Analytics-Zoo和大数据存储管理开源项目SSM的主要贡献者。



黄晓军

英特尔数据平台事业部资深云计算工程师。长期从事软件架构设计和开发工作,专注于深度学习应用开发与性能优化,以及基于隐私保护机器学习、联邦学习、同态加密和可信执行环境的应用场景落地。曾参与多个数据安全领域开源项目的开发工作。



惠思远

英特尔数据平台事业部软件工程师。主要从事数据安全和隐私保护、人工智能等领域的研究与开发等工作,目前与国内多家云计算厂商合作研发基于英特尔可信执行环境的解决方案。研究兴趣包括可信执行环境、联邦学习和机器学习系统等。



步建林

人工智能与安全软件工程师。主要从事人工智能、高性能计算与隐私保护计算等领域的相关工作。工作重点主要包括AI推理引擎与训练框架的研发与优化,以及基于可信执行环境的隐私保护计算方案的设计与构建。毕业于合肥工业大学微电子科学与工程专业,拥有学士学位。


精彩书评

面向隐私保护的大数据分析、机器学习和深度学习正成为众多应用场景的核心技术。本书从关键的可信执行环境技术(如英特尔SGX)出发,讨论了多个实际的隐私计算工程实践和开源项目(如BigDL PPML),是一本不可多得的兼具理论深度和实际应用的著作。

戴金权

英特尔院士、大数据技术全球CTO



随着各国数据安全相关法规的颁布,在人工智能应用中合规合法地使用数据变得非常重要。火山引擎作为人工智能应用落地的实践者,严格履行数据安全法规,推出了产品化的火山引擎隐私计算平台Fedlearner。本书详细地描述了人工智能方案落地过程中遇到的数据安全和隐私保护问题,并且详细介绍了Fedlearner TEE方案的实现原理和细节,对于关注数据安全和隐私计算的人工智能开发人员来说,是一本很好的参考书和实践手册。

项 亮

火山引擎机器学习负责人



随着云计算的兴起,用户数据的泄露成为云计算推广的主要阻碍,如何保护用户数据的安全成为云计算提供商的首要任务。人工智能作为云计算落地的重要场景之一,其用户数据和模型是客户宝贵的知识资产。本书以英特尔SGX为例,系统地介绍了可信执行环境技术在人工智能训练、推理及大数据场景下的应用和实践,对于云计算用户理解和实践可信执行环境技术有重要的参考价值。

Niveditha Sundaram

英特尔数据平台事业部副总裁


目录

目录

第1部分 基本概念框架

第1章 数据安全的挑战与需求 2

1.1 数据安全的战略意义 3

1.2 数据产业面临的安全挑战 5

1.3 数据安全核心需求 8

1.3.1 数据生命周期 8

1.3.2 数据安全需求 9

1.4 隐私保护计算背景 10

1.4.1 基本概念 10

1.4.2 国内外政策环境 12

1.5 AI领域中的数据安全问题 15

1.5.1 AI中的CIA数据安全模型 15

1.5.2 AI中的攻击模型 16

1.5.3 典型AI场景中的数据安全问题 18

参考文献 20


第2章 隐私保护计算技术 21

2.1 安全多方计算 22

2.1.1 安全多方计算的定义和分类 22

2.1.2 不经意传输 23

2.1.3 混淆电路 25

2.1.4 秘密共享 27

2.1.5 零知识证明 29

2.1.6 应用场景 31

2.2 同态加密 31

2.2.1 部分同态加密 33

2.2.2 类同态加密 37

2.2.3 全同态加密 38

2.2.4 应用场景 40

2.3 差分隐私 41

2.3.1 基本定义 42

2.3.2 噪声机制 42

2.3.3 应用场景 44

2.4 可信执行环境 45

2.4.1 英特尔SGX 46

2.4.2 ARM TrustZone 47

2.4.3 AMD SEV 48

2.4.4 应用场景 51

2.5 各类技术比较 51

2.5.1 安全多方计算 52

2.5.2 同态加密 52

2.5.3 差分隐私 53

2.5.4 可信执行环境 53

参考文献 54


第3章 AI场景中的隐私保护计算方案 58

3.1 联邦学习 59

3.1.1 联邦学习简介 59

3.1.2 横向联邦学习架构及案例 60

3.1.3 纵向联邦学习架构及案例 62

3.2 联邦学习扩展方案 64

3.2.1 共享智能 64

3.2.2 联邦智能 65

3.2.3 知识联邦 66

3.3 AI推理 67

3.4 隐私保护计算方案总结 69

参考文献 70


第2部分 深度技术解析

第4章 可信执行环境技术 72

4.1 背景介绍 73

4.2 架构概述 75

4.2.1 芯片支持 75

4.2.2 固件支持 80

4.2.3 软件栈 80

4.3 关键技术 82

4.3.1 内存组织结构 83

4.3.2 内存加密引擎 85

4.3.3 Enclave生命周期 88

4.3.4 线程运行模式 91

4.3.5 密钥 92

4.3.6 认证 92

4.4 SGX防御的攻击 98

4.4.1 硬件攻击防御 99

4.4.2 软件攻击防御 99

4.5 SGX面临的威胁及其防御 101

4.5.1 拒绝服务攻击 101

4.5.2 Iago攻击 102

4.5.3 侧信道攻击 102

4.5.4 Enclave代码漏洞 102


第5章 可信执行环境应用程序开发 104

5.1 软件栈 105

5.1.1 驱动 105

5.1.2 Qemu/KVM虚拟化 106

5.1.3 软件栈SDK和PSW 107

5.1.4 数据中心认证DCAP 109

5.2 应用程序开发 112

5.2.1 应用程序开发基本原理 112

5.2.2 应用程序基本构成 115

5.2.3 Hello World案例 116

5.3 TEE生态技术介绍 125

5.3.1 TEE SDK 125

5.3.2 TEE程序分割 126

5.3.3 TEE LibOS 128

5.3.4 TEE容器栈 135

第3部分 工程应用实践


第6章 联邦学习的隐私保护与工程实践 138

6.1 联邦学习的数据安全问题 139

6.1.1 半诚实的参与方的问题 141

6.1.2 第三方协作者的数据安全问题 147

6.1.3 传输间数据安全问题 148

6.2 TEE安全技术解决方案 153

6.2.1 应用程序隔离 153

6.2.2 远程认证 155

6.2.3 基于远程认证的传输层安全协议 156

6.3 案例实践 163

6.3.1 横向联邦学习实践 164

6.3.2 纵向联邦学习实践 170

6.3.3 总结与展望 173

参考文献 174


第7章 在线推理服务的安全方案与工程实践 176

7.1 在线推理服务的安全问题 177

7.1.1 云原生在线推理参考架构及其组件 177

7.1.2 威胁模型与安全目标 181

7.2 安全方案与设计原理 188

7.2.1 安全技术与方案 188

7.2.2 安全模型与边界 192

7.3 案例实践 194

参考文献 198


第8章 大数据AI的安全方案和工程实践 200

8.1 大数据AI应用中的安全问题 201

8.1.1 大数据生态与相关技术 202

8.1.2 安全目标 206

8.1.3 威胁模型 208

8.2 安全技术与参考方案 209

8.2.1 现有大数据安全技术 209

8.2.2 基于TEE的大数据AI安全方案 218

8.2.3 工作流程与安全性分析 219

8.3 案例实践 222

8.3.1 可信的大数据AI平台 223

8.3.2 可信的联邦学习平台 225

8.4 总结与展望 229

参考文献 230


查看全部↓

前言/序言

推荐序一

全球数字化进程方兴未艾,数字化转型深入各行各业。全球数据体量呈现指数级增长态势,数据成为企业发展和政府管理的重要基石。不断扩大的数据规模促使各国各方将注意力投向数据安全领域。作为世界重要经济体的中国,近年来在互联网、云计算和人工智能等行业都取得了高速发展,随之面临的数据协作和数据保护的诉求也日趋增多。特别是疫情爆发以来,一方面,人工智能系统高度依赖数据做出决策;另一方面,解决隐私保护问题迫在眉睫。目前,数据安全在政府、金融和电信等基础民生领域的应用已经较为深入,业务占比将近50%。随着数据安全技术的持续突破,其在医疗、制造等领域的应用也逐渐深入。为了有效地应对信息技术创新和数字经济产业高速发展所带来的数据安全和隐私保护等诸多问题,中国网络安全和数据治理方面的政策不断出台,立法体系不断完善,对数据安全的监管力度不断提升。2021年,《中华人民共和国数据安全法》正式颁布,数据安全上升到了国家安全范畴,企业数据安全义务和法律合规要求也达到了新的高度。中国数据安全产业前景广阔,预计到2023年,中国数据安全产业市场规模有望达到97亿元。

数据安全技术不断发展,不断升级的安全隐私保护需求也对技术的创新、实践和应用提出了更高的要求。随着网络攻击向系统堆栈的层级下移,已不能仅依靠软件的安全保护。要维持更安全的计算环境,需要从硬件到软件进行全方位的守护。企业、机构的安全应建立在最基础的系统层(芯片)上的可信根之上。内置于芯片的安全技术有助于保护潜在的攻击面,保护客户依赖


机密计算:AI数据安全和隐私保护的评论 (共 条)

分享到微博请遵守国家法律