book

大型语言模型的隐私与安全 (Chinese Edition)

Name: 大型语言模型的隐私与安全 (Chinese Edition)
Author: Baihan Lin
ISBN: 0642572313869

by Baihan Lin

January 2026

Beginner to intermediate

318 pages

3h 38m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
本书读者对象为何撰写本书阅读指南本书采用的规范代码示例使用说明O'Reilly在线学习联系我们鸣谢
1. 引言
大型语言模型的崛起LLMs中的隐私与安全问题本书内容涵盖您在此旅程中的角色总结
2. 理解大型语言模型
大型语言模型的基础原理语言模型的基础构建模块LLMs核心概念LLM架构Transformer架构专家混合架构热门LLM模型LLM训练技术预训练技术微调技术检索增强生成总结
3. 评估LLMs的隐私与安全风险
隐私度量差分隐私隐私损失k-匿名性RAG系统中的隐私考量安全指标攻击成功率 (ASR)成员关系推断的误报率（FPR）模型逆向工程的重建误差大型LLM的隐私与安全审计攻击模拟LLMPrivacySecurityEvaluator：全能审计工具现代评估框架与基准测试摘要
4. 隐私保护训练技术
训练阶段隐私泄露的真实案例 LLM的差分隐私用于隐私评估的合成数据如何在您的数据上应用LLMPrivacySecurityEvaluatorLLMs的差分隐私技术数学基础为LLMs实现差分隐私随机梯度下降隐私会计实践权衡与考量将差分隐私应用于检索增强生成基于LLMs的联邦学习概念为LLMs实现联邦学习联合学习的优势与挑战LLMs中的同态加密概念为LLMs实现同态加密同态加密的优势与挑战安全聚合的多方计算概念基于现代库实现MPCMPC的优势与挑战参数高效的隐私保护微调低秩自适应量化低秩适应隐私保护数据转换数据匿名化与去标识化隐私保护数据增强隐私保护数据增强的优势与挑战数据增强摘要
5. LLMs的安全部署
安全模型托管与基础设施理解基础设施组件隔离策略网络安全资源管理与监控安全API与通信API设计原则安全API的实现身份验证与授权安全通信安全模型版本控制与更新模型注册表与版本控制安全更新流程摘要
6. 对抗性攻击与防御策略
理解针对LLMs的对抗性攻击针对LLMs的对抗性攻击分类典型攻击方法嵌入空间攻击LLM代理攻击模型规模与架构的影响案例研究：防御越狱攻击鲁棒微调技术对抗性训练鲁棒优化技术数据增强与鲁棒性前缀调优与基于prompt的鲁棒性集成方法可验证鲁棒微调针对LLMs的红队测试红队对抗方法论实施红队计划红队工具与框架自动化多轮红队演练案例研究：实战中的红队演练对抗性评估与鲁棒性指标稳健性基准分布偏移下的稳健性人机协同评估基于代理的评估标准化攻击成功指标防御评估指标鲁棒性评估的挑战最佳实践大型LLM鲁棒性的未来方向摘要
7. 深度微调LLMs的伦理考量
个性化中的偏见与公平性问题理解微调LLMs中的偏见在微调模型中衡量公平性偏见缓解策略隐私保护偏见缓解的挑战微调模型中的透明度与可解释性LLMs可解释性挑战解释LLM行为的技术隐私保护下的可解释性在隐私约束下解决AI偏见隐私与公平的权衡群体感知隐私机制偏见感知联邦学习隐私保护偏见审计摘要
8. 应对文化、社会与法律环境
新型社会技术系统人工智能驱动的文化演进浪潮中前行人工智能生成内容的兴起与信任的侵蚀个性化人工智能与身份危机在监控资本主义时代人机交互中的存在主义问题揭开生成式人工智能供应链的面纱机器文化的兴起适应性法律框架：监管与问责机制LLMs时代的版权与知识产权困境个性化人工智能系统中的数据隐私与保护案例算法偏见与歧视案例研究 ——人工智能驱动决策中的伦理困境人工智能驱动系统中的责任与问责案例技术法律解决方案主义面临的普遍挑战构建负责任的人工智能文化超越算法的人工智能安全：人类因素摘要
9. 构建隐私保护型人工智能能力
医疗健康AI实践：基于差分隐私的临床病历分析医疗隐私挑战合成数据作为隐私保护基础LoRA：高效且隐私友好的微调方案基于RDP的隐私核算现实世界部署考量法律AI实践：跨律所或法院的联合学习法律保密性要求法律人工智能的联合学习架构安全聚合与模型更新联合法律人工智能的法律与伦理考量性能与实用性评估构建以隐私为先的人工智能能力组织准备度与实施策略团队架构与技术决策治理整合与成效衡量为明日隐私格局预作准备技术融合与监管演进市场动态与竞争定位面向未来的战略定位摘要结论您所见证的变革我们正在走的路您在塑造未来中的角色

索引
关于作者

Content preview from 大型语言模型的隐私与安全 (Chinese Edition)

第三章. 评估 LLMs的隐私与安全风险

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

既然你已经熟悉了这些健谈的AI伙伴的算法构造，现在就该带领它们踏入现实世界的黑暗森林了。你将戴上侦探帽，学习如何评估这些人工智能话痨在隐私泄露和安全攻击面前的脆弱程度。不妨将其视为对人工智能伙伴的健康体检——只不过这次不是测量血压，而是检测它们保守秘密和抵御数字捣蛋鬼的能力。

理解LLMs的隐私机制，如同解析这些数字生命体的免疫系统：这是保障其社会健康运作的基石。你将探索的隐私评估方法不仅能识别漏洞，更为后续开发的隐私保护技术奠定基础。掌握这些评估工具后，你将能预判隐私隐患于萌芽状态，并制定精准方案强化模型的隐私防御机制。

本章将深入剖析评估LLMs隐私与安全风险的方法及指标体系。您将系统学习各类隐私安全度量标准，涵盖数学模型推导与Python实践实现。完成本章学习后，您将掌握全面的工具集，用于评估LLMs在隐私泄露与安全攻击中的脆弱性。

需特别说明的是，本书涵盖的隐私风险仅反映当前现状，并非穷尽式目录。随着模型日益复杂化与广泛部署，AI隐私领域正快速演进，新的攻击途径与漏洞持续涌现。你正在构建的评估框架具有可扩展性，因此你不仅将学习具体指标，更将掌握系统性思考隐私评估的方法论。这种灵活的思维模式将助你应对尚未被预见的全新隐私挑战。

隐私度量

隐私是使用LLMs时的重要关切，因这些模型基于海量数据训练，其中可能包含敏感信息。探讨LLMs的隐私问题，本质上是在问："该模型在不泄露训练数据信息方面的表现如何？"本文将重点探讨差异隐私，并介绍若干有助于解答此问题的指标。

相较于其他机器学习模型，LLMs面临独特的隐私挑战。其生成能力可能导致训练数据中的原文段落被原样复现，而庞大的参数数量更增加了记忆信息的风险。此外，检索增强生成（RAG）等新兴架构引入了新的隐私向量——检索数据库中的敏感信息可能因此暴露。系统prompt泄露风险同样不容忽视——精心设计的用户prompt可能诱使模型暴露指令或其他特权信息。

隐私度量指标（差分隐私、隐私损失和k匿名性）初看或许抽象，但它们为量化并缓解这些LLM特有的漏洞提供了关键框架。让我们深入探讨。

差分隐私

差分隐私（DP）是一种数学框架，为数据被用于统计分析或机器学习模型的个人提供正式隐私保障。它揭示了数据集中可能泄露的个人信息程度。

想象你在派对上，有人问："谁吃了最后一片披萨？"差分隐私就像能如实回答这个问题，却不会让任何人被指认。这相当于人工智能说："有人吃了，但我不能透露具体是谁，否则会损害所有人的披萨食用隐私。"

数学表述

形式上，若随机化算法M满足以下条件，则称其具有ε-差分隐私性：对于所有仅差一个元素的数据集D1和 D2，以及所有S⊆ Range(M)：

P (M (D 1) \in S) \leq \exp (ε) \cdot P (M (D 2) \in S)

此处Range(M)指算法M的所有可能输出，S代表这些输出中的任意子集。该公式本质表明：无论是否包含单个个体数据，任何特定输出的概率变化均不显著。

参数ε（epsilon）称为隐私预算。较小的ε值意味着更强的隐私保护，但通常会降低模型实用性。典型取值范围为ε< 1（强隐私）至ε= 10（弱隐私但实用性更佳）。

提示

将ε视为隐私增强器的音量旋钮。调低（ε值变小）可增强隐私保护，但可能降低结果实用性；调高则能提升结果准确性，但会削弱隐私保障。关键在于找到恰当平衡点！

代码实现

以下是验证差分隐私的简易实现：

import ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572313869

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills