book

大型语言模型的隐私与安全 (Chinese Edition)

Name: 大型语言模型的隐私与安全 (Chinese Edition)
Author: Baihan Lin
ISBN: 0642572313869

by Baihan Lin

January 2026

Beginner to intermediate

318 pages

3h 38m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
本书读者对象为何撰写本书阅读指南本书采用的规范代码示例使用说明O'Reilly在线学习联系我们鸣谢
1. 引言
大型语言模型的崛起LLMs中的隐私与安全问题本书内容涵盖您在此旅程中的角色总结
2. 理解大型语言模型
大型语言模型的基础原理语言模型的基础构建模块LLMs核心概念LLM架构Transformer架构专家混合架构热门LLM模型LLM训练技术预训练技术微调技术检索增强生成总结
3. 评估LLMs的隐私与安全风险
隐私度量差分隐私隐私损失k-匿名性RAG系统中的隐私考量安全指标攻击成功率 (ASR)成员关系推断的误报率（FPR）模型逆向工程的重建误差大型LLM的隐私与安全审计攻击模拟LLMPrivacySecurityEvaluator：全能审计工具现代评估框架与基准测试摘要
4. 隐私保护训练技术
训练阶段隐私泄露的真实案例 LLM的差分隐私用于隐私评估的合成数据如何在您的数据上应用LLMPrivacySecurityEvaluatorLLMs的差分隐私技术数学基础为LLMs实现差分隐私随机梯度下降隐私会计实践权衡与考量将差分隐私应用于检索增强生成基于LLMs的联邦学习概念为LLMs实现联邦学习联合学习的优势与挑战LLMs中的同态加密概念为LLMs实现同态加密同态加密的优势与挑战安全聚合的多方计算概念基于现代库实现MPCMPC的优势与挑战参数高效的隐私保护微调低秩自适应量化低秩适应隐私保护数据转换数据匿名化与去标识化隐私保护数据增强隐私保护数据增强的优势与挑战数据增强摘要
5. LLMs的安全部署
安全模型托管与基础设施理解基础设施组件隔离策略网络安全资源管理与监控安全API与通信API设计原则安全API的实现身份验证与授权安全通信安全模型版本控制与更新模型注册表与版本控制安全更新流程摘要
6. 对抗性攻击与防御策略
理解针对LLMs的对抗性攻击针对LLMs的对抗性攻击分类典型攻击方法嵌入空间攻击LLM代理攻击模型规模与架构的影响案例研究：防御越狱攻击鲁棒微调技术对抗性训练鲁棒优化技术数据增强与鲁棒性前缀调优与基于prompt的鲁棒性集成方法可验证鲁棒微调针对LLMs的红队测试红队对抗方法论实施红队计划红队工具与框架自动化多轮红队演练案例研究：实战中的红队演练对抗性评估与鲁棒性指标稳健性基准分布偏移下的稳健性人机协同评估基于代理的评估标准化攻击成功指标防御评估指标鲁棒性评估的挑战最佳实践大型LLM鲁棒性的未来方向摘要
7. 深度微调LLMs的伦理考量
个性化中的偏见与公平性问题理解微调LLMs中的偏见在微调模型中衡量公平性偏见缓解策略隐私保护偏见缓解的挑战微调模型中的透明度与可解释性LLMs可解释性挑战解释LLM行为的技术隐私保护下的可解释性在隐私约束下解决AI偏见隐私与公平的权衡群体感知隐私机制偏见感知联邦学习隐私保护偏见审计摘要
8. 应对文化、社会与法律环境
新型社会技术系统人工智能驱动的文化演进浪潮中前行人工智能生成内容的兴起与信任的侵蚀个性化人工智能与身份危机在监控资本主义时代人机交互中的存在主义问题揭开生成式人工智能供应链的面纱机器文化的兴起适应性法律框架：监管与问责机制LLMs时代的版权与知识产权困境个性化人工智能系统中的数据隐私与保护案例算法偏见与歧视案例研究 ——人工智能驱动决策中的伦理困境人工智能驱动系统中的责任与问责案例技术法律解决方案主义面临的普遍挑战构建负责任的人工智能文化超越算法的人工智能安全：人类因素摘要
9. 构建隐私保护型人工智能能力
医疗健康AI实践：基于差分隐私的临床病历分析医疗隐私挑战合成数据作为隐私保护基础LoRA：高效且隐私友好的微调方案基于RDP的隐私核算现实世界部署考量法律AI实践：跨律所或法院的联合学习法律保密性要求法律人工智能的联合学习架构安全聚合与模型更新联合法律人工智能的法律与伦理考量性能与实用性评估构建以隐私为先的人工智能能力组织准备度与实施策略团队架构与技术决策治理整合与成效衡量为明日隐私格局预作准备技术融合与监管演进市场动态与竞争定位面向未来的战略定位摘要结论您所见证的变革我们正在走的路您在塑造未来中的角色

索引
关于作者

Content preview from 大型语言模型的隐私与安全 (Chinese Edition)

第4章隐私保护训练技术

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

在我们迄今的探索中，您已掌握创建LLMs的方法，并学会如何从隐私与安全角度评估其健康状态。接下来，您将学习如何通过在模型中直接构建保护机制来维护这些人工智能伙伴的健康。本章将探讨一类技术，使人工智能能在处理敏感信息时保持信息隐蔽性。

隐私保护方法是人工智能发展的关键前沿领域，尤其当LLMs日益处理个人、医疗、金融等敏感信息时。这些方法使模型能够从数据中提取有价值的模式和洞察，同时不损害个体记录或示例的保密性。其运作原理在于创建数学保证和密码学保护机制，限制从训练模型中可提取或推断的信息范围。

本章将探讨若干核心技术，使人工智能系统能在强隐私保护下学习敏感信息。这些方法融合了机器学习、密码学与隐私理论，构建出能够分析原始数据却无法完全"窥见"其完整形态的系统。

我们将涵盖五大类隐私保护技术：差分隐私、联合学习、同态加密、多方计算以及隐私保护数据转换。此外，您还将探索现代参数高效的微调方法——通过限制可训练参数数量来降低隐私风险。

训练阶段隐私泄露的真实案例在深入探讨解决方案之前，让我们先理解隐私保护训练技术为何至关重要。

在深入探讨解决方案前，让我们先理解隐私保护训练技术为何至关重要。假设您是医生，正训练AI辅助诊断罕见疾病。输入数千份病历后，神奇的医疗AI诞生了！但且慢——若有人能从该AI中提取个体患者信息呢？这不仅令人尴尬，更严重违反医疗伦理与隐私法规（详见第八章）。

本节将首先通过逻辑回归模型作为基础案例，引出基于模型的隐私泄露问题。随后我们将引入更贴近现实的Transformer架构，模拟复杂模型环境，这更符合现代LLM的应用场景。

让我们通过简化案例了解此类泄露可能发生的途径：

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# Simulated patient data (age, blood pressure, cholesterol, diagnosis)
np.random.seed(42)
data = np.random.rand(1000, 3)
labels = (data[:,0] + data[:,1] + data[:,2] > 1.5).astype(int)

# Add some "unique" patients
unique_patients = np.array([
    [0.1, 0.1, 0.1, 0],  # Alice
    [0.9, 0.9, 0.9, 1],  # Bob
])
data = np.vstack([data, unique_patients[:,:3]])
labels = np.concatenate([labels, unique_patients[:,3]])

# Train a simple model
X_train, X_test, y_train, y_test = train_test_split(data, labels, test_size=0.2)
model = LogisticRegression()
model.fit(X_train ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572313869

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

大型语言模型的隐私与安全 (Chinese Edition)

by Baihan Lin

第4章隐私保护训练技术

训练阶段隐私泄露的真实案例在深入探讨解决方案之前，让我们先理解隐私保护训练技术为何至关重要。

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.