Skip to Content
大型语言模型的隐私与安全 (Chinese Edition)
book

大型语言模型的隐私与安全 (Chinese Edition)

by Baihan Lin
January 2026
Beginner to intermediate
318 pages
3h 38m
Chinese
O'Reilly Media, Inc.
Content preview from 大型语言模型的隐私与安全 (Chinese Edition)

第九章 构建 隐私保护型人工智能能力

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

恭喜!您已抵达本书的最终篇章。通过本书的学习,您已全面掌握理论基础,探索了实际应用方案,并深入理解了LLMs相关的复杂伦理与法律考量。还记得那些探索过的隐私保护技术吗?现在正是将其付诸实践的时刻。 通过深入剖析两个典型案例,您将跨越理论与实践的鸿沟,见证这些隐私保护技术如何在高风险敏感领域落地应用。

从实验室走向现实,才是检验隐私保护技术真正价值的试金石。 在受控环境下理解差分隐私的数学原理或实现联合学习是一回事,而在关乎患者生命的医疗系统,或保密性可能决定职业生涯与案件成败的法律环境中部署这些方法则是另一回事。这些现实应用不仅验证了技术方案的可行性,更揭示了隐私保护、实用价值与合规要求在生产系统中共存时产生的微妙挑战。

本章将通过两个引人入胜的案例,展现隐私保护型人工智能的不同维度。首先深入医疗领域,在严格保持差分隐私保障的前提下,对合成医疗数据进行语言模型微调。该案例将演示如何通过数学保障机制,在保护患者隐私的同时提取有价值的临床洞察。 其次,您将考察法律领域的联合学习场景:多家律所协作改进共享模型,全程不泄露机密案件文件。这些案例共同展现了您在本书中掌握的隐私保护技术之广度与深度。

但本章不仅是对所学知识的回顾,更是对领域发展方向的前瞻性探索。在审视这些实际应用时,您还将思考正在形成的新兴趋势、持续存在的挑战以及未来方向,这些因素将塑造下一代隐私保护人工智能系统。随着新监管框架、技术创新和社会期望的不断涌现,该领域正在快速演变,持续重塑着这一领域中可能实现与必须实现的目标。

医疗人工智能实践:差分隐私的临床病历分析

医疗领域是LLM部署最具前景却也最具挑战性的领域之一。其潜在效益巨大:人工智能系统可辅助诊断、建议治疗方案,并帮助医疗从业者应对日益复杂的医学知识体系。然而医疗领域也存在隐私泄露的严重后果,不仅危及个人,更可能导致整个社区对医疗体系丧失信任。

让我们深入首个案例研究:在保持最强隐私保障的前提下,针对临床应用对语言模型进行微调。我们将处理一个既符合现实又合法合规的场景:使用包含真实但虚构的受保护个人信息(PPI)的合成临床病历,对相对小巧但功能强大的语言模型Llama 3.2进行微调。

医疗隐私挑战

在深入探讨具体方案前,必须理解隐私为何在医疗AI领域至关重要。美国《健康保险携带与责任法案》(HIPAA)及全球类似法规,对保护患者健康信息设定了严格要求。但除了法律合规性,更涉及深远的伦理责任——患者向医疗提供者披露最私密的信息时,始终基于这些信息将受到保护且仅用于其自身利益的信任前提。

当考虑到人工智能系统可能无意间记忆并复现敏感信息时,这一挑战尤为严峻。基于真实临床记录训练的模型,在适当prompt下可能生成与实际病历高度相似的文本。即便移除了姓名等明显标识,医疗记录中丰富的细节仍可能通过"马赛克识别"过程实现重新识别——看似无害的细节组合足以唯一标识特定个体。

试想一份提及罕见遗传病症、特定年龄、特定地理位置及独特症状组合的临床记录。这些细节单独存在时或许无法识别患者,但组合起来便能将可能性缩小到单个个体,尤其在小规模社区中。正因如此,传统去标识化技术虽具价值,却难以满足现代人工智能系统学习并复现复杂模式的需求。

合成数据作为隐私保护的基础

首先需要创建真实可信却完全虚构的临床记录,既要捕捉真实医疗数据中的语言模式和医学关联,又不能包含任何实际患者信息。这绝非简单替换姓名为化名,而是要生成既能保留有效模型训练所需统计特性,又能确保无法还原真实患者信息的数据。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

产品思维工程师 (Chinese Edition)

产品思维工程师 (Chinese Edition)

Drew Hoskins

Publisher Resources

ISBN: 0642572313869