Skip to Content
대규모 언어 모델을 위한 개인정보 보호 및 보안 (Korean Edition)
book

대규모 언어 모델을 위한 개인정보 보호 및 보안 (Korean Edition)

by Baihan Lin
January 2026
Beginner to intermediate
318 pages
5h 5m
Korean
O'Reilly Media, Inc.
Content preview from 대규모 언어 모델을 위한 개인정보 보호 및 보안 (Korean Edition)

제4장. 프라이버시 보호 훈련 기법

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

지금까지의 여정에서 여러분은 LLMs를 생성하는 방법과 개인정보 및 보안 측면에서 모델의 건전성을 적절히 평가하는 방법을 배웠습니다. 이제 여러분은 이러한 보호 기능을 모델에 직접 구축함으로써 AI 친구들을 건강하게 유지하는 방법을 배우게 될 것입니다. 이 장에서는 민감한 정보를 숨긴 채 AI가 해당 정보로 학습할 수 있도록 하는 일련의 기법들을 탐구할 것입니다.

개인정보 보호 기법은 특히 LLMs가 개인, 의료, 금융 등 민감한 정보를 점점 더 많이 처리함에 따라 AI 개발의 중요한 최전선을 대표합니다. 이러한 접근법은 개별 기록이나 예시의 기밀성을 훼손하지 않으면서도 모델이 데이터로부터 가치 있는 패턴과 통찰력을 추출할 수 있게 합니다. 훈련된 모델로부터 추출되거나 추론될 수 있는 정보를 제한하는 수학적 보증과 암호학적 보호 장치를 생성함으로써 작동합니다.

이 장에서는 강력한 프라이버시 보호를 유지하면서 AI 시스템이 민감한 정보로부터 학습할 수 있게 하는 몇 가지 핵심 기법을 살펴봅니다. 이러한 방법들은 머신러닝, 암호학, 프라이버시 이론의 교차점에 위치하며, 원본 형태로는 완전히 '볼' 수 없는 데이터를 분석할 수 있는 시스템을 구축합니다.

다섯 가지 주요 프라이버시 보호 기법(차등 프라이버시, 연합 학습, 동형 암호화, 다자간 계산, 프라이버시 보호 데이터 변환)을 다룰 것입니다. 또한 훈련 가능한 매개변수 수를 제한하여 프라이버시 위험을 줄이는 현대적인 매개변수 효율적 미세 조정 방법도 살펴보게 됩니다.

훈련 단계에서의 실제 개인정보 유출 사례 해결책으로 넘어가기 전에, 개인정보 보호훈련 기술이 왜 그토록 중요한지 잠시 살펴보겠습니다.

해결책으로 넘어가기 전에, 개인정보 보호 훈련 기법이 왜 그토록 중요한지 잠시 살펴보겠습니다. 희귀 질환 진단을 돕는 AI를 훈련시키는 의사라고 상상해 보십시오. 수천 건의 환자 기록을 입력하면, 짜잔! 초지능 의료 AI가 완성됩니다. 하지만 잠깐만… 누군가 이 AI에서 개별 환자 정보를 추출할 수 있다면 어떨까요? 이는 단순히 당황스러운 수준을 넘어 의료 윤리와 개인정보 보호법 위반이라는 심각한 문제를 야기합니다( 8장에서 자세히 살펴보겠습니다).

이 섹션에서는 먼저 모델 기반 개인정보 침해의 기본 소개로 로지스틱 회귀 모델을 살펴볼 것입니다. 그런 다음 현대적인 LLM 애플리케이션에 더 적합한 복잡한 모델 환경을 시뮬레이션하기 위해 보다 현실적인 트랜스포머 기반 설정을 소개하겠습니다.

이러한 침해가 발생할 수 있는 단순화된 예를 살펴보겠습니다:

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

AWS의 보안 및 마이크로 서비스 아키텍처

AWS의 보안 및 마이크로 서비스 아키텍처

Gaurav Raje

Publisher Resources

ISBN: 0642572313845