Skip to Content
머신러닝 시스템 설계
book

머신러닝 시스템 설계

by 칩 후옌, 김대근, 김영민
March 2023
Beginner to intermediate
436 pages
9h 20m
Korean
Hanbit Media, Inc.
Content preview from 머신러닝 시스템 설계
296
머신러닝 시스템 설계
8.2.2 8.2.2
일반적인 데이터 분포 시프트일반적인 데이터 분포 시프트
학계에서는 잘 연구되지 않았지만 현실에서 모델 성능을 저하할 수 있는 몇 가지 변화 유형이
있습니다.
하나는 피처 변화
feature
change
입니다. 신규 피처가 추가되거나, 이전 피처가 제거되거나, 피처
값의 가능한 범위가 변한 경우입니다.
28
예를 들어, 모델이 ‘연령’ 피처에 연 단위를 사용하다가
이제는 월 단위를 사용한다면 해당 피처 값의 범위가 변하게 됩니다. 한번은 필자가 속한 팀에
서 파이프라인 버그로 인해 피처 값이 모두
NaN
(‘
not
a
number
’의 줄임말)이 돼 모델 성능
이 급락한 걸 발견한 적이 있습니다.
레이블 스키마 변화
label
schema
change
Y
값의 가능한 범위가 변하는 경우입니다. 레이블 시
프트의 경우
P
(
Y
)는 변하지만
P
(
X
|
Y
)는 그대로 유지됩니다. 반면 레이블 스키마가 변하면
P
(
Y
)
P
(
X
|
Y
)가 모두 변하게 됩니다. 스키마는 데이터 구조를 설명하므로 특정 작업에 대
한 레이블 스키마는 해당 작업의 레이블 구조를 설명합니다. 예를 들어, {양성’:
0
, ‘음성’:
1
}과
같이 각 클래스를 정숫값에 대응시키는 딕셔너리는 스키마입니다.
회귀 작업의 경우 레이블 값의 가능한 범위가 변하면서 레이블 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

마이크로서비스 아키텍처 구축(전면 개정판)

마이크로서비스 아키텍처 구축(전면 개정판)

샘 뉴먼
파이썬으로 살펴보는 아키텍처 패턴

파이썬으로 살펴보는 아키텍처 패턴

오현석, 해리 퍼시벌, 밥 그레고리
러닝 타입스크립트

러닝 타입스크립트

조시 골드버그
GPT-4를 활용한 인공지능 앱 개발

GPT-4를 활용한 인공지능 앱 개발

올리비에 케일린, 마리 알리스 블레트

Publisher Resources

ISBN: 9791169210850