Skip to Content
머신러닝 시스템 설계
book

머신러닝 시스템 설계

by 칩 후옌, 김대근, 김영민
March 2023
Beginner to intermediate
436 pages
9h 20m
Korean
Hanbit Media, Inc.
Content preview from 머신러닝 시스템 설계
165
5
피처 엔지니어링
CHAPTER
5
피처 엔지니어링
2014
년 발표된 논문 「
Practical
lessons
from
predicting
clicks
on
ads
at
facebook
1
서는 올바른 피처를 보유하는 것이
ML
모델을 개발하는 데 가장 중요하다고 주장합니다. 그
이후 필자가 협업했던 많은 회사에서는 실행 가능한 모델이 있는 한 올바른 피처를 보유하는
것이 하이퍼파라미터 조정 같은 알고리즘 기법보다 큰 성능 향상을 이끌어내는 것을 몇 번이나
확인했죠. 최첨단 모델 아키텍처는 적절한 피처 집합을 사용하지 않으면 성능이 저하됩니다.
따라서
ML
엔지니어링과 데이터 과학에서는 유용한 신규 피처를 생성하는 일이 상당한 부분
을 차지합니다. 이 장에서는 피처 엔지니어링 관련 기법과 중요한 고려 사항을 살펴봅니다.
ML
프로덕션에서 많은 문제를 일으키는 데이터 누수
data
leakage
를 감지하고 방지하는 방법도 알아
봅니다.
마지막으로는 피처 중요도와 피처 일반화를 함께 고려해 좋은 피처를 설계하는 방법을 논의합
니다. 피처 엔지니어링을 언급할 때 피처 스토어를 떠올리는 분들도 있을 겁니다. 피처 스토어
는 여러
ML
애플리케이션을 지원하는 인프라에 더 가까우므로
10
장에서 다룹니다.
1
He
,
X
.,
Bowers
,
S
.,
Candela
,
J
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

개발 7년차, 매니저 1일차

개발 7년차, 매니저 1일차

권원상, 한민주, 카미유 푸르니에
견고한 데이터 엔지니어링

견고한 데이터 엔지니어링

조 라이스, 맷 하우슬리
러닝 타입스크립트

러닝 타입스크립트

조시 골드버그

Publisher Resources

ISBN: 9791169210850