것이 하이퍼파라미터 조정 같은 알고리즘 기법보다 큰 성능 향상을 이끌어내는 것을 몇 번이나
확인했죠. 최첨단 모델 아키텍처는 적절한 피처 집합을 사용하지 않으면 성능이 저하됩니다.
따라서
ML
엔지니어링과 데이터 과학에서는 유용한 신규 피처를 생성하는 일이 상당한 부분
을 차지합니다. 이 장에서는 피처 엔지니어링 관련 기법과 중요한 고려 사항을 살펴봅니다.
ML
프로덕션에서 많은 문제를 일으키는 데이터 누수
data
leakage
를 감지하고 방지하는 방법도 알아
봅니다.
마지막으로는 피처 중요도와 피처 일반화를 함께 고려해 좋은 피처를 설계하는 방법을 논의합
니다. 피처 엔지니어링을 언급할 때 피처 스토어를 떠올리는 분들도 있을 겁니다. 피처 스토어
는 여러
ML
애플리케이션을 지원하는 인프라에 더 가까우므로
10
장에서 다룹니다.
1
He
,
X
.,
Bowers
,
S
.,
Candela
,
J
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.