Skip to Content
머신러닝 인터뷰 실무 가이드
book

머신러닝 인터뷰 실무 가이드

by 수잔 수 창, 박상현
September 2024
Beginner to intermediate
364 pages
8h 27m
Korean
Hanbit Media, Inc.
Content preview from 머신러닝 인터뷰 실무 가이드
189
CHAPTER 04
기술 인터뷰: 모델 학습 및 평가
도 불구하고 말이죠.
피처 선택
데이터 세트에는 서로 높은 상관관계를 가진 피처가 포함될 수 있습니다. 즉, 피처 간에 공선
collinearity
이 존재하는 경우가 있습니다. 예를 들면 센티미터 단위로 측정된 키와 미터 단위로
측정된 키는 본질적으로 동일한 정보를 포착합니다. 다른 피처들도 상당한 비율로 같은 정보
를 포착할 수 있으며, 이들을 제거하여 모델이 처리해야 할 피처 수를 줄임으로써, 발생하기
쉬운 오버피팅을 줄이거나 모델의 처리 속도를 향상시킬 수 있습니다. 차원 축소는 피처 선
택을 위한 일반적인 방법이며, 가장 중요한 정보를 유지하면서도 데이터의 차원을 줄이는 작
업입니다.
또 다른 방법은 피처 중요도 테이블
Feature
Importance
Table
을 활용하는 것입니다. 예를 들어,
XGBoost
CatBoost
에서 제공하는 피처 중요도 테이블을 이용하여 모델에 가장 낮은 기
여를 하는 피처를 제거할 수 있습니다.
데이터 전처리와 피처 엔지니어링에 관한 인터뷰 문제 예제
데이터 전처리 및 피처 엔지니어링의 기초에 대해 알아보았으니, 이제 몇 가지 인터뷰 문제
예제를 살펴보겠습니다.
인터뷰 문제
4
-
1
: 피처 엔지니어링과 피처 선택의 차이점은 무엇인가요?
답변 예시
피처 엔지니어링은 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

견고한 데이터 엔지니어링

견고한 데이터 엔지니어링

조 라이스, 맷 하우슬리
자바스크립트 완벽 가이드

자바스크립트 완벽 가이드

David Flanagan, Han Seon- yong
잘되는 머신러닝 팀엔 이유가 있다

잘되는 머신러닝 팀엔 이유가 있다

데이비드 탄, 에이다 양, 데이비드 콜스

Publisher Resources

ISBN: 9791169212397