Skip to Content
머신러닝 시스템 설계
book

머신러닝 시스템 설계

by 칩 후옌, 김대근, 김영민
March 2023
Beginner to intermediate
436 pages
9h 20m
Korean
Hanbit Media, Inc.
Content preview from 머신러닝 시스템 설계
169
5
피처 엔지니어링
댓글
ID
사용자
ID
스레드
ID
시간
생성 시점
시간
텍스트
부가 정보
텍스트
링크
댓글 개수
링크
이미지
개수
카르마
이미지
개수
스레드
ID
스레드
개수
댓글 개수
댓글
대상자
이메일
인증 여부
아니오
조회 수
댓글 개수
좋아요
좋아요
사용자
사용자
사용자
그림
5-2
모델에 사용 가능한 피처 예시(댓글, 스레드, 사용자)
5.2
피처 엔지니어링 기법 피처 엔지니어링 기법
지금까지 살펴봤듯
ML
프로젝트에서 피처 엔지니어링은 중요하고도 보편적입니다. 따라서 프
로세스를 자동화하기 위해 많은 기법이 개발됐습니다. 이 절에서는 데이터의 피처를 전처리
할 때 고려할 중요한 작업 몇 가지를 알아봅니다. 결측값
missing
value
처리, 스케일링
scaling
, 이산
discretization
, 범주형
categorical
피처 인코딩, 오래됐지만 여전히 매우 효과적인 교차
cross
피처와
새롭고 흥미로운 위치
positional
피처 생성 등이 있죠. 이는 일반적이고 유용한 기법들로 피처 엔
지니어링을 처음 시작하기에 적합하며 이 외에도 수많은 기법이 있습니다. 결측값 처리부터 하
나씩 살펴봅시다.
5.2.1 5.2.1
결측값 처리결측값 처리
프로덕션에서 데이터를 다룰 때 빠르게 알아차릴 수 있는 것 중 하나는 일부 값이 결측됐다는
점입니다. 하지만 필자가 그간
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

개발 7년차, 매니저 1일차

개발 7년차, 매니저 1일차

권원상, 한민주, 카미유 푸르니에
견고한 데이터 엔지니어링

견고한 데이터 엔지니어링

조 라이스, 맷 하우슬리
러닝 타입스크립트

러닝 타입스크립트

조시 골드버그

Publisher Resources

ISBN: 9791169210850