는 연구자도 있다. 가장 좋은 것은 분석적 측면과 수치적 측면 모두를 적절히 이해하는 것, 즉
이 두 가지 스타일의 연구자들 사이에 위치하는 것이다.
3.3
회귀: 숫자 값 예측
캐글 웹 사이트
49
에서 회귀 분석용 데이터셋을 검색하면 훌륭한 데이터셋과 관련 주피터 노
트북을 많이 찾을 수 있다. 여기서는
Fish
Market
데이터셋
50
을 사용할 것이다. 우리의 목표
는 길이
1
(
Length1
), 길이
2
(
Length2
), 길이
3
(
Length3
), 높이(
Height
), 너비(
Width
)로 레이블
이 지정된 다섯 가지 피처가 주어졌을 때 물고기의 무게를 예측하는 모델을 만드는 것이다(그
림
3
-
2
). 문제를 단순화하기 위해 이 모델에 범주형 피처인 종(
Species
)은 포함하지 않았다
(물고기의 종이 무게를 예측하는 데 좋은 변수이므로 이 변수를 사용하면 더 나은 예측 결과
를 얻을 수 있다). 범주형 피처인 종(
Species
)을 모델의 피처에 포함하려면 원-핫 인코딩
one
-
hot
encoding
을 사용하여 값을 숫자 값으로 변환해야 한다. 이는 말 그대로 카테고리 유형(물고기
의 종)에 따라 각 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.