
193
6
장
빅쿼리 ML로 선형 회귀 모델 학습시키기
합니다. 선형 회귀 모델에서 이 기준선은 데이터셋 전체의 평균 레이블값(에너지 생산량)을 의
미합니다.
어떻게 기여돗값을 해석할 수 있을까요? 예측된 레이블값이 기준 예측값보다 낮고, 모든 기여
도의 값이 음수임에 주목해야 합니다. 온도는 기준값에서 평균적으로 약
1
.
98
MW
의 감소를,
상대 습도는 평균적으로 약
2
.
54
MW
감소를, 외기 압력은 평균적으로 약
0
.
11
MW
증가를
일으켰습니다. 배기 진공 압력은 상위 세 가지 특징이 아니므로 여기에 포함되지 않았지만, 이
예에서 외기 압력보다도 더 작은 영향을 미쳤습니다. 이 예에서 보듯이, 대부분의 에너지 생산
량 편차는 온도로 인한 것이며, 다른 특징들은 약간의 영향을 미쳤음을 알 수 있습니다.
구글 코랩과 같은 주피터 노트북에서
LIME
및
SHAP
같은 설명 가능성 라이브러리를 활용하
는 것도 좋은 생각입니다. 이 둘은 다양한 사용 사례에서 일반적으로 사용할 수 있는 파이썬 라
이브러리입니다. 다만, 이 책에서는 해당 두 라이브러리를 다루지 않으므로 이를 소개하는 블
로그 게시글
12
과 설명 가능성에 관한 기타
AI
참고 자료에서 명시적인 예시를 확인해 보기 바
랍니다.
NOTE
이전 단락의 ‘평균적으로’라는 말이 다소 이상하게 들릴지 모릅니다. ...