
128
로우코드 AI
5.2
판다스, 맷플롯립, 시본으로 데이터셋 탐색하기
이 절의 모든 코드는
low
-
code
-
ai
깃허브 저장소
4
의 주피터 노트북에 있습니다. 이 책에서
는 해당 노트북을 만드는 과정을 처음부터 끝까지 다루지만(일부 추가 예제 제외), 나중에 여러
분이 프로젝트를 진행하면서 막히는 부분이 있을 때 깃허브 저장소의 노트북을 살펴보면 도움
이 될 것입니다.
4
장에서처럼
CSV
파일을 주피터 노트북 환경으로 불러온 다음에 판다스, 맷플롯립, 시본을 이
용해 데이터를 분석 및 탐색하여 특징들에 관한 이해도를 높여봅니다. 그리고 이 과정에서 얻
은 통찰로부터
AutoML
모델에 가장 유용한 특징들을 선택하게 됩니다.
5.2.1
구글 코랩 노트북에서 판다스 데이터프레임으로 데이터 불러오기
먼저 구글의 코랩
5
으로 이동한 다음,
2
장과
4
장에서 설명한 구글 코랩의 노트북 만들기 절차
에 따라 신규 노트북을 생성합니다. 노트북의 이름은 이 장의 의미를 담은
Fraud
_
Detection
_
Model
.
ipynb
로 변경해 줍니다.
그리고 첫 번째 코드 블록에 금융 거래 데이터셋을 분석하고 시각화하는 데 필요한 패키지를
가져오는 다음 코드를 입력하고 실행합니다.
import matplotlib.pyplot as plt
import numpy as np
import pandas ...