
166
파이썬 데이터 분석 입문
이제 엑셀 통합 문서에서 워크시트를 처리하고 날짜로 포매팅하는 방법을 이해했으므로 워크
시트에서 특정 행을 필터링하는 문제로 넘어가겠다.
2
장에서와 마찬가지로 어떤 행의 값이 특
정 조건을 충족하는지, 관심 집합에 포함되어 있는지, 특정한 패턴과 일치하는지 등 행을 필터
링하는 세 가지 방법에 대해 알아볼 것이다.
3.2.2
특정 행 필터링하기
때로는 엑셀 워크시트에 보유해야 할 것보다 많은 행이 포함되는 경우가 있다. 예를 들어 특정
단어나 숫자가 포함된 행의 하위 집합만 필요하거나 특정 날짜와 연관된 행의 하위 집합만 필
요할 수 있다. 이러한 경우 파이썬을 사용하여 필요하지 않은 행은 걸러내고 필요한 행을 유지
할 수 있다.
이미 엑셀에서 수동으로 행을 필터링하는 방법에 익숙할 수도 있지만 이 장의 목적은 파이썬을
이용해 엑셀 파일을 처리하는 능력을 확장시키는 것이다. 데이터가 너무 커서 열 수도 없는 엑
셀 파일과 수동으로 처리하는 데 너무 많은 시간이 소요되는 다수의 엑셀 워크시트들을 파이썬
으로 처리할 수 있다.
특정 조건을 충족하는 행의 필터링
| 기본 파이썬 |
먼저 기본 파이썬으로 특정 행을 필터링하는 방법을 살펴보자.
Sale
Amount
열의 데이터 값
이 $
1
,
400
.
00
보다 큰 행을 하위 데이터셋으로 선택하려고 ...