
122
파이썬 데이터 분석 입문
data_frame = pd.read_csv(input_file)
important_dates = ['1/20/14', '1/30/14']
data_frame_value_in_set = data_frame.loc[data_frame['Purchase Date']\
.isin(important_dates), :]
data_frame_value_in_set.to_csv(output_file, index=False)
새로운 명령어인
isin
()
을 볼 수 있다.
5
마찬가지로 명령 줄에서 입력 및 출력 파일 이름 인수를 입력하고 스크립트를 실행한다.
python pandas_value_in_set.py supplier_data.csv pandas_output.csv
그다음 출력 파일인
pandas _output.csv
를 열어 결과를 확인할 수 있다.
2.5.3
패턴/정규 표현식을 활용한 필터링
기본 파이썬
특정한 패턴과 일치하거나 패턴이 포함되어 있는(즉, 정규 표현식) 행을 선택하여 하위 데
이터셋으로 만들어야 하는 경우가 종종 있다. 예를 들어 가지고 있는 데이터셋에서
Invoice
Number
열의 데이터 값이
001
-로 시작하는 모든 행을 선택해야 하는 경우가 있을 수 있다.
또는
Supplier
Name
열의 데이터 값에
Y
가 포함되어 ...