Skip to Main Content
파이썬 데이터 분석 입문: 엑셀 및 CSV 파일 처리부터 데이터베이스, 시각화, 통계분석, 자동화까지
book

파이썬 데이터 분석 입문: 엑셀 및 CSV 파일 처리부터 데이터베이스, 시각화, 통계분석, 자동화까지

by 한창진, 이병욱, 클린턴 브라운리
November 2017
Beginner to intermediate content levelBeginner to intermediate
368 pages
7h 48m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 데이터 분석 입문: 엑셀 및 CSV 파일 처리부터 데이터베이스, 시각화, 통계분석, 자동화까지
122
파이썬 데이터 분석 입문
data_frame = pd.read_csv(input_file)
important_dates = ['1/20/14', '1/30/14']
data_frame_value_in_set = data_frame.loc[data_frame['Purchase Date']\
.isin(important_dates), :]
data_frame_value_in_set.to_csv(output_file, index=False)
새로운 명령어인
isin
()
을 볼 수 있다.
5
마찬가지로 명령 줄에서 입력 및 출력 파일 이름 인수를 입력하고 스크립트를 실행한다.
python pandas_value_in_set.py supplier_data.csv pandas_output.csv
그다음 출력 파일인
pandas _output.csv
를 열어 결과를 확인할 수 있다.
2.5.3
패턴/정규 표현식을 활용한 필터링
기본 파이썬
특정한 패턴과 일치하거나 패턴이 포함되어 있는(즉, 정규 표현식) 행을 선택하여 하위 데
이터셋으로 만들어야 하는 경우가 종종 있다. 예를 들어 가지고 있는 데이터셋에서
Invoice
Number
열의 데이터 값이
001
-로 시작하는 모든 행을 선택해야 하는 경우가 있을 수 있다.
또는
Supplier
Name
열의 데이터 값에
Y
가 포함되어 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

BPF로 리눅스 관측 가능성 향상하기: 성능 분석과 네트워킹을 위한 고급 프로그래밍

BPF로 리눅스 관측 가능성 향상하기: 성능 분석과 네트워킹을 위한 고급 프로그래밍

류광, 데이비드 칼라베라, 로렌초 폰타나

Publisher Resources

ISBN: 9791162240144