Skip to Main Content
파이썬 데이터 분석 입문: 엑셀 및 CSV 파일 처리부터 데이터베이스, 시각화, 통계분석, 자동화까지
book

파이썬 데이터 분석 입문: 엑셀 및 CSV 파일 처리부터 데이터베이스, 시각화, 통계분석, 자동화까지

by 한창진, 이병욱, 클린턴 브라운리
November 2017
Beginner to intermediate content levelBeginner to intermediate
368 pages
7h 48m
Korean
Hanbit Media, Inc.
Content preview from 파이썬 데이터 분석 입문: 엑셀 및 CSV 파일 처리부터 데이터베이스, 시각화, 통계분석, 자동화까지
243
5
응용 작업
5.1
대량의 파일에서 원하는 집합 찾기
회사들은 사업적으로 다양한 측면에서 많은 데이터를 쌓는다. 예를 들어 공급 업체, 고객,
내부 운영 등 사업 운영 전반에 대한 기록 파일이 있을 것이다. 앞서 설명했듯이 이러한 데
이터를
CSV
파일같이 잘 구분된 파일이나 엑셀과 같은 스프레드시트 및 데이터베이스 시스
템에 저장하곤 한다. 회사가 데이터 분석을 하려면 이처럼 데이터를 파일로 저장하는 것이
편리하다. 파일로 저장하면 시간에 따른 변경 사항을 추적하는 데 도움이 되며 판단 근거로
삼기도 좋다.
하지만 기록 파일이 많은 경우에는 필요한 데이터를 찾기 어려울 수 있다. 예를 들어
300
의 엑셀 파일과
200
개의
CSV
파일에 지난
5
년 동안 구매한 공급 물품 데이터가 뒤섞여 있
다고 생각해보자(시간의 흐름에 따라 충분히 가능한 일이다). 현재 시점에서 공급 업체에
대한 논의를 하려고 할 때, 논의에 도움이 될 이력이 담긴 데이터를 찾고 싶다고 하자.
물론 모든 파일을 열어서 필요한 정보를 찾아서 각 정보를 복사한 후 새 파일에 붙여넣기할
수도 있다. 하지만 이러한 과정은 많은 시간이 소모되고 오류가 발생하기 쉬우며 반복 작업
이 고통스러울 것이다. 이 같은 경우에 파이썬 코딩 기술을 적용한다면 전 과정을 자동화하
여 시간을 절약하고
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

BPF로 리눅스 관측 가능성 향상하기: 성능 분석과 네트워킹을 위한 고급 프로그래밍

BPF로 리눅스 관측 가능성 향상하기: 성능 분석과 네트워킹을 위한 고급 프로그래밍

류광, 데이비드 칼라베라, 로렌초 폰타나

Publisher Resources

ISBN: 9791162240144