
243
5
장
응용 작업
5.1
대량의 파일에서 원하는 집합 찾기
회사들은 사업적으로 다양한 측면에서 많은 데이터를 쌓는다. 예를 들어 공급 업체, 고객,
내부 운영 등 사업 운영 전반에 대한 기록 파일이 있을 것이다. 앞서 설명했듯이 이러한 데
이터를
CSV
파일같이 잘 구분된 파일이나 엑셀과 같은 스프레드시트 및 데이터베이스 시스
템에 저장하곤 한다. 회사가 데이터 분석을 하려면 이처럼 데이터를 파일로 저장하는 것이
편리하다. 파일로 저장하면 시간에 따른 변경 사항을 추적하는 데 도움이 되며 판단 근거로
삼기도 좋다.
하지만 기록 파일이 많은 경우에는 필요한 데이터를 찾기 어려울 수 있다. 예를 들어
300
개
의 엑셀 파일과
200
개의
CSV
파일에 지난
5
년 동안 구매한 공급 물품 데이터가 뒤섞여 있
다고 생각해보자(시간의 흐름에 따라 충분히 가능한 일이다). 현재 시점에서 공급 업체에
대한 논의를 하려고 할 때, 논의에 도움이 될 이력이 담긴 데이터를 찾고 싶다고 하자.
물론 모든 파일을 열어서 필요한 정보를 찾아서 각 정보를 복사한 후 새 파일에 붙여넣기할
수도 있다. 하지만 이러한 과정은 많은 시간이 소모되고 오류가 발생하기 쉬우며 반복 작업
이 고통스러울 것이다. 이 같은 경우에 파이썬 코딩 기술을 적용한다면 전 과정을 자동화하
여 시간을 절약하고