세 개의 워크시트가 포함된 엑셀 통합 문서를 만들었으니 파이썬으로 이를 처리하는 방법을 알
아보자. 이 장에서는
xlrd
와
xlwt
패키지를 사용하므로 두 패키지가 설치되어 있어야 한다.
엑셀 파일은 적어도 두 가지 중요한 점에서
CSV
파일과 다르다. 첫째, 엑셀 파일은
CSV
파일
과 달리 일반 텍스트 파일이 아니므로 텍스트 편집기에서 파일을 열어 데이터를 볼 수 없다. 방
금 작성한 엑셀 통합 문서도 메모장 또는
TextWrangler
같은 텍스트 편집기로 열어볼 수는
있지만 사람이 읽을 수 있는 데이터 대신 복잡한 특수문자들만 보일 것이다.
둘째, 엑셀 통합 문서는
CSV
파일과 달리 여러 개의 워크시트를 포함하도록 설계되었다. 단일
엑셀 통합 문서에 여러 개의 워크시트가 포함될 수 있으므로 수동으로 통합 문서를 열지 않고
도 통합 문서의 모든 워크시트를 살펴보고 검토하는 방법을 알아야 한다. 실제로 통합 문서의
데이터를 처리하기 전에 엑셀 통합 문서를 살펴봄으로써 워크시트의 수와 각 워크시트 내의 데
이터 유형 및 그 양을 검토할 수 있다.
엑셀 파일을 살펴보면 예상되는 데이터가 포함되어 있는지 확인하고 그 데이터의 일관성과 완
성도를 신속하게 확인할 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.