Skip to Content
머신러닝 시스템 설계
book

머신러닝 시스템 설계

by 칩 후옌, 김대근, 김영민
March 2023
Beginner to intermediate
436 pages
9h 20m
Korean
Hanbit Media, Inc.
Content preview from 머신러닝 시스템 설계
94
머신러닝 시스템 설계
3.2.3 3.2.3
텍스트 포맷 텍스트 포맷
vsvs
. 이진 포맷. 이진 포맷
CSV
JSON
은 텍스트 파일인 반면 파케이 파일은 이진 파일입니다. 텍스트 파일은 일반 텍
스트로 된 파일로, 대개 사람이 읽을 수 있습니다. 이진 파일은 텍스트가 아닌 모든 파일을 지
칭합니다. 이름에서 드러나듯
0
1
만 포함하며, 원시 바이트를 해석하는 방법을 알고 있는 프
로그램에서 읽거나 사용하기 위한 파일입니다. 프로그램은 이진 파일 내부 데이터가 어떻게 배
치돼 있는지 정확히 알아야 그 파일을 사용할 수 있습니다.
VS
코드
VS
Code
나 메모장 같은 텍스
트 편집기로 텍스트 파일을 열면 그 안에 있는 텍스트를 읽을 수 있습니다. 반면에 텍스트 편
집기로 이진 파일을 열면 숫자 블록이 표시됩니다. 숫자는 파일의 각 바이트에 해당하며
16
hexadecimal
값일 가능성이 큽니다.
이진 파일은 간결하며 텍스트 파일에 비해 공간을 절약합니다. 간단히 예를 들어봅시다. 숫자
1000000
을 텍스트 파일에 저장하면 일곱 글자이고, 각 문자가
1
바이트이면
7
바이트가 필요합
니다. 반면에
int32
로 이진 파일에 저장하면
32
비트, 즉
4
바이트만 차지합니다.
[그림
3
-
3
]은
CSV
파일(텍스트 포맷 )
Interview
.
csv
를 사용한 예시입니다. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

개발 7년차, 매니저 1일차

개발 7년차, 매니저 1일차

권원상, 한민주, 카미유 푸르니에
견고한 데이터 엔지니어링

견고한 데이터 엔지니어링

조 라이스, 맷 하우슬리
러닝 타입스크립트

러닝 타입스크립트

조시 골드버그

Publisher Resources

ISBN: 9791169210850