
504
2
부
신경망과 딥러닝
이 장에서 데이터
API
,
TFRecord
포맷을 다루고 사용자 정의 전처리 층을 만드는 방법과 표
준 케라스 전처리 층을 사용하는 방법을 다룹니다. 또한 텐서플로 생태계에 있는 관련된 프로
젝트를 몇 가지 알아봅니다.
•
TF
변환 (
tf
.
Transform
)
(실행 속도를 높이기 위해 ) 훈련 전에 전체 훈련 세트에 대해 실행하는 전처리 함수를 작성할 수 있습니
다. 그다음 텐서플로 함수로 변환하고 상용 환경에 배포된 다음 훈련된 모델과 협업하여 새로운 샘플에 대
해 동적으로 전처리를 수행할 수 있습니다.
•
TF
데이터셋 (
TFDS
)
각종 데이터셋을 다운로드할 수 있는 편리한 함수를 제공합니다. 이미지넷과 같은 대용량 데이터셋도 포
함됩니다. 또한 데이터
API
로 조작할 수 있는 편리한 데이터셋 객체도 제공합니다.
13.1
데이터
API
전체적인 데이터
API
의 중심에는
데이터셋
dataset
개념이 있습니다. 쉽게 예상할 수 있듯이 이는
연속된 데이터 샘플을 나타냅니다. 일반적으로 디스크에서 데이터를 점진적으로 읽는 데이터
셋을 사용합니다. 하지만 간단히
tf
.
data
.
Dataset
.
from
_
tensor
_
slices
()
를 사용해 메모
리에서 전체 데이터셋을 생성해보겠습니다.
>>> X = tf.range(10)
# 샘플 데이터 텐서 ...