
555
13
장
텐서플로를 사용한 데이터 적재와 전처리
13.3
케라스의 전처리 층
신경망에 사용할 데이터를 준비하려면 일반적으로 수치 특성 정규화, 범주형 특성이나 텍스트
인코딩, 이미지 자르기와 크기 조정 등의 작업이 필요합니다. 이러한 작업을 위한 몇 가지 방법
이 있습니다.
•
훈련 데이터 파일을 준비할 때 넘파이, 판다스, 사이킷런과 같은 도구를 사용하여 미리 전처리를 수행할
수 있습니다. 제품에 투입한 모델이 훈련할 때와 비슷하게 전처리된 입력을 받으려면 제품 환경에 정확히
동일한 전처리 단계를 적용해야 합니다.
•
이 장의 앞부분에서 수행한 것처럼 데이터셋의
map()
메서드를 사용하여 데이터셋의 모든 원소에 전처리
함수를 적용하여
tf.data
로 데이터를 로드하는 동안 바로 전처리할 수 있습니다. 여기서도 제품 환경에서
동일한 전처리 단계를 적용해야 합니다.
•
모델 내부에 전처리 층을 직접 포함시켜 훈련 중에 즉시 모든 입력 데이터를 전처리합니다. 그런 다음 제
품 환경에서 동일한 전처리 층을 사용하는 것입니다. 이 장의 나머지 부분에서는 이 접근 방식에 관해 살
펴봅니다.
케라스는 모델에 포함할 수 있는 다양한 전처리 층을 제공하며 이를 수치 특성, 범주형 특성,
이미지 및 텍스트에 적용할 수 있습니다. 다음 절에서는 수치 특성, 범주형 특성과 ...