
575
13
장
텐서플로를 사용한 데이터 적재와 전처리
test_loss, test_accuracy = model.evaluate(test_set)
기술적인 내용이 많은 이 장을 마친 것을 축하합니다! 멋지게 보였던 추상화된 신경망 개념과
거리가 있다고 느꼈을지도 모릅니다. 하지만 딥러닝은 대량의 데이터를 다루는 경우가 많고 이
런 데이터를 효율적으로 적재, 파싱, 전처리하는 것이 아주 중요한 기술입니다. 다음 장에서는
이미지 처리와 그 외 많은 애플리케이션에서 가장 성공적으로 적용된 신경망 구조인 합성곱 신
경망을 알아보겠습니다.
연습문제
①
왜
tf
.
data
API
를 사용해야 하나요?
②
대용량 데이터셋을 여러 파일로 나누면 어떤 장점이 있나요?
③
훈련 과정에서 입력 파이프라인의 병목을 어떻게 찾을 수 있나요? 어떻게 병목 현상을 고
칠 수 있나요?
④
어떤 이진 데이터라도
TFRecord
파일 또는 직렬화된 프로토콜 버퍼로 저장할 수 있나요?
⑤
모든 데이터를
Example
프로토콜 버퍼 포맷으로 변환해야 하나요? 자신만의 프로토콜 버
퍼 정의를 사용하는 것은 어떤가요?
⑥
TFRecord
를 사용할 때 언제 압축을 사용하나요? 왜 기본적으로 압축을 사용하지 않나요?
⑦
데이터 파일을 작성할 때 또는
tf
.
data
파이프라인이나 모델의 전처리 층 안에서 데이터를