
523
13
장
텐서플로에서 데이터 적재와 전처리하기
리스트를 포함하고 있습니다.
Feature
객체는 바이트 스트링의 리스트나
64
비트 정수의 리
스트, 실수의 리스트일 수 있습니다 (이 예에서
Feature
는 하나의 문장이나 코멘트를 표현합
니다. 아마도 단어를 나타내는 아이디의 리스트 형태일 것입니다).
SequenceExample
를 만들
고 직렬화하고 파싱하는 것은
Example
을 만들고 직렬화하고 파싱하는 것과 비슷합니다. 하지
만 하나의
SequenceExample
를 파싱하려면
tf
.
io
.
parse
_
single
_
sequence
_
example
()
를
사용하고 배치를 파싱하려면
tf
.
io
.
parse
_
sequence
_
example
()
를 사용해야 합니다. 두 함
수는 모두 문맥 특성 (딕셔너리 )과 특성 리스트 (역시 딕셔너리 )를 담은 튜플을 반환합니다. 특
성 리스트가 (앞선 예제처럼 ) 가변 길이의 시퀀스를 담고 있다면
tf
.
RaggedTensor
.
from
_
sparse
()
를 사용해 래그드 텐서로 바꿀 수 있습니다 (주피터 노트북에서 전체 코드를 확인하
세요 ).
parsed_context, parsed_feature_lists = tf.io.parse_single_sequence_example(
serialized_sequence_example, context_feature_descriptions ...