배치 중심의 접근 방식을 사용하여 보관된 레코드를 탐색하는 동안 배운 노하우를 활용하여 최
신 정보를 제공하는 스트리밍 작업을 생성할 수 있다.
배치 분석에서 우리가 관찰한 첫 번째 차이점은 데이터의 출처다. 스트리밍 연습을 위해
TCP
서버를 사용하여 로그를 실시간으로 전송하는 웹 시스템을 시뮬레이션할 것이다. 시뮬레이터는
동일한 데이터셋을 사용하지만 우리가 분석할 스트림을 구체화하는
TCP
소켓 연결을 통해 공
급할 것이다.
NOTE
_
온라인 리소스
이번 예제에서는 이 책의 온라인 리소스인
weblog
_
TCP
_
server
및
streaming
_
weblogs
노트북을 사용
할 것이다. 해당 자료는
https
://
github
.
com
/
stream
-
processing
-
with
-
spark
에서 확인할 수 있다.
7.3.1
스트림에 연결하기
이 장의 소개를 떠올려 보면 구조적 스트리밍은 소스와 싱크의 개념을 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.