Skip to Content
데이터 엔지니어를 위한 97가지 조언
book

데이터 엔지니어를 위한 97가지 조언

by Tobias Macey, 임혜연(Lim Hye Yeon)
November 2023
Beginner to intermediate
344 pages
3h 47m
Korean
Gilbut
Content preview from 데이터 엔지니어를 위한 97가지 조언

16 데이터 엔지니어링은 스파크와 같지 않다

 

제시 앤더슨(Jesse Anderson)

어떤 사람들은 아파치 스파크만 있으면 데이터 파이프라인1을 만들 수 있다고 주장합니다. 하지만 실제로 데이터 파이프라인을 생성하기 위해서는 다음 3가지의 일반적인 기술 유형을 구현하는 구성 요소가 필요합니다.

 

계산

스토리지

메시징

 

스파크만 있으면 데이터 파이프라인을 만들 수 있다는 오해를 바로잡아야 빅데이터 프로젝트를 성공시키거나 빅데이터를 학습할 수 있습니다. 스파크는 데이터 파이프라인을 만드는 데 필요한 대규모 빅데이터 생태계의 일부일 뿐입니다. 간단히 다음과 같이 정리할 수 있습니다.

 

데이터 엔지니어링 = 계산 + 스토리지 + 메시징 + 코드 + 아키텍처 + 도메인 지식 + 사용 사례

 

 

¦ 배치 및 실시간 시스템 ¦

배치 데이터 파이프라인에서는 보편적으로 2가지 핵심 문제를 해결해야 합니다. 하나는 계산이고, 다른 하나는 데이터 스토리지입니다. 배치 계산 처리에는 스파크가 적합하지만, 적합한 스토리지 솔루션을 찾는 것은 어려울 수 있습니다. 더 정확하게 말하자면, 사용 사례에 맞는 다양하고 최적화된 스토리지 기술을 알아보는 것이 어려울 수 있습니다.

 

 

¦ 계산 컴포넌트 ¦

계산computation이란 데이터가 처리되는 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

클라우드 엔지니어를 위한 97가지 조언

클라우드 엔지니어를 위한 97가지 조언

Emily Freeman, Nathen Harvey, 정기훈(Jung Ki Hun)
데브옵스 엔지니어를 위한 실전 관찰 가능성 엔지니어링

데브옵스 엔지니어를 위한 실전 관찰 가능성 엔지니어링

채리티 메이저, 리즈 퐁 존스, 조지 미란다

Publisher Resources

ISBN: 9791140706815