book

스트리밍 Data Mesh

by Hubert Dulay, Stephen Mooney

May 2025

Beginner to intermediate

226 pages

3h 39m

Korean

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

이 책을 읽어야 하는 대상이 책을 쓴 이유이 책 탐색하기이 책에서 사용된 규칙코드 예제 사용오라일리 온라인 학습문의 방법감사HubertStephen
데이터 분할Data Mesh 기둥데이터 소유권제품으로서의 데이터연합 전산 데이터 거버넌스셀프 서비스 데이터 플랫폼Data Mesh 다이어그램기타 유사한 아키텍처 패턴데이터 패브릭데이터 게이트웨이 및 데이터 서비스데이터 민주화데이터 가상화구현에 집중Apache KafkaAsyncAPI
스트리밍의 이점스트리밍으로 실시간 사용 사례 지원스트리밍을 통한 데이터 최적화 이점리버스 ETL카파 아키텍처Lambda 아키텍처 소개카파 아키텍처 소개요약
도메인 식별식별 가능한 도메인지리적 지역하이브리드 아키텍처멀티클라우드모호한 도메인 피하기도메인 중심 설계도메인 모델도메인 로직바운드 컨텍스트유비쿼터스 언어Data Mesh 도메인 역할데이터 제품 엔지니어데이터 제품 소유자 또는 데이터 스튜어드고려해야 할 스트리밍 데이터 메시 도구 및 플랫폼도메인 차지백요약
데이터 제품 요구 사항 정의데이터 상품 파생 상품 식별다른 도메인의 파생 상품Kafka Connect로 데이터 제품 파생 상품 수집하기소모성동기식 데이터 소스비동기 데이터 소스 및 변경 데이터 캡처데베지움 커넥터데이터 파생상품을 데이터 상품으로 전환하기데이터 표준화민감한 정보 보호SQL추출, 변환 및 로드AsyncAPI를 사용한 데이터 제품 게시스트리밍 데이터 제품 등록하기AsyncAPI YAML 문서 빌드하기데이터 태그 할당버전 관리모니터링요약
스트리밍 데이터 메시의 데이터 거버넌스데이터 계보 그래프데이터 제품 구성을 위한 데이터 카탈로그 스트리밍메타데이터스키마리니지보안확장성AsyncAPI에서 데이터 제품 페이지 생성하기아피큐리오 레지스트리액세스 워크플로중앙 집중식 대 분산형중앙 집중식 엔지니어분산형(도메인) 엔지니어요약
스트리밍 Data Mesh CLI리소스 관련 명령클러스터 관련 명령토픽 관련 명령도메인 명령연결 명령스트리밍 명령스트리밍 데이터 제품 게시데이터 거버넌스 관련 서비스보안 서비스표준 서비스리니지 서비스SaaS 서비스 및 API요약
인프라두 가지 아키텍처 솔루션전용 인프라멀티테넌트 인프라스트리밍 Data Mesh 중앙 아키텍처도메인 에이전트(일명 사이드카)데이터 플레인제어 평면요약
전통적인 데이터 웨어하우스 구조분산형 팀 구조 소개직원 역량 강화작업 프로세스협업 촉진데이터 기반 자동화데이터 도메인의 새로운 역할데이터 플레인의 새로운 역할데이터 과학 및 비즈니스 인텔리전스의 새로운 역할
데이터 엔지니어링과 데이터 과학의 분리온라인 및 오프라인 데이터 저장소Apache Feast 소개요약

스트리밍 데이터 메시 예제온프레미스 스트리밍 데이터 메시 배포하기커넥터 설치클릭스트림 커넥터 배포 및 테이블 자동 생성Debezium Postgres CDC 커넥터 배포하기스트리밍 데이터 강화데이터 제품 게시스트리밍 데이터 제품 사용완전 관리형 SaaS 서비스요약 및 고려 사항

Content preview from 스트리밍 Data Mesh

1장. Data Mesh 소개

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

젊은 사람들은 데이터 아키텍처가 어느 시점에는 쉬웠다가 데이터의 양과 속도, 다양성이 증가하면서 어렵고 새로운 아키텍처가 필요하다고 생각합니다. 실제로 데이터 문제는 항상 조직의 문제였기 때문에 결코 해결되지 않았습니다.

그웬 (첸) 샤피라, Kafka: 결정적 가이드 (오라일리)

성장하는 회사에서 일하고 있다면 회사 성장과 유입 데이터 규모 사이에 양의 상관관계가 존재한다는 사실을 알게 될 것입니다. 이는 기존 애플리케이션의 사용량 증가 또는 새로 추가된 애플리케이션과 기능으로 인한 것일 수 있습니다. 이렇게 증가하는 데이터를 정리, 최적화, 처리, 관리하고 서비스 수준 계약(SLA)을 유지하면서 소비자에게 제공하는 것은 데이터 엔지니어의 몫입니다. 대부분의 경우, 이러한 SLA는 데이터 엔지니어의 입력 없이도 소비자에게 보장됩니다. 이렇게 많은 양의 데이터로 작업할 때 가장 먼저 알게 되는 것은 데이터 처리가 이러한 SLA가 보장하는 범위를 침범하기 시작하면, SLA를 지키는 데 더 집중하게 되고 데이터 거버넌스와 같은 것들은 소외된다는 것입니다. 이는 결국 제공되는 데이터에 대한 불신과 궁극적으로는 운영 애플리케이션을 개선하여 더 많은 수익을 창출하거나 수익 손실을 방지하는 데 사용할 수 있는 분석에 대한 불신으로 이어집니다.

이 문제를 기업의 모든 비즈니스 라인에 적용하면, 데이터 레이크와 데이터 처리 클러스터의 용량 내에서 데이터 파이프라인의 속도를 높이려는 데이터 엔지니어들이 매우 불만을 갖기 시작합니다. 저는 이런 상황에 자주 처하게 됩니다.

데이터 메시란 무엇인가요? "데이터 메시"의 "메시"라는 용어는 "서비스 메시"라는 용어에서 따온 것으로, 애플리케이션 계층이 아닌 플랫폼 수준에서 통합 가시성, 보안, 검색, 안정성을 추가하는 수단입니다. 서비스 메시는 일반적으로 애플리케이션 코드와 함께 배포되는 확장 가능한 네트워크 프록시 집합으로 구현됩니다( 사이드카라고도 하는 패턴). 이러한 프록시는 마이크로서비스 간의통신을 처리하며 서비스 메시 기능이도입되는 지점 역할을 하기도 합니다.

마이크로서비스 아키텍처 는 스트리밍 데이터 메시 아키텍처의 핵심이며, 느슨하게 결합되고, 더 작고, 유지 관리가 용이하며, Agile하고, 독립적으로 확장 가능한 서비스를 생성함으로써 모놀리식 애플리케이션을 분해하는 근본적인 변화를 도입합니다. 그림 1-1에서는 애플리케이션의 비즈니스 목적을 잃지 않고 확장성이 뛰어난 마이크로서비스 아키텍처를 만들기 위해 모놀리식 애플리케이션을 이렇게 분해한 것을 볼 수 있습니다.