Skip to Content
Apache Hudi: The Definitive Guide
book

Apache Hudi: The Definitive Guide

by Shiyan Xu, Prashant Wason, Bhavani Sudha Saktheeswaran, Rebecca Bilbro
October 2025
Beginner to intermediate
290 pages
4h 16m
Korean
O'Reilly Media, Inc.
Book available
Content preview from Apache Hudi: The Definitive Guide

3장. Hudi에 쓰기

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

쓰기 작업은 모든 데이터 레이크하우스에서 안정성과 성능을 직접적으로 좌우하는 중요한 기능입니다. 따라서 Hudi 작성기의 내부 동작에 대한 깊은 이해와 특정 사용 사례에 어떤 기능을 활용할지 파악하는 것이 필수적입니다. 2장의 테이블 레이아웃, 타임라인 구조, 테이블 유형 트레이드오프에 대한 기본 개념을 바탕으로, 이 장에서는 내부에 대한 심층 분석과 사용 예제를 결합하여 Apache Hudi의 쓰기 작업을 이해하는 데 도움이 되는 가이드 역할을 합니다.

이 장은 Hudi의 쓰기 기능을 포괄적으로 살펴볼 수 있도록 세 섹션으로 구성되어 있습니다. '쓰기 흐름 분석하기'에서는 엔드투엔드 Hudi 쓰기 프로세스를 분석합니다. 데이터 준비부터 최종 트랜잭션 커밋까지 각 단계를 추적하여 데이터의 정확성과 효율성을 보장하는 내부 메커니즘을 밝힙니다.

'쓰기 작업 살펴보기 '에서는 수백만 개의 IoT(사물 인터넷) 장치에서 센서 데이터를 전문적으로 분석하는 데이터 제공업체인 DataCentral의 실제 사용 사례를 소개하여 실제 적용에 대한 논의의 근거를 마련합니다. upsert , delete, insert, bulk_insert을 포함한 모든 Hudi의 쓰기 작업을 시연하여 실제 상황에서 일반적인 데이터 조작 문제를 해결하는 방법을 보여드립니다.

Hudi의 핵심 쓰기 작업의 강력한 성능과 효율성은 복잡한 레이크하우스 데이터 패턴을 처리하도록 설계된 몇 가지 중요한 기능에서 비롯됩니다. 주요 쓰기 흐름에 방해가 되지 않도록 "주목할 만한 기능 강조하기"에서 이러한 관련 기능을 살펴봅니다.

이 장을 완료하면 Hudi에 데이터를 효과적으로 쓸 수 있습니다. 쓰기 흐름을 명확하게 이해하고, 다양한 시나리오에 다양한 쓰기 작업을 적용하는 방법을 배우며, 고급 기능을 사용하여 효율적이고 안정적인 데이터 레이크하우스 파이프라인을 구축하는 방법을 알게 될 것입니다.

작성 흐름 분석

데이터 레이크하우스를 구축하는 데 Hudi를 효과적으로 사용하려면 내부 쓰기 흐름을 명확하게 이해하는 것이 필수적입니다. 이 섹션에서는 커밋 시작부터 레코드 준비 및 데이터 쓰기, 커밋 완료에 이르기까지 각 단계를 안내하면서 Hudi 쓰기 흐름을 단계별로 설명합니다.

그림 3-1은 기본 단계와 선택 단계로 구성된 Hudi 쓰기 흐름에 대한 개요를 제공합니다.

그림 3-1. Hudi 쓰기 흐름 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Apache Hudi: The Definitive Guide

Apache Hudi: The Definitive Guide

Shiyan Xu, Prashant Wason, Bhavani Sudha Saktheeswaran, Rebecca Bilbro

Publisher Resources

ISBN: 0642572273552