Skip to Content
Apache Polaris: The Definitive Guide
book

Apache Polaris: The Definitive Guide

by Alex Merced, Andrew Madson, Tomer Shiran
September 2025
Beginner to intermediate
258 pages
3h 47m
Korean
O'Reilly Media, Inc.
Content preview from Apache Polaris: The Definitive Guide

2장. Apache Iceberg 카탈로그의 역할

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

이전 장에서 살펴본 것처럼, Apache Iceberg는 데이터 레이크하우스에 강력한 테이블 관리 기능을 제공하여 ACID 트랜잭션, 스키마 진화, 시간 이동과 같은 기능을 통해 안정적이고 확장 가능한 데이터 운영을 가능하게 합니다. 하지만 Iceberg 테이블의 잠재력을 완전히 활용하려면 방대하고 다양한 레이크하우스 도구 에코시스템에서 테이블을 관리하고 구성할 수 있는 방법이 필요합니다. 바로 이 부분에서 Apache Iceberg 카탈로그가 등장하여 레이크하우스 퍼즐의 마지막 조각을 제공합니다.

Iceberg 카탈로그는 레이크하우스 환경에서 증가하는 테이블 수를 추적, 구성 및 관리하는 중앙 집중식 레이어 역할을 합니다. 다양한 도구와 프레임워크에서 테이블을 검색할 수 있도록 하여 데이터 엔지니어, 분석가 및 기타 사용자가 데이터의 위치에 관계없이 모든 테이블의 최신 상태에 쉽게 액세스할 수 있도록 해줍니다. 카탈로그가 없으면 서로 다른 쿼리 엔진과 환경에서 대규모 데이터 세트를 관리하는 것이 혼란스럽고 오류가 발생하기 쉬워 테이블 메타데이터, 버전 및 스키마 변경에 대한 통합된 보기가 부족해집니다.

단순한 추적 시스템 이상의 기능을 제공하는 Iceberg 카탈로그는 레이크하우스 전반에 걸쳐 액세스 제어와 감사 기능을 강화하는 거버넌스 계층을 제공합니다. Iceberg 카탈로그는 규정 준수 및 운영 보안에 필요한 투명성을 제공하면서 올바른 사용자가 올바른 데이터에 적절하게 액세스할 수 있도록 보장할 수 있습니다. 이 장에서는 Iceberg 카탈로그를 통해 이러한 기능을 구현하는 방법을 살펴보고, 다양한 카탈로그 옵션과 함께 제공되는 여러 유형의 카탈로그와 그에 따른 과제를 살펴봅니다. 마지막으로, 모든 환경에서 Iceberg 테이블을 관리할 수 있는 유연하고 확장 가능한 접근 방식을 제공하는 Apache Iceberg REST 카탈로그 사양에 대해 자세히 살펴봅니다.

Apache Iceberg 카탈로그란 무엇이고 무엇이 아닌가?

카탈로그라는 용어는 데이터 아키텍처에서 오랫동안 사용되어 왔지만, 상황에 따라 여러 가지를 지칭할 수 있습니다. Apache Iceberg와 같은 기술이 등장하기 전에는 '카탈로그'라는 단어가 주로 엔터프라이즈 메타데이터 카탈로그를 가리켰습니다. Collibra, Alation 등의 도구는 데이터 소비자(비즈니스 사용자, 데이터 분석가, 데이터 과학자)가 조직 전체에서 데이터 세트를 검색할 수 있는 플랫폼 역할을 했습니다. 이러한 카탈로그는 데이터를 문서화하여 설명, 계보, 액세스 정책을 제공함으로써 사용자가 필요한 데이터를 찾고, 데이터의 컨텍스트를 이해하고, 데이터 관리자나 소유자에게 액세스를 요청할 수 있도록 설계되었습니다. 이러한 의미에서 엔터프라이즈 메타데이터 카탈로그는 사람이 데이터를 검색하고 관리하기 위한 게이트웨이 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Apache Polaris: The Definitive Guide

Apache Polaris: The Definitive Guide

Alex Merced, Andrew Madson, Tomer Shiran
Apache Flink를 사용한 스트림 처리

Apache Flink를 사용한 스트림 처리

Fabian Hueske, Vasiliki Kalavri
Virtualizing Hadoop: How to Install, Deploy, and Optimize Hadoop in a Virtualized Architecture

Virtualizing Hadoop: How to Install, Deploy, and Optimize Hadoop in a Virtualized Architecture

George J. Trujillo Jr., Charles Kim, Steven Jones, Rommel Garcia, Justin Murray

Publisher Resources

ISBN: 9798341670013