파트 III. Apache Polaris 실습하기
이 책의 처음 두 섹션에서는 레이크하우스, Apache Iceberg, Apache Polaris의 핵심 개념을 살펴보는 토대를 마련했습니다. 아키텍처, 오픈 테이블 형식의 원리, 그리고 Polaris가 대규모 메타데이터 관리를 위한 최첨단 카탈로그 솔루션으로 어떻게 사용되는지 살펴봤습니다. 이러한 기초 지식을 갖추었으면 이제 이러한 개념을 실제로 적용해 볼 차례입니다.
3부에서는 Apache Polaris의 실제 적용과 최신 데이터 도구와의 통합에 중점을 둡니다. 먼저 로컬에 Polaris를 배포하는 방법을 배우면서 오픈 소스 버전을 직접 경험해 볼 수 있습니다. 그 다음에는 Polaris가 Apache Spark, Snowflake, Dremio와 같은 강력한 도구와 어떻게 상호 작용하는지 살펴봅니다. 각 장에서는 카탈로그를 구성, 쿼리 및 관리하는 단계별 가이드를 제공하여 앞서 다룬 이론적 개념을 실제 워크플로에 연결할 수 있도록 도와줍니다.
이 섹션을 마치면 Polaris를 배포했을 뿐만 아니라 더 광범위한 데이터 에코시스템에 통합하여 레이크하우스 아키텍처가 실제로 어떻게 작동하는지 포괄적으로 이해하게 될 것입니다. 온프레미스 레이크하우스를 구축하든, 오픈 테이블 형식을 실험하든, 프로덕션용으로 Polaris를 평가하든, 이 챕터에서는 데이터 환경을 자신 있게 관리할 수 있는 기술과 통찰력을 갖추게 될 것입니다.
로컬 환경에서 Polaris를 설정하고 내부 작동 방식을 직접 이해하는 것부터 시작해 보세요!
이 장에 나오는 많은 지원 코드는 Git 리포지토리 (https://github.com/developer-advocacy-dremio/apache-polaris-the-definitive-guide)에서 찾을 수 있습니다.
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access