머리말
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
데이터 거버넌스를 위한 Unity 카탈로그에 오신 것을 환영합니다. 파일 형식의 진화가 지배적이었던 지난 10년에서 다음 시대는 카탈로그의 중요성이 부각되고 있습니다. 2021년 출시된 이후 Unity 카탈로그는 Databricks 데이터 인텔리전스 플랫폼의 기본 구성 요소로 부상했습니다. Unity Catalog의 오픈 소싱은 기존 도구의 한계를 극복하고 거버넌스 혁신을 위한 새로운 가능성을 열었습니다.
업계가 개방적이고 상호 운용 가능한 기술로의 전환을 지속하고 있는 가운데, Unity Catalog는 개방적이고 확장 가능한 카탈로그로서 두각을 나타내고 있습니다. 개방형 API와 데이터 및 AI 환경의 주요 파일 포맷 및 애플리케이션과의 통합을 통해 탁월한 유연성을 제공합니다. 이러한 기반을 바탕으로 Delta 및 Iceberg REST 카탈로그와 테이블, 뷰, Cloud 스토리지 파일, AI 모델 및 함수를 기본적으로 지원하는 Unity Catalog는 통합된 데이터 관리 환경을 제공하는 진정한 멀티모달 카탈로그입니다.
이 책을 쓴 이유와 지금 출간한 이유
처음 이 책의 아이디어를 오라일리에 제안했을 때만 해도 Unity Catalog는 Databricks 플랫폼의 독점적인 구성 요소였습니다. 이 책을 집필하는 동안 Unity Catalog는 오픈 소스가 되었고 수많은 개선 사항과 새로운 기능이 통합되었습니다. 아키텍처는 시간이 지남에 따라 상당한 변화와 진화를 겪었지만, 기본 원칙과 거버넌스 구현은 비교적 일관되게 유지되었습니다. 유니티는 3년 넘게 Unity Catalog와 긴밀히 협력하면서 핵심 개념을 Solidly 이해하는 것이 중요하다는 것을 깨달았습니다. 따라서 이러한 기본 요소와 현재 공개적으로 제공되는 기능을 문서화할 시기가 되었다고 판단했습니다.
이 책의 대상
Unity 카탈로그 거버넌스 책은 주로 다음과 같은 사람들을 대상으로 합니다:
- 데이터 설계자 및 경영진
-
전체 조직 또는 사업부의 데이터 및 AI 전략 수립을 담당하는 의사 결정권자는 이 책에서 많은 것을 얻을 수 있습니다. 개방형 중앙 집중식 멀티모달 카탈로그와 상호 운용성에 대한 업계 방향에 대한 포괄적인 이해를 제공하여 비즈니스 성공을 이끄는 정보에 입각한 전략적 의사 결정을 내릴 수 있게 해줍니다.
- 데이터 응용 프로그램 팀
-
이 책은 또한 ETL 파이프라인을 설계 및 구현하고, 데이터 처리를 자동화하며, 데이터 엔지니어, 분석가, 과학자 등 다양한 이해관계자가 데이터에 액세스할 수 있도록 하는 전문가를 위한 책입니다. 이 책은 데이터 관리 및 거버넌스를 개선하고 데이터 품질을 보장하며 원활한 데이터 공유 및 협업을 지원하기 위해 Unity Catalog를 활용하는 방법에 대한 실용적인 지침을 제공합니다.
- Cloud 플랫폼 엔지니어
-
데이터 팀을 위한 플랫폼을 제공하고 보안 및 거버넌스 표준을 시행하는 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access