4장. dbt를 사용한 데이터 변환
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
dbt의 주요 목적은 SQL 문을 작성하는 것만으로 데이터 플랫폼의 데이터를 쉽고 통합된 방식으로 변환할 수 있도록 지원하는 것입니다. dbt를 ELT 워크플로우에 배치하면 변환 단계의 활동 과 일치하여 버전 관리, 문서화, 테스트 또는 자동화된 배포와 같은 추가 구성 요소를 제공하여 데이터 전문가의 전반적인 작업을 간소화합니다. 이것이 분석 엔지니어의 실제 활동을 떠올리게 하나요? 네, DBT는 분석 엔지니어가 하는 일을 정의하는 최신 도구 중 하나로, 플랫폼과 통합된 도구를 제공함으로써 특정 문제에 답하기 위해 추가 서비스를 설정할 필요성을 줄이고 전반적인 시스템 복잡성을 줄여주기 때문입니다.
dbt는 분석 엔지니어를 위해 설명된 작업을 지원하여 데이터 플랫폼에서 코드를 협업적으로 실행하여 메트릭과 비즈니스 정의에 대한 단일 데이터 소스를 확보할 수 있도록 합니다. 진자 템플릿 언어, 매크로 또는 패키지와 함께 DRY 코드를 활용하여 중앙 및 모듈식 분석 코드를 촉진합니다. 이와 동시에 dbt는 데이터 모델에 대한 협업, 버전 관리, 쿼리를 안전하게 프로덕션에 배포하기 전에 테스트 및 문서화, 모니터링 및 가시성과 같은 소프트웨어 엔지니어링 모범 사례에서 일반적으로 볼 수 있는 보안 기능도 제공합니다.
지금까지 dbt에 대해 자세히 소개해 드렸습니다. 하지만 이 장에서는 dbt의 세부 사항을 더욱 자세히 살펴보고 데이터 분석 세계에서 dbt의 중요성을 명확히 하겠습니다. dbt 설계 철학, 이 변환 도구의 이면에 있는 원칙, 그리고 데이터 수명주기에 대해 논의하고, dbt가 원시 데이터를 쉽게 사용할 수 있도록 구조화된 모델로 변환하는 방법을 제시할 것입니다. 모델 구축, 문서화 및 테스트와 같은 다양한 기능을 간략하게 설명하고 YAML 파일과 같은 기타 dbt 아티팩트에 대해 자세히 설명함으로써 dbt 프로젝트 구조를 살펴봅니다. 이 장이 끝나면 데이터 분석 워크플로우에서 효과적으로 구현할 수 있도록 dbt와 그 기능을 포괄적으로 이해하게 될 것입니다.
dbt 디자인 철학
데이터 엔지니어링 및 분석 워크플로우가 점점 더 복잡해지면서 데이터 품질과 안정성을 유지하면서 프로세스를 간소화하는 도구가 필수적입니다. dbt는 데이터 모델링 및 분석 엔지니어링에 대한 접근 방식을 뒷받침하는 잘 정의된 설계 철학을 갖춘 집중된 솔루션으로 부상했습니다.
요약하면, DBT 디자인 철학은 다음과 같은 점에 의존합니다:
- 코드 중심 접근 방식
-
dbt의 디자인 철학의 핵심은 데이터 모델링과 변환에 대한 코드 중심 접근 방식입니다. dbt는 GUI 기반 인터페이스나 수동 SQL 스크립트에 의존하는 대신 사용자가 코드를 사용하여 데이터 변환을 정의하도록 권장합니다. 이러한 코드 중심 개발로의 전환은 협업, 버전 관리 및 자동화를 촉진합니다.
- 재사용성을 위한 모듈화
-
dbt는 모듈화를 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access