5장. 효율성 및 확장성
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
이 마지막 장에서는 우리가 개발한 데이터 파이프라인을 최적화하고 확장하는 데 있어 중요한 측면에 초점을 맞춥니다. 먼저 '효율성'과 '확장성'의 의미를 정의하여 논의의 경계를 설정합니다.
우리의 여정은 운영 환경에 대한 철저한 이해에 기반한 리소스 할당에서 시작됩니다. 이러한 이해를 바탕으로 프로세스를 효과적으로 최적화할 수 있습니다.
이 장은 두 가지에 초점을 맞춘 토론으로 마무리됩니다. 첫째, 협업 프로세스, 특히 팀 규모와 숙련도 측면에서 효과적으로 확장하는 방법을 살펴봅니다. 둘째, 효율적인 데이터 파이프라인 관리의 핵심 요소인 최적의 개발자 환경을 만드는 방법에 대해 살펴봅니다.
이 장에서는 도구 및 플랫폼 고려 사항, 관리형 솔루션과 맞춤형 솔루션의 장단점, 우수한 ETL 시스템을 구축하기 위한 아키텍처 전략과 같은 지속적인 주제를 다루고 있습니다. 이러한 논의는 효율적이고 확장 가능한 데이터 시스템 구축 및 유지 관리에 대한 포괄적인 관점을 제공하는 것을 목표로 합니다.
정의된 효율성 및 확장성
효율성은 데이터를 통해 비즈니스 가치를 제공하기 위해 워크플로를 최적화하는 것입니다. 이는 코드, 서비스, 팀워크 등의 측면을 포함하여 주어진 자원으로 영향력 있는 결과물을 창출하는 능력을 측정합니다. 효율성의 궁극적인 척도는 사용된 유한한 리소스에 비해 창출되는 영향력입니다.
확장성이란 증가하는 작업량을 처리할 수 있는 시스템, 네트워크 또는 프로세스의 능력 또는 이러한 증가를 수용하기 위해 확장할 수 있는 잠재력을 말합니다. 데이터 변환의 맥락에서는 데이터 처리 시스템이 성능이나 효율성의 저하 없이 증가하는 데이터 양과 더 복잡한 변환 작업을 처리할 수 있는 능력을 의미합니다.
처음에는 소규모 전자상거래 웹사이트의 데이터를 처리하는 데이터 변환 시스템을 상상해 보세요. 비즈니스가 성장함에 따라 수천 명에서 수백만 명의 고객, 거래, 제품 상호 작용 등 데이터도 증가합니다. 이러한 맥락에서 확장성이란 시스템이 이러한 성장을 관리하기 위해 데이터 처리 기능을 확장할 수 있음을 의미합니다.
데이터 팀은 데이터 변환 시스템을 확장할 때 가격과 성능 사이에서 종종 트레이드오프에 직면하게 됩니다. 더 강력한 컴퓨팅, 정교한 솔루션, 확장된 Cloud 스토리지 등 더 높은 성능은 더 높은 비용과 함께 제공되는 경우가 많습니다.
인생에서와 마찬가지로 데이터에서도 균형이 중요합니다. 말처럼 쉽지는 않지만, 저희의 목표는 지속 가능한 가격으로 적절한 성능을 제공하는 솔루션을 찾는 것입니다. 예를 들어, 사용량 기반 요금제는 서비스 평가를 시작하는 좋은 방법이 될 수 있지만, 일반적으로 어느 시점에서는 구독 또는 정액 요금제에 의해 가려집니다. 데이터 팀은 확장 결정의 비용 효율성을 평가하여 투자 대비 최적의 성능을 얻고 있는지, 불필요한 용량에 과도한 지출을 하고 있지 않은지 확인해야 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access