5장. 성능을 위한 Cloud 데이터 레이크아키텍처 최적화
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
단순함은 궁극의 정교함입니다.
레오나르도 다빈치
가장 간단한 용어로성능은 완료된 작업의 적시성으로 정의할 수 있습니다. 하지만 성능에 대한 단일 측정 기준이 없기 때문에 Cloud 서비스에서 성능은 가장 부하가 많이 걸리는 용어 중 하나일 것입니다. 이 장에서는 성능의 의미, Cloud 데이터 레이크와 관련하여 성능 측정과 관련된 다양한 차원, 최상의 성능을 위해 Cloud 데이터 레이크를 최적화하고 조정하는 데 도움이 되는 전략에 대한 이해를 바탕으로 성능의 계층을 벗겨보겠습니다. 또한 이러한 개념과 전략을 설명하기 위해 Klodars Corporation을 예로 들어 설명합니다.
성능 측정의 기본 사항
퍼포먼스를 생각할 때, 개인 기록을 세우고 결승선을 통과하는 주자와 같이 속도와 관련된 것을 가정하고 있다고 어느 정도 자신 있게 말할 수 있습니다. 두 가지 모두 관중의 기대에 부응하거나 그 이상의 성과를 내며 성공적으로 작업을 완료하고 원하는 결과를 달성하기 위해 노력한다는 공통된 목표를 가지고 있습니다. 비슷한 맥락에서 Cloud 데이터 레이크에서 성능은 수행해야 할 작업에 대한 목표를 설정하고 설정된 목표 내에서 작업이 완료되도록 하는 프로세스를 의미합니다.
작업의 성과에는 두 가지 측면이 있으며, 모든 성과 측정에는 이 두 가지 요소를 통합해야 합니다:
- 응답 시간
-
작업을 완료하는 데 시간이 얼마나 걸렸나요?
- 처리량
-
생산량은 얼마나 되나요?
"일상 속 스케일링"에서 살펴본 샌드위치 만들기를 예로 들어보겠습니다 . 이 섹션에서는 그림 5-1에 표시된 엔드투엔드 실행 방식과 그림 5-2에 표시된 조립 라인 방식이라는 두 가지 샌드위치 제조 아키텍처를 살펴봤습니다. 이 예시를 통해 성능을 측정해 보겠습니다.
그림 5-1. 샌드위치 제작을 위한 엔드투엔드 실행 방식
그림 5-2. 조립 라인 접근 방식
성과에 대한 목표 및 지표
앞서 말했듯이 성능은 응답 시간과 처리량이라는 두 가지 요소에 따라 달라집니다. 성능을 측정하려면 목표를 설정해야 합니다. 샌드위치 만들기의 예에서 목표는 샌드위치 5개를 만드는 것입니다. 다음으로 비교적 측정하기 쉬운 일련의 측정 항목을 식별해야 합니다. 단순화를 위해 모든 작업자가 샌드위치를 만들 때 동일한 속도를 가지며 작업 간 전환 시간이 없다고 가정하겠습니다. 가변 측정값과 상수 측정값을 고려할 것입니다:
- 가변 측정값
-
다음 측정값은 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access