5장. 성능을 위한 스토리지 및 쿼리 최적화
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
통합 가시성 스택을 통해 사용자는 자신의 원격 분석 및 사용 사례에 가장 적합한 스토리지 솔루션을 결정할 수 있습니다. 기존에는 통합 가시성의 각 기둥에 최적화된 다양한 유형의 스토리지 시스템이 존재했습니다. 예를 들어
- 메트릭
- Prometheus, 타임스케일, InfluxDB 및 기타 시계열 데이터베이스 또는 키-값 저장소
- 로그
- Grafana Loki, Elasticsearch, OpenSearch 및 기타 검색 엔진
- 추적
- 그라파나 템포, 예거, 하이퍼트레이스 및 기타 열 저장소
최근에는 Apache Pinot 및 ClickHouse와 같은 실시간 분석 데이터베이스가 공통 리포지토리에서 둘 이상의 "기둥"(즉, 3장에서 언급한 "Observability 1.5")을 지원할 수 있기 때문에 통합 가시성 사용 사례에 점점 더 많이 사용되고 있습니다.
분리된 스택 내에서 데이터베이스를 혼합하고 일치시키는 다른 방법을 살펴봅시다. 예거 플랫폼은 PostgreSQL, Cassandra, ClickHouse("추가 스토리지 백엔드" 2025)와 같이 커뮤니티에서 지원하는 다양한 백엔드 스토리지 옵션을 통해 매우 다재다능합니다. 이러한 각 스토리지 옵션은 지원되는 수집 속도, 쿼리 성능, 쿼리 유연성 등 매우 다양한 기능을 제공합니다(예가디시 2023).
그러나 사용자들은 Jaeger 스토리지 백엔드를 완전히 우회하여 실시간 분석을 위해 Jaeger 에이전트에서 직접 Apache Pinot으로 원격 분석을 스트리밍하기도 했습니다(StarTree 2024).
통합 가시성 백엔드에 적합한 조건에 대해 좀 더 자세히 알아보겠습니다.
높은 카디널리티, 고차원성 및 JSON 지원 처리
특히 건초 더미가 매우 크고 복잡할 때 원격 측정 건초 더미에서 인사이트의 바늘을 어떻게 찾을 수 있을까요?
높은 카디널리티는 데이터 결과에 고유한 값이 많은 경우(예: 열 전체에 걸쳐)를 말합니다. 낮은 카디널리티의 예로, 공식 우편 약어가 있는 미국 주, 지구, 영토 및 소유물의 수는 총 59개입니다(미국 우편 서비스 2018). 이 수치를 Comcast(Cadieux 2024)와 같은 대기업에서 언제든지 관리할 수 있는 수십만 개의 Kubernetes 포드나 T-Mobile(T-Mobile 2025)과 같은 대규모 휴대폰 네트워크에 연결된 1억 9천만 개 이상의 장치와 비교해 보세요. 세션ID, 사용자ID, 제품ID 등은 모두 고유 결과의 수가 일반적으로 수백만 개에서 수십억 개에 이르는 고카디널리티 데이터의 예입니다.
고차원성이란 데이터 요소와 연관된 속성, 기능 또는 변수가 얼마나 많은지를 나타냅니다. 예를 들어, 모바일 디바이스ID의 경우 핸드셋 유형(Android 또는 iPhone 및 각각의 모델 번호 열거), OS 버전, CPU, 메모리 및 스토리지 용량(총량 및 사용 중인 용량), ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access