21장. 모든 것을 종합하기
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
이전 장에서는 계측, 대시보드, 서비스 검색, 내보내기, PromQL, 알림 및 알림 관리자와 같은 Prometheus 설정의 모든 구성 요소 에 대해 배웠습니다. 이 마지막 장에서는 이 모든 것을 통합하고 Prometheus 배포를 계획하고 향후에 유지 관리하는 방법을 배웁니다.
롤아웃 계획
새로운 기술을 고려하고 있다면, 가장 좋은 방법은 롤아웃을 시작하는 것입니다.1 너무 많은 노력을 들이지 않거나 완전한 롤아웃을 너무 일찍 약속하지 않는 작은 것부터 시작하세요. 기존 시스템에서 Prometheus를 시작할 때는 노드 익스포터(2 와 Prometheus를 실행하는 것이 좋습니다. 이미 2장에서 이 두 가지를 모두 실행했습니다.
노드 익스포터는 다른 모니터링 시스템에서 사용할 수 있는 모든 머신 수준 메트릭을 다루고 있으며,7장에서 다룬 것처럼 꽤 많은 메트릭을 다루고 있습니다. 이 단계에서는 적은 노력으로 다양한 메트릭을 사용할 수 있으며, Prometheus에 익숙해지고, 대시보드를 설정하고, 알림을 설정할 수도 있을 것입니다.
다음으로, 어떤 타사 시스템을 사용하고 있는지, 어떤 내보내기가 있는지 살펴보고 해당 내보내기를 배포하기 시작하는 것이 좋습니다. 예를 들어, 네트워크 장치가 있는 경우 SNMP 내보내기를 실행하고, Kafka나 Cassandra와 같은 JVM 기반 애플리케이션이 있는 경우 JMX 내보내기를 사용하고, 블랙박스 모니터링을 원하는 경우10장에서 다룬 대로 Blackbox 내보내기를 사용할 수 있습니다. 이 단계의 목표는 가능한 한 적은 노력으로 시스템의 다양한 부분에 대한 메트릭을 확보하는 것입니다.
지금쯤이면 Prometheus에 익숙해졌을 것이며,8장에서 설명한 대로 서비스 검색과 같은 측면에 대한 접근 방식을 파악했을 것입니다. 롤아웃의 모든 이전 단계를 혼자서 수행할 수도 있습니다. 다음 단계는 3장에서 다룬 대로 조직의 자체 애플리케이션 계측을 시작하는 것이며, 여기에는 다른 사람들도 참여하여 모니터링에 시간을 할애하도록 요청하는 것이 포함됩니다. 지금까지 설정한 모니터링 및 대시보드를 모두 3 (수출업체의 지원을 받는)를 모두 시연할 수 있다면 다른 사람들에게 Prometheus 사용을 설득하기가 훨씬 쉬워질 것입니다. 1단계에서 모든 코드를 광범위하게 계측하는 것은 동의를 얻기가 어려울 수 있습니다.
이전과 마찬가지로 계측을 추가할 때는 가장 큰 이득을 얻을 수 있는 지표부터 시작하는 것이 좋습니다. 애플리케이션에서 트래픽의 상당 부분이 통과하는 초크포인트를 찾아보세요. 예를 들어, 모든 애플리케이션이 서로 통신하는 데 사용하는 공통 HTTP 라이브러리가 있고'서비스 계측'에서 다룬 대로 기본 RED 메트릭으로 계측하는 경우, 단 한 번의 계측 변경으로 온라인 서비스 시스템의 주요 성능 메트릭을 얻을 수 있습니다.
다른 모니터링 시스템의 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access