book

Prometheus: Up & Running, 2nd Edition

Name: Prometheus: Up & Running, 2nd Edition
ISBN: 9798341654181

by Julien Pivotto, Brian Brazil

May 2025

Beginner to intermediate

418 pages

6h 18m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

서문
알려진 범위 확장하기프로메테우스의 진화이 책에서 사용된 규칙코드 예제 사용오라일리 온라인 학습문의 방법감사
I. 소개
1. 프로메테우스란 무엇인가요?
모니터링이란 무엇인가요?모니터링의 짧고 불완전한 역사모니터링 범주프로메테우스 아키텍처클라이언트 라이브러리수출업체서비스 검색스크래핑스토리지대시보드녹화 규칙 및 알림알림 관리장기 보관프로메테우스가 아닌 것
2. Prometheus 시작하기
프로메테우스 실행표현식 브라우저 사용노드 익스포터 실행알림
II. 애플리케이션 모니터링
3. 계측
간단한 프로그램카운터예외 계산계산 크기게이지게이지 사용콜백요약히스토그램버킷단위 테스트 계측계측에 접근하기무엇을 계측해야 하나요?인스트루먼트는 얼마나 해야 하나요?지표의 이름은 어떻게 지어야 하나요?
4. 박람회
PythonWSGITwistedGunicorn을 사용한 멀티프로세스GoJavaHTTPServer서블릿푸시 게이트웨이브릿지파서텍스트 노출 형식메트릭 유형레이블탈출타임스탬프메트릭 확인OpenMetrics메트릭 유형레이블타임스탬프
5. 라벨
라벨이란 무엇인가요?계측 및 대상 레이블계측Metric여러 레이블자식집계라벨 패턴Enum정보레이블 사용 시기카디널리티
6. Grafana로 대시보드 작성
설치데이터 소스대시보드 및 패널그래프의 벽 피하기시계열 패널시간 제어통계 패널테이블 패널상태 타임라인 패널템플릿 변수
III. 인프라 모니터링

7. 노드 내보내기
CPU 수집기파일 시스템 수집기디스크 통계 수집기넷데브 콜렉터Meminfo 수집기화문 수집가통계 수집기Uname 수집기OS 수집기Loadavg 수집기압력 수집기텍스트 파일 수집기텍스트 파일 수집기 사용타임스탬프
8. 서비스 검색
서비스 검색 메커니즘정적파일HTTP영사EC2레이블 변경스크랩할 항목 선택대상 레이블스크랩하는 방법metric_relabel_configs레이블 충돌 및 명예_레이블
9. 컨테이너와 Kubernetes
cAdvisorCPU메모리레이블KubernetesKubernetes에서 실행하기서비스 검색큐브-상태-메트릭스대체 배포
10. 일반 수출업체
영사MySQLdGrok 내보내기블랙박스ICMPTCPHTTPDNSPrometheus 구성
11. 다른 모니터링 시스템과 함께 작업하기
기타 모니터링 시스템InfluxDBStatsD
12. 내보내기 작성
컨설턴트 원격 측정사용자 지정 수집기레이블가이드라인
IV. PromQL
13. PromQL 소개
집계 기본 사항게이지카운터요약히스토그램선택기매처인스턴트 벡터범위 벡터하위 쿼리오프셋수정자에서HTTP API쿼리쿼리 범위
14. 집계 연산자
그룹화없이by연산자합계카운트평균그룹stddev 및 stdvar최소 및 최대상단 및 하단사분위수카운트_값
15. 이진 연산자
스칼라로 작업하기산술 연산자삼각 연산자비교 연산자벡터 매칭일대일다대일 및 그룹_왼쪽다대다 및 논리 연산자연산자 우선 순위
16. 기능
유형 변경벡터스칼라수학복근ln, log2, log10expsqrt천장 및 바닥라운드클램프, 클램프_최대 및 클램프_최소sgn삼각 함수시간 및 날짜시간분, 시간, 요일, 일, 월, 일, 년, 일, 월, 월, 연도타임스탬프레이블label_replacelabel_join누락된 시리즈, 결석 및 결석_오버타임정렬 및 정렬_desc로 정렬히스토그램과 히스토그램_분위수카운터rate증가irate리셋게이지 변경변경 사항파생예측_선형델타idelta홀트_윈터스시간 경과에 따른 집계
17. 기록 규칙
레코딩 규칙 사용녹화 규칙을 사용해야 하는 경우카디널리티 감소범위 벡터 함수 구성하기API 규칙규칙을 사용하지 않는 방법레코딩 규칙 이름 지정
V. 경고
18. 경고
알림 규칙에 대한알림 레이블주석 및 템플릿좋은 알림이란 무엇인가요?Prometheus에서 알림 관리자 구성하기외부 레이블
19. 알림 관리자
알림 파이프라인구성 파일라우팅 트리수신기억제알림 관리자 웹 인터페이스
VI. 배포
20. 서버 측 보안
프로메테우스가 제공하는 보안 기능TLS 사용고급 TLS 옵션기본 인증 사용 설정
21. 모든 것을 종합하기
롤아웃 계획성장하는 프로메테우스페더레이션과 함께 글로벌 진출하기장기 보관프로메테우스 실행하드웨어구성 관리네트워크 및 인증실패에 대비한 계획알림 관리자 클러스터링메타 및 교차 모니터링성능 관리문제 감지하기고비용 지표 및 목표 찾기부하 감소수평 샤딩변경 사항 관리도움 받기
색인
저자 소개

Content preview from Prometheus: Up & Running, 2nd Edition

19장. 알림 관리자

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

18장에서는 Prometheus에서 알림 규칙을 정의하여 알림 관리자에게 알림을 전송하는 방법을 살펴보았습니다. 모든 Prometheus 서버의 모든 알림을 수신하여 이메일, 채팅 메시지, 페이지 등의 알림으로 변환하는 것은 알림 관리자의 책임입니다. 2장에서는 알림 관리자 사용에 대해 간략하게 소개했지만, 이 장에서는 알림 관리자의 모든 기능을 구성하고 사용하는 방법을 배웁니다.

알림 파이프라인

알림 관리자는 일대일 방식으로 무작정 알림으로 전환하는 것 이상의 기능을 제공합니다. 이상적인 세계에서는 각 프로덕션 인시던트에 대해 정확히 하나의 알림을 받을 수 있습니다. 이것은 무리한 요구이지만, Alertmanager는 알림이 알림으로 처리되는 방식에 대한 제어 가능한 파이프라인을 제공함으로써 이러한 목표를 달성하기 위해 노력합니다. 레이블이 Prometheus 자체의 핵심인 것처럼, 레이블도 Alertmanager의 핵심입니다:

억제

증상 기반 알림을 사용하는 경우에도 서비스가 있는 데이터센터에 장애가 발생했지만 트래픽이 전혀 수신되지 않는 경우 서비스에 대한 알림을 방지하는 등 더 심각한 다른 알림이 발생하면 일부 알림에 대한 알림을 방지하고 싶을 때가 있습니다. 이것이 바로 억제의 역할입니다.

침묵

이미 문제에 대해 알고 있거나 유지보수를 위해 서비스를 중단하고 있는 경우에는 대기 중인 담당자에게 호출할 필요가 없습니다. 무음을 사용하면 특정 알림을 잠시 동안 무시할 수 있으며, 알림 관리자의 웹 인터페이스를 통해 추가할 수 있습니다.

라우팅

조직당 하나의 Alertmanager를 실행하는 것이 좋지만 모든 알림이 한 곳으로 가는 것은 바람직하지 않습니다. 팀마다 알림이 다른 곳으로 전달되기를 원할 수도 있고, 한 팀 내에서도 프로덕션 환경과 개발 환경에 대한 알림이 다르게 처리되기를 원할 수도 있습니다. 라우팅 트리를 사용하여 이를 구성할 수 있습니다.

그룹화

이제 경로로 이동하는 팀에 대한 생산 알림( )을 받을 수 있습니다. 실패한 랙의 각 머신에 대해 개별 알림을 받으려면¹ 에 대해 개별 알림을 받는 것은 스팸이 될 수 있으므로 Alertmanager 그룹 알림을 통해 랙당 하나의 알림, 데이터센터당 하나의 알림 또는 연결할 수 없는 머신에 대해 전 세계적으로 하나의 알림만 받을 수 있습니다.

스로틀링 및 반복

머신 랙이 다운되어 발생하는 알림 그룹이 있는데 랙에 있는 머신 중 하나에 대한 알림이 이미 알림을 보낸 후에 들어온다고 가정해 보세요. 한 그룹에서 새 알림이 들어올 때마다 알림 관리자가 새 알림을 보낸다면 그룹화의 목적이 무색해집니다. 대신 알림 관리자가 특정 그룹에 대한 알림을 스로틀링하여 스팸을 받지 않도록 합니다.

이상적인 세계에서는 모든 알림이 즉시 처리되지만, 현실에서는 대기 담당자나 다른 시스템이 문제를 놓칠 수 있습니다. 알림 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341654181

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Prometheus: Up & Running, 2nd Edition

by Julien Pivotto, Brian Brazil

19장. 알림 관리자

알림 파이프라인

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.