book

Prometheus: Up & Running, 2nd Edition

Name: Prometheus: Up & Running, 2nd Edition
ISBN: 9798341654181

by Julien Pivotto, Brian Brazil

May 2025

Beginner to intermediate

418 pages

6h 18m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

서문
알려진 범위 확장하기프로메테우스의 진화이 책에서 사용된 규칙코드 예제 사용오라일리 온라인 학습문의 방법감사
I. 소개
1. 프로메테우스란 무엇인가요?
모니터링이란 무엇인가요?모니터링의 짧고 불완전한 역사모니터링 범주프로메테우스 아키텍처클라이언트 라이브러리수출업체서비스 검색스크래핑스토리지대시보드녹화 규칙 및 알림알림 관리장기 보관프로메테우스가 아닌 것
2. Prometheus 시작하기
프로메테우스 실행표현식 브라우저 사용노드 익스포터 실행알림
II. 애플리케이션 모니터링
3. 계측
간단한 프로그램카운터예외 계산계산 크기게이지게이지 사용콜백요약히스토그램버킷단위 테스트 계측계측에 접근하기무엇을 계측해야 하나요?인스트루먼트는 얼마나 해야 하나요?지표의 이름은 어떻게 지어야 하나요?
4. 박람회
PythonWSGITwistedGunicorn을 사용한 멀티프로세스GoJavaHTTPServer서블릿푸시 게이트웨이브릿지파서텍스트 노출 형식메트릭 유형레이블탈출타임스탬프메트릭 확인OpenMetrics메트릭 유형레이블타임스탬프
5. 라벨
라벨이란 무엇인가요?계측 및 대상 레이블계측Metric여러 레이블자식집계라벨 패턴Enum정보레이블 사용 시기카디널리티
6. Grafana로 대시보드 작성
설치데이터 소스대시보드 및 패널그래프의 벽 피하기시계열 패널시간 제어통계 패널테이블 패널상태 타임라인 패널템플릿 변수
III. 인프라 모니터링

7. 노드 내보내기
CPU 수집기파일 시스템 수집기디스크 통계 수집기넷데브 콜렉터Meminfo 수집기화문 수집가통계 수집기Uname 수집기OS 수집기Loadavg 수집기압력 수집기텍스트 파일 수집기텍스트 파일 수집기 사용타임스탬프
8. 서비스 검색
서비스 검색 메커니즘정적파일HTTP영사EC2레이블 변경스크랩할 항목 선택대상 레이블스크랩하는 방법metric_relabel_configs레이블 충돌 및 명예_레이블
9. 컨테이너와 Kubernetes
cAdvisorCPU메모리레이블KubernetesKubernetes에서 실행하기서비스 검색큐브-상태-메트릭스대체 배포
10. 일반 수출업체
영사MySQLdGrok 내보내기블랙박스ICMPTCPHTTPDNSPrometheus 구성
11. 다른 모니터링 시스템과 함께 작업하기
기타 모니터링 시스템InfluxDBStatsD
12. 내보내기 작성
컨설턴트 원격 측정사용자 지정 수집기레이블가이드라인
IV. PromQL
13. PromQL 소개
집계 기본 사항게이지카운터요약히스토그램선택기매처인스턴트 벡터범위 벡터하위 쿼리오프셋수정자에서HTTP API쿼리쿼리 범위
14. 집계 연산자
그룹화없이by연산자합계카운트평균그룹stddev 및 stdvar최소 및 최대상단 및 하단사분위수카운트_값
15. 이진 연산자
스칼라로 작업하기산술 연산자삼각 연산자비교 연산자벡터 매칭일대일다대일 및 그룹_왼쪽다대다 및 논리 연산자연산자 우선 순위
16. 기능
유형 변경벡터스칼라수학복근ln, log2, log10expsqrt천장 및 바닥라운드클램프, 클램프_최대 및 클램프_최소sgn삼각 함수시간 및 날짜시간분, 시간, 요일, 일, 월, 일, 년, 일, 월, 월, 연도타임스탬프레이블label_replacelabel_join누락된 시리즈, 결석 및 결석_오버타임정렬 및 정렬_desc로 정렬히스토그램과 히스토그램_분위수카운터rate증가irate리셋게이지 변경변경 사항파생예측_선형델타idelta홀트_윈터스시간 경과에 따른 집계
17. 기록 규칙
레코딩 규칙 사용녹화 규칙을 사용해야 하는 경우카디널리티 감소범위 벡터 함수 구성하기API 규칙규칙을 사용하지 않는 방법레코딩 규칙 이름 지정
V. 경고
18. 경고
알림 규칙에 대한알림 레이블주석 및 템플릿좋은 알림이란 무엇인가요?Prometheus에서 알림 관리자 구성하기외부 레이블
19. 알림 관리자
알림 파이프라인구성 파일라우팅 트리수신기억제알림 관리자 웹 인터페이스
VI. 배포
20. 서버 측 보안
프로메테우스가 제공하는 보안 기능TLS 사용고급 TLS 옵션기본 인증 사용 설정
21. 모든 것을 종합하기
롤아웃 계획성장하는 프로메테우스페더레이션과 함께 글로벌 진출하기장기 보관프로메테우스 실행하드웨어구성 관리네트워크 및 인증실패에 대비한 계획알림 관리자 클러스터링메타 및 교차 모니터링성능 관리문제 감지하기고비용 지표 및 목표 찾기부하 감소수평 샤딩변경 사항 관리도움 받기
색인
저자 소개

Content preview from Prometheus: Up & Running, 2nd Edition

18장. 경고

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

"모니터링이란 무엇인가요?" 에서 알림은 문제가 있을 때 사람에게 알릴 수 있는 모니터링의 구성 요소 중 하나라고 설명했습니다.Prometheus를 사용하면 지속적으로 평가되는 PromQL 표현식의 형태로 조건을 정의하고 그 결과 시계열이 알림이 됩니다. 이 장에서는 Prometheus에서 알림을 구성하는 방법을 보여드리겠습니다.

"알림"의 예에서 보았듯이 Prometheus는 이메일, 채팅 메시지 또는 페이지와 같은 알림을 발송할 책임이 없습니다. 이 역할은 알림 관리자가 처리합니다.

Prometheus는 알림 여부를 결정하는 로직을 정의하는 곳입니다. Prometheus에서 알림이 발생하면 여러 Prometheus 서버에서 알림을 수신할 수 있는 Alertmanager로 전송됩니다. 그러면 알림 관리자가 알림을 그룹화하여 사용자에게 스로틀링된 알림을 보냅니다(그림 18-1).

Prometheus and Alertmanager architecture.

그림 18-1에 표시된 이 아키텍처는 유연성뿐만 아니라 여러 다른 Prometheus 서버의 알림을 기반으로 단일 알림을 받을 수 있는 기능도 제공합니다. 예를 들어 모든 데이터센터에 데이터를 전송하는 데 문제가 있는 경우, 각 데이터센터에 대한 알림을 스팸으로 받지 않고 단일 알림만 받도록 알림 그룹을 구성할 수 있습니다.

알림 규칙

알림 규칙은17장에서 다룬 레코딩 규칙과 유사합니다. 알림 규칙은 레코딩 규칙과 동일한 규칙 그룹에 배치하며, 적절하다고 생각되는 대로 혼합하여 사용할 수 있습니다. 예를 들어, 한 작업에 대한 모든 규칙과 알림을 하나의 그룹에 두는 것이 일반적입니다:¹

groups:
 - name: node_rules
   rules:
    - record: job:up:avg
      expr: avg without(instance)(up{job="node"})
    - alert: ManyInstancesDown
      expr: job:up:avg{job="node"} < 0.5

이것은 노드 내보내기의 절반 이상이 다운된 경우 ManyInstancesDown 이라는 이름의 알림을 정의합니다. record 필드가 아닌 alert 필드가 있으므로 알림 규칙임을 알 수 있습니다.

이 예에서는 by 대신 without 을 사용하여 시계열에 있는 다른 모든 레이블이 보존되고 알림 관리자에게 전달되도록 주의했습니다. 알림의 작업, 환경 및 클러스터와 같은 세부 정보를 알고 있으면 최종 알림을 받을 때 오히려 유용합니다.

기록 규칙의 경우 시계열이 나타나고 사라지는 것은 처리하기 어렵기 때문에 표현식에 필터링을 사용하지 않아야 합니다. 알림 규칙의 경우 필터링이 필수적입니다. 알림 표현식을 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341654181

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Prometheus: Up & Running, 2nd Edition

by Julien Pivotto, Brian Brazil

18장. 경고

그림 18-1. Prometheus 및 Alertmanager 아키텍처

알림 규칙

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.