book

카오스 엔지니어링

by Casey Rosenthal, Nora Jones

May 2025

Beginner to intermediate

308 pages

4h 33m

Korean

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

이 책에서 사용된 규칙오라일리 온라인 학습문의 방법감사
강령으로서의 관리 원칙카오스 원숭이 탄생Go Big규율의 공식화커뮤니티 탄생빠른 진화
복잡성 고려하기복잡성과의 만남예 1: 비즈니스 로직과 애플리케이션 로직의 불일치예 2: 고객이 유발한 재시도 폭풍예 3: 휴일 코드 동결복잡성에 맞서기우발적 복잡성필수 복잡성복잡성 수용
동적 안전 모델경제학워크로드안전복잡성의 경제적 기둥상태관계환경가역성소프트웨어에 적용되는 복잡성의 경제적 기둥시스템적 관점
카오스 엔지니어링이란?실험과 테스트검증 대 유효성 검사카오스 엔지니어링이 아닌 것뉴스 속보불안정성 방지고급 원칙정상 상태 동작에 대한 가설 세우기다양한 실제 이벤트프로덕션 환경에서 실험 실행실험을 자동화하여 지속적으로 실행폭발 반경 최소화"원칙"의 미래
카오스 개조구형 시스템에서 흔히 볼 수 있는 디자인 패턴최신 시스템에서 흔히 볼 수 있는 디자인 패턴기본 내결함성 달성하기재난 영화관목표안티 목표프로세스준비연습디브리핑프로세스의 진화 과정경영진의 동의 얻기결과캐시 불일치 방지시도, 다시 시도(안전을 위해)불가능 결과결론
DiRT 테스트의 수명참여 규칙테스트 대상테스트 방법수집 결과Google의 테스트 범위결론
모든 것이 왜 이렇게 복잡할까요?예상치 못한 합병증의 예간단한 시스템은 빙산의 일각에 불과합니다.실험 결과의 범주알려진 이벤트/예상치 못한 결과알 수 없는 이벤트/예상치 못한 결과장애 우선순위 지정종속성 살펴보기변화의 정도다양한 실패변형과 우선순위 지정의 결합종속성으로 변형 확장대규모 실험 배포결론

재해로부터 배우기세분화된 실험 타겟팅규모에 맞는 안전한 실험실제로: 링크드아웃장애 모드LiX를 사용하여 실험 대상 지정빠른 실험을 위한 브라우저 확장 프로그램자동화된 실험결론
캐피탈 원 사례 연구블라인드 복원력 테스트카오스 엔지니어링으로 전환CI/CD의 카오스 실험실험을 설계할 때 주의해야 할 사항툴링팀 구조전도결론
카오스 엔지니어링 및 복원력카오스 엔지니어링 주기의 단계실험 설계하기카오스 실험 설계를 위한 도구 지원효과적인 내부 파트너십운영 절차 이해범위 논의가설결론
시스템 내 인간사회기술 시스템에 '소시오'를 더하다조직은 시스템의 시스템입니다엔지니어링 적응 용량약한 신호 발견하기동전의 양면, 실패와 성공원칙을 실천에 옮기기가설 세우기다양한 실제 이벤트폭발 반경 최소화사례 연구 1: 게임 데이 게임커뮤니케이션: 모든 조직의 네트워크 지연 시간사례 연구 2: 점과 점 연결하기리더십은 시스템의 긴급한 속성입니다.사례 연구 3: 기본 가정 변경하기혼돈을 안전하게 정리하기고도와 방향만 있으면 됩니다.루프 닫기실패하지 않으면 배우지 않는 것입니다.
실험의 이유, 방법, 시기이유방법언제기능 할당, 또는 인간이 더 나은/기계가 더 나은 업무대체 신화결론
실험 선택무작위 검색전문가의 시대관찰 가능성: 기회직관 엔지니어링을 위한 관찰 가능성결론
인시던트 감소의 일시적 특성커크패트릭 모델레벨 1: 반응레벨 2: 학습레벨 3: 전송레벨 4: 결과대체 ROI 예시담보 ROI결론
협업 마인드오픈 사이언스; 오픈 소스카오스 실험 열기실험 결과, 공유 가능한 결과결론
입양카오스 엔지니어링을 인수한 기업카오스 엔지니어링에 얼마나 많은 조직이 참여하나요?전제 조건채택의 장애물정교함모든 것을 종합하기
이력서의 출처CV 시스템의 유형야생의 이력서: ChAPChAP: 실험 선택하기ChAP: 실험 실행ChAP의 고급 원칙지속적 검증으로서의 ChAP가까운 시스템에 CV 출시 예정성능 테스트데이터 아티팩트정확성
사이버-물리 시스템의 부상기능적 안전과 카오스 엔지니어링의 만남FMEA 및 카오스 엔지니어링사이버-물리 시스템의 소프트웨어FMEA를 한 단계 뛰어넘는 카오스 엔지니어링프로브 효과프로브 효과 해결결론
인간 및 조직 성과(HOP)란 무엇인가요?HOP의 주요 원칙원칙 1: 오류는 정상입니다원칙 2: 비난은 아무것도 해결하지 못합니다원칙 3: 컨텍스트가 행동을 주도합니다.원칙 4: 학습과 개선이 중요합니다.원칙 5: 의도적인 대응이 중요함HOP, 카오스 엔지니어링을 만나다카오스 엔지니어링과 HOP의 실제 적용결론
카오스 엔지니어링이 필요한 이유는 무엇인가요?견고성 및 안정성실제 사례카오스 엔지니어링 적용혼돈을 포용하는 우리의 방식결함 주입애플리케이션의 결함 주입CPU 및 메모리의 오류 주입네트워크 내 결함 주입파일 시스템 내 결함 주입장애 감지혼돈의 자동화자동화된 실험 플랫폼: 슈뢰딩거슈뢰딩거 워크플로결론
보안에 대한 현대적인 접근 방식인적 요인과 실패낮은 곳에 매달린 과일 제거피드백 루프보안 카오스 엔지니어링 및 현재 방법레드팀 문제퍼플팀 관련 문제보안 카오스 엔지니어링의 이점보안 게임 데이보안 카오스 엔지니어링 도구 예시: 차오슬링어차오슬링르의 이야기결론기여자/리뷰어

Content preview from 카오스 엔지니어링

7장. 회원을 배려하는 LinkedIn

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

로건 로젠

프로덕션 환경에서 카오스 실험을 실행하면 제품 사용자에게 영향을 미칠 수 있습니다. 충성도가 높은 사용자가 없다면 유지 관리할 시스템이 없으므로 실험을 신중하게 계획하면서 사용자를 최우선으로 고려해야 합니다. 약간의 영향은 불가피할 수 있지만, 카오스 실험의 영향 반경을 최소화하고 모든 것을 정상으로 되돌릴 수 있는 간단한 복구 계획을 세우는 것이 매우 중요합니다. 실제로 폭발 반경을 최소화하는 것은 카오스 엔지니어링의 고급 원칙 중 하나입니다( 3장 참조). 이 장에서는 이 원칙을 준수하기 위한 모범 사례와 함께 소프트웨어 업계에서 이 원칙이 어떻게 구현되었는지에 대한 이야기를 소개합니다.

이 주제의 맥락을 이해하기 위해 자동차 산업으로 잠시 시선을 돌려보겠습니다. 모든 최신 차량은 제조업체, 제3자 및 정부에서 엄격한 충돌 테스트를 거쳐 사고 발생 시 탑승자의 안전성을 검증합니다. 이러한 테스트를 수행하기 위해 엔지니어는 인체를 시뮬레이션하는 충돌 테스트 더미를 활용하고 여러 센서를 통해 충돌이 실제 사람에게 어떤 영향을 미치는지 파악합니다.

자동차 충돌 테스트 더미는 지난 수십 년 동안 크게 발전해 왔습니다. 2018년, 미국 도로교통안전국은 지금까지 개발된 충돌 테스트 더미 중 가장 실물 같은 더미로 불리는 Thor를 출시했습니다. 토르는 약 140개의 데이터 채널을 통해 엔지니어에게 사고가 실제 사람에게 미치는 영향에 대한 풍부한 데이터를 제공하며, 이러한 더미를 통해 제조업체와 정부는 시장에 출시되는 차량에 대한 확신을 가질 수 있습니다.¹

차량의 구조적 무결성과 안전 메커니즘을 테스트하기 위해 실제 사람에게 의도적인 충돌을 가하는 대신 충격을 시뮬레이션할 수 있는데 왜 굳이 사람을 실험에 참여시킬까요? 이 아이디어는 카오스 엔지니어링의 소프트웨어에도 동일하게 적용됩니다.

충돌 충격을 판단하는 토르의 여러 센서와 마찬가지로, 엔지니어들은 정상 상태에서의 편차를 측정하는 여러 가지 방법을 수년 동안 개발해 왔습니다. 제한된 규모의 장애 실험을 통해서도 지표에 교란을 일으키고 사용자 경험에 영향을 미치는지 확인할 수 있습니다. 실험은 가능한 한 적은 수의 사용자에게 영향을 미치도록 설계해야 하며, 적어도 이러한 장애를 대규모로 비슷한 방식으로 처리할 수 있을 만큼 시스템에 자신이 있을 때까지는 실험을 진행해야 합니다.

카오스 실험 중에 사용자의 피해를 최소화하기 위해 필요한 모든 예방 조치를 취하더라도 예기치 않은 영향이 발생할 가능성은 여전히 존재합니다. 머피의 법칙에 따르면 "잘못될 수 있는 것은 무엇이든 잘못된다"고 합니다. 애플리케이션이 사용자에게 허용되는 범위를 벗어나는 방식으로 오작동을 일으키는 경우 실험을 종료할 수 있는 큰 빨간 버튼이 필요합니다. 마우스 클릭 한 번으로 쉽게 정상 상태로 돌아갈 수 있어야 합니다.