November 2023
Beginner to intermediate
344 pages
3h 47m
Korean

폴 도란(Paul Doran)
CAP 정리는 분산 데이터 시스템에서 일관성과 가용성, 분할내성 사이에서 타협해야만 한다는 내용입니다.
• 일관성(consistency)은 모든 클라이언트가 쿼리에 대해 동일한 응답을 받는다는 의미입니다.
• 가용성(availability)은 클라이언트가 모든 쿼리마다 응답을 받는다는 의미입니다.
• 분할내성(partition tolerance)은 메시지가 손실되거나 시스템 일부가 망가져도 시스템이 계속 작동할 수 있다는 의미입니다.
데이터 엔지니어는 분산 데이터 시스템이 파티션으로 나뉜다는 사실을 받아들여야 하기 때문에, 일관성과 가용성 사이의 절충 지점을 이해해야 합니다. 견고한 데이터 파이프라인을 구축하려다가 무엇이 잘못될 수 있는지를 알아야 합니다. 기본적으로 데이터 파이프라인은 데이터를 한 곳에서 다른 곳으로 이동시켜야 합니다.
CAP 정리가 시스템 설계에 미치는 영향에서 주의할 점은 다음과 같습니다.
• 데이터 시스템을 CP나 AP로 분류하는 일은 의미가 없습니다. 작동시키는 방식이나 구성에 따라 다르게 분류할 수 있습니다. 시스템이 CAP 정리에서 정의한 대로 일관성과 가용성을 맞추지 못할 수 있습니다.
• 실제로 CAP 정리 때문에 제약을 받는 것 같지만 ...