200
클라우드 네이티브 애플리케이션 디자인 패턴
할 수 있도록
HDFS
를 서비스로 제공합니다.
HDFS
는 데이터를 여러 데이터 노드에 저장하며 데이터에 대한 모든 메타 데이터를 단일 네임
노드의 메모리에 저장합니다. 해당 노드에 장애가 발생하면 새로운 읽기 및 쓰기 작업을 할 수
없으며 시스템을 사용할 수 없는 상태가 됩니다. 또한 네임 노드의 메모리 크기에 따라 저장할
수 있는 파일 수에 제한이 생깁니다. 이런 이유로
HDFS
에는 크기가 작은 많은 파일을 저장하
는 것보다는 크기가 큰 적은 수의 파일을 저장하는 것이 좋습니다. 또한 순차적 읽기에 최적화
되어 있기 때문에, 랜덤 엑세스가 필요한 경우에는 그다지 적합하지 않습니다.
4.10.84.10.8
아마존 아마존
S3S3
아마존
S3
Simple
Storage
Service
는
AWS
에서 제공하는 오브젝트 스토리지입니다. 데이터 레이크
data
lake
나 클라우드 네이티브 애플리케이션의 스토리지, 데이터 백업, 아카이브, 빅데이터 분석 등
으로 사용할 수 있습니다. 또한 아마존 아테나
Athena
의 표준
SQL
구문을 사용해서 데이터 노드
에서 분석 작업을 실행하는 데이터 지역성 패턴도 지원합니다.
S3
Select
를 통해 전체 오브젝
트가 아닌 오브젝트 데이터의 일부만 읽을 수도 있습니다. 이를 통해 데이터 접근 성능을 최대
4
배까지 향상시킬 수 있습니다. 아마존
S3
는 매우 높은 가용성을 제공하며 세밀한 데이터 접근
제어 기능 또한 제공합니다. 클라우드 네이티브 애플리케이션의 주요 ...