197
4
장
데이터 관리 패턴
합니다. 카산드라는 페타바이트 단위의 데이터를 다룰 수 있으며 초당 동시 수 천개의 작업을
처리할 수 있고 하이브리드 클라우드 또는 멀티클라우드 환경에서 수많은 데이터를 다룰 수 있
습니다. 클라우드 네이티브 애플리케이션을 만드는 경우 아마존 키스페이스
Amazon
Keyspaces
나
구글 클라우드아스타
Google
Cloudasta
와 같은 관리형 카산드라를 사용하는 것이 좋습니다.
카산드라의 쓰기 성능은 읽기 성능에 비해 훨씬 좋습니다.
NoSQL
데이터베이스에 설명할 때
언급했다시피 카산드라는 설계상 약한 일관성을 제공합니다. 하지만 일관성 수준을 변경해서
애플리케이션에 따라 약한 일관성이나 강한 일관성을 모두 구현할 수 있습니다.
카산드라 성능은 데이터를 어떻게 저장하고 질의할지에 따라서도 달라집니다. 키 집합에 근거
한 질의 데이터를 사용한다면 행 키 (파티션 키 )를 사용해야 합니다. 서로 다른 여러 키를 통
해 데이터를 질의한다면 부 색인을 만드는 것이 좋습니다. 부 색인을 너무 많이 사용하면 데이
터를 삽입할 때마다 색인을 업데이트해야 하기 때문에 데이터 스토어 속도가 느려질 수 있습니
다. 또한 카산드라는 두 개의 컬럼을 조인하는 것이 비효율적이며 데이터를 자주 업데이트하는
경우에도 그다지 좋지 않습니다.
4.10.34.10.3
아파치 아파치
HBaseHBase
아파치
HBase
는 확장 가능한 분산
NoSQL
컬럼 스토어로서
HDFS
에서 동작합니다.
HBase
는 수십만 개의 행과 수백만개의