book

러닝 SQL: 데이터 생성, 검색, 조작까지 데이터 제대로 주무르기

by 류수미, 송희정, 앨런 볼리외

March 2021

Beginner to intermediate

456 pages

12h 49m

Korean

Hanbit Media, Inc.

Read now

Unlock full access

Content preview from 러닝 SQL: 데이터 생성, 검색, 조작까지 데이터 제대로 주무르기

390

러닝 SQL

●

개별 샤드가 너무 커지면 (예를 들어 소셜 미디어업체에 현재

억 명의 사용자가 존재할 경우 ) 더 많은

샤드를 추가하고 샤드 전체에 데이터를 재분배할 계획이 필요합니다.

●

스키마를 변경해야 하는 경우 모든 스키마가 동기화되도록 모든 샤드에 변경 사항을 배포하는 전략이 필

요합니다.

●

애플리케이션 로직에서 둘 이상의 샤드에 저장된 데이터에 액세스해야 하는 경우, 여러 데이터베이스를

통해 쿼리하는 방법과 여러 데이터베이스에 걸쳐 트랜잭션을 구현하는 방법에 대한 전략이 필요합니다.

만약 샤딩이 복잡해 보인다면 그것은 방금 설명한 사항들 때문이며,

2000

년대 후반에 이르러

많은 업체가 새로운 접근법을 찾기 시작했습니다. 다음 절에서는 관계형 데이터베이스 영역 밖

에서 대용량 데이터셋을 처리하는 다른 전략을 살펴봅니다.

17.4

빅데이터

샤딩의 장단점을 따져본 후, 소셜 미디어업체의 데이터 아키텍트인 여러분이 다른 접근 방식을

조사하기로 결정했다고 가정해보겠습니다. 이때 자신의 길을 개척하려고 하기보다는 아마존,

구글, 페이스북, 트위터와 같은 다른 업체들이 방대한 양의 데이터를 어떻게 다루는지를 검토

하는 편이 도움이 될 것입니다. 이 기업들이 개척한 일련의 기술은

빅데이터

bigdata

로 브랜드화되

어 업계의 유행어가 되었지만 몇 가지 정의를 담고 있습니다. 빅데이터의 경계를 정의하는 한

가지 방법은 다음과 같은 ‘

’입니다.

●

볼륨

volume

: 이러한 맥락에서 볼륨은 보통 수십 억 또는 수조

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

클라우드 네이티브를 위한 데이터 센터 네트워크 구축: 데이터 센터 네트워킹을 위한 아키텍처, 프로토콜, 도구

정기훈, 디네시 G. 더트

스파크를 활용한 실시간 처리: 실시간 데이터 처리를 위한 고수준 스트리밍 API 마스터하기

김인범, 제러드 마스, 프랑수아 가릴로

데이터 과학을 위한 통계: 데이터 분석에서 머신러닝까지 50가지 핵심 개념

이준용, 피터 브루스, 앤드루 브루스

한 권으로 끝내는 Node & Express(2판): 모던 웹을 위한 서버 사이드 자바스크립트의 모든 것

한선용, 이선 브라운

Publisher Resources

ISBN: 9791162244074