Book description
하둡 프로젝트의 커미터이자 핵심 설계자인 톰 화이트가 집필한 이 책은 하둡 창시자인 더그 커팅을 비롯한 프로젝트별 전문가의 강력한 조언이 충실하게 반영되어 오랫동안 하둡 개발자의 바이블로서 자리를 지켜왔다. 이번 4판에서는 하둡 2.0 기반 YARN, 파케이, 플룸, 크런치, 스파크 프로젝트 예제와 헬스케어 시스템과 유전체 분석 사례가 새로이 추가되었다. 최신 하둡 정보는 물론이고 하둡과 연동하는 아파치 하둡 프로젝트의 서브 프로젝트인 피그, 주키퍼, HBase, 하이브, 스쿱, 에이브 등에 대해서도 다루기 때문에 하둡에 대한 전반적인 지식을 얻을 수 있다. 이 책은 대규모 데이터셋을 분석하는 개발자와 하둡 클러스터를 구축하고 사용하는 시스템 관리자를 위한 최고의 지침서가 될 것이다.
Table of contents
- 하둡 완벽 가이드
-
Part I 하둡 기초
- CHAPTER 1 하둡과의 만남
- CHAPTER 2 맵리듀스
- CHAPTER 3 하둡 분산 파일시스템
- CHAPTER 4 YARN
- CHAPTER 5 하둡 I/O
-
Part II 맵리듀스
- CHAPTER 6 맵리듀스 프로그래밍
- CHAPTER 7 맵리듀스 작동 방법
- CHAPTER 8 맵리듀스 타입과 포맷
- CHAPTER 9 맵리듀스 기능
- Part III 하둡 운영
-
Part IV 관련 프로젝트
- CHAPTER 12 에이브로
- CHAPTER 13 파케이
- CHAPTER 14 플룸
- CHAPTER 15 스쿱
- CHAPTER 16 피그
- CHAPTER 17 하이브
- CHAPTER 18 크런치
- CHAPTER 19 스파크
- CHAPTER 20 HBase
- CHAPTER 21 주키퍼
- Part V 사례 연구
- 부록 A (1/2)
- 부록 A (2/2)
- 부록 B
- 부록 C
- 부록 D
- 찾아보기 (1/3)
- 찾아보기 (2/3)
- 찾아보기 (3/3)
Product information
- Title: 하둡 완벽 가이드(4판): 데이터의 숨겨진 힘을 끌어내는 최고의 클라우드 컴퓨팅 기술
- Author(s):
- Release date: May 2017
- Publisher(s): Hanbit Media, Inc.
- ISBN: 9788968484599
You might also like
book
머신러닝을 위한 실전 데이터셋: 개인 정보를 보호하고 머신러닝 학습에 사용할 합성 데이터 만들기
머신러닝 모델을 구축하고, 테스트를 진행하려면 크고 다양한 종류의 데이터가 필요하다. 그러나 대부분의 데이터셋은 개인 정보 문제로 …
book
코드로 인프라 관리하기: 효율적인 인프라 관리를 위한 자동화 방법
『코드로 인프라 관리하기』는 시스템 관리자가 자동으로 플랫폼을 통제하는 ‘코드로서의 인프라’를 세 부분으로 나눠 소개하는 안내서다. 1부에서는 …
book
컨테이너 보안: 컨테이너화된 응용 프로그램의 보안을 위한 개념, 이론, 대응법과 모범 관행까지
컨테이너 환경에 특화된 보안 문제를 다루는 실무 지침서다. 컨테이너를 배치하고 실행하는 단계마다 어떤 일이 일어나며, 발생할 …
book
머신러닝 디자인 패턴: 효율적인 머신러닝 파이프라인과 MLOps를 구축하는 30가지 디자인 패턴
디자인 패턴이란 전문가 수백 명의 경험을 간단하고 접근하기 쉽게 체계화한 것이다. 이 책에는 데이터의 표현, 운영, …