第1章 HBase集群安装

本章内容:

  • 快速入门
  • Amazon EC2的安装及准备
  • Hadoop安装
  • ZooKeeper安装
  • 内核参数设置修改
  • HBase安装
  • Hadoop/ZooKeeper/HBase基本配置
  • 多个高可靠性(HA)主节点的安装

本章将介绍HBase集群的安装方法,首先将介绍基本的单机运行模式的HBase实例的安装方法,然后介绍如何在Amazon EC2上安装完全分布式运行的高可靠性HBase集群。

根据Apache HBase主页上的定义:

HBase是Hadoop上的数据库。它适合在需要对大数据进行随机且实时读写的情况下使用。其目标是在基于商品化硬件构建的集群之上存储那些非常大的表——比如那些有数百万个字段和数十亿条记录的大表。

HBase可以在任何文件系统上运行。比如说,无论是在EXT4本地文件系统、Amazon S3(Amazon Simple Storage Service),还是Hadoop分布式文件系统(HDFS)上,都可以运行HBase。 HDFS是Hadoop首选的分布式文件系统,因此大多数完全分布式的HBase集群都运行在HDFS文件系统上,所以我们将首先介绍一下如何安装Hadoop。

Apache ZooKeeper是一个开源软件,它能够提供一种具有高可靠性的分布式的协调服务。分布式的HBase需要运行一个ZooKeeper集群。

作为一种运行在Hadoop上的数据库,HBase需要同时打开很多个文件。 为了使HBase能够顺畅运行,我们需要修改一些Linux内核参数的设置。

一个完全分布式的HBase集群都有一个或多个主节点(HMaster)和许多从节点(RegionServer),其中主节点用于协调整个集群,从节点用于处理实际的数据存储和要求。图1-1显示的是一个典型的HBase集群结构。 ...

Get HBase管理指南 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.