第6章 维护和安全

本章内容:

  • 启用HBase RPC的DEBUG级日志功能
  • 平稳节点停机
  • 给集群增加节点
  • 滚动重启
  • 管理HBase进程的简单脚本
  • 简化部署的简单脚本
  • 对Hadoop和HBase使用Kerberos身份认证
  • 配置HDFS使用Kerberos安全保护机制
  • HBase的安全保护配置

从集群交付使用开始,只要集群还在使用之中,维护就将是一项需要持续进行的必备工作。其中典型的维护任务有:发现和纠正错误、改变集群规模、对配置进行修改等。

HBase最重要的特性之一就是它可以非常容易地实现规模的上下伸缩。随着服务和数据的不断增长,你可能经常需要在集群中增加一些节点。

平稳的节点停机和滚动重启也十分必要。最大限度地减少停机和重启期间的离线时间是一项重要的任务。最重要的是能让数据分布情况与重启之前保持一致,从而保持数据的局部化。

另一项维护工作是管理HBase的部署。将HBase部署到集群的方法有很多种。最简单的方法是使用基于脚本的方法来在不同集群之间同步HBase的安装和配置。

本章的6.1~6.7节将讨论这些话题。

本章还会探讨一下安全机制。随着HBase的日益流行,不同用户和用户组也会在其共享的HBase集群中存储越来越多的数据。你可能并不想让所有用户都对每一张HBase表拥有全部权限。因为这样会给你的数据带来更多的风险,比如安全风险或数据误操作的风险。你需要对用户的身份进行验证,然后再根据用户的身份控制其对HBase表的访问权限。

在Hadoop 0.20.203版之前,Hadoop没有包含一种可用来验证用户身份的机制。Hadoop使用用户当前登录账号作为Hadoop用户名(即相当于whoami)。HDFS本身并不验证该用户名是否真实,是否属于实际的操作者。 ...

Get HBase管理指南 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.