第9章 高级配置和调整

本章内容:

  • 使用YCSB对HBase集群进行基准测试
  • 增加区域服务器的处理线程数
  • 使用自定义算法预创建区域
  • 避免写密集集群中的更新阻塞
  • 调整MemStore内存大小
  • 低延迟系统的客户端调节
  • 配置列族的块缓存
  • 调高读密集集群的块缓存大小
  • 客户端扫描设置
  • 调整块大小以提高寻道性能
  • 启用Bloom过滤器来提高整体吞吐量

这是另一个关于性能优化的章节。在第8章“基本性能调整”中,我们介绍了一些通过调整Hadoop、操作系统设置、Java和HBase本身来改进HBase集群的整体性能的方法。这是一些可适用于很多场合的一般性改进方法。本章将介绍一些更具针对性的调优方法,其中有些适用于写密集的集群,而另一些则以提高集群的读性能为目的。

在对HBase集群进行调整之前,你需要先知道它的性能如何。因此,本章将首先介绍如何使用Yahoo! Cloud Serving BenchmarkYCSB雅虎云服务基准)来测量HBase集群的性能(基准性能测试)。

第2章的“2.5 在将数据移入HBase之前预创建区域”一节曾经介绍过如何使用HBase中的RegionSplitter实用工具来在创建表时预创建一些区域以提高数据加载速度。然而RegionSplitter预创建区域时默认使用的是MD5数字型边界,而对于那些行键不能表示为MD5数字的情形,我们需要使用一些其他的分割算法。本章将介绍一种方法让你在预创建区域时可根据自己的意愿指定边界。

HBase集群基本上可按负载类型分为两类:写密集的集群和读密集的集群。每种类型的调优选项不同。许多调优方案都需要在写性能和读性能之间作出权衡。我们将介绍几种调整HBase集群以获得更好写入性能的方法,同时我们也将介绍几种调整读密集HBase集群的方法。这些方法包括服务器端配置、客户端设置和表模式选择。 ...

Get HBase管理指南 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.