
|
207
第八章:叢集維運
第八章
叢集維運
Hadoop
叢集需要適度的日常照護與餵食,才能維持健康與最佳的運作狀態。維運工作
通常是因應事件才執行的,如:擴充叢集硬體、處理故障或錯誤的任務、管理日誌檔,
或升級在商業運轉環境的軟體。本章是依「營運手冊型式(
run book form
)」撰寫,
內含常見的工作與處理這些情形的簡易流程。這不代表足以取代對系統的完整瞭解,
而且永遠記得要循正常的中止申請流程,特別是在處理儲存資料的系統或關鍵的服務
功能。
管理
Hadoop
的程序
由於修改設定檔或要執行較大型的流程,啟動、關閉或重新啟動
Hadoop
背景程式是常
見的。相依於選定的佈署模型與發行版(
distribution
),可以簡單地用標準的服務啟
動腳本(
service init sript
)或者特定的
Hadoop
腳本來達成。有些系統管理者可能會用
設定檔管理系統(
configuration management system
),如
Puppet
或
Chef
來管理這些
流程。
使用啟動腳本啟動與關閉程序
系統管理者重新啟動
Hadoop
程序最常見的理由是為了讓修改後的設定檔生效。其他理
由包括升級
Hadoop
、新增或移除工作節點,或者對突發事件做出反應。啟動或關閉某
個程序的影響,完全與該程序有關。啟動名稱節點(
NameNode
)會先載入
fsimage
、
重新播放交易日誌(
transaction log
)、看到資料節點回報的部份比例區塊(最小副本),
然後等候定義於
dfs.safemode.extension ...