Skip to Main Content
Hadoop数据分析
book

Hadoop数据分析

by Benjamin Bengfort, Jenny Kim
April 2018
Intermediate to advanced content levelIntermediate to advanced
229 pages
6h 19m
Chinese
Posts & Telecom Press
Content preview from Hadoop数据分析
附录B
安装
Hadoop
生态系统产品
除了
Hadoop
提供的核心功能之外,本书也涵盖了构建于
Hadoop
之上的其他
Hadoop
生态
系统项目。在典型设置中,这些产品通常要么安装在运行
Hadoop
YARN
的集群上,要
么通过配置连接到
Hadoop
集群。本书假设你已经在单个节点上设置和配置了伪分布式模
式的
Apache Hadoop
。然而,要运行单节点
Hadoop
集群和
Hadoop
生态系统产品,还有其
他几个选择,本书也将对此进行讨论。
B.1
 打包的
Hadoop
发行版
要运行
Hadoop
单机配置,最简单的方法是安装一款由主流
Hadoop
厂商提供的虚拟化
Hadoop
发行版,比如
Cloudera
Quickstart VM
ttp://bit.ly/1YWtzPC
)、
Hortonworks Sandbox
http://bit.ly/1YWtyLy
)和
MapR
Hadoop
沙箱(
http://bit.ly/1YWtz27
)。除了一个单节点
Hadoop
集群之外,这些虚拟机还包含流行的
Apache Hadoop
生态系统项目以及专有的应用
程序和工具,它们都在一个简单的完整包(
turn-key bundle
)里。你可以使用喜欢的虚拟化
软件,如
VMWare Player
https://www.vmware.com/products/player
)或
Virtualbox
https://
www.virtualbox.org/wiki/Downloads
)来运行这些虚拟机。
B.2
 自己安装
Apache Hadoop ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Kudu:构建高性能实时数据分析存储系统

Kudu:构建高性能实时数据分析存储系统

Jean-Marc Spaggiari, Mladen Kovacevic, Brock Noland, Ryan Bosshart
Java并发编程实战

Java并发编程实战

Brian Goetz, Tim Peierls
面向机器学习的自然语言标注

面向机器学习的自然语言标注

James Pustejovsky, Amber Stubbs

Publisher Resources

ISBN: 9787115479648