Skip to Main Content
Hadoop数据分析
book

Hadoop数据分析

by Benjamin Bengfort, Jenny Kim
April 2018
Intermediate to advanced content levelIntermediate to advanced
229 pages
6h 19m
Chinese
Posts & Telecom Press
Content preview from Hadoop数据分析
附录A
创建
Hadoop
伪分布式开发环境
为了执行本书中的代码,你需要设置开发环境。
Hadoop
开发人员通常在
伪分布式环境
(也
被称为
单个节点设置
)上测试其脚本和代码,该虚拟机在单个机器上同时运行所有
Hadoop
守护进程。
如下指导将帮助你在
Ubuntu 14.04
上使用
Hadoop 2.5.0
安装一个伪分布式环境。
A.1
 快速上手
如果你不熟悉
Linux
系统管理,或者不想自己去安装
Hadoop
,那么有几个选择。我们提供
了一个
VMDK
,供你在选中的虚拟化软件(如
VirtualBox
VMWare Fusion
)中使用;此
外,
Hortonworks
Cloudera
都提供了可快速下载的虚拟机。
若想快速安装,只需下载虚拟机并在你最喜欢的虚拟化软件中运行它。请注意,如果你使
Cloudera
Hortonworks
的发行版,那么可能与我们使用的环境略有不同。要完成所有
设置,请下载预先配置好的机器或按照如下所述步骤进行。
如果你使用了我们提供的
VMDK
,请使用以下用户名和密码登录机器:
username: student
password: password
如果你有信心自己设置环境,那么请继续看下一节!
A.2
 设置
Linux
环境
在开始安装
Hadoop
之前,你需要配置一个可以使用的
Linux
环境。下面的指导假设你能
在你选的机器上安装
Ubuntu 14.04
发行版——要么选择双引导配置,要么选择虚拟机。你
176
创建
Hadoop
伪分布式开发环境
177
可以凭喜好选择使用
Ubuntu
服务器版还是
Ubuntu ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Kudu:构建高性能实时数据分析存储系统

Kudu:构建高性能实时数据分析存储系统

Jean-Marc Spaggiari, Mladen Kovacevic, Brock Noland, Ryan Bosshart
Java并发编程实战

Java并发编程实战

Brian Goetz, Tim Peierls
面向机器学习的自然语言标注

面向机器学习的自然语言标注

James Pustejovsky, Amber Stubbs

Publisher Resources

ISBN: 9787115479648