Skip to Content
数据分析之图算法: 基于Spark和Neo4j
book

数据分析之图算法: 基于Spark和Neo4j

by Mark Needham, Amy E. Hodler
September 2020
Intermediate to advanced
213 pages
5h 25m
Chinese
Posts & Telecom Press
Content preview from 数据分析之图算法: 基于Spark和Neo4j
28
3
export SPARK_VERSION="spark-2.4.0-bin-hadoop2.7"
./${SPARK_VERSION}/bin/pyspark \
--driver-memory 2g \
--executor-memory 6g \
--packages graphframes:graphframes:0.7.0-spark2.4-s_2.11
撰写本书时,
Spark
的最新发布版本是
Spark-2.4.0-bin-hadoop2.7
,读者阅读本书时情况可
能会有变化。若是如此,请确保正确更改
SPARK_VERSION
环境变量。
尽管应该在计算机集群上执行
Spark
作业,但为了便于演示,我们仅在单机
上执行这些作业。
Bill Chambers
Matei Zaharia
所著的《
Spark
权威指南》
一书涵盖了在生产环境中运行
Spark
的更多内容。
现在,你已经做好在
Spark
上运行图算法的准备了。
3.2.3
 
Neo4j
图平台
Neo4j
图平台支持图数据的事务处理和分析处理。它提供了图存储与计算功能以及数据管
理与分析工具。该集成工具集位于常见协议、
API
和查询语言(
Cypher
)之上,针对不同
用途提供高效访问,如图
3-2
所示。
应用程序
开发人员
管理员 数据科学家
数据分析人员
数据集成
开发和管理 分析工具
图事务处理
数据
仓库
数据湖NoSQLRDBMS
图分析
驱动程序和 API 发现与可视化
业务用户
3-2Neo4j 图平台围绕支持事务处理应用与图分析的本地图数据库构建 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

大数据项目管理:从规划到实现

大数据项目管理:从规划到实现

Ted Malaska, Jonathan Seidman
Presto实战

Presto实战

Matt Fuller, Manfred Moser, Martin Traverso
精實企業|高績效組織如何達成創新規模化

精實企業|高績效組織如何達成創新規模化

Jez Humble, Joanne Molesky, Barry O'Reilly

Publisher Resources

ISBN: 9787115546678