Skip to Content
数据分析之图算法: 基于Spark和Neo4j
book

数据分析之图算法: 基于Spark和Neo4j

by Mark Needham, Amy E. Hodler
September 2020
Intermediate to advanced
213 pages
5h 25m
Chinese
Posts & Telecom Press
Content preview from 数据分析之图算法: 基于Spark和Neo4j
1
1
导论
图是计算机科学的一大主题,可用于抽象表示交通运输系统、人际交往网络和电
信网络。对于训练有素的程序员而言,能够用一种形式来对不同的结构建模是强
大的力量之源。
——《算法设计指南》
Steven S. Skiena
,石溪大学计算机科学杰出授课教授
当今紧迫的数据挑战在于厘清关系,而不仅仅是对离散数据制表。图技术及其分析方法为
用于研究、社会活动和商业解决方案的关联数据提供了强大的工具,举例如下:
对金融市场、信息技术服务等多种动态环境建模;
预测传染病的传播以及由此引发的服务延迟和中断;
查找用于机器学习的预测性特征,以打击金融犯罪;
发现针对个性化体验和推荐的模式。
随着数据之间的关联度日益增强,系统也越来越复杂,利用数据中丰富且不断演进的关系
变得非常重要。
本章将介绍图分析和图算法。在介绍图算法和解释图数据库与图处理之间的区别之前,首
先简要回顾图的起源。本章将探究现代数据的本质,揭示为何联系所含的信息要比用基本
统计方法发现的信息复杂得多,最后还会研究一些图分析用例。
1.1
 何谓图
图的历史可以追溯到
1736
年,即欧拉解决“哥尼斯堡七桥”问题的那一年。“哥尼斯堡七
2
1
桥”问题是指,能否参观哥尼斯堡市里由
7
座桥连接的
4
个区域,而且每座桥只允许经过
一次。实际上这是不可能做到的。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

大数据项目管理:从规划到实现

大数据项目管理:从规划到实现

Ted Malaska, Jonathan Seidman
Presto实战

Presto实战

Matt Fuller, Manfred Moser, Martin Traverso
精實企業|高績效組織如何達成創新規模化

精實企業|高績效組織如何達成創新規模化

Jez Humble, Joanne Molesky, Barry O'Reilly

Publisher Resources

ISBN: 9787115546678