Skip to Content
数据分析之图算法: 基于Spark和Neo4j
book

数据分析之图算法: 基于Spark和Neo4j

by Mark Needham, Amy E. Hodler
September 2020
Intermediate to advanced
213 pages
5h 25m
Chinese
Posts & Telecom Press
Content preview from 数据分析之图算法: 基于Spark和Neo4j
社团发现算法
113
label libraries
11 [pytz, matplotlib, spacy, six, pandas, numpy, python-dateutil]
10 [nbconvert, jpy-client, jpy-core]
6 [jupyter, jpy-console, ipykernel]
4 [pyspark, py4j]
簇的数量从
6
减少到
4
,现在图中
matplotlib
部分的所有节点都被分到一组了,如图
6-10
所示。
6-10:当忽略关系方向时,通过标签传播算法发现簇
虽然在该数据之上运行标签传播算法时,无向图和有向图的计算结果相似,但是在复杂图上,
差异会更显著。这是因为忽略方向会导致节点尝试采用更多标签,而不考虑关系的来源。
6.6
 
Louvain
模块度算法
Louvain
模块度算法在将节点分配到不同群组时,通过比较社团密度来查找簇。可以将其
视为一种假设分析,尝试多种分组方式以达到全局最优。
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

大数据项目管理:从规划到实现

大数据项目管理:从规划到实现

Ted Malaska, Jonathan Seidman
Presto实战

Presto实战

Matt Fuller, Manfred Moser, Martin Traverso
精實企業|高績效組織如何達成創新規模化

精實企業|高績效組織如何達成創新規模化

Jez Humble, Joanne Molesky, Barry O'Reilly

Publisher Resources

ISBN: 9787115546678