Skip to Content
数据分析之图算法: 基于Spark和Neo4j
book

数据分析之图算法: 基于Spark和Neo4j

by Mark Needham, Amy E. Hodler
September 2020
Intermediate to advanced
213 pages
5h 25m
Chinese
Posts & Telecom Press
Content preview from 数据分析之图算法: 基于Spark和Neo4j
70
5
Mark 3 1 2
David 2 1 1
Amy 1 1 0
James 1 0 1
5-4
显示,
Doug
是该图中最受欢迎的用户,他有
5
个粉丝(入连接)。图中这部分的所
有用户都关注他,而他只关注一个人。在真实的
Twitter
网络中,名人的粉丝数量众多,但
他们关注的人往往很少,因此可以认为
Doug
是名人。
5-4:度中心性的可视化
如果要创建一个显示最受关注用户的网页,或者想推荐可关注的人,就可以使用该算法来
识别这些人。
有些数据可能包含关系非常稠密(有大量关系)的节点。这并不会增加太多
额外信息,但是会扭曲一些结果或增加计算复杂度。应该通过子图过滤这些
稠密的关系,或者采用投影方法汇总关系权重。
5.3
 接近中心性算法
接近中心性算法用于发现可通过子图高效传播信息的节点。
衡量节点中心性的指标是其到其他各节点的平均距离(反距离)。接近中心性得分高的节
点与其他各节点的距离最短。
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

大数据项目管理:从规划到实现

大数据项目管理:从规划到实现

Ted Malaska, Jonathan Seidman
Presto实战

Presto实战

Matt Fuller, Manfred Moser, Martin Traverso
精實企業|高績效組織如何達成創新規模化

精實企業|高績效組織如何達成創新規模化

Jez Humble, Joanne Molesky, Barry O'Reilly

Publisher Resources

ISBN: 9787115546678