Skip to Content
数据分析之图算法: 基于Spark和Neo4j
book

数据分析之图算法: 基于Spark和Neo4j

by Mark Needham, Amy E. Hodler
September 2020
Intermediate to advanced
213 pages
5h 25m
Chinese
Posts & Telecom Press
Content preview from 数据分析之图算法: 基于Spark和Neo4j
使用图算法增强机器学习
181
1.
从节点
0
开始,由于
commonAuthors
数大于
1.5
,因此沿着
False
分支到达节点
2
2.
这里的
commonAuthors
数大于
2.5
,因此沿着
False
分支到达节点
6
3.
prefAttachment
得分低于
15.5
,这样就到达节点
9
4.
节点
9
是该决策树中的一个叶节点,这意味着不需要检查其他任何条件——该节点的
Prediction
值(
True
)就是决策树的预测结果。
5.
最后,随机森林针对整个决策树集合求解待预测项,并基于最广泛接受的结果做出预测。
下面添加更多图特征进行研究。
8.3.8
 预测链接
三角形和聚类系数
推荐解决方案通常基于某种形式的三角形度量指标进行预测,下面看看这些指标是否对本
例有更多帮助。执行以下查询来计算经过节点的三角形数量及其聚类系数:
CALL algo.triangleCount('Author', 'CO_AUTHOR_EARLY', { write:true,
writeProperty:'trianglesTrain', clusteringCoefficientProperty:
'coefficientTrain'});
CALL algo.triangleCount('Author', 'CO_AUTHOR', { write:true,
writeProperty:'trianglesTest', clusteringCoefficientProperty:
'coefficientTest'}); ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

大数据项目管理:从规划到实现

大数据项目管理:从规划到实现

Ted Malaska, Jonathan Seidman
Presto实战

Presto实战

Matt Fuller, Manfred Moser, Martin Traverso
精實企業|高績效組織如何達成創新規模化

精實企業|高績效組織如何達成創新規模化

Jez Humble, Joanne Molesky, Barry O'Reilly

Publisher Resources

ISBN: 9787115546678