book

图数据实战：用图思维和图技术解决复杂问题

Name: 图数据实战：用图思维和图技术解决复杂问题
ISBN: 9787111736288

by Denise Koessler Gosnell, Matthias Broecheler

March 2024

Beginner to intermediate

351 pages

7h 37m

Chinese

China Machine Press

Read now

Unlock full access

1.3 制定技术决策解决复杂问题 (1/2)
1.3 制定技术决策解决复杂问题 (2/2)
1.4 开启你的图思维旅程
第2章从关系思维进化到图思维
2.1 本章预览：将关系概念转化为图术语
2.2 关系和图：差异在哪里
2.3 关系型数据建模
2.4 图数据中的概念
2.5 图结构语言 (1/2)
2.5 图结构语言 (2/2)
2.6 确定是关系型还是图
2.7 总结
第3章入门：简单的C360视图
3.1 本章预览：关系型技术和图技术
3.2 图数据的基本用例：C360
3.3 在关系型系统中实施C360应用程序 (1/2)
3.3 在关系型系统中实施C360应用程序 (2/2)
3.4 在图系统中实现C360应用程序 (1/3)
3.4 在图系统中实现C360应用程序 (2/3)
3.4 在图系统中实现C360应用程序 (3/3)
3.5 关系型与图：如何选择
3.6 总结
第4章在开发环境中探索邻接点
4.1 本章预览：构建一个更现实的C360
4.2 图数据建模101 (1/3)
4.2 图数据建模101 (2/3)
4.2 图数据建模101 (3/3)
4.3 在开发环境中探索邻接点的实现细节
4.4 Gremlin基础导航 (1/2)
4.4 Gremlin基础导航 (2/2)
4.5 高级Gremlin：构造查询结果 (1/2)
4.5 高级Gremlin：构造查询结果 (2/2)
4.6 从开发到生产
第5章在生产环境中探索邻接点
5.1 本章预览：学习Apache Cassandra的分布式图数据
5.2 使用Apache Cassandra处理图数据 (1/3)
5.2 使用Apache Cassandra处理图数据 (2/3)
5.2 使用Apache Cassandra处理图数据 (3/3)
5.3 图数据建模201
5.4 生产环境的实现细节 (1/2)
5.4 生产环境的实现细节 (2/2)
5.5 更复杂的分布式图问题
第6章在开发环境中使用树
6.1 本章预览：导航树、分层数据和循环6.2 分层和嵌套数据
6.3 在纷繁的术语中找到出路
6.4 通过传感器数据学习层次结构 (1/2)
6.4 通过传感器数据学习层次结构 (2/2)
6.5 开发环境中从叶子节点到根节点的查询 (1/2)
6.5 开发环境中从叶子节点到根节点的查询 (2/2)
6.6 开发环境中从根节点到叶子节点的查询
6.7 回到过去
第7章在生产环境中使用树
7.1 本章预览：分支系数、深度和边上的时间属性
7.2 传感器数据中的时间 (1/2)
7.2 传感器数据中的时间 (2/2)
7.3 示例中的分支系数
7.4 传感器数据的生产结构
7.5 生产环境中从叶子节点到根节点的查询 (1/2)
7.5 生产环境中从叶子节点到根节点的查询 (2/2)
7.6 生产环境中从根节点到叶子节点的查询
7.7 在通信塔故障的场景中应用查询
7.8 以小见大
第8章开发环境中的路径查找
8.1 本章预览：量化网络中的信任
8.2 关于信任的三个例子
8.3 路径的基本概念
8.4 信任网络中的路径查找
8.5 用比特币信任网络理解遍历
8.6 最短路径查询 (1/3)
8.6 最短路径查询 (2/3)
8.6 最短路径查询 (3/3)
第9章生产环境中的路径查找
9.1 本章预览：权重、距离和剪枝
9.2 加权路径和搜索算法
9.3 最短路径问题的边权重归一化 (1/2)
9.3 最短路径问题的边权重归一化 (2/2)
9.4 最短加权路径查询 (1/2)
9.4 最短加权路径查询 (2/2)
9.5 生产环境中的加权路径和信任
第10章开发环境中的推荐
10.1 本章预览：电影推荐的协同过滤
10.2 推荐系统示例
10.3 协同过滤导论 (1/2)
10.3 协同过滤导论 (2/2)
10.4 电影数据：结构、加载和查询 (1/3)
10.4 电影数据：结构、加载和查询 (2/3)
10.4 电影数据：结构、加载和查询 (3/3)
10.5 Gremlin中基于条目的协同过滤 (1/2)
10.5 Gremlin中基于条目的协同过滤 (2/2)
第11章图中的简单实体解析
11.1 本章预览：合并多个数据集到一个图
11.2 定义一个不同的复杂问题：实体解析
11.3 分析两个电影数据集 (1/2)
11.3 分析两个电影数据集 (2/2)
11.4 匹配和合并电影数据
11.5 解决假阳性 (1/2)
11.5 解决假阳性 (2/2)
第12章生产环境中的推荐
12.1 本章预览：快捷边、预计算和高级修剪技术
12.2 实时推荐的快捷边
12.3 计算我们的电影数据的快捷边 (1/2)
12.3 计算我们的电影数据的快捷边 (2/2)
12.4 电影推荐的生产结构和数据加载
12.5 带有快捷边的推荐查询 (1/2)
12.5 带有快捷边的推荐查询 (2/2)
第13章结语
13.1 何去何从
13.2 保持联系
关于作者
关于封面

Content preview from 图数据实战：用图思维和图技术解决复杂问题

292

第

章

在

11.4

节中，我们将逐步介绍合并过程。我们希望你对我们的方法论部分有正确的期

望：两个数据源所需的匹配和合并类型不需要图结构来进行实体解析。我们希望本节中

的细节能帮助你了解原因。

在

11.5

节中，我们将深入研究在合并过程中发现的错误，并介绍数据中假阳性和真阴性

之间的区别。我们还将简要介绍一些误用图结构来解析数据中的实体的常见问题。我们

将展示几个例子，其中图结构增强了实体解析流程。

我们本章的最终目标有两个。

本章的第一个目标是展示合并数据的实际情况。警告：这个过程并不迷人。合并数据集

是一项烦琐的工作，经常被忽视，尽管它是创建图模型的常见第一步。

本章的第二个目标是让你了解整个问题域。因为合并数据是创建图数据库最常见的第一

步之一，所以我们希望这些信息能够帮助你理解解决这个复杂问题所需的所有工具。提

示：你最有可能使用的大多数（如果不是全部）实体解析技术都不需要图结构来确定谁

是谁。

11.2

定义一个不同的复杂问题：实体解析

两个数据源之间的匹配和合并过程的主要工作是一个称为实体解析的庞大问题域。非正

式地说，实体解析的复杂问题旨在解决不同数据源中谁是谁或什么是什么的问题。

Jon Smith

和

John Smith

是同一个人吗

或者在我们的电影数据中，来自

MovieLens

的

电影

Das Versprechen

和来自

Kaggle

的电影

The Promise

是同一个吗？

然而，在大多数传统情况下，链接身份的唯一用户标识符可能无法使用，原因有很多：

外部源数据的使用、用户隐私限制导致的数据不可用，或者不一致的数据。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9787111736288

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

图数据实战：用图思维和图技术解决复杂问题

by Denise Koessler Gosnell, Matthias Broecheler

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.