Skip to Content
Neo4j:权威指南
book

Neo4j:权威指南

by Luanne Misquitta, Christophe Willemsen
July 2025
Beginner to intermediate
410 pages
5h 15m
Chinese
O'Reilly Media, Inc.
Content preview from Neo4j:权威指南

第 12 章 实用图表数据科学

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

ElectricHarmony 处于创新的前沿。数据科学团队一直热衷于探索新技术,现在他们面临着一个挑战:如何为用户提供更加个性化和更具吸引力的体验?尽管他们拥有先进的分析和机器学习能力,但他们意识到自己还缺少一个关键因素--了解数据中的复杂关系。

请进入 Neo4j 中的图形数据科学(GDS)库 。与传统的数据科学方法不同,GDS 提供了一种强大的方法来建模和分析实体之间错综复杂的联系,从而获得更深入的见解和更有效的解决方案。ElectricHarmony 团队认识到图的潜力,决定深入这一令人兴奋的领域。在本章中,我们将跟随他们利用图的力量彻底改变其服务的历程。我们将介绍 GDS 的一般概念,并演示如何使用它来发现隐藏的模式和洞察力。

该团队的主要目标之一是通过社区检测了解用户行为的自然分组,从而提高用户参与度。他们不是从预定义的流派或标签出发,而是利用算法发现具有相似收听习惯的用户群组。这种洞察力使协作播放列表和有针对性的推荐等功能得以实现,这些功能反映了真实的用户偏好,而不是编辑的假设。通过将音乐内容与用户行为更紧密地结合在一起,该团队为听众创造了更相关、更愉快的体验。

在本章中,我们将制定一个使用 Neo4j 创建 GDS 管道的有效流程。我们将重点讨论如何迭代建立和完善这些管道,以分析 ElectricHarmony 音乐流媒体平台中的复杂网络。通过学习如何实施社区检测算法并评估其结果,您将获得在数据中发现有意义的模式所需的技能。这种迭代器将使您能够不断改进您的模型,从而实现更准确的内容推荐和增强的用户参与策略。

是时候提升您的数据科学水平,让您的数据为您服务了。欢迎来到令人兴奋的图形驱动洞察世界!

图形数据科学库简介

Neo4j GDS 库提供高性能、并行的基本图算法实现,可通过 Cypher 程序访问。除算法外,GDS 还具有 ML 管道,旨在训练预测监督模型,从而为以图为中心的挑战(如预测缺失关系)提供解决方案。

算法

图算法 计算图、节点或关系的度量,提供对关键实体(如中心性和排名)和底层结构(如通过社区检测、图分割和聚类的社区)的见解。

这些算法通常采用迭代器,通常使用随机行走、广度优先搜索、深度优先搜索、模式匹配、图嵌入和寻路等技术遍历图。由于随着图距离的增长,可能的路径会呈指数增长,因此许多图算法的计算复杂度都很高。

幸运的是,你可以使用优化算法,这些算法可以利用特定的图结构,记忆已探索的部分,并将操作并行化。只要可行,这些优化算法都会被纳入 GDS。Neo4j GDS 库包含这些算法的综合集合,详情请参见Neo4j 文档

图形目录

为了最大限度地提高 算法的效率,GDS 使用了一种专门的图形格式,这种格式结构紧凑,便于并行处理。这需要将 Neo4j 数据库中的图形数据子集加载到内存图形目录中。通过使用图投影(),可以根据节点标签、关系类型和其他条件进行过滤,从而控制加载的数据量。

使用 GDS 时,您通常会采用相同的流程(如图 12-1 所示)。首先,您将读取数据库中存储的相关数据部分,并将其作为命名图形加载到图形目录的内存中。然后,在命名图形上运行所选算法,并返回算法结果。您还可以选择将这些结果写回数据库。

图 12-1. 基本的 GDS 工作流程

人工智能驱动的播放列表社区

在 ElectricHarmony 的音乐流媒体平台中,播放列表 与单个曲目相连,形成了丰富而复杂的用户偏好和音乐关系图。利用 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

基于scikit-learn和PyTorch的实践机器学习

基于scikit-learn和PyTorch的实践机器学习

Aurélien Géron
企业级Java开发中的应用人工智能 (Chinese Edition)

企业级Java开发中的应用人工智能 (Chinese Edition)

Alex Soto Bueno, Markus Eisele, Natale Vinto

Publisher Resources

ISBN: 9798341664852