第13章 图形与生成式人工智能的未来
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
人工智能的发展日新月异。毫无疑问,当你拿到这本书时,该领域已经取得了长足的进步。在这最后一章中,你将了解到图形为何如此与众不同,以及 Neo4j 是如何利用GenAI 这一最有前途的创新前沿之一的。
2022 年,当 ChatGPT 戏剧性地登场时,它吸引了全世界的想象力。它主要用于回答问题,但很快就发展到文本摘要和图像生成。很快,人们就发现,GenAI 模型擅长内容创建和模式识别,但在事实准确性方面却很吃力,结果往往不可靠。当LLMs 生成内容时,它们会根据在训练过程中学到的统计模式预测接下来应该出现的内容。但是,由于没有接受过更多最新或相关信息的训练,他们往往会产生幻觉,生成一些自信的 "事实",而这些 "事实 "并不总是可信的。对于任何非琐碎的业务领域来说,这种现象都是令人担忧的。
检索增强生成(RAG)架构,确保LLM的响应基于事实并来自各种知识来源,从而提高了GenAI系统的可靠性。知识图谱代表现实世界中的实体以及它们之间存在的复杂关系。通过将知识图谱作为事实来源,LLMs 可以做出更少偏差、更准确的回应。
GenAI 的兴起让知识图谱再次成为关注的焦点,同时也创造了某种共生关系。知识图谱为 LLMs 提供了事实信息的基础,而 LLMs 则有助于大幅减少从非结构化文本中创建知识图谱所需的时间和精力。
在这最后一章中,你将清楚地了解知识图谱到底是什么、在哪里使用、为什么知识图谱是 GraphRAG 的基石,以及 LLMs 在加快从非结构化数据创建知识图谱方面可以发挥的作用。本章不涉及具体的工具和框架,因为到本书付梓时,这些工具和框架几乎肯定会被新的工具和框架取代。要了解该领域的最新进展,可以访问Neo4j for GenAI页面。与你现在已经习惯的核心领域一样,你将通过 GenAI 把 ElectricHarmony 带入 3000 年,但你也将拓展视野,探索其他领域如何从知识图谱中获益。
知识图谱
知识图谱捕捉现实世界实体及其关系的知识,通常存储在 Neo4j 等图数据库中。知识图谱包含某种形式的组织原则:规定如何组织节点和关系的框架。它可以像模式一样简单,也可以包括分类法和本体论,复杂程度足以支持推理引擎。
分类法 主要是一个分类系统。它根据某些属性或特征将实体归为不同类别,并对这些类别进行分级组织。分类法通常意味着IS-A 或SUBCLASS-OF 关系。
你可能熟悉的最早的分类法之一是生物学,这实际上也是该术语的起源。生物被分为领域、王国、门、纲、目、科、属和种。有了这种分类法,就可以推断出生物的特征。例如,本书封面上的丝纹食蚁兽(Cyclopes didactylus)属于食蚁兽科(Cyclopedidae)。 该科隶属于异齿胎盘哺乳动物纲(Pilosa),这已经暗示了食蚁兽是哺乳动物的一种特殊类型。
您能猜出 ElectricHarmony 的分类法吗?鉴于其分类和类别,一个显而易见的分类是流派。音乐流派种类繁多,范围广泛,但简单的部分分类法可以如图 13-1 所示。
图 13-1. 音乐流派的部分分类法
本体是一种组织原则,是概念及其关联方式的正式规范,通常代表一个语义网络。维护本体可能很复杂,通常需要使用一些框架、工具和语言,如网络本体语言(OWL)。本体比分层分类法更丰富,可以捕捉行为或约束的上下文和规则。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access