序言
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
知识图谱、本体论、分类法和其他类型的语义数据模型已在数据和人工智能(AI)领域开发和使用了几十年。它们的使用以明确和可共享的方式捕捉数据的意义,提高了数据驱动型应用的效率。在过去的十年中,此类模型的普及率尤其高。例如,市场情报公司 Gartner 将知识图谱纳入了其 2018 年新兴技术炒作周期;亚马逊、LinkedIn、BBC 和 IBM 等多家知名机构一直在其产品和服务中开发和使用语义数据模型。
这一趋势的背后有两大驱动力:
-
数据丰富的企业越来越意识到,仅仅拥有海量数据是不够的。为了从中获取价值,您实际上需要这些数据干净、一致、相互关联并具有清晰的语义。这样,数据科学家和业务分析师才能专注于他们最擅长的领域:从中提取有用的见解。语义数据建模正是为了应对这一挑战。
-
人工智能应用的开发者和提供商日益认识到,机器学习和统计推理技术并不总是足以构建他们所需的智能行为;用明确的符号知识对其进行补充可能是必要和有益的。语义数据建模正是以构建和提供此类知识为重点。
目前有多种语言、方法论、平台和工具可用于构建语义模型,它们来自不同的社区,侧重于模型的不同方面(如表示、推理、存储、查询等)。然而,指定、开发、投入使用和发展语义模型的总体任务并不像人们想象的那么简单,尤其是当模型的范围和规模不断扩大时。原因在于,人类的语言和思维充满了模棱两可、含糊不清、不精确等现象,这使得数据语义的正式和普遍接受的表述成为一项相当困难的任务。
本书向你展示了语义数据建模的内涵,以及作为语义模型的创建者或使用者必须面对的挑战。更重要的是,它为您提供了如何避免危险(陷阱)和克服障碍(困境)的具体建议。本书教给您一些基本而持久的语义建模原则,无论您使用哪种特定的框架或技术,这些原则都是正确的,并向您展示如何将这些原则应用到您的具体环境中。
阅读本书后,您将能够批判性地评估和更好地利用现有的语义模型和技术,做出明智的决策,并提高所构建模型的质量和可用性。
谁应该阅读这本书
本书面向在日常工作中开发或使用数据语义表示的数据从业人员(知识工程师、信息架构师、数据工程师、数据科学家等),对他们来说,数据意义的明确性、准确性和通俗易懂性是其工作的一个重要方面。
如果你发现自己有以下一种或多种情况,你会发现这本书特别有用:
-
您是分类学家、本体论学家或其他类型的数据建模者,对语义数据建模有很多了解,但大多是从学术和研究的角度出发。您可能拥有该领域的博士学位或硕士学位,并且精通建模语言和框架,但却很少有机会在工业环境中应用这些知识。现在,您正处于行业工作的早期阶段,有机会将您的知识应用到实际问题中。不过,你已经开始意识到,事情与学术论文和教科书所描述的大相径庭;你所学到的方法和技术并不像你想象的那样适用或有效。您面临的困难情况是,没有明显的决定可做,最终,您开发的语义模型被误解、误用,或没有提供什么附加价值。本书将帮助您将宝贵的、来之不易的知识付诸实践,提高工作质量。
-
您是一名数据或信息架构师,负责开发语义模型,以解决贵组织拥有的众多不同数据源和应用程序或产品之间的语义异构问题。为此,您已经应用了几种开箱即用的语义数据管理解决方案,它们承诺实现无缝集成,但结果大多不尽如人意。本书将帮助您更好地理解,要实现您想要的语义互操作性,您需要解决哪些并不显而易见的问题和挑战。
-
您是数据科学家、机器学习和统计数据分析专家,是为人工智能应用(如虚拟助手的知识图谱)构建语义模型的多学科团队的一员。您每天都要与本体论者、语言学家和其他语义学专业人士交流,但您很难理解他们的行话,也不知道如何将您的技能与他们的技能结合起来。本书将向您介绍语义数据建模的基础知识,并帮助您确定在哪些方面您的专业知识可以产生最大的影响。 ...