第 5 章 语义模型开发 语义模型开发
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
"如果你足够努力地挖掘数据 你也能找到上帝的讯息"[杜格伯特]
斯科特-亚当斯,《呆伯特
到目前为止,我们已经了解了语义模型可以包括哪些内容,在开发和使用过程中我们应该关注哪些现象,以及在使用之前我们需要评估哪些质量维度。 在本章中,我们将重点讨论语义模型的开发过程,研究其中涉及的挑战、步骤和活动,以及为每项挑战、步骤和活动提供的方法和技术支持。
如果您主要是语义模型的消费者而不是创建者,本章将帮助您了解开发过程的挑战性,以及如何帮助模型创建者为您构建实际需要的模型。
发展活动
语义建模文献中有几种方法和生命周期,试图定义开发语义数据模型所涉及的步骤和活动[93]。 有些只规定了一些高层次的活动,而有些则包含更详细、更具体的任务。有的针对特定类型的模型和/或建模框架,有的则更为通用。有些基于更集中的理念,有些则基于更协作的理念。有些项目享有全面的技术和工具支持,而有些项目则没有。
在我的语义建模师生涯中,我曾有机会在(非学术性)项目中应用过其中的几种方法,结果喜忧参半。我学到的最大的三条经验是
-
如果现成的方法不适合某个问题,就不能将其强加于人;而应该反其道而行之,即利用问题的背景和实际情况来调整方法。这一点看似显而易见,但却经常被遗忘。
-
语义数据建模项目几乎从来不是一次性的工程项目;您所建立的模型需要持续不断的努力才能保持其相关性和实用性。
-
语义数据建模项目几乎从来都不是纯技术性的;你必须考虑到业务、战略和组织方面的问题。
也就是说,我现在把每个语义模型开发项目都看作是六项活动的迭代:设定阶段、决定构建什么、构建它、确保它是好的、让它有用、让它持久。让我们来看看这六项活动分别意味着什么。
搭建舞台
在打开您最喜欢的语义建模编辑器或开始在白板上绘制图表之前,您实际上需要为模型的开发确定一个适当的策略,并确保您拥有成功执行该策略所需的一切。这实质上就是要提出(并得到尽可能多的明确而满意的答案)五个关键问题:
-
我们在建造什么?
-
我们为什么要建造它?
-
我们如何建设它?
-
谁在建造?
-
谁在乎呢?
第一个问题看似微不足道,其实不然。例如,假设一位客户要求你为他构建一个知识图谱。 你认为他们想到的是以下哪种(截然不同的)定义?
知识图谱获取信息并将其整合到本体中,然后应用推理器推导出新的知识[94]。
知识图谱是一种类似数据库的结构,便于检索相关信息[95]。
知识图谱(i) 主要描述现实世界中的实体及其相互关系,并以图谱的形式组织起来,(ii) 在模式中定义实体的可能类别和关系,(iii) 允许任意实体之间潜在的相互关系,(iv) 涵盖各种专题领域[96]。
知识图谱可以看作是与特定领域或组织相关的各种事物的网络。知识图谱不仅限于抽象概念和关系,还可以包含文档和数据集等实例[97]。
我们将知识图谱定义为 RDF 图。RDF 图由一组 RDF 三元组组成,其中每个 RDF 三元组......[78]。
知识图谱是实体、实体的语义类型、属性以及实体间关系的大型网络[98]。
在实践中,你不能指望一个组织或项目中的每个人都知道或同意什么是本体、分类法、知识图谱或其他类型的语义数据模型。有些人根本不知道你在说什么,有些人可能读到过或在某个会议上听说过,还有些人会根据自己的背景,以不同的方式了解它。语义网人员会想到 RDF 和关联数据,语言学家和 NLP 人员会想到 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access