book

语义建模与数据

by Panos Alexopoulos

May 2025

Beginner to intermediate

330 pages

3h 35m

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

谁应该阅读这本书本书值得期待之处图书大纲本书使用的约定O'Reilly 在线学习如何联系我们致谢
什么是语义数据建模？为什么要开发和使用语义数据模型？糟糕的语义建模避免陷阱打破困境
一般要素实体关系班级和个人属性复杂公理、约束和规则条款通用和标准化要素词法化和同义词实例化意义包含和类别/关系归属部分与整体的关系语义相关性制图和相互联系关系文件要素摘要
模糊性不确定性含糊不清刚性、特性、统一性和依赖性对称性、反转性和传递性封闭世界和开放世界假设语义变化摘要
语义准确性完整性一致性简洁及时性相关性可理解性可信度可用性、多功能性和性能摘要
发展活动搭建舞台决定建造什么建设它确保良好使其有用使其持久词汇、模式和示范模型上层本体设计模式标准和参考模式公共模型和数据集语义模型挖掘采矿任务采矿方法和技术摘要
起坏名字树立坏榜样我们为何给人起坏名字力求清晰省略定义或给出错误定义需要定义时我们为何省略定义好的和坏的定义如何获取定义忽略模糊性含糊不清是特点而非缺陷检测和描述模糊性不记录偏见和假设亲近你的敌人摘要
不良身份糟糕的同义词不良映射和相互链接不良子类实例化即子类化部件作为子类刚性类作为非刚性类的子类身份标准不兼容的常见超类糟糕的公理和规则将层次关系定义为传递关系将模糊关系定义为传递关系补充模糊类将推理规则误认为约束条件摘要

建造错误的东西为什么我们会有糟糕的规格如何获得正确的规格糟糕的知识获取错误的知识来源错误的获取方法和工具规范与知识获取的故事模型规格和设计模型人口摘要
不将质量视为一系列权衡取舍的结果语义准确性与完整性简洁与完整简洁与易懂与情境 A 的相关性与与情境 B 的相关性未将质量与风险和效益挂钩没有使用正确的衡量标准使用具有误导性解释的衡量标准使用缺乏比较价值的指标使用具有任意阈值的指标使用实际上是质量信号的指标精确测量含糊断言的准确性将模型质量等同于信息提取质量摘要
不良实体解决实体解析系统如何使用语义模型当知识会伤害你时如何选择消歧-有用知识两个实体解决故事语义关联性差语义关联性为何棘手如何获得您真正需要的语义相关性语义关联故事摘要
糟糕的战略语义模型战略是什么？误信神话和半真半假的话低估复杂性和成本不了解或不应用你的语境不良组织没有建立正确的团队低估治理的必要性摘要
班级还是个人？要不要分门别类？属性还是关系？模糊化还是不模糊化？模糊化涉及哪些方面何时模糊化两个模糊化故事摘要
该如何词法化？如何细化？如何成为将军？如何消极？要处理多少真相？如何相互关联？摘要
模型演变记住还是忘记？跑步还是踱步？React 还是预防？了解语义漂移并采取行动治理模式民主、寡头政治还是独裁？中央集权的故事摘要
地图不是领土乐观但不天真避免隧道视野避免分散注意力的辩论语义框架与非语义框架符号化知识表示与机器学习不造成伤害弥合语义鸿沟

Content preview from 语义建模与数据

第 6 章糟糕的描述

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

我语言的局限意味着我世界的局限。

路德维希-维特根斯坦

在开发语义模型时，我们会定义有助于人类理解的方面（元素名称、文本定义、使用指南和其他文档），以及旨在实现机器可理解性的方面（与其他元素的关系、逻辑公理、推理规则等）。作为语义模型的创建者，我们非常重视机器可解释性方面，这是正确的，但我们往往低估了创建人类可清晰理解的语义模型的重要性和难度。相反，作为语义模型的用户，我们往往低估了我们实际上误解了语义模型真正含义的可能性，最终导致我们以不正确的方式使用语义模型。这也许是数据供应商和消费者之间存在语义鸿沟的最大原因。

本章介绍了我们在通过名称、文本定义和其他类型的人类可读信息来描述语义模型元素时常犯的一些错误，并提供了提高这些描述质量的技巧和指南。

起坏名字

在我举办语义建模讲座或面试雇用人员时，我最喜欢做的测验如下：假设您想为一家公司的客户建模，而这些客户可以是自然人，也可以是其他公司。图 6-1中的两个语义模型哪个是正确的，左边的还是右边的？

左边的模型认为有一个类Customer 和它的两个子类Person 和Organization 。而右边的模型则认为，类Customer 应该是类Person 的子类，同时也是类Organization 的子类。大多数人都倾向于回答左边的模式是正确的，但他们嗅到了陷阱的味道，仍然犹豫不决。事实上，这确实是个陷阱，即两个模型都是错误的。让我们来看看为什么。

右边的模型，如果用自然语言来表达，就是说 "所有客户既是个人，同时也是组织"。然而，这是不可能的，因为一个人不可能是一个组织（一个人的公司仍然是一个公司，而不是一个人）。另一方面，左边的模型说 "所有的人和组织同时也是客户"；这也是有问题的，因为它意味着在领域或数据中不存在不是客户的人或组织。后一个错误建模的例子只是错误命名的一个案例。

如果建模元素的名称不能帮助人类用户理解该元素的含义，或者更糟糕的是，会导致用户产生错误的理解，那么这个名称就是糟糕的。在图 6-1 的左侧模型中，类Person 的命名很糟糕，因为实际上建模者想表示的是有形的客户，而不是所有的人。类Organization 也是如此。因此，这两个类更准确的名称分别是PrivateCustomer 和 CorporateCustomer，而图 6-2 所示的模型要好得多。即使在您的领域中，您只对作为客户的个人和组织感兴趣，情况也应该是这样。

树立坏榜样

即使是在语义建模专家设计的模型中，糟糕的命名也比你想象的要经常发生。例如，SKOS 框架为意义包含建模定义的关系名为。这显然是一个模棱两可的名称，它没有提供任何关于关系的预期方向的信息，也就是说，如果 "A B"，那么 A 是否比 B 更宽泛，反之亦然。现在，在 SKOS 规范中，这个问题通过一个注释得到了澄清，该注释指出，" ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

What Employees Want Most in Uncertain Times

Publisher Resources

ISBN: 9798341659353

语义建模与数据

by Panos Alexopoulos

第 6 章糟糕的描述

起坏名字

图 6-1. 建模困境

图 6-2. 图 6-1建模困境的解决方案

树立坏榜样

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

What Employees Want Most in Uncertain Times

Building Table Views with Phoenix LiveView

Reinventing the Organization for GenAI and LLMs

How I Built a Personal Board of Directors With GenAI

Publisher Resources

第 6 章 糟糕的描述

起坏名字

图 6-1. 建模困境

图 6-2. 图 6-1建模困境的解决方案

树立坏榜样

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

What Employees Want Most in Uncertain Times

Building Table Views with Phoenix LiveView

Reinventing the Organization for GenAI and LLMs

How I Built a Personal Board of Directors With GenAI

Publisher Resources

第 6 章糟糕的描述

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.