Skip to Content
语义建模与数据
book

语义建模与数据

by Panos Alexopoulos
May 2025
Beginner to intermediate
330 pages
3h 35m
Chinese
O'Reilly Media, Inc.
Content preview from 语义建模与数据

第 15 章 展望未来 展望未来

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

它应该是自动的,但实际上你必须按下这个按钮。

约翰-布鲁纳,《站在桑给巴尔岛》(Stand on Zanzibar

我们到了。你们已经和我一起踏上了数据语义世界的征程,研究了使这个世界变得困难但值得参与和工作的许多怪癖和挑战。一路上,我希望您能学到一些技巧,帮助您避开关键陷阱,打破关键困境,否则您可能无法构建和使用高质量、有价值的数据语义表征。

在最后一章中,我想把本书中一些反复出现的主题归纳起来,并在此基础上展望未来。

地图不是领土

我之所以围绕陷阱和困境编排本书,而不是给你一套构建完美语义模型的秘诀,主要原因是我不知道这样的模型在你的领域、数据和应用上下文中是什么样子的。 换句话说,我的地图并不一定能反映你们的领域。

除非我们坐在一起,做我在第 11 章中描述的所有工作,为您的语义模型及其上下文制定量身定制的策略,否则我告诉您应该使用一种建模语言而不是另一种,或者优化一个质量维度而牺牲另一个质量维度,不仅是无效的,而且是不负责任的。相反,我选择告诉你,你的上下文可能包含哪些潜在危险,以及如何避免这些危险;你做出某些选择和决定可能会承担哪些风险,以及如何降低这些风险。这样,你不仅能开辟自己的道路,还能有效地驾驭它。

乐观但不天真

本书的关键前提是,语义数据建模的目标是创建数据的描述和表示,以清晰、准确和通俗易懂的方式传达数据意义的那些方面,这些方面对于人类和机器有效解释和使用数据非常重要。我们在全书中看到的众多陷阱和困境表明,尽管语义技术、大数据处理、自然语言处理和机器学习取得了长足的发展,但这仍然是一个极具挑战性的问题,而且远未得到解决。

这不是悲观主义,而是现实主义。我们数据人往往会忘记(或淡化)一个事实,那就是语义学几乎总是以共识为基础的,而建立共识是很难的。然而,语义模型的价值取决于基本共识的范围,不同意的各方无法保证其(正确)使用。随着知识图谱和其他类型的语义模型在规模和范围上越来越大,并被更多不同的受众所使用,它们表示共识信息的能力也受到了压力。

因此,不考虑如何解决共识问题就启动语义模型计划的做法是幼稚的,而语义网在过去几年中受到的许多批评正是与此有关。例如,研究互联网技术的社会和经济影响的著名思想家克莱-舍基(Clay Shirky)在2003年发表的一篇文章中指出,语义网愿景的问题在于 "它想当然地认为,世界的许多重要方面都可以用一种毫不含糊和普遍认同的方式来描述,并花了大量时间来讨论这些描述的理想XML格式"[245]。16 年后的 2019 年,根特大学的两位著名语义网研究人员撰写了一篇名为《语义网身份危机》的文章:In Search of the Trivialities That Never Were"(寻找从未存在过的琐事)一文,他们在文中指出:"虽然关联数据的呼声给我们带来了鸡蛋,但本应孵化鸡蛋的鸡却仍然不见踪影,部分原因是要理解他人的数据仍然很难"[246]

这并不意味着语义技术没有价值,也不意味着开发语义模型是徒劳无益的;恰恰相反。但这意味着,你应该避免听信供应商和顾问的一面之词,他们声称可以在一夜之间为你建立一个语义模型,只需付出极少的努力,就能让你的组织的所有数据和应用实现语义互操作。即使在小型企业中,领域、数据、流程和系统的复杂性也可能相当高,指望通过几个现有的语义模型和某个软件平台就能无缝地解决所有这些复杂问题,无论它有多复杂,都不会有好结果。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

设计机器学习系统

设计机器学习系统

Chip Huyen
AWS认证数据工程师助理考试指南

AWS认证数据工程师助理考试指南

Sakti Mishra, Dylan Qu, Anusha Challa

Publisher Resources

ISBN: 9798341659353