第9章 语篇分析:理解才是可信的

语篇分析是自然语言处理的另一种应用。语篇分析可以认为是确定上下文信息(语境)的过程,这些信息有助于执行其他类型的任务,例如:指代消解(anaphora resolution,AR)(随后我们将在本章讨论这一部分内容)以及NER等。

本章将涵盖以下主题:

  • 语篇分析简介。
  • 使用中心理论执行语篇分析。
  • 指代消解。

语言学术语单词discourse是指使用中的语言。语篇分析可以认为是执行文本或语言分析的过程,其包含了文本解释以及对社交互动的理解。语篇分析可能涉及对语素、n元语法模型、时态、口语范畴以及页面布局等的处理。语篇可以认为是一个有序的句子集。

在大多数情况下,基于其前面的句子,我们可以解释一个句子的含义。

考虑如下话语"John went to the club on Saturday. He met Sam.",这里He指的是John。

人们开发语篇表述理论(Discourse Representation Theory,DRT)用于提供执行AR的方法,开发语篇表述结构(Discourse Representation Structure,DRS)用于提供语篇的含义(在语篇指称对象和条件的帮助下)。语篇指称对象是指在一阶逻辑中使用的变量以及在语篇中正在考虑的事物。语篇表述结构的条件是指在一阶谓词逻辑中使用的原子公式。

人们开发一阶谓词逻辑(First Order Predicate Logic,FOPL)用于扩展命题逻辑的概念。FOPL涉及函数、参数和量词的使用。两种类型的量词(也就是通用量词和存在量词)用于表示常规的句子。在FOPL中,也使用了连接词、常量和变量,例如:Robin is a bird,在FOPL中可以表示为 ...

Get 精通Python自然语言处理 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.