第8章 模式识别(OCR案例)

目前为止,我们已经看到了神经网络以监督方式学习和无监督方式学习来处理数据的卓越能力。在本章中,我们要呈现一个与光学字符识别(optical character recognition,OCR)相关的模式识别的额外案例。神经网络经过训练后能够准确地识别图片文件中的文本字符。在介绍应用程序本身之前,先对分类和聚类进行简要回顾。本章将涉及以下主题:

  • 模式识别
    • 定义的类
    • 未定义的类
  • 模式识别中的神经网络
    • Kohonen网络和MLP
  • OCR问题
    • 预处理和类定义
  • Java实现
    • 数字识别

模式是一些相似的数据和元素,能系统性地出现并不断重复。模式识别任务主要由无监督学习来完成。但是,当有标记数据或者已定义好分类的数据存在时,这类任务就可以用有监督方法来完成。我们作为人类完成这类任务比想像的要频繁。当我们看见物体并识别出它们属于某个确定的类别时,就是在识别一个模式。另外,当我们分析图表、离散事件和时间序列时,或许会发现在某个特定条件下某些事件序列系统性出现的证据。总之,模式能通过数据观测值来学习。模式识别任务的案例包括,如下:

  • 形状识别;
  • 对象分类;
  • 行为聚类;
  • 语音识别;
  • 光学字符识别;
  • 化学反应分类。

一个特定领域会预先定义一个类的集合,每个类都被视为一个模式。因此,每条数据或事件都会被赋予一个预先定义的类。

提示:

类通常由专家来预定义或基于应用领域的先验知识提出。另外,当我们想要将数据严格分类到一个预定义类时,最好能应用到预先定义的类。 ...

Get 神经网络算法与Java编程 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.