第1章 深度学习入门

本章讨论深度学习,这是一种强大的多层架构,可以用于模式识别、信号检测以及分类或预测等多个领域。深度学习并不新鲜,但在过去十年它获得了极高的关注,这部分归功于计算能力的不断发展和训练模型不断涌现出更有效的新方法,也源于可使用的数据量不断增加。在本章中,我们将学习深度学习是什么,训练这种模型有哪些R包,如何建立分析系统以及如何连接R和H2O。在随后的章节,我们会将H2O用于许多案例,这些案例探讨如何真正训练和使用一个深度学习模型。

本章包括以下内容。

  • 什么是深度学习?
  • 使用R包来训练深度学习模型,如深度信念网络或深度神经网络。
  • 连接R和H2O,深度学习使用H2O。

为了理解深度学习是什么,最简单的方式也许是首先理解常规机器学习是什么。一般来说,机器学习主要用于开发和使用那些从原始数据中学习、总结出来的用于进行预测的算法。预测是个非常笼统的术语。例如,机器学习中的预测可以包括预测某位消费者将会在一家给定的公司花费是多少,或者预测一笔特殊的信用卡消费中是否存在欺诈。预测也包括更一般的模式识别,如给定的图片显示了什么字母,或者这张照片中是否有马、狗、人、脸、建筑等。深度学习是机器学习的一个分支,其中的深度(多层)架构用于映射输入或观测特征与输出之间的联系。这种深度架构使得深度学习特别适合处理含有大量变量的问题,同时可以把深度学习生成的特征当作学习算法整体的一部分,而不是把特征生成当作一个单独步骤。现已证明,深度学习在图像识别(包括笔迹以及图片或者物体的识别)和自然语言处理(如语音识别)领域非常有效。

现在已有许多类型的机器学习算法。在本书中,我们主要讨论神经网络,因为它在深度学习中非常流行。但是,这种侧重并不意味着这就是用于机器学习甚至深度学习的唯一技术,也不是说其他的技术没有价值或者不适合,技术的选择取决于具体的任务。我们将在1.2节从概念上更深入地讨论神经网络和深度神经网络是什么。 ...

Get R深度学习权威指南 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.