第8章 近期的新模型及其发展
本书在之前的章节中探讨了大量的ML模型训练机制,从简单通过型机制开始,例如正向反馈神经网络(Feedforward Neural Network),然后是一些更复杂且更实际的机制,例如接受已知的数据序列作为其训练用数据集的递归神经网络(Recurrent Neural Network,RNN)。
本章将介绍近期出现的两种新的神经网络,它们将更多现实世界的元素引入其模型。第一种神经网络,不仅使用自身来优化其模型,还通过另一个神经网络同时训练,两个网络通过博弈来互相提高。该网络是生成对抗网络(Generative Adversarial Network,GAN)。
第二种与之前的完全不同,它通过选择执行任务的最优步骤来最大化其激励,名叫强化学习(Reinforcement Learning,RL)。
8.1 GAN
GAN是一种全新的非监督式学习模型,在过去的10年中它成为了少数几个打破了机器学习格局的模型之一。它通过使用两个模型在不断迭代中互相竞争,来提升其模型的性能。
这个模型源于监督式学习和博弈论,其主要目标是通过学习,使模型从由同类数据的元素组成的源数据集中生成几近真实的样本。
值得注意的是,GAN的研究数量几乎是呈指数型增长,如图8.1所示。
图8.1 以GAN为名的文献数量
GAN的应用类别
GAN可以通过已知的样本来生成新的样本,甚至可以补全丢失的数据。
图8.2展示了LSGAN架构通过训练LSUN数据集中的5种场景所生成的图像,其中包括厨房、教堂、餐厅和会议室。 ...
Get 机器学习开发者指南 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.