第10章 迁移学习
本章中,我们将讨论迁移学习的概念,涉及以下主题:
- 举例说明预训练模型的使用;
- 构建迁移学习模型;
- 构建图像分类模型;
- 在GPU上训练深度学习模型;
- 比较使用CPU和GPU的性能。
10.1 介绍
近年来,深度学习领域中发生了大量的变化,以提高不同领域(如文本、图像、音频和视频)的算法效率和计算效率。然而,当涉及新数据集的训练时,机器学习通常从零开始重构模型,这就像在解决传统的数据科学问题中所做的那样,变得具有挑战性,因为这需要非常高的计算能力和大量的时间来达到期望的模型效率。
迁移学习是一种从现有模型中学习新场景的机制。这种方法对于训练大数据集非常有用,不一定来自类似的领域或问题。例如,研究人员已经展示了迁移学习的例子,他们训练了迁移学习,以应对完全不同的问题场景,比如将分类猫和狗构建的模型用于分类飞机和汽车等物体。
从类比的角度来看,迁移学习更多是将已学习的关系传递给新的架构,以便对权重进行微调。图10-1是如何使用迁移学习的一个示例。
图10-1
图10-1显示了迁移学习的步骤,其中来自预先开发的深度学习模型的权重/架构被重新用于预测新的问题。迁移学习有助于为深度学习架构提供一个良好的起点。在不同的领域中,有不同的开源项目在进行,这些项目有利于迁移学习,例如,ImageNet是一个图像分类的开源项目,其中开发了许多不同的架构,例如 Alexnet、VGG16和VGG19。同样,在文本挖掘中,Google新闻的Word2Vec项目使用了30亿个单词进行训练。 ...
Get 深度学习实战手册(R语言版) now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.