book

深度学习：核心原理与案例分析

Name: 深度学习：核心原理与案例分析
ISBN: 9781836201212

by Posts & Telecom Press, Ahmed Menshawy

May 2024

Intermediate to advanced

389 pages

6h 49m

Chinese

Packt Publishing

Read now

Unlock full access

版权信息
版权
版权声明
内容提要
作者简介
技术审稿人简介
译者序
前言
资源与支持
第1章数据科学——鸟瞰全景
1.1 通过示例了解数据科学1.2 设计数据科学算法的流程1.2.1 数据预处理1.2.2 特征选择1.2.3 模型选择1.2.4 学习过程1.2.5 评估模型1.3 开始学习学习的挑战1.4 实现鱼类识别/检测模型1.4.1 知识库/数据集1.4.2 数据分析预处理1.4.3 搭建模型1.5 不同学习类型1.5.1 监督学习1.5.2 无监督学习1.5.3 半监督学习1.5.4 强化学习1.6 数据量和行业需求1.7 总结

第2章数据建模实战——“泰坦尼克号”示例
2.1 线性回归模型2.1.1 原因2.1.2 广告——一个财务方面的例子2.2 线性分类模型分类与逻辑回归2.3 “泰坦尼克号”示例——建立和训练模型2.3.1 数据处理和可视化2.3.2 数据分析——监督机器学习2.4 不同类型的误差解析2.5 表现（训练集）误差2.6 泛化/真实误差2.7 总结
第3章特征工程与模型复杂性——重温“泰坦尼克号”示例
3.1 特征工程3.1.1 特征工程的类型3.1.2 重温“泰坦尼克号”示例3.2 维度灾难避免维度灾难3.3 重温“泰坦尼克号”示例——融会贯通3.4 偏差-方差分解3.5 学习可见性[2]打破经验法则3.6 总结
第4章 TensorFlow入门实战
4.1 安装TensorFlow4.1.1 在Ubuntu 16.04系统上安装GPU版的TensorFlow4.1.2 在Ubuntu 16.04系统上安装CPU版的TensorFlow4.1.3 在Mac OS X上安装CPU版的TensorFlow4.1.4 在Windows系统上安装CPU/GPU版的TensorFlow4.2 TensorFlow运行环境4.3 计算图4.4 TensorFlow中的数据类型、变量、占位符4.4.1 变量4.4.2 占位符4.4.3 数学运算4.5 获取TensorFlow的输出4.6 TensorBoard——可视化学习过程4.7 总结
第5章 TensorFlow基础示例实战
5.1 神经元的结构生物学中的激活和连接5.2 激活函数5.2.1 sigmoid5.2.2 tanh5.2.3 ReLU5.3 前馈神经网络5.4 需要多层网络的原因5.4.1 训练MLP——反向传播算法5.4.2 前馈传播5.4.3 反向传播和权值更新5.5 TensorFlow术语回顾5.5.1 使用Tensorflow定义多维数组5.5.2 为什么使用张量5.5.3 变量5.5.4 占位符5.5.5 操作5.6 构建与训练线性回归模型使用Tensorflow实现线性回归5.7 构建与训练逻辑回归模型在TensorFlow中使用逻辑回归5.8 总结
第6章深度前馈神经网络——实现数字分类
6.1 隐藏单元与架构设计6.2 MNIST数据集分析MNIST数据6.3 数字分类——构建与训练模型6.3.1 分析数据6.3.2 构建模型6.3.3 训练模型6.4 总结
第7章卷积神经网络
7.1 卷积运算7.2 动机CNN的应用7.3 CNN的不同层7.3.1 输入层7.3.2 卷积步骤7.3.3 引入非线性7.3.4 池化步骤7.3.5 全连接层7.4 CNN基础示例——MNIST手写数字分类7.4.1 构建模型7.4.2 训练模型7.5 总结
第8章目标检测——CIFAR-10示例
8.1 目标检测8.2 CIFAR-10目标图像检测——构建与训练模型8.2.1 使用软件包8.2.2 加载CIFAR-10数据集8.2.3 数据分析与预处理8.2.4 建立网络8.2.5 训练模型8.2.6 测试模型8.3 总结
第9章目标检测——CNN迁移学习
9.1 迁移学习9.1.1 迁移学习背后的直觉9.1.2 传统机器学习与迁移学习之间的不同9.2 CIFAR-10目标检测——回顾9.2.1 解决方案大纲9.2.2 加载和探索CIFAR-10数据集9.2.3 inception模型迁移值9.2.4 迁移值分析9.2.5 模型构建与训练9.3 总结
第10章循环神经网络——语言模型
10.1 RNN的直观解释10.1.1 RNN的架构10.1.2 RNN的示例10.1.3 梯度消失问题10.1.4 长期依赖问题10.2 LSTM网络为什么LSTM网络有效10.3 语言模型的实现10.3.1 生成训练的最小批10.3.2 构建模型10.3.3 训练模型10.4 总结
第11章表示学习——实现词嵌入
11.1 表示学习简介11.2 Word2Vec构建Word2Vec模型11.3 skip-gram架构的一个实际例子11.4 实现skip-gram Word2Vec11.4.1 数据分析与预处理11.4.2 构建模型11.4.3 训练模型11.5 总结
第12章神经网络在情感分析中的应用
12.1 常用的情感分析模型12.1.1 RNN——情感分析背景12.1.2 梯度爆炸与梯度消失——回顾12.2 情感分析——模型实现12.2.1 Keras12.2.2 数据分析与预处理12.2.3 构建模型12.2.4 模型训练和结果分析12.3 总结
第13章自动编码器——特征提取和降噪
13.1 自动编码器简介13.2 自动编码器的示例13.3 自动编码器架构13.4 压缩MNIST数据集13.4.1 MNIST数据集13.4.2 构建模型13.4.3 训练模型13.5 卷积自动编码器13.5.1 数据集13.5.2 构建模型13.5.3 训练模型13.6 降噪自动编码器13.6.1 构建模型13.6.2 训练模型13.7 自动编码器的应用13.7.1 图像着色13.7.2 更多的应用13.8 总结
第14章生成对抗网络
14.1 直观介绍14.2 GAN的简单实现14.2.1 模型输入14.2.2 变量作用域14.2.3 Leaky ReLU14.2.4 生成器14.2.5 判别器14.2.6 构建GAN网络14.2.7 训练模型14.2.8 从生成器中采样14.3 总结
第15章面部生成与标签缺失处理
15.1 面部生成15.1.1 获取数据15.1.2 探讨数据集15.1.3 构建模型15.2 用生成对抗网络进行半监督学习15.2.1 直观解释15.2.2 数据分析与预处理15.2.3 构建模型15.3 总结
附录A 实现鱼类识别
鱼类识别部分的代码

Content preview from 深度学习：核心原理与案例分析

第9章　目标检测——CNN迁移学习

“个人如何从一个环境中转移到具有相似特征的另一个环境？”

——E. L. Thorndike, R. S. Woodworth (1991)

迁移学习（transfer learning，TL）是数据科学中研究的一个问题，主要涉及在解决特定任务时不断获取知识，并使用这些已获得的知识来解决另一个不同但相似的任务。本章将展示数据科学领域中使用TL的现代实践和共同主题之一。这里的想法是在处理具有较小数据集的领域中的问题时，如何从具有非常大的数据集的领域中来获得帮助。最后，本章将重新探讨CIFAR-10目标检测示例，并尝试使用TL来缩短训练时间和减小性能误差。

本章主要包括以下两个主题。

迁移学习。
CIFAR-10目标检测——回顾。

9.1　迁移学习

深度学习架构对于数据是贪婪的，在训练集中有一些样本不能够充分发挥作用。TL通过将从解决大数据集任务中学习和获得的知识/表示迁移到另一个具有小数据集的不同但相似的任务上来解决这个问题。

TL不但适用于小型数据集的情况，而且可以加速训练过程。从头开始训练大型的深度学习架构通常是非常慢的，因为可能需要学习数百万的权重参数。相反，我们可以考虑使用TL方法，将从类似问题中学习到的权重微调到自己尝试解决的问题上来。

9.1.1　迁移学习背后的直觉

这里通过使用教师-学生来类比TL背后的直觉。教师在他所熟悉的领域中有多年的教学经验，学生从教师讲授的课程中获得对该课程的一个简单理解。因此可以认为教师正在以简明扼要的方式向学生传授着知识。

同样，教师与学生的类比通常可以应用于通过深度学习或者神经网络来传递知识的情境中。模型学习到数据的一些特征，这些特征由网络的权重来表示。这些学习到的/特征（权重）能够转移到另一个不同但是相似的任务中。为了使深度学习架构收敛，将学习到的权重转移到另一个任务的过程将减少程序对大型数据集的需求，并且与从头开始训练模型相比，它还将缩短模型适应于新数据集所需的时间。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9781836201212

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

深度学习：核心原理与案例分析

by Posts & Telecom Press, Ahmed Menshawy

第9章　目标检测——CNN迁移学习