book

深度學習｜內行人的做法

Name: 深度學習｜內行人的做法
ISBN: 9789865020262

by Josh Patterson, Adam Gibson

January 2019

Beginner to intermediate

576 pages

14h 31m

Chinese

GoTop Information, Inc.

Read now

Unlock full access

來自生物界的啟發
什麼是深度學習？
跳進兔子洞
對於問題的構思
機器學習背後的數學基礎：線性代數純量
向量
矩陣
張量
超平面相關的數學運算
把資料轉換成向量
解聯立方程式
機器學習背後的數學基礎：統計
機率
條件機率
後驗機率
分佈
樣本與母體
重取樣方法選擇偏差可能性
機器學習的工作原理
迴歸
分類
集群
套入不足和過度套入
最佳化
凸面最佳化
梯度遞減
隨機梯度遞減（SGD）
準牛頓最佳化方法
「生成型」與「判別型」模型
邏輯迴歸
邏輯函數
了解邏輯迴歸輸出
模型評估
混淆矩陣
建立對機器學習的理解
第二章神經網路和深度學習基礎
神經網路
生物神經元
感知器
多層正向饋送網路 (1/2)
多層正向饋送網路 (2/2)
訓練神經網路
反向傳播學習
激活函數
線性函數S型函數
tanh函數
硬tanh函數
softmax函數
整流線性函數
損失函數
損失函數所用到的符號
迴歸損失函數
分類損失函數
重建損失函數
超參數
學習速率
正則化
動量
稀疏性
第三章深度網路基礎
深度學習的定義什麼是深度學習？
本章的結構
深度網路的一般架構原則
參數
層
激活函數
損失函數
最佳化演算法
超參數
總結
深度網路構建模塊
受限波茲曼機器（RBM） (1/2)
受限波茲曼機器（RBM） (2/2)
自動編碼器
變異自動編碼器
第四章深度網路的主要架構
無監督預訓練網路（UPN）
深度信念網路（DBN）
生成對抗網路（GAN）
卷積神經網路（CNN）
來自生物界的啟發
直觀的理解
CNN架構概述
輸入層
卷積層 (1/2)
卷積層 (2/2)
池化層
全連結層
CNN的其他應用
CNN注意事項
總結
遞迴神經網路（RNN）
時間維度模型化
3D立方體輸入
為什麼不用馬可夫模型？
一般RNN結構
LSTM網路 (1/2)
LSTM網路 (2/2)
特定領域應用與混合型網路
遞歸神經網路
遞歸神經網路架構
遞歸神經網路的種類遞歸神經網路的應用
總結與討論
深度學習會讓其他演算法過時嗎？
不同問題有不同的最佳解法
我何時需要用到深度學習？
第五章打造深度網路
把深度網路對應到正確的問題上
欄位型資料與多層感知器
圖片資料與CNN
時間序列資料與RNN
使用混合型網路
DL4J工具套件
向量化與DataVec執行階段與ND4J
DL4J API的一些基本概念
模型的載入與儲存
取得模型的輸入
設定模型的架構
模型的訓練與評估
使用多層感知器網路，為CSV資料建立模型
設定輸入資料
確定網路的架構
模型的訓練
模型的評估
使用CNN，為手寫圖片建立模型
LeNet CNN的Java程式碼
輸入圖片的載入與向量化
DL4J的LeNet網路架構
CNN的訓練
使用RNN，為序列資料建立模型
使用LSTM，生成莎士比亞風格作品
使用LSTM，對感測器時間序列進行分類 (1/2)
使用LSTM，對感測器時間序列進行分類 (2/2)
使用自動編碼器，進行異常檢測
自動編碼器範例的Java程式碼
設定輸入資料
自動編碼器網路的架構與訓練
模型的評估
使用VAE，重建MNIST數字
用VAE重建MNIST數字的Java程式碼
檢視VAE模型
深度學習在自然語言處理的應用
使用Word2Vec，學習單詞內嵌
使用段落向量，做為句子的分散式表達方式
使用段落向量，進行文件分類
第六章深度網路的調整
調整深度網路的基本概念
打造深度網路的直覺想法
把直覺化為一步一步的程序
輸入資料—找出相匹配的網路架構
總結
輸出層—與模型目標的關聯性
迴歸模型輸出層
分類模型輸出層
層數、參數數量與記憶體
正向饋送多層神經網路
層數與參數數量的控制
估計網路的記憶體需求
權重初始化策略
RNN的正交權重初始化
激活函數
激活函數總表
損失函數
學習速率
使用參數更新比率
關於學習速率的具體建議
稀疏性對學習的影響
最佳化方法
SGD的最佳實務做法
運用平行運算與GPU來加速訓練
線上學習與平行迭代演算法
DL4J處理SGD平行化的做法
GPU圖形處理器
小批量數量與訓練階段的控制
瞭解小批量數量的權衡取捨考量
正則化方法
在前正則化器
最大範數正則化
隨機拋棄
其他正則化相關主題
處理各類別數量不均衡的情況
類別取樣方法
加權損失函數
過度套入的處理
運用調整界面中的網路統計訊息
偵測出不良的權重初始值
偵測出未打亂過的資料
偵測出正則化相關問題
第七章特定深度網路架構的調整
卷積神經網路（CNN）
常見的卷積架構模式
設置卷積層 (1/2)
設置卷積層 (2/2)
設置池化層
轉移學習
遞迴神經網路（RNN）
網路輸入資料與輸入層
輸出層與RnnOutputLayer
訓練網路
RNN除錯時常見的問題
填充與遮罩
評估與評分時遮罩的作用
遞迴網路架構的其他變形
受限波茲曼機器（RBM）
隱藏單元與資料所隱含訊息的關係
採用不同類型的單元
對RBM進行正則化處理
深度信念網路（DBN）
使用動量
使用正則化
決定隱藏單元的數量
第八章向量化
機器學習向量化簡介
為什麼要把資料向量化？
處理欄位型原始資料的策略
特徵工程與歸一化技術 (1/2)
特徵工程與歸一化技術 (2/2)
使用DataVec來進行ETL與向量化
圖片資料的向量化
圖片資料在DL4J中的表達方式
使用DataVec進行圖片資料與向量的歸一化
順序性序列資料的向量化
各種主要的順序性序列資料來源
使用DataVec來向量化順序性序列資料 (1/2)
使用DataVec來向量化順序性序列資料 (2/2)
文字資料的向量化
單詞袋
TF-IDF
Word2Vec和VSM的比較
graph圖的處理
第九章在Spark上使用深度學習與DL4J
DL4J搭配Spark與Hadoop的使用簡介
在指令行中操作Spark
Spark執行配置與調整
透過Mesos運行Spark
透過YARN運行Spark
Spark通用調整指南
調整Spark上的DL4J Job
為Spark與DL4J設定Maven專案物件模型
pom.xml檔案的依賴關係範本
針對CDH 5.X設置POM檔案
針對HDP 2.4設置POM檔案
Spark與Hadoop的疑難排除
ND4J的幾個常見問題
以平行方式執行Spark上的DL4J
最小化的Spark訓練範例
Spark的DL4J API最佳實務做法
多層感知器Spark範例
針對Spark設定MLP網路架構
分散式訓練與模型評估
構建與執行DL4J Spark job
運用Spark與LSTM，生成莎士比亞風格文字
設定LSTM網路架構
訓練、追蹤進度與理解結果
運用Spark上的CNN，為MNIST建立模型
設定Spark Job相關配置與載入MNIST資料
設定LeNet CNN網路架構與訓練
附錄A 什麼是人工智慧？ (1/3)
附錄A 什麼是人工智慧？ (2/3)
附錄A 什麼是人工智慧？ (3/3)
附錄B RL4J與強化學習 (1/5)
附錄B RL4J與強化學習 (2/5)
附錄B RL4J與強化學習 (3/5)
附錄B RL4J與強化學習 (4/5)
附錄B RL4J與強化學習 (5/5)
附錄C 大家都應該知道的幾個數字
附錄D 神經網路與反向傳播：數學做法
附錄E 使用ND4J API (1/3)
附錄E 使用ND4J API (2/3)
附錄E 使用ND4J API (3/3)
附錄F 使用DataVec (1/3)
附錄F 使用DataVec (2/3)
附錄F 使用DataVec (3/3)
附錄G 使用DL4J的源程式碼
附錄H 設定DL4J專案
附錄I 為DL4J專案設定GPU
附錄J DL4J安裝問題排除 (1/2)
附錄J DL4J安裝問題排除 (2/2)
索引 (1/5)
索引 (2/5)
索引 (3/5)
索引 (4/5)
索引 (5/5)
關於作者
出版記事

Content preview from 深度學習｜內行人的做法

322

第七章：特定深度網路架構的調整

卷積層序列中並沒有魔法子彈

在撰寫本文時，並不存在一種具有魔力的卷積架構，可以完全適用於所有

圖片模型化問題。我們建議可以先從一些已知的成功架構開始進行嘗試，

例如 LeNet、VGGNet、Inception

或 AlexNet，試著把它套用到你想要解

決的問題中。你可以把已知的架構當成一個「好的開始」，試著調整各層

的配置與超參數，做為嘗試的起點。

最後我們的輸出層，則會依循第 6 章所呈現的模式。

設置卷積層

我們必須要設置卷積層的空間排列，然後選擇過濾器的數量。

在卷積層中設定超參數時，就必須決定輸出立方體中有多少個神經元，以及神經元排列

的方式。這裡就是一些關鍵的超參數：

• 過濾器大小（filter size）

• 步幅（stride）

• 填充（padding）

舉例來說，如果我們想要構建出帶有一些 5 × 5 過濾器的一個卷積層，程式碼看起來很

可能就類似下面這樣：

ConvolutionLayer convLayer = new ConvolutionLayer.Builder()

.kernelSize(5,5).stride(1,1).padding(2,2)

.name("first_layer")

.nOut(out)

.biasInit(bias)

.build();

在這個範例中，我們可以看到過濾器大小（

.kernelSize

）是 5 × 5，而且我們採用（1,1）

的步幅以及（2,2）的填充，這裡全都是採用整數的參數。我們使用

.name() ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9789865020262

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

深度學習｜內行人的做法

by Josh Patterson, Adam Gibson

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

高效能網站建置指南

初探深度學習｜使用TensorFlow

监控运维实践：原则与策略

深度学习实战

Publisher Resources