book

深度學習｜內行人的做法

Name: 深度學習｜內行人的做法
ISBN: 9789865020262

by Josh Patterson, Adam Gibson

January 2019

Beginner to intermediate

576 pages

14h 31m

Chinese

GoTop Information, Inc.

Read now

Unlock full access

來自生物界的啟發
什麼是深度學習？
跳進兔子洞
對於問題的構思
機器學習背後的數學基礎：線性代數純量
向量
矩陣
張量
超平面相關的數學運算
把資料轉換成向量
解聯立方程式
機器學習背後的數學基礎：統計
機率
條件機率
後驗機率
分佈
樣本與母體
重取樣方法選擇偏差可能性
機器學習的工作原理
迴歸
分類
集群
套入不足和過度套入
最佳化
凸面最佳化
梯度遞減
隨機梯度遞減（SGD）
準牛頓最佳化方法
「生成型」與「判別型」模型
邏輯迴歸
邏輯函數
了解邏輯迴歸輸出
模型評估
混淆矩陣
建立對機器學習的理解
第二章神經網路和深度學習基礎
神經網路
生物神經元
感知器
多層正向饋送網路 (1/2)
多層正向饋送網路 (2/2)
訓練神經網路
反向傳播學習
激活函數
線性函數S型函數
tanh函數
硬tanh函數
softmax函數
整流線性函數
損失函數
損失函數所用到的符號
迴歸損失函數
分類損失函數
重建損失函數
超參數
學習速率
正則化
動量
稀疏性
第三章深度網路基礎
深度學習的定義什麼是深度學習？
本章的結構
深度網路的一般架構原則
參數
層
激活函數
損失函數
最佳化演算法
超參數
總結
深度網路構建模塊
受限波茲曼機器（RBM） (1/2)
受限波茲曼機器（RBM） (2/2)
自動編碼器
變異自動編碼器
第四章深度網路的主要架構
無監督預訓練網路（UPN）
深度信念網路（DBN）
生成對抗網路（GAN）
卷積神經網路（CNN）
來自生物界的啟發
直觀的理解
CNN架構概述
輸入層
卷積層 (1/2)
卷積層 (2/2)
池化層
全連結層
CNN的其他應用
CNN注意事項
總結
遞迴神經網路（RNN）
時間維度模型化
3D立方體輸入
為什麼不用馬可夫模型？
一般RNN結構
LSTM網路 (1/2)
LSTM網路 (2/2)
特定領域應用與混合型網路
遞歸神經網路
遞歸神經網路架構
遞歸神經網路的種類遞歸神經網路的應用
總結與討論
深度學習會讓其他演算法過時嗎？
不同問題有不同的最佳解法
我何時需要用到深度學習？
第五章打造深度網路
把深度網路對應到正確的問題上
欄位型資料與多層感知器
圖片資料與CNN
時間序列資料與RNN
使用混合型網路
DL4J工具套件
向量化與DataVec執行階段與ND4J
DL4J API的一些基本概念
模型的載入與儲存
取得模型的輸入
設定模型的架構
模型的訓練與評估
使用多層感知器網路，為CSV資料建立模型
設定輸入資料
確定網路的架構
模型的訓練
模型的評估
使用CNN，為手寫圖片建立模型
LeNet CNN的Java程式碼
輸入圖片的載入與向量化
DL4J的LeNet網路架構
CNN的訓練
使用RNN，為序列資料建立模型
使用LSTM，生成莎士比亞風格作品
使用LSTM，對感測器時間序列進行分類 (1/2)
使用LSTM，對感測器時間序列進行分類 (2/2)
使用自動編碼器，進行異常檢測
自動編碼器範例的Java程式碼
設定輸入資料
自動編碼器網路的架構與訓練
模型的評估
使用VAE，重建MNIST數字
用VAE重建MNIST數字的Java程式碼
檢視VAE模型
深度學習在自然語言處理的應用
使用Word2Vec，學習單詞內嵌
使用段落向量，做為句子的分散式表達方式
使用段落向量，進行文件分類
第六章深度網路的調整
調整深度網路的基本概念
打造深度網路的直覺想法
把直覺化為一步一步的程序
輸入資料—找出相匹配的網路架構
總結
輸出層—與模型目標的關聯性
迴歸模型輸出層
分類模型輸出層
層數、參數數量與記憶體
正向饋送多層神經網路
層數與參數數量的控制
估計網路的記憶體需求
權重初始化策略
RNN的正交權重初始化
激活函數
激活函數總表
損失函數
學習速率
使用參數更新比率
關於學習速率的具體建議
稀疏性對學習的影響
最佳化方法
SGD的最佳實務做法
運用平行運算與GPU來加速訓練
線上學習與平行迭代演算法
DL4J處理SGD平行化的做法
GPU圖形處理器
小批量數量與訓練階段的控制
瞭解小批量數量的權衡取捨考量
正則化方法
在前正則化器
最大範數正則化
隨機拋棄
其他正則化相關主題
處理各類別數量不均衡的情況
類別取樣方法
加權損失函數
過度套入的處理
運用調整界面中的網路統計訊息
偵測出不良的權重初始值
偵測出未打亂過的資料
偵測出正則化相關問題
第七章特定深度網路架構的調整
卷積神經網路（CNN）
常見的卷積架構模式
設置卷積層 (1/2)
設置卷積層 (2/2)
設置池化層
轉移學習
遞迴神經網路（RNN）
網路輸入資料與輸入層
輸出層與RnnOutputLayer
訓練網路
RNN除錯時常見的問題
填充與遮罩
評估與評分時遮罩的作用
遞迴網路架構的其他變形
受限波茲曼機器（RBM）
隱藏單元與資料所隱含訊息的關係
採用不同類型的單元
對RBM進行正則化處理
深度信念網路（DBN）
使用動量
使用正則化
決定隱藏單元的數量
第八章向量化
機器學習向量化簡介
為什麼要把資料向量化？
處理欄位型原始資料的策略
特徵工程與歸一化技術 (1/2)
特徵工程與歸一化技術 (2/2)
使用DataVec來進行ETL與向量化
圖片資料的向量化
圖片資料在DL4J中的表達方式
使用DataVec進行圖片資料與向量的歸一化
順序性序列資料的向量化
各種主要的順序性序列資料來源
使用DataVec來向量化順序性序列資料 (1/2)
使用DataVec來向量化順序性序列資料 (2/2)
文字資料的向量化
單詞袋
TF-IDF
Word2Vec和VSM的比較
graph圖的處理
第九章在Spark上使用深度學習與DL4J
DL4J搭配Spark與Hadoop的使用簡介
在指令行中操作Spark
Spark執行配置與調整
透過Mesos運行Spark
透過YARN運行Spark
Spark通用調整指南
調整Spark上的DL4J Job
為Spark與DL4J設定Maven專案物件模型
pom.xml檔案的依賴關係範本
針對CDH 5.X設置POM檔案
針對HDP 2.4設置POM檔案
Spark與Hadoop的疑難排除
ND4J的幾個常見問題
以平行方式執行Spark上的DL4J
最小化的Spark訓練範例
Spark的DL4J API最佳實務做法
多層感知器Spark範例
針對Spark設定MLP網路架構
分散式訓練與模型評估
構建與執行DL4J Spark job
運用Spark與LSTM，生成莎士比亞風格文字
設定LSTM網路架構
訓練、追蹤進度與理解結果
運用Spark上的CNN，為MNIST建立模型
設定Spark Job相關配置與載入MNIST資料
設定LeNet CNN網路架構與訓練
附錄A 什麼是人工智慧？ (1/3)
附錄A 什麼是人工智慧？ (2/3)
附錄A 什麼是人工智慧？ (3/3)
附錄B RL4J與強化學習 (1/5)
附錄B RL4J與強化學習 (2/5)
附錄B RL4J與強化學習 (3/5)
附錄B RL4J與強化學習 (4/5)
附錄B RL4J與強化學習 (5/5)
附錄C 大家都應該知道的幾個數字
附錄D 神經網路與反向傳播：數學做法
附錄E 使用ND4J API (1/3)
附錄E 使用ND4J API (2/3)
附錄E 使用ND4J API (3/3)
附錄F 使用DataVec (1/3)
附錄F 使用DataVec (2/3)
附錄F 使用DataVec (3/3)
附錄G 使用DL4J的源程式碼
附錄H 設定DL4J專案
附錄I 為DL4J專案設定GPU
附錄J DL4J安裝問題排除 (1/2)
附錄J DL4J安裝問題排除 (2/2)
索引 (1/5)
索引 (2/5)
索引 (3/5)
索引 (4/5)
索引 (5/5)
關於作者
出版記事

Content preview from 深度學習｜內行人的做法

178

第五章：打造深度網路

• 時間序列資料模型化

• 自然語言處理應用

本章會用到許多深度網路的概念，也就是我們從第 1 章開始就一直在建立的相關概念。

雖然我們無法只用一個範例來涵蓋第 4 章介紹過的每一種架構，但我們確實編寫了一整

組範例，希望能讓你更深入了解深度學習的核心概念，這樣你就可以更容易把大多數範

例擴展到新的應用目標上了。我們首先來重新檢視一下之前介紹過的各種類型資料，如

何對應到合適的網路架構。

在網路上尋找範例

我們已經在 GitHub 儲存庫（

http://bit.ly/2uy8ClX

）創建了一個範例的 fork

副本。因為像 DL4J 這樣的專案，會一直隨時間不斷發展，因此我們希望

為讀者提供一個能夠與本書版本保持一致的程式碼快照。

欄位型資料與多層感知器

一般的欄位型資料具有靜態的結構，而且只要透過 DL4J 中的經典多層感知器神經網

路，就能達到最好的模型化效果。如果稍微進行一些特徵工程的工作，對於這些問題也

許有些幫助，但我們通常會讓網路自己針對資料集找出最好的權重組合。使用多層感知

器進行模型化時，超參數調整是主要的挑戰之一。我們會在第 6 章介紹各種技術，協助

你選出適當的超參數。

圖片資料與 CNN

CNN（卷積神經網路）已被證明特別擅長從原始圖片資料找出其中的結構。在過去，

圖片模型化領域一直被過量的預處理技術所主導，總是要先設法讓輸入圖片具備一定程

度的一致性，再轉換成模型化技術更容易處理的形式。只要是稍微旋轉或縮放的輕微變

化，就有可能讓圖片處理變成一項艱鉅的任務。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9789865020262

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

深度學習｜內行人的做法

by Josh Patterson, Adam Gibson

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

高效能網站建置指南

初探深度學習｜使用TensorFlow

监控运维实践：原则与策略

深度学习实战

Publisher Resources