book

深度學習｜內行人的做法

Name: 深度學習｜內行人的做法
ISBN: 9789865020262

by Josh Patterson, Adam Gibson

January 2019

Beginner to intermediate

576 pages

14h 31m

Chinese

GoTop Information, Inc.

Read now

Unlock full access

來自生物界的啟發
什麼是深度學習？
跳進兔子洞
對於問題的構思
機器學習背後的數學基礎：線性代數純量
向量
矩陣
張量
超平面相關的數學運算
把資料轉換成向量
解聯立方程式
機器學習背後的數學基礎：統計
機率
條件機率
後驗機率
分佈
樣本與母體
重取樣方法選擇偏差可能性
機器學習的工作原理
迴歸
分類
集群
套入不足和過度套入
最佳化
凸面最佳化
梯度遞減
隨機梯度遞減（SGD）
準牛頓最佳化方法
「生成型」與「判別型」模型
邏輯迴歸
邏輯函數
了解邏輯迴歸輸出
模型評估
混淆矩陣
建立對機器學習的理解
第二章神經網路和深度學習基礎
神經網路
生物神經元
感知器
多層正向饋送網路 (1/2)
多層正向饋送網路 (2/2)
訓練神經網路
反向傳播學習
激活函數
線性函數S型函數
tanh函數
硬tanh函數
softmax函數
整流線性函數
損失函數
損失函數所用到的符號
迴歸損失函數
分類損失函數
重建損失函數
超參數
學習速率
正則化
動量
稀疏性
第三章深度網路基礎
深度學習的定義什麼是深度學習？
本章的結構
深度網路的一般架構原則
參數
層
激活函數
損失函數
最佳化演算法
超參數
總結
深度網路構建模塊
受限波茲曼機器（RBM） (1/2)
受限波茲曼機器（RBM） (2/2)
自動編碼器
變異自動編碼器
第四章深度網路的主要架構
無監督預訓練網路（UPN）
深度信念網路（DBN）
生成對抗網路（GAN）
卷積神經網路（CNN）
來自生物界的啟發
直觀的理解
CNN架構概述
輸入層
卷積層 (1/2)
卷積層 (2/2)
池化層
全連結層
CNN的其他應用
CNN注意事項
總結
遞迴神經網路（RNN）
時間維度模型化
3D立方體輸入
為什麼不用馬可夫模型？
一般RNN結構
LSTM網路 (1/2)
LSTM網路 (2/2)
特定領域應用與混合型網路
遞歸神經網路
遞歸神經網路架構
遞歸神經網路的種類遞歸神經網路的應用
總結與討論
深度學習會讓其他演算法過時嗎？
不同問題有不同的最佳解法
我何時需要用到深度學習？
第五章打造深度網路
把深度網路對應到正確的問題上
欄位型資料與多層感知器
圖片資料與CNN
時間序列資料與RNN
使用混合型網路
DL4J工具套件
向量化與DataVec執行階段與ND4J
DL4J API的一些基本概念
模型的載入與儲存
取得模型的輸入
設定模型的架構
模型的訓練與評估
使用多層感知器網路，為CSV資料建立模型
設定輸入資料
確定網路的架構
模型的訓練
模型的評估
使用CNN，為手寫圖片建立模型
LeNet CNN的Java程式碼
輸入圖片的載入與向量化
DL4J的LeNet網路架構
CNN的訓練
使用RNN，為序列資料建立模型
使用LSTM，生成莎士比亞風格作品
使用LSTM，對感測器時間序列進行分類 (1/2)
使用LSTM，對感測器時間序列進行分類 (2/2)
使用自動編碼器，進行異常檢測
自動編碼器範例的Java程式碼
設定輸入資料
自動編碼器網路的架構與訓練
模型的評估
使用VAE，重建MNIST數字
用VAE重建MNIST數字的Java程式碼
檢視VAE模型
深度學習在自然語言處理的應用
使用Word2Vec，學習單詞內嵌
使用段落向量，做為句子的分散式表達方式
使用段落向量，進行文件分類
第六章深度網路的調整
調整深度網路的基本概念
打造深度網路的直覺想法
把直覺化為一步一步的程序
輸入資料—找出相匹配的網路架構
總結
輸出層—與模型目標的關聯性
迴歸模型輸出層
分類模型輸出層
層數、參數數量與記憶體
正向饋送多層神經網路
層數與參數數量的控制
估計網路的記憶體需求
權重初始化策略
RNN的正交權重初始化
激活函數
激活函數總表
損失函數
學習速率
使用參數更新比率
關於學習速率的具體建議
稀疏性對學習的影響
最佳化方法
SGD的最佳實務做法
運用平行運算與GPU來加速訓練
線上學習與平行迭代演算法
DL4J處理SGD平行化的做法
GPU圖形處理器
小批量數量與訓練階段的控制
瞭解小批量數量的權衡取捨考量
正則化方法
在前正則化器
最大範數正則化
隨機拋棄
其他正則化相關主題
處理各類別數量不均衡的情況
類別取樣方法
加權損失函數
過度套入的處理
運用調整界面中的網路統計訊息
偵測出不良的權重初始值
偵測出未打亂過的資料
偵測出正則化相關問題
第七章特定深度網路架構的調整
卷積神經網路（CNN）
常見的卷積架構模式
設置卷積層 (1/2)
設置卷積層 (2/2)
設置池化層
轉移學習
遞迴神經網路（RNN）
網路輸入資料與輸入層
輸出層與RnnOutputLayer
訓練網路
RNN除錯時常見的問題
填充與遮罩
評估與評分時遮罩的作用
遞迴網路架構的其他變形
受限波茲曼機器（RBM）
隱藏單元與資料所隱含訊息的關係
採用不同類型的單元
對RBM進行正則化處理
深度信念網路（DBN）
使用動量
使用正則化
決定隱藏單元的數量
第八章向量化
機器學習向量化簡介
為什麼要把資料向量化？
處理欄位型原始資料的策略
特徵工程與歸一化技術 (1/2)
特徵工程與歸一化技術 (2/2)
使用DataVec來進行ETL與向量化
圖片資料的向量化
圖片資料在DL4J中的表達方式
使用DataVec進行圖片資料與向量的歸一化
順序性序列資料的向量化
各種主要的順序性序列資料來源
使用DataVec來向量化順序性序列資料 (1/2)
使用DataVec來向量化順序性序列資料 (2/2)
文字資料的向量化
單詞袋
TF-IDF
Word2Vec和VSM的比較
graph圖的處理
第九章在Spark上使用深度學習與DL4J
DL4J搭配Spark與Hadoop的使用簡介
在指令行中操作Spark
Spark執行配置與調整
透過Mesos運行Spark
透過YARN運行Spark
Spark通用調整指南
調整Spark上的DL4J Job
為Spark與DL4J設定Maven專案物件模型
pom.xml檔案的依賴關係範本
針對CDH 5.X設置POM檔案
針對HDP 2.4設置POM檔案
Spark與Hadoop的疑難排除
ND4J的幾個常見問題
以平行方式執行Spark上的DL4J
最小化的Spark訓練範例
Spark的DL4J API最佳實務做法
多層感知器Spark範例
針對Spark設定MLP網路架構
分散式訓練與模型評估
構建與執行DL4J Spark job
運用Spark與LSTM，生成莎士比亞風格文字
設定LSTM網路架構
訓練、追蹤進度與理解結果
運用Spark上的CNN，為MNIST建立模型
設定Spark Job相關配置與載入MNIST資料
設定LeNet CNN網路架構與訓練
附錄A 什麼是人工智慧？ (1/3)
附錄A 什麼是人工智慧？ (2/3)
附錄A 什麼是人工智慧？ (3/3)
附錄B RL4J與強化學習 (1/5)
附錄B RL4J與強化學習 (2/5)
附錄B RL4J與強化學習 (3/5)
附錄B RL4J與強化學習 (4/5)
附錄B RL4J與強化學習 (5/5)
附錄C 大家都應該知道的幾個數字
附錄D 神經網路與反向傳播：數學做法
附錄E 使用ND4J API (1/3)
附錄E 使用ND4J API (2/3)
附錄E 使用ND4J API (3/3)
附錄F 使用DataVec (1/3)
附錄F 使用DataVec (2/3)
附錄F 使用DataVec (3/3)
附錄G 使用DL4J的源程式碼
附錄H 設定DL4J專案
附錄I 為DL4J專案設定GPU
附錄J DL4J安裝問題排除 (1/2)
附錄J DL4J安裝問題排除 (2/2)
索引 (1/5)
索引 (2/5)
索引 (3/5)
索引 (4/5)
索引 (5/5)
關於作者
出版記事

Content preview from 深度學習｜內行人的做法

451

附錄 B

RL4J 與強化學習

Ruben Fiszel

（

http://rubenfiszel.github.io/

）

序言

本附錄一開始先介紹「強化學習（reinforcement learning）」，然後再詳細說明以像素為

輸入的深度 Q 網路（DQN, Deep Q-Networks），最後展示一個 RL4J 範例來做個小結。

我們先來看看強化學習的核心概念。

強化學習是機器學習領域中一個令人興奮的子領域。基本上，它指的是在特定環境中

學習高效的策略。如果用比較非正式的說法，它其實與「帕夫洛夫制約」（Pavlovian

conditioning，又稱「古典制約」）非常相似：如果你針對某個行為給予獎勵，經過一段

時間之後，代理者就能學會重複這樣的行為，以獲得更多的獎勵。

馬可夫決策過程

從形式上來看，前面所提到的環境，可以用所謂的「馬可夫決策過程（MDP, Markov

Decision Process）」來加以定義。這個聽起來很可怕的名字，其實就是以下（五元組）

所構成的組合：

• 一組狀態（State）S：例如在西洋棋中，狀態指的就是各種棋局下每個棋子的位置。

• 一組可能的動作（Action）A：在西洋棋中，指的就是每一種棋局下每一種可能的動

作（例如從 e4 移動到 e5）。

452

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9789865020262

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

深度學習｜內行人的做法

by Josh Patterson, Adam Gibson

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

高效能網站建置指南

初探深度學習｜使用TensorFlow

监控运维实践：原则与策略

深度学习实战

Publisher Resources