book

精通機器學習

Name: 精通機器學習
Author: Aurélien Géron
ISBN: 9789865024345

by Aurélien Géron

April 2020

Intermediate to advanced

816 pages

18h 32m

Chinese

GoTop Information, Inc.

Read now

Unlock full access

前言 (1/2)
前言 (2/2)
第一部分
機器學習基本知識
第一章
機器學習領域
什麼是機器學習？
為何使用機器學習？
應用範例
機器學習系統的種類 (1/4)
監督/無監督學習
機器學習系統的種類 (2/4)
批次與線上學習
機器學習系統的種類 (3/4)
基於實例vs. 基於模型
機器學習系統的種類 (4/4)

機器學習的主要挑戰 (1/2)
訓練資料不足訓練資料無代表性低品質的資料無關的特徵過擬訓練資料
機器學習的主要挑戰 (2/2)
欠擬訓練資料後退一步
測試與驗證
超參數調整與模型選擇資料不匹配
習題
第二章
端對端機器學習專案使用真實的資料
瞭解大局
制定問題選擇性能指標
檢查假設
取得資料 (1/3)建立工作區下載資料
取得資料 (2/3)
快速地看一下資料結構建立測試組
取得資料 (3/3)
發現資料並將它視覺化來取得見解 (1/2)
將地理資料視覺化尋找相關性
發現資料並將它視覺化來取得見解 (2/2)
用屬性組合進行實驗
準備資料供機器學習演算法使用 (1/2)
清理資料處理文件與分類屬性
準備資料供機器學習演算法使用 (2/2)
自訂轉換器特徵縮放轉換pipeline
選擇與訓練模型
用訓練組來訓練與評估使用交叉驗證來做更好的評估
微調模型
網格搜尋隨機搜尋整體方法分析最佳模型與它們的誤差用測試組來評估系統
發表、監視與維護系統
盡情嘗試！
習題
第三章
分類MNIST
訓練二元分類器
評量績效用交叉驗證評估準確度混淆矩陣precision與recall
precision/recall取捨
ROC曲線
多類別分類
誤差分析
多標籤分類
多輸出分類
習題
第四章
訓練模型
線性回歸
正規方程式計算複雜度
梯度下降 (1/2)
批次梯度下降
梯度下降 (2/2)
隨機梯度下降小批次梯度下降
多項式回歸
學習曲線
含正則化的線性模型 (1/2)
山嶺回歸Lasso回歸
含正則化的線性模型 (2/2)
彈性網路提前停止
Logistic回歸 (1/2)
估計機率訓練與代價函數決策邊界
Logistic回歸 (2/2)
Softmax回歸
習題
第五章
支援向量機線性SVM分類軟邊距分類
非線性SVM分類
多項式kernel相似的特徵高斯RBF kernel
計算複雜度
SVM回歸
引擎蓋下 (1/2)
決策函數與預測訓練目標二次規劃對偶問題
引擎蓋下 (2/2)
kernelized SVM線上SVM
習題
第六章
決策樹訓練與視覺化決策樹
進行預測
估計類別機率
CART訓練演算法
計算複雜度
使用Gini不純度還是熵？
正則化參數
回歸
不穩定性
習題
第七章
整體學習與隨機森林投票分類器
bagging與pasting
Scikit-Learn的bagging與pastingOut-of-Bag評估
隨機補丁與隨機子空間
隨機森林
Extra-Trees特徵重要性
boosting (1/2)
AdaBoost梯度增強
boosting (2/2)
stacking
習題
第八章
降維
維數災難
主要的降維法
投射Manifold學習
PCA (1/2)
保留變異度主成分往下投射至d維使用Scikit-Learn已解釋變異比選擇正數的維數
PCA (2/2)
用PCA來壓縮Randomized PCAIncremental PCA
Kernel PCA
選擇kernel與調整超參數
LLE
其他的降維技術
習題
第九章
無監督學習技術
分群法（clustering） (1/5)
K-Means
分群法（clustering） (2/5)
分群法（clustering） (3/5)
K-Means的限制用分群來做圖像分割
分群法（clustering） (4/5)
用分群法來進行前置作業使用分群法來做半監督學習
分群法（clustering） (5/5)
DBSCAN其他的分群演算法
高斯混合 (1/3)
高斯混合 (2/3)
使用高斯混合進行異常檢測選擇群聚數量
高斯混合 (3/3)
貝氏高斯混合模型其他的異常與新穎檢測演算法
習題
第二部分
神經網路與深度學習
第十章
以Keras介紹人工神經網路
從生物神經元到人工神經元 (1/3)
生物神經元以神經元進行邏輯計算感知器
從生物神經元到人工神經元 (2/3)
多層感知器與反向傳播
從生物神經元到人工神經元 (3/3)
回歸MLP分類MLP
用Keras來實作MLP (1/5)
安裝TensorFlow 2使用Sequential API來製作圖像分類器
用Keras來實作MLP (2/5)
用Keras來實作MLP (3/5)
使用Sequential API來建立回歸MLP用Functional API來建立複雜的模型
用Keras來實作MLP (4/5)
使用Subclassing API來建立動態模型儲存和取回模型使用回呼
用Keras來實作MLP (5/5)
使用TensorBoard來進行視覺化
微調神經網路超參數 (1/2)
隱藏層的數量每一個隱藏層的神經元數量
微調神經網路超參數 (2/2)
學習速度、批次大小，以及其他超參數
習題
第十一章
訓練深度神經網路
梯度消失/爆炸問題 (1/3)
Glorot與He初始化不飽和觸發函數
梯度消失/爆炸問題 (2/3)
批次正規化
梯度消失/爆炸問題 (3/3)
梯度修剪
重複使用訓練好的階層 (1/2)
用Keras進行遷移學習無監督預先訓練
重複使用訓練好的階層 (2/2)
在輔助任務中預先訓練
更快速的優化法 (1/3)
動量優化Nesterov加速梯度法AdaGradRMSPropAdam與Nadam優化法
更快速的優化法 (2/3)
學習速度排程
更快速的優化法 (3/3)
用正則化來避免過擬 (1/2)
ℓ1與ℓ2正則化DropoutMonte Carlo（MC）Dropout
用正則化來避免過擬 (2/2)
Max-Norm正則化
總結與實作指南
習題
第十二章
用TensorFlow來自製模型和進行訓練
TensorFlow簡介
像NumPy一樣使用TensorFlow
tensor和操作Tensor與NumPy型態轉換變數其他的資料結構
自製模型和訓練演算法 (1/4)
自製損失函數儲存和載入包含自訂元件的模型自製觸發函數、初始化、正則化和約束自訂評量標準
自製模型和訓練演算法 (2/4)
自訂階層
自製模型和訓練演算法 (3/4)
自製模型用模型的內在來定義loss和評量標準使用autodiff來計算梯度
自製模型和訓練演算法 (4/4)
自訂訓練迴圈
TensorFlow函式與圖
AutoGraph與描繪TF Function規則
習題
第十三章
使用TensorFlow來載入和預先處理資料
Data API (1/2)
串接轉換方法將資料洗亂
Data API (2/2)
預先處理資料整合預取以tf.keras使用資料組
TFRecord格式 (1/2)
壓縮TFRecord檔案協定緩衝區（Protocol Buffer）簡介TensorFlow Protobuf載入與解析Example
TFRecord格式 (2/2)
使用SequenceExample Protobuf來處理串列的串列
預先處理輸入特徵 (1/2)
使用one-hot向量來編碼分類特徵使用embedding來編碼分類特徵
預先處理輸入特徵 (2/2)
Keras前置作業層
TF Transform
TensorFlow Datasets（TFDS）專案
習題
第十四章
使用摺積神經網路來製作深度電腦視覺
視覺皮層的結構
摺積層 (1/2)
過濾器堆疊多張特徵圖
摺積層 (2/2)
TensorFlow實作記憶體需求
池化層
TensorFlow實作
CNN結構 (1/4)
LeNet-5AlexNet
CNN結構 (2/4)
GoogLeNetVGGNetResNet
CNN結構 (3/4)
XceptionSENet
CNN結構 (4/4)
用Keras實作ResNet-34 CNN
使用Keras訓練好的模型
用訓練好的模型來進行遷移學習
分類和定位
物體偵測 (1/2)
全摺積網路You Only Look Once（YOLO）
物體偵測 (2/2)
語義分割
習題
第十五章
使用RNN和CNN來處理序列
遞迴神經與階層
記憶細胞輸入與輸出序列
訓練RNN
預測時間序列基準指標實作簡單RNN深度RNN
提前幾個時步預測未來
處理很長的序列 (1/2)
對抗梯度不穩定問題處理短期記憶問題
處理很長的序列 (2/2)
習題
第十六章
用RNN與Attention處理自然語言
用Character RNN產生莎翁文章 (1/2)
建立訓練資料組如何拆開循序的資料組將循序資料組分成多個窗口建立與訓練Char-RNN模型
用Character RNN產生莎翁文章 (2/2)
使用Char-RNN模型產生假的莎翁文章stateful RNN
情緒分析 (1/2)
遮罩
情緒分析 (2/2)
重複使用訓練好的embedding
用於神經機器翻譯的Encoder–Decoder網路 (1/2)
雙向RNN集束搜尋
用於神經機器翻譯的Encoder–Decoder網路 (2/2)
專注機制 (1/3)
視覺專注你需要的只是專注：Transformer結構
專注機制 (2/3)
專注機制 (3/3)
最近在語言模型領域的創新
習題
第十七章
使用自動編碼網路與GAN來進行表徵學習與生成學習
高效的資料表示法
使用undercomplete線性自動編碼網路來執行PCA
自動編碼網路堆疊 (1/2)
使用Keras實作堆疊式自動編碼網路將重建結果視覺化將Fashion MNIST資料組視覺化用堆疊式自動編碼網路來進行無監督預先訓練
自動編碼網路堆疊 (2/2)
綁定權重一次訓練一個自動編碼網路
摺積自動編碼網路
遞迴自動編碼網路
去雜訊自動編碼網路
稀疏自動編碼網路
變分自動編碼網路 (1/2)
產生Fashion MNIST圖像
變分自動編碼網路 (2/2)
生成對抗網路 (1/3)
訓練GAN的挑戰
生成對抗網路 (2/3)
深度摺積GAN逐漸建構GAN
生成對抗網路 (3/3)
StyleGANs
習題
第十八章
強化學習
藉由學習來優化獎勵
策略搜尋
OpenAI Gym簡介
神經網路策略
評估行動：歸功問題
策略梯度
馬可夫決策過程
時序差分學習
Q-Learning
探索策略Approximate Q-Learning與Deep Q-Learning
實作Deep Q-Learning
Deep Q-Learning的變體
固定Q值目標Double DQN經驗重播優先排序Dueling DQN
TF-Agents程式庫 (1/4)
安裝TF-AgentsTF-Agents環境環境規格環境包裝與Atari前置作業
TF-Agents程式庫 (2/4)
訓練結構建立Deep Q-Network
TF-Agents程式庫 (3/4)
建立DQN Agent建立重播緩衝區和相應的觀察器建立訓練評量標準建立收集驅動程式
TF-Agents程式庫 (4/4)
建立資料組建立訓練迴圈
一些熱門的RL演算法概要
習題
第十九章
大規模訓練與部署TensorFlow模型
讓TensorFlow模型提供服務 (1/4)
使用TensorFlow Serving
讓TensorFlow模型提供服務 (2/4)
在GCP AI Platform上建立預測服務
讓TensorFlow模型提供服務 (3/4)
使用預測服務
讓TensorFlow模型提供服務 (4/4)
在行動或嵌入式裝置中部署模型
使用GPU來加快計算速度 (1/3)
購買自己的GPU使用裝備GPU的虛擬機器
使用GPU來加快計算速度 (2/3)
Colaboratory管理GPU RAM將操作與變數傳給裝置
使用GPU來加快計算速度 (3/3)
在多台裝置上平行執行
用多個裝置訓練模型 (1/3)
模型平行化資料平行化
用多個裝置訓練模型 (2/3)
使用Distribution Strategies API來進行大規模訓練用TensorFlow叢集來訓練模型
用多個裝置訓練模型 (3/3)
在Google Cloud AI Platform運行大型訓練工作在AI Platform進行黑箱超參數調整
習題
感謝您！
附錄A
習題解答
附錄B
機器學習專案檢核表
附錄C
SVM對偶問題
附錄D
Autodiff
附錄E
其他流行的ANN結構
附錄F
特殊資料結構
附錄G
TensorFlow圖
索引 (1/5)
索引 (2/5)
索引 (3/5)
索引 (4/5)
索引 (5/5)

Content preview from 精通機器學習

596

第十八章：強化學習

來

，

我們可以合理地假設負優勢的行動是不好的

，

正優勢的行動是好的

。

完美

—

現在我

們有一種評估每一個行動的方法了

，

接下來要使用策略梯度來訓練我們的第一個

agent。

我們來看一下怎麼做

。

策略梯度

如前所述

，PG

演算法藉著追隨前往更高獎勵的梯度來優化策略的參數

。

有一種流行的

演算法稱為

REINFORCE

演算法

，

它是

Ronald Williams

早在

1992

年就提出來的

（https://

homl.info/132

）

。

以下是一種常見的變體

：

1. 先讓神經網路策略玩幾次遊戲，在每一步，計算可讓所選擇的行動更有可能被選中

的梯度，但是先不要套用這些梯度。

2. 執行幾期之後，計算各個行動的優勢（advantage）（使用上一節介紹的方法）。

3. 如果行動的優勢是正的，代表該行動可能是好的，此時你要套用之前算出來的梯度，

來讓此行動以後更有可能被選中。但是，如果行動的優勢是負的，代表該行動可能

是不好的，你要對這個行動套用相反的梯度，讓這個行動以後比較不會被選中。解

決方案就是直接將各個梯度向量乘以對映行動的優勢。

4. 最後，計算所有得到的梯度向量的均值，並用它來執行梯度下降。

我們用

tf.keras

來實作這個演算法

。

我們將訓練之前做出來的神經網路策略

，

讓它學會平

衡車上的桿子

。

首先

，

我們需要一個玩一個步驟的函式

。

我們先假裝它採取的行動是正確

的

，

以便計算

loss

與它的梯度

（

先將這些梯度存起來

，

稍後會根據行動最終的結果是好是

壞來修改它們

）：

def

play_one_step(env, ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9789865024345

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

精通機器學習

by Aurélien Géron

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

下一代空间计算：AR与VR创新理论与实践

C语言核心技术（原书第2版）

面向数据科学家的实用统计学

Python数据科学手册

Publisher Resources