book

精通機器學習

Name: 精通機器學習
Author: Aurélien Géron
ISBN: 9789865024345

by Aurélien Géron

April 2020

Intermediate to advanced

816 pages

18h 32m

Chinese

GoTop Information, Inc.

Read now

Unlock full access

前言 (1/2)
前言 (2/2)
第一部分
機器學習基本知識
第一章
機器學習領域
什麼是機器學習？
為何使用機器學習？
應用範例
機器學習系統的種類 (1/4)
監督/無監督學習
機器學習系統的種類 (2/4)
批次與線上學習
機器學習系統的種類 (3/4)
基於實例vs. 基於模型
機器學習系統的種類 (4/4)

機器學習的主要挑戰 (1/2)
訓練資料不足訓練資料無代表性低品質的資料無關的特徵過擬訓練資料
機器學習的主要挑戰 (2/2)
欠擬訓練資料後退一步
測試與驗證
超參數調整與模型選擇資料不匹配
習題
第二章
端對端機器學習專案使用真實的資料
瞭解大局
制定問題選擇性能指標
檢查假設
取得資料 (1/3)建立工作區下載資料
取得資料 (2/3)
快速地看一下資料結構建立測試組
取得資料 (3/3)
發現資料並將它視覺化來取得見解 (1/2)
將地理資料視覺化尋找相關性
發現資料並將它視覺化來取得見解 (2/2)
用屬性組合進行實驗
準備資料供機器學習演算法使用 (1/2)
清理資料處理文件與分類屬性
準備資料供機器學習演算法使用 (2/2)
自訂轉換器特徵縮放轉換pipeline
選擇與訓練模型
用訓練組來訓練與評估使用交叉驗證來做更好的評估
微調模型
網格搜尋隨機搜尋整體方法分析最佳模型與它們的誤差用測試組來評估系統
發表、監視與維護系統
盡情嘗試！
習題
第三章
分類MNIST
訓練二元分類器
評量績效用交叉驗證評估準確度混淆矩陣precision與recall
precision/recall取捨
ROC曲線
多類別分類
誤差分析
多標籤分類
多輸出分類
習題
第四章
訓練模型
線性回歸
正規方程式計算複雜度
梯度下降 (1/2)
批次梯度下降
梯度下降 (2/2)
隨機梯度下降小批次梯度下降
多項式回歸
學習曲線
含正則化的線性模型 (1/2)
山嶺回歸Lasso回歸
含正則化的線性模型 (2/2)
彈性網路提前停止
Logistic回歸 (1/2)
估計機率訓練與代價函數決策邊界
Logistic回歸 (2/2)
Softmax回歸
習題
第五章
支援向量機線性SVM分類軟邊距分類
非線性SVM分類
多項式kernel相似的特徵高斯RBF kernel
計算複雜度
SVM回歸
引擎蓋下 (1/2)
決策函數與預測訓練目標二次規劃對偶問題
引擎蓋下 (2/2)
kernelized SVM線上SVM
習題
第六章
決策樹訓練與視覺化決策樹
進行預測
估計類別機率
CART訓練演算法
計算複雜度
使用Gini不純度還是熵？
正則化參數
回歸
不穩定性
習題
第七章
整體學習與隨機森林投票分類器
bagging與pasting
Scikit-Learn的bagging與pastingOut-of-Bag評估
隨機補丁與隨機子空間
隨機森林
Extra-Trees特徵重要性
boosting (1/2)
AdaBoost梯度增強
boosting (2/2)
stacking
習題
第八章
降維
維數災難
主要的降維法
投射Manifold學習
PCA (1/2)
保留變異度主成分往下投射至d維使用Scikit-Learn已解釋變異比選擇正數的維數
PCA (2/2)
用PCA來壓縮Randomized PCAIncremental PCA
Kernel PCA
選擇kernel與調整超參數
LLE
其他的降維技術
習題
第九章
無監督學習技術
分群法（clustering） (1/5)
K-Means
分群法（clustering） (2/5)
分群法（clustering） (3/5)
K-Means的限制用分群來做圖像分割
分群法（clustering） (4/5)
用分群法來進行前置作業使用分群法來做半監督學習
分群法（clustering） (5/5)
DBSCAN其他的分群演算法
高斯混合 (1/3)
高斯混合 (2/3)
使用高斯混合進行異常檢測選擇群聚數量
高斯混合 (3/3)
貝氏高斯混合模型其他的異常與新穎檢測演算法
習題
第二部分
神經網路與深度學習
第十章
以Keras介紹人工神經網路
從生物神經元到人工神經元 (1/3)
生物神經元以神經元進行邏輯計算感知器
從生物神經元到人工神經元 (2/3)
多層感知器與反向傳播
從生物神經元到人工神經元 (3/3)
回歸MLP分類MLP
用Keras來實作MLP (1/5)
安裝TensorFlow 2使用Sequential API來製作圖像分類器
用Keras來實作MLP (2/5)
用Keras來實作MLP (3/5)
使用Sequential API來建立回歸MLP用Functional API來建立複雜的模型
用Keras來實作MLP (4/5)
使用Subclassing API來建立動態模型儲存和取回模型使用回呼
用Keras來實作MLP (5/5)
使用TensorBoard來進行視覺化
微調神經網路超參數 (1/2)
隱藏層的數量每一個隱藏層的神經元數量
微調神經網路超參數 (2/2)
學習速度、批次大小，以及其他超參數
習題
第十一章
訓練深度神經網路
梯度消失/爆炸問題 (1/3)
Glorot與He初始化不飽和觸發函數
梯度消失/爆炸問題 (2/3)
批次正規化
梯度消失/爆炸問題 (3/3)
梯度修剪
重複使用訓練好的階層 (1/2)
用Keras進行遷移學習無監督預先訓練
重複使用訓練好的階層 (2/2)
在輔助任務中預先訓練
更快速的優化法 (1/3)
動量優化Nesterov加速梯度法AdaGradRMSPropAdam與Nadam優化法
更快速的優化法 (2/3)
學習速度排程
更快速的優化法 (3/3)
用正則化來避免過擬 (1/2)
ℓ1與ℓ2正則化DropoutMonte Carlo（MC）Dropout
用正則化來避免過擬 (2/2)
Max-Norm正則化
總結與實作指南
習題
第十二章
用TensorFlow來自製模型和進行訓練
TensorFlow簡介
像NumPy一樣使用TensorFlow
tensor和操作Tensor與NumPy型態轉換變數其他的資料結構
自製模型和訓練演算法 (1/4)
自製損失函數儲存和載入包含自訂元件的模型自製觸發函數、初始化、正則化和約束自訂評量標準
自製模型和訓練演算法 (2/4)
自訂階層
自製模型和訓練演算法 (3/4)
自製模型用模型的內在來定義loss和評量標準使用autodiff來計算梯度
自製模型和訓練演算法 (4/4)
自訂訓練迴圈
TensorFlow函式與圖
AutoGraph與描繪TF Function規則
習題
第十三章
使用TensorFlow來載入和預先處理資料
Data API (1/2)
串接轉換方法將資料洗亂
Data API (2/2)
預先處理資料整合預取以tf.keras使用資料組
TFRecord格式 (1/2)
壓縮TFRecord檔案協定緩衝區（Protocol Buffer）簡介TensorFlow Protobuf載入與解析Example
TFRecord格式 (2/2)
使用SequenceExample Protobuf來處理串列的串列
預先處理輸入特徵 (1/2)
使用one-hot向量來編碼分類特徵使用embedding來編碼分類特徵
預先處理輸入特徵 (2/2)
Keras前置作業層
TF Transform
TensorFlow Datasets（TFDS）專案
習題
第十四章
使用摺積神經網路來製作深度電腦視覺
視覺皮層的結構
摺積層 (1/2)
過濾器堆疊多張特徵圖
摺積層 (2/2)
TensorFlow實作記憶體需求
池化層
TensorFlow實作
CNN結構 (1/4)
LeNet-5AlexNet
CNN結構 (2/4)
GoogLeNetVGGNetResNet
CNN結構 (3/4)
XceptionSENet
CNN結構 (4/4)
用Keras實作ResNet-34 CNN
使用Keras訓練好的模型
用訓練好的模型來進行遷移學習
分類和定位
物體偵測 (1/2)
全摺積網路You Only Look Once（YOLO）
物體偵測 (2/2)
語義分割
習題
第十五章
使用RNN和CNN來處理序列
遞迴神經與階層
記憶細胞輸入與輸出序列
訓練RNN
預測時間序列基準指標實作簡單RNN深度RNN
提前幾個時步預測未來
處理很長的序列 (1/2)
對抗梯度不穩定問題處理短期記憶問題
處理很長的序列 (2/2)
習題
第十六章
用RNN與Attention處理自然語言
用Character RNN產生莎翁文章 (1/2)
建立訓練資料組如何拆開循序的資料組將循序資料組分成多個窗口建立與訓練Char-RNN模型
用Character RNN產生莎翁文章 (2/2)
使用Char-RNN模型產生假的莎翁文章stateful RNN
情緒分析 (1/2)
遮罩
情緒分析 (2/2)
重複使用訓練好的embedding
用於神經機器翻譯的Encoder–Decoder網路 (1/2)
雙向RNN集束搜尋
用於神經機器翻譯的Encoder–Decoder網路 (2/2)
專注機制 (1/3)
視覺專注你需要的只是專注：Transformer結構
專注機制 (2/3)
專注機制 (3/3)
最近在語言模型領域的創新
習題
第十七章
使用自動編碼網路與GAN來進行表徵學習與生成學習
高效的資料表示法
使用undercomplete線性自動編碼網路來執行PCA
自動編碼網路堆疊 (1/2)
使用Keras實作堆疊式自動編碼網路將重建結果視覺化將Fashion MNIST資料組視覺化用堆疊式自動編碼網路來進行無監督預先訓練
自動編碼網路堆疊 (2/2)
綁定權重一次訓練一個自動編碼網路
摺積自動編碼網路
遞迴自動編碼網路
去雜訊自動編碼網路
稀疏自動編碼網路
變分自動編碼網路 (1/2)
產生Fashion MNIST圖像
變分自動編碼網路 (2/2)
生成對抗網路 (1/3)
訓練GAN的挑戰
生成對抗網路 (2/3)
深度摺積GAN逐漸建構GAN
生成對抗網路 (3/3)
StyleGANs
習題
第十八章
強化學習
藉由學習來優化獎勵
策略搜尋
OpenAI Gym簡介
神經網路策略
評估行動：歸功問題
策略梯度
馬可夫決策過程
時序差分學習
Q-Learning
探索策略Approximate Q-Learning與Deep Q-Learning
實作Deep Q-Learning
Deep Q-Learning的變體
固定Q值目標Double DQN經驗重播優先排序Dueling DQN
TF-Agents程式庫 (1/4)
安裝TF-AgentsTF-Agents環境環境規格環境包裝與Atari前置作業
TF-Agents程式庫 (2/4)
訓練結構建立Deep Q-Network
TF-Agents程式庫 (3/4)
建立DQN Agent建立重播緩衝區和相應的觀察器建立訓練評量標準建立收集驅動程式
TF-Agents程式庫 (4/4)
建立資料組建立訓練迴圈
一些熱門的RL演算法概要
習題
第十九章
大規模訓練與部署TensorFlow模型
讓TensorFlow模型提供服務 (1/4)
使用TensorFlow Serving
讓TensorFlow模型提供服務 (2/4)
在GCP AI Platform上建立預測服務
讓TensorFlow模型提供服務 (3/4)
使用預測服務
讓TensorFlow模型提供服務 (4/4)
在行動或嵌入式裝置中部署模型
使用GPU來加快計算速度 (1/3)
購買自己的GPU使用裝備GPU的虛擬機器
使用GPU來加快計算速度 (2/3)
Colaboratory管理GPU RAM將操作與變數傳給裝置
使用GPU來加快計算速度 (3/3)
在多台裝置上平行執行
用多個裝置訓練模型 (1/3)
模型平行化資料平行化
用多個裝置訓練模型 (2/3)
使用Distribution Strategies API來進行大規模訓練用TensorFlow叢集來訓練模型
用多個裝置訓練模型 (3/3)
在Google Cloud AI Platform運行大型訓練工作在AI Platform進行黑箱超參數調整
習題
感謝您！
附錄A
習題解答
附錄B
機器學習專案檢核表
附錄C
SVM對偶問題
附錄D
Autodiff
附錄E
其他流行的ANN結構
附錄F
特殊資料結構
附錄G
TensorFlow圖
索引 (1/5)
索引 (2/5)
索引 (3/5)
索引 (4/5)
索引 (5/5)

Content preview from 精通機器學習

分群法（clustering）

235

>>>

kmeans.transform(X_new)

array([[2.81093633, 0.32995317, 2.9042344 , 1.49439034, 2.88633901],

[5.80730058, 2.80290755, 5.84739223, 4.4759332 , 5.84236351],

[1.21475352, 3.29399768, 0.29040966, 1.69136631, 1.71086031],

[0.72581411, 3.21806371, 0.36159148, 1.54808703, 1.21567622]])

在這個例子中

，

X_new

的第一個實例距離第一個質心

2.81，

距離第二個質心

0.33，

距離第

三個質心

2.90，

距離第四個質心

1.49，

距離第五個質心

2.89。

如果你的資料組是高維的

，

用這種方式轉換它可產生一個

維的資料組

：

這個轉換或許是非常高效的非線性降維技

術

。

K-Means 演算法

那麼

，

這個演算法究竟是如何運作的呢

？

如果你已經知道質心了

，

你可以將資料組的所有

實例分配給最接近它的質心所屬的群聚

，

來輕鬆地幫所有實例加上標籤

。

反過來說

，

如果

你已經取得所有實例標籤了

，

你可以計算各個群體的實例均值

，

來輕鬆地找到所有質心

。

但是現在你既沒有標籤

，

也沒有質心

，

該如何繼續工作

？

你只要隨便放置質心

（

例如隨機

選擇

個實例

，

並且將它們的位置當成質心

），

再幫實例加上標籤

，

更改質心

，

加標籤

，

更改質心

，

以此類推 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9789865024345

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

精通機器學習

by Aurélien Géron

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

下一代空间计算：AR与VR创新理论与实践

C语言核心技术（原书第2版）

面向数据科学家的实用统计学

Python数据科学手册

Publisher Resources