
364
|
第八章:向量化
圖片格式
每一種格式都採用不同的方式儲存圖片資料,並對原始資料執行不同等級
的壓縮。圖片與文字有所不同,相較之下圖片的向量化做法會比較直接
一點。
處理影片資料
影片資料向量化是圖片向量化與時間序列向量化的綜合體。在影片資料
中,我們會有一系列帶有時間戳(timestamp)的圖片。影片的向量化過
程必須隨時間追蹤圖片向量化的結果,而且以我們所考慮的單一向量而言
(例如採用單一畫格,或是跨越多個畫格的圖片子集),情況有可能還會
變得更加複雜。
圖片資料在 DL4J 中的表達方式
在深度學習的領域中,我們最感興趣的就是 CNN 的圖片向量化做法。在 DL4J 中,我們
會用
INDArray
物件把每個圖片轉換成三維張量表達方式(更多關於這個主題的介紹,請
參見附錄 E 的內容),如圖 8-1 所示。
轉換函數 激活函數
激活值
淨輸入
輸入立方體
(特別強調過濾器關注的部分)
過濾器
人工神經元模型細節
神經元
圖 8-1 CNN 的三維輸入立方體