
12.13 資料分群
|
489
將布林值轉換為 0 與 1 後,你可以看出
EuclideanDistance
與
ManhattanDistance
將輸
出大量分群。[Page-491]
針 對 字 串, 可 以 使 用
EditDistance
、
DamerauLevenshteinDistance
與
HammingDistance
等度量。
HammingDistance
度量必須使用等長的字串,否則將輸出錯誤訊息,因此我使用了一個
前置指令將短字串後面填上空格,使每個字串與字數最多的字串等長。
ch12.indd 489 2014/4/2 下午 01:58:02