
可用的客戶端
|
277
再一次使用
DUMP
,這次使用關係
S
,最後的結果如下:
grunt>
DUMP S;
(002BB5A52580A8ED,970916150445,margaret laurence the stone angel)
(002BB5A52580A8ED,970916150505,margaret laurence the stone angel)
...
在這個地方,只要在取代在先前程式碼的
LOAD
和
STORE
敘述,繼續處理剩下來的 Pig 練
習課程。要結束這個範例,最後輸入
QUIT
來離開 Grunt shell:
grunt>
QUIT;
$
然而,Pig 對 HBase 的支援,在目前的版本還有些缺點:
沒有版本支援
處理 HBase 儲存單元時,目前沒有辦法指定任意的版本。Pig 只支援最新版本。
固定的欄位對應
Row key 必須是第一個欄位,而且不能被放在其他位置。透過隨後的
FOREACH...GENERATE
敘述,重新編排關係的配置,可以克服此問題。
檢查 Pig 專案網站,看這些特色是否已經被加入。
Cascading
Cascading 是一個給MapReduce 用的替代性API。在執行期間,它會在背後使
用 MapReduce,但在開發階段,使用者不必去想在 Hadoop 上執行時所要建立的
MapReduce 解決方案。
使用的模式很像是一個真實世界的
管線組合
(
pipe assembly
),這裡的資料來源是
水龍
頭
(
tap
)而輸出是
水槽
(
sink
)。這些
管道
(
piped ...