Skip to Content
Hadoop技術手冊 第三版
book

Hadoop技術手冊 第三版

by Tom White
January 2013
Intermediate to advanced
680 pages
17h 18m
Chinese
GoTop Information, Inc.
Content preview from Hadoop技術手冊 第三版
396
|
11
章:
Pig
底下的程式碼展示了如何定義並使用一個
trim
自訂函數,來呼叫
Apache Commons
Lang
StringUtils
類別。
grunt> DEFINE trim InvokeForString('org.apache.commons.lang.StringUtils.trim', 'String');
grunt> B = FOREACH A GENERATE trim(fruit);
grunt> DUMP B;
(pomegranate)
(banana)
(apple)
(lychee)
這裡用到
InvokeForString
呼叫器是因為這個函數的回傳值是
String
型態。(另外
還有
InvokeForInt
InvokeForLong
InvokeForDouble
InvokeForFloat
呼叫
器。)呼叫器建構者(
invoker constructor
)的第一個參數是欲呼叫的完整函數。第二
個參數是由空白隔開的參數列表,這些參數是給第一個參數指定的函數用的。
11.5.3
載入用自訂函數
接下來我們將示範一個客製化的載入函數,它可以用欄位字數範圍載入純文字,就像
Unix
cut
指令。其使用方式如下:
grunt>
records = LOAD 'input/ncdc/micro/sample.txt'
>>
USING com.hadoopbook.pig.CutLoadFunc('16-19,88-92,93-93')
>>
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

面向自然语言处理的深度学习课程:深度神经网络在机器学习任务的应用

面向自然语言处理的深度学习课程:深度神经网络在机器学习任务的应用

乔恩·克罗恩
Java并发编程实战

Java并发编程实战

Brian Goetz, Tim Peierls
机器学习和AI精粹

机器学习和AI精粹

诺亚·吉夫特
自造手冊:新工業革命實務指南

自造手冊:新工業革命實務指南

Paolo Aliverti, Andrea Maietta

Publisher Resources

ISBN: 9789862766682