
108
|
第
6
章
~$ $HIVE_HOME/bin/hive
hive> use log_data;
OK
Time taken: 0.221 seconds
使用 LOAD DATA 命令,并指定日志文件的
HDFS
路径,将内容写入到 apache_log 表中:
hive> LOAD DATA INPATH 'statistics/log_data/apache.log'
OVERWRITE INTO TABLE apache_log;
Loading data to table log_data.apache_log
rmr: DEPRECATED: Please use 'rm -r' instead.
Deleted hdfs://localhost:9000/user/hive/warehouse/log_data.db/apache_log
Table log_data.apache_log stats: [numFiles=1, numRows=0, totalSize=52276758,
rawDataSize=0]
OK
Time taken: 0.902 seconds
LOAD DATA 是
Hive
的批量加载命令。INPATH 携带一个指向默认文件系统(本例中为
HDFS
)
中的路径的参数。我们还可以使用 LOCAL INPATH 来指定本地文件系统上的路径。
Hive
将文
件移动到仓库位置。如果使用 OVERWRITE 关键字,则目标表中的所有已有数据将被删除并 ...