#大資料# #大資料分析# #Hadoop# #資料分析#
上一篇介紹了Pig的部署與安裝,本篇將繼續介紹Pig查詢語言為Pig Latin的使用
5 PigLatin使用方法5.1 兩種執行模式:本地或叢集。pig -x local / pig -x mapreduce(等同於pig)
5.2 sh 選項從Grunt shell中呼叫Linux shell的 ls 命令,fs選項呼叫HDFS的ls命令。幫助help,退出quit。
5.3 資料型別:基本型別,複雜型別。基本型別:int,long,float,double,chararray(string:單引號包裹),bytearray(byte[])
複雜型別:map,type,bag(可以任意巢狀)
map:key 是char array ;value 可以任意型別。
[’name’#’bob’,’age’#55]:建立一個包含 name 和 age 兩個鍵的map。
tuple:是一個定長,無須相同型別。
(’bob’,55):建立一個包含兩個欄位的tuple 常量。
bag:是一個無序的tuple集合。無須載入到記憶體中的資料型別。
{(‘bob’,55),(’sally’,52),(‘john,25’)}:構造了一個包含的3個 tuple 的 bag,每個tuple 包含兩個欄位。
5.4 功能語法:建立表(載入資料):load
stu = load '/test/data.txt' using PigStorage('\t') as(name:chararray,height:int,weight:double);
逐行查詢:foreach
stu1 = foreach stu generate *;dump stu1;
generate:提取列
filter:過濾
stu2 = filter stu by name==‘luoxuan’;
distinct:去重
order by:排序
group by:分組
join:多表查詢
union:聯合查詢
dump:把結果輸出到螢幕上
dump stu;
store:把結果儲存到HDFS上