首頁>技術>

#大資料# #大資料分析# #Hadoop# #資料分析#

上一篇介紹了Pig的部署與安裝,本篇將繼續介紹Pig查詢語言為Pig Latin的使用

5 PigLatin使用方法5.1 兩種執行模式:本地或叢集。

pig -x local / pig -x mapreduce(等同於pig)

5.2 sh 選項從Grunt shell中呼叫Linux shell的 ls 命令,fs選項呼叫HDFS的ls命令。

幫助help,退出quit。

5.3 資料型別:基本型別,複雜型別。

基本型別:int,long,float,double,chararray(string:單引號包裹),bytearray(byte[])

複雜型別:map,type,bag(可以任意巢狀)

map:key 是char array ;value 可以任意型別。

[’name’#’bob’,’age’#55]:建立一個包含 name 和 age 兩個鍵的map。

tuple:是一個定長,無須相同型別。

(’bob’,55):建立一個包含兩個欄位的tuple 常量。

bag:是一個無序的tuple集合。無須載入到記憶體中的資料型別。

{(‘bob’,55),(’sally’,52),(‘john,25’)}:構造了一個包含的3個 tuple 的 bag,每個tuple 包含兩個欄位。

5.4 功能語法:

建立表(載入資料):load

stu = load '/test/data.txt' using PigStorage('\t') as(name:chararray,height:int,weight:double);

逐行查詢:foreach

stu1 = foreach stu generate *;dump stu1;

generate:提取列

filter:過濾

stu2 = filter stu by name==‘luoxuan’;

distinct:去重

order by:排序

group by:分組

join:多表查詢

union:聯合查詢

dump:把結果輸出到螢幕上

dump stu;

store:把結果儲存到HDFS上

19
  • BSA-TRITC(10mg/ml) TRITC-BSA 牛血清白蛋白改性標記羅丹明
  • python的常用內建模組與常用第三方模組