Welcome to Scribd!

Pig Queries

Uploaded by

0% found this document useful (0 votes)

11 views5 pages

The document outlines steps to use Pig on HDFS: load data from files into Pig, run Pig commands in the grunt shell to read, filter, group, and store data. It demonstrates loading data from HDFS, specifying schemas, combining relations, filtering based on field values, grouping by fields, selecting fields, and storing the output back to HDFS.

Original Description:

Copyright

Available Formats

TXT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

11 views5 pages

Pig Queries

Uploaded by

dude

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 5

Search inside document

Objectives:

• To read a file from HDFS into Pig environment

• To execute pig commands in grunt shell
• To be familiar with tuples and bags in Pig

Q1: How to enter in grunt shell?

[cloudera@quickstart Desktop]$ pig

Q2: Create two data sets using gedit command in local?

[cloudera@quickstart Desktop]$ cat pigfile.txt
1,2,3
4,5,6
5,7,0

[cloudera@quickstart Desktop]$ gedit pigfile1.txt

2,4,5
2,4,5
4,7,9

Q3: Copy the above files in HDFS?

[cloudera@quickstart Desktop]$ hadoop fs -put pigfile.txt /user/cloudera/
[cloudera@quickstart Desktop]$ hadoop fs -put pigfile1.txt /user/cloudera/

Q4: How to read your (pigfile.txt and pigfile.txt) data in PIG

grunt> a = LOAD '/user/cloudera/pigfile.txt' using PigStorage(',');
grunt> dump a;

OUTPUT
(1,2,3)
(4,5,6)
(5,7,0)

grunt> a = LOAD '/user/cloudera/pigfile1.txt' using PigStorage(',');

grunt> dump b;
OUTPUT
2,4,5
2,4,5
4,7,9

Q4: Specify the schema for above two tables?

grunt> a = LOAD '/user/cloudera/pigfile.txt' using PigStorage(',') as (a1:int,
a2:int, a3:int);
grunt> dump a;
grunt> b = LOAD '/user/cloudera/pigfile1.txt' using PigStorage(',') as (b1:int,
b2:int, b3:int);
grunt> dump b;

Q5: Check the schema of the two tables?

grunt> describe a;
OUTPUT
a: {a1: int,a2: int,a3: int}
grunt> describe b;
OUTPUT
b: {b1: int,b2: int,b3: int}

Q6: Combine the two tables

grunt> c= union a,b;
grunt> dump c
OUTPUT

(2,4,5)
(2,4,5)
(4,7,9)
(1,2,3)
(4,5,6)
(5,7,0)

Q7: Split the c data set into two different relations eg. d and e? E.g. I want one
data set where $0 is having value 1 and other data set where value of $0 is 4
grunt> SPLIT c INTO d IF $0 == 1 , e IF $0 == 4;

dump d;
OUTPUT
(1,2,3)
dump e;
(4,7,9)
(4,5,6)
Q8: Do filtering on data set c where $1 is greater than 6?
grunt> f = FILTER c BY $1 > 6;

grunt> dump f
OUTPUT
(5,7,0)
(4,7,9)

Q9: Group data set c by $2?

grunt> g = GROUP c by $2;
OUTPUT

(0,{(5,7,0)})
(3,{(1,2,3)})
(5,{(2,4,5),(2,4,5)})
(6,{(4,5,6)})
(9,{(4,7,9)})

Q10: Select column 1 and 2 from dataset a ?

grunt> s1 = foreach a generate $1,$2;

grunt> dump s1;
OUTPUT
(2,3)
(5,6)
(7,0)

Q11: Store the above result in HDFS?

grunt> store s1 into '/user/cloudera/pigresult';

Q12: check the file written in HDFS

[cloudera@quickstart Desktop]$ hadoop fs -ls /user/cloudera/pigresult/

OUTPUT
Found 2 items
-rw-r--r-- 1 clouderacloudera 0 2018-09-19 03:50
/user/cloudera/pigresult/_SUCCESS
-rw-r--r-- 1 clouderacloudera 12 2018-09-19 03:50
/user/cloudera/pigresult/part-m-00000
Now see what’s inside part-m-00000

[cloudera@quickstart Desktop]$ hadoop fs -cat /user/cloudera/pigresult/part-m-00000

Analyzing Historical Stock - Revenue Data and Building A Dashboard - Jupyter Notebook
Document9 pages
Analyzing Historical Stock - Revenue Data and Building A Dashboard - Jupyter Notebook
Nitish Ravuvari
No ratings yet
AQA Assembly Language Questions and MS
Document9 pages
AQA Assembly Language Questions and MS
Ben Daffada
No ratings yet
Big Data Practice
Document93 pages
Big Data Practice
srinivas75k
No ratings yet
Store Exercises Assembly
Document5 pages
Store Exercises Assembly
Dương Dũng
50% (2)
Free Form RPG
Document18 pages
Free Form RPG
VISHNU400
No ratings yet
Tutorial On Oracle Forms, Reports and Graphics
Document124 pages
Tutorial On Oracle Forms, Reports and Graphics
Sathyaraj Mathivanan
No ratings yet
EnterpriseDB PostgreSQL Exercises
Document29 pages
EnterpriseDB PostgreSQL Exercises
Stephen Efange
No ratings yet
Pig
Document12 pages
Pig
Stunt Stunt
No ratings yet
CS6481 OS Lab Manua 2018-19
Document11 pages
CS6481 OS Lab Manua 2018-19
Prakash
No ratings yet
Assignment 3 Submitted by:-YOGESH YADAV ROLL NO. R610215057 SAP ID 500048466
Document6 pages
Assignment 3 Submitted by:-YOGESH YADAV ROLL NO. R610215057 SAP ID 500048466
Yogesh Yadav
No ratings yet
Computer Science Project For Class 12
Document10 pages
Computer Science Project For Class 12
Mukul
No ratings yet
Import Pandas As PD
Document10 pages
Import Pandas As PD
nihalparteti26
No ratings yet
Big Data Lab Manual and Syllabus
Document71 pages
Big Data Lab Manual and Syllabus
startechbyjus123
No ratings yet
Miscellaneous R Notes: C 2005 Ben Bolker September 15, 2005
Document2 pages
Miscellaneous R Notes: C 2005 Ben Bolker September 15, 2005
juntujuntu
No ratings yet
Practical - 1 Aim
Document13 pages
Practical - 1 Aim
nihalparteti26
No ratings yet
EM622 Data Analysis and Visualization Techniques For Decision-Making
Document47 pages
EM622 Data Analysis and Visualization Techniques For Decision-Making
Ridhi B
No ratings yet
Geonode On Ubuntu-Latest
Document7 pages
Geonode On Ubuntu-Latest
xbartolone
No ratings yet
Experiment 3: Hive: Aim: To Understand Data Processing Tool - Hive and HQL (Hive Query Language)
Document11 pages
Experiment 3: Hive: Aim: To Understand Data Processing Tool - Hive and HQL (Hive Query Language)
Ňąŕëşh ķümãŕ S
No ratings yet
BDA - Week04 - 10
Document41 pages
BDA - Week04 - 10
Aditya Raj
No ratings yet
Programming With R: Lecture #4
Document34 pages
Programming With R: Lecture #4
Shubham Patidar
No ratings yet
HUAWEI - 05 Python Exercise
Document5 pages
HUAWEI - 05 Python Exercise
Pierpaolo Vergati
No ratings yet
Sqflite - Flutter Package
Document10 pages
Sqflite - Flutter Package
osaadoukou
No ratings yet
Xilinx Ise Project Navigator
Document55 pages
Xilinx Ise Project Navigator
anon_720738735
No ratings yet
SQL Server
Document9 pages
SQL Server
Zakaria Biaz
No ratings yet
Class XII Computer Science: HOTS (High Order Thinking Skill)
Document14 pages
Class XII Computer Science: HOTS (High Order Thinking Skill)
Janaki
No ratings yet
Lesson1 Notes Fastai
Document18 pages
Lesson1 Notes Fastai
Oscar Toku
No ratings yet
Quiz 3: Computer Programming (MA511)
Document2 pages
Quiz 3: Computer Programming (MA511)
Naveen Gupta
No ratings yet
Os Lab Manual
Document113 pages
Os Lab Manual
sasi kumar L
No ratings yet
ORACLE To Oracle Replication Through Golden Gate 3
Document8 pages
ORACLE To Oracle Replication Through Golden Gate 3
SSABEEN
No ratings yet
C++ Exercises Chapter 2 (Solution)
Document11 pages
C++ Exercises Chapter 2 (Solution)
Mauricio Bedoya
No ratings yet
Answers To Aspire in
Document43 pages
Answers To Aspire in
Vasanth Kumar
No ratings yet
Data Minig and Techniquezz
Document48 pages
Data Minig and Techniquezz
manikantaala5
No ratings yet
Readme
Document11 pages
Readme
Edisson Alzate
No ratings yet
Pygments Options With Minted: 1 Default
Document24 pages
Pygments Options With Minted: 1 Default
Alex Mandel
No ratings yet
R Programs
Document30 pages
R Programs
Ranga Swamy
No ratings yet
Computer Science Class 12th Projects - Employee Database Management System
Document27 pages
Computer Science Class 12th Projects - Employee Database Management System
Dev Mehta
0% (1)
KV No 1, Afs, Agra: Section - A
Document4 pages
KV No 1, Afs, Agra: Section - A
Captain America
No ratings yet
Ifs Read Dir
Document3 pages
Ifs Read Dir
Miguel Ángel Macías Martínez
No ratings yet
All Questions 1-50
Document25 pages
All Questions 1-50
hamid_25
No ratings yet
R Syntax Examples 1
Document6 pages
R Syntax Examples 1
Pedro Cruz
No ratings yet
Pset 1
Document4 pages
Pset 1
Dhruv Bhalla
No ratings yet
Create A PDF File Via The IText Library
Document4 pages
Create A PDF File Via The IText Library
Bikash Bhanu Roy
No ratings yet
Answers To Aspire in
Document44 pages
Answers To Aspire in
Kumar Abhinav
No ratings yet
Kaun Banega Crorepati C Project
Document43 pages
Kaun Banega Crorepati C Project
Prince Kumar
100% (1)
DR Doc MPMKVVCL v1
Document12 pages
DR Doc MPMKVVCL v1
Anil Kumar Singh
No ratings yet
Fresco Code Python Application Programming
Document7 pages
Fresco Code Python Application Programming
TECHer YT
No ratings yet
HADOOP AND BIG DATA - Final
Document26 pages
HADOOP AND BIG DATA - Final
Deeq Huseen
No ratings yet
Objectives
Document7 pages
Objectives
shrikant2002
No ratings yet
3 Lec Notes For DJCT
Document5 pages
3 Lec Notes For DJCT
kv n
No ratings yet
Sample Paper - 2012 Class - XII Subject - COMPUTER SCIENCE - 083 (Theory) Time Allowed: 3 Hours Maximum Marks: 70
Document7 pages
Sample Paper - 2012 Class - XII Subject - COMPUTER SCIENCE - 083 (Theory) Time Allowed: 3 Hours Maximum Marks: 70
Atif Imam
No ratings yet
Python - DataScience Question - Paper
Document5 pages
Python - DataScience Question - Paper
ASHUTOSH TRIVEDI
No ratings yet
Java Mock Tests For SCJP
Document36 pages
Java Mock Tests For SCJP
Thyagarajan
100% (4)
Ayush - CNN - Deep Learning Cat&Dog
Document1 page
Ayush - CNN - Deep Learning Cat&Dog
ayush vaishya
No ratings yet
Sr. Python Developer Test
Document4 pages
Sr. Python Developer Test
Mani Sankar Karanam
No ratings yet
Anmol Puri Xii D Roll No.:07
Document43 pages
Anmol Puri Xii D Roll No.:07
Beenu Puri
No ratings yet
Assignment-1 (Python Pandas-Series Object and Data Frame: 1. Answer The Following
Document8 pages
Assignment-1 (Python Pandas-Series Object and Data Frame: 1. Answer The Following
Vaishnavi Kesarwani
No ratings yet
Internacionalization: Building Multi-Language Applications With Cakephp
Document18 pages
Internacionalization: Building Multi-Language Applications With Cakephp
zumbul11
No ratings yet
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
LPIC-1 Primer
From Everand
LPIC-1 Primer
John Greene
Rating: 4.5 out of 5 stars
4.5/5 (3)
150+ C Pattern Programs
From Everand
150+ C Pattern Programs
Hernando Abella
No ratings yet
UNIX Shell Programming Interview Questions You'll Most Likely Be Asked
From Everand
UNIX Shell Programming Interview Questions You'll Most Likely Be Asked
Vibrant Publishers
No ratings yet
Unit - 3
Document112 pages
Unit - 3
dude
No ratings yet
Bda Record 18071a0597-1
Document28 pages
Bda Record 18071a0597-1
dude
No ratings yet
Bda Record 18071a0597-1
Document29 pages
Bda Record 18071a0597-1
dude
No ratings yet
Vallurupalli Nageswara Rao Vignana Jyothi Institute of Engineering &technology
Document19 pages
Vallurupalli Nageswara Rao Vignana Jyothi Institute of Engineering &technology
dude
No ratings yet
Replica Set
Document16 pages
Replica Set
umanagarjuna
No ratings yet
Android JSON Parsing Tutorial
Document16 pages
Android JSON Parsing Tutorial
Luis F Jauregui
No ratings yet
Assembly Language Lab # 5 Loop Instruction: Eng. Alaa.I.Haniya
Document6 pages
Assembly Language Lab # 5 Loop Instruction: Eng. Alaa.I.Haniya
Ali Muhammad
No ratings yet
Python Lab Exercises: Code
Document7 pages
Python Lab Exercises: Code
ram gopal sharma
No ratings yet
1 Bcom - 2 Semester - E-Commerce and Web Designing - LAB-Experiments
Document23 pages
1 Bcom - 2 Semester - E-Commerce and Web Designing - LAB-Experiments
THE KING
100% (3)
Compiler Design Lab
Document10 pages
Compiler Design Lab
Varghese Shibu
No ratings yet
30 Hour Basic Commodore 64 Edition
Document292 pages
30 Hour Basic Commodore 64 Edition
Lo
No ratings yet
TM 354
Document25 pages
TM 354
عمر حجر
No ratings yet
Querydsl Reference
Document55 pages
Querydsl Reference
Logan Grimnar
No ratings yet
Assignment 10 Solution
Document4 pages
Assignment 10 Solution
vinith
No ratings yet
Comp Architecture Sample Questions
Document9 pages
Comp Architecture Sample Questions
Mohamaad Sihatth
No ratings yet
SFDC Fullstack Course Content
Document14 pages
SFDC Fullstack Course Content
Sarath Kumar
No ratings yet
Mergetool en
Document18 pages
Mergetool en
Lucky Hunter
No ratings yet
Java Notes
Document13 pages
Java Notes
Taylor Maxfield
No ratings yet
PIC Microcontrollers: Chapter 5: Branch, Call, and Time Delay Loop
Document31 pages
PIC Microcontrollers: Chapter 5: Branch, Call, and Time Delay Loop
Bernard Maacaron
100% (1)
Intro
Document1 page
Intro
sapatitocaro
No ratings yet
Basic C Program
Document23 pages
Basic C Program
Malik Jaani
No ratings yet
Revision History
Document31 pages
Revision History
huertourbano27
No ratings yet
I PUC Computer Science
Document2 pages
I PUC Computer Science
Melwin Sera
No ratings yet
Oracle Placement Sample Paper 5
Document16 pages
Oracle Placement Sample Paper 5
Naveen Pal
No ratings yet
Mini Project MAD 2
Document22 pages
Mini Project MAD 2
Sachin Awati
No ratings yet
SE Question Bank
Document7 pages
SE Question Bank
kb181203
No ratings yet
Winter 2019 OOP
Document2 pages
Winter 2019 OOP
Rakesh Joshi
No ratings yet
15SE202 SoftwareEP Syllabus
Document2 pages
15SE202 SoftwareEP Syllabus
Anonymous k1cZPS5xX
0% (1)
Step by Step Guide To Develop Outbound ABAP Proxy With PDF Attachment
Document6 pages
Step by Step Guide To Develop Outbound ABAP Proxy With PDF Attachment
蔡裕峰
No ratings yet
Creating and Editing A Data File Final
Document36 pages
Creating and Editing A Data File Final
Thanh Thảo
No ratings yet
Untitled
Document7 pages
Untitled
Indra Rian Jaya
No ratings yet
8086 Assembly Language Programming I
Document46 pages
8086 Assembly Language Programming I
Mohammad Gulam Ahamad
100% (3)