Welcome to Scribd!

BDA4

Uploaded by

0% found this document useful (0 votes)

2 views7 pages

This document describes an experiment to analyze weather data using MapReduce. The experiment involves: 1) Downloading weather data files from NOAA and concatenating them into a single file. 2) Creating a Java project in Eclipse containing Mapper, Reducer, and Driver classes to find the maximum temperature by year in the weather data using MapReduce. 3) Configuring the Java project to include the necessary Hadoop libraries and jars.

Original Description:

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

2 views7 pages

BDA4

Uploaded by

nikithakatta0

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 7

Search inside document

Big data Analytics LAB

Experiment_no-04

Aim: Write a Map Reduce program that mines weather data. Weather sensors
collecting data every hour at many locations across the globe gather a large volume
of log data, which is a good candidate for analysis with MapReduce, since it is
semi structured and record-oriented.

Description:

1) Open Oracle VM VirtualBox->export cloudera->start

2) Open browser and type “ftp://ftp.ncdc.noaa.gov/pub/data/noaa/”.

3) Download any 3 folders to workspace.

4) There are multiple files in a folder, concatenate those files into a folder as
follows.
5) Concatenate these 3 folders into a single folder as follows.

6) Right click on ncdc.gz ->Extract here->rename->ncdc.txt

7) In eclipse->File->New->Java project->Project name “Weather”->Finish

8) Create three classes.

Right click on Weather-> New->class->Name “MaxTemperature”

Right click on Weather-> New->class->Name “MaxTemperatureMapper”

Right click on Weather -> New->class->Name “MaxTemperatureReducer”

9) Add Hadoop libraries.

Right click on Weather->Build path->Configure Build path->Add external

JARS. (usr\lib\hadoop\hadoop-common-2.6.0-cdh 5.13.0 jar,

usr\lib\hadoop\hadoop-core-2.6.0-cdh 5.13.0 jar)

Program:

MaxTemperature.java

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class MaxTemperature {

public static void main(String[] args)throws Exception{

if(args.length!=2)

System.err.println("error");

System.exit(-1);

Job job=new Job();

job.setJarByClass(MaxTemperature.class);

job.setJobName("Max Temperature");

FileInputFormat.addInputPath(job,new Path(args[0]));

FileOutputFormat.setOutputPath(job,new Path(args[1]));

job.setMapperClass(MaxTemperatureMapper.class);

job.setReducerClass(MaxTemperatureReducer.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(IntWritable.class);

System.exit(job.waitForCompletion(true)?0:1);

MaxTemperatureMapper.java

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;
public class MaxTemperatureMapper extends

Mapper<LongWritable,Text,Text,IntWritable>

private static final int MISSING=9999;

@Override

public void map(LongWritable key,Text value,Context context)

throws IOException,InterruptedException{

String line=value.toString();

String year=line.substring(15,19);

int airTemperature;

if(line.charAt(87)=='+')

airTemperature=Integer.parseInt(line.substring(88,92));

else

airTemperature=Integer.parseInt(line.substring(87,92));

String quality=line.substring(92,93);

if(airTemperature!=MISSING && quality.matches("[01459]"))

context.write(new Text(year),new IntWritable(airTemperature));

MaxTemperatureReducer.java

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

public class MaxTemperatureReducer extends

Reducer<Text,IntWritable,Text,IntWritable>{

@Override

public void reduce(Text key,Iterable<IntWritable> values,Context

context)throws IOException,InterruptedException

int maxValue=Integer.MIN_VALUE;

for(IntWritable Values:values)

maxValue=Math.max(maxValue, Values.get());

context.write(key, new IntWritable(maxValue));

Right click on Weather->Export->java->jar file->JAR file:” Temp”->Finish

OUTPUT:

In Terminal

Lab Manual
Document86 pages
Lab Manual
pthuynh709
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements Public Void Throws
Document6 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements Public Void Throws
SARAVANAN
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
Document7 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
SARAVANAN
No ratings yet
Bda Unit 3
Document22 pages
Bda Unit 3
Vyshnavi Thottempudi
No ratings yet
Tutorial Partitioner
Document8 pages
Tutorial Partitioner
pavan2711
No ratings yet
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Document61 pages
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Parth
No ratings yet
Worksheet 6th
Document6 pages
Worksheet 6th
Neeraj Kukreti
No ratings yet
Analyzing The Data With Hadoop
Document13 pages
Analyzing The Data With Hadoop
Vyshnavi Thottempudi
No ratings yet
BDALab Assn4
Document9 pages
BDALab Assn4
Deepti Agrawal
No ratings yet
BDALab Assn4
Document9 pages
BDALab Assn4
Deepti Agrawal
No ratings yet
BDT Lab Manual
Document48 pages
BDT Lab Manual
Vishnu Vardhan H
No ratings yet
12 CodigoNetbeans
Document5 pages
12 CodigoNetbeans
Miguel Angel
No ratings yet
BDA3
Document7 pages
BDA3
nikithakatta0
No ratings yet
CP5261 Data Analytics Laboratory LTPC0042 Objectives
Document80 pages
CP5261 Data Analytics Laboratory LTPC0042 Objectives
Bef
No ratings yet
Big Data
Document67 pages
Big Data
B21A4530 Ashritha
No ratings yet
Run Wordcount
Document3 pages
Run Wordcount
Khushi Patil
No ratings yet
Assignment 2-033
Document13 pages
Assignment 2-033
DHARSHANA C P
No ratings yet
Generic Algorithm Based Intrusion Detection System (GA-IDS) : Documentation
Document9 pages
Generic Algorithm Based Intrusion Detection System (GA-IDS) : Documentation
vtapia
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
Document5 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
riya k
No ratings yet
Apache Tomcat Mysql New Information Related To The Tomcat Config
Document8 pages
Apache Tomcat Mysql New Information Related To The Tomcat Config
Muhammad Aizuddin
No ratings yet
Experiment: Word Count in Hadoop
Document12 pages
Experiment: Word Count in Hadoop
SAMINA ATTARI
No ratings yet
Execute Java Map Reduce Sample Using Eclipse
Document9 pages
Execute Java Map Reduce Sample Using Eclipse
Arjun S
No ratings yet
Setting Arduino Xampp
Document3 pages
Setting Arduino Xampp
baso_syahrul
100% (1)
Digital Assignment-1: Raghvendra Singh Sisodia 19bce1381
Document12 pages
Digital Assignment-1: Raghvendra Singh Sisodia 19bce1381
Raghvendra Sisodia
No ratings yet
Big Data Manual
Document19 pages
Big Data Manual
Madhubala J
No ratings yet
Learning C#
Document69 pages
Learning C#
Syahrial Paola
No ratings yet
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
Document11 pages
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
saiconze
No ratings yet
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
Document4 pages
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
Karthick Jothivel
No ratings yet
create Objects: Return
Document200 pages
create Objects: Return
Niranjan
No ratings yet
Big Data Fundamentals and Platforms Assginment 3
Document6 pages
Big Data Fundamentals and Platforms Assginment 3
sagar srivastava
No ratings yet
Palak
Document10 pages
Palak
Dolly Mehra
No ratings yet
MapReduce Word Count Program
Document6 pages
MapReduce Word Count Program
shaliniiii
No ratings yet
Practical No 8 (C)
Document3 pages
Practical No 8 (C)
jenni koko
No ratings yet
Utilizing The Power of Interfaces When Mocking and Testing External APIs in Golang
Document25 pages
Utilizing The Power of Interfaces When Mocking and Testing External APIs in Golang
Carlos Ricardo Schmitz
No ratings yet
Big Data - ASSIGNMENT 2
Document15 pages
Big Data - ASSIGNMENT 2
DHARSHANA C P
No ratings yet
Installation of Apache Hadoop 2. Word Count Program
Document25 pages
Installation of Apache Hadoop 2. Word Count Program
necn cse-b 2nd-year
No ratings yet
Step 2 - First MapReduce Program
Document25 pages
Step 2 - First MapReduce Program
Santosh Kumar Desai
No ratings yet
Wordcount
Document3 pages
Wordcount
21020279 Trần Diệu Anh
No ratings yet
Big Data
Document25 pages
Big Data
Anu Graphics
No ratings yet
Word Count Exercise Instructions
Document3 pages
Word Count Exercise Instructions
Ashwin Ajmera
No ratings yet
1-Implementing A Java Program
Document13 pages
1-Implementing A Java Program
pratigya g
No ratings yet
BDA LabManual
Document20 pages
BDA LabManual
posprojectz
No ratings yet
How Can I Be A Programmer in C#
Document12 pages
How Can I Be A Programmer in C#
Ariel Cupertino
No ratings yet
EA3 Build
Document63 pages
EA3 Build
megalai
No ratings yet
Les Code
Document8 pages
Les Code
Manelle Bouyahyi
No ratings yet
Setting Up Eclipse:: Codelab 1 Introduction To The Hadoop Environment (Version 0.17.0)
Document9 pages
Setting Up Eclipse:: Codelab 1 Introduction To The Hadoop Environment (Version 0.17.0)
K V D Sagar
No ratings yet
04 Lab Exer 1
Document1 page
04 Lab Exer 1
Jay Rome Tropia
No ratings yet
Hadoop
Document51 pages
Hadoop
Ravitej Tadinada
No ratings yet
Exp 4 Word Count
Document4 pages
Exp 4 Word Count
munish kumar agarwal
No ratings yet
MapReduce and Yarn
Document39 pages
MapReduce and Yarn
Alekhya Abbaraju
No ratings yet
Mykodes Mykodes: Home Home Java Java Javascript Javascript Oracle/ SQL Oracle/ SQL Others Others Forum Forum
Document18 pages
Mykodes Mykodes: Home Home Java Java Javascript Javascript Oracle/ SQL Oracle/ SQL Others Others Forum Forum
ashok565656gmailcom
No ratings yet
Notepadinstructions For MinGW and JDK
Document3 pages
Notepadinstructions For MinGW and JDK
Justin Wright
No ratings yet
Hadoop Training in Hyderabad
Document49 pages
Hadoop Training in Hyderabad
kellytechnologies
No ratings yet
ADA Lab Manual
Document34 pages
ADA Lab Manual
nalluri_08
No ratings yet
Java Programs PDF
Document107 pages
Java Programs PDF
sachinsaaran
No ratings yet
Big Data File
Document16 pages
Big Data File
Arnav Shrivastava
No ratings yet
Map Reduce Example
Document6 pages
Map Reduce Example
Jajang Nurjaman
No ratings yet
4.0 New Features
Document19 pages
4.0 New Features
nagkhushi_khushi3529
No ratings yet
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
Rating: 3 out of 5 stars
3/5 (4)
Inspiring Powershell Articles
From Everand
Inspiring Powershell Articles
Murat Yildirimoglu
No ratings yet
DM104 - Evaluation of Business Performance
Document15 pages
DM104 - Evaluation of Business Performance
Jaysan Ray Ngujo Chee
No ratings yet
C Sharp Corner Two
Document36 pages
C Sharp Corner Two
Arfan Mohammad
No ratings yet
Policy Public Analyisis
Document48 pages
Policy Public Analyisis
mars
No ratings yet
An Introduction To Statistics PDF
Document9 pages
An Introduction To Statistics PDF
Ishu
No ratings yet
Carry Out Mensuration and Calculation
Document16 pages
Carry Out Mensuration and Calculation
Romulo Baj
No ratings yet
NMM 3.0.1 Admin Guide
Document156 pages
NMM 3.0.1 Admin Guide
puneetgoyal100
No ratings yet
Assignment/Tutorial/Practical Report Cover Sheet
Document4 pages
Assignment/Tutorial/Practical Report Cover Sheet
Mohamad Amiruddin Jahari
No ratings yet
ASA Viva
Document37 pages
ASA Viva
jone austin
No ratings yet
DSS 12 S4 03 Design Specification
Document48 pages
DSS 12 S4 03 Design Specification
jxkhoo001
No ratings yet
Unit 3 Network Layer
Document27 pages
Unit 3 Network Layer
Bhavna Hotchandani
100% (1)
QuickAppsforSharePoint 6.2 SIDeveloperGuide PDF
Document21 pages
QuickAppsforSharePoint 6.2 SIDeveloperGuide PDF
Anonymous oGoAgx0Nx3
No ratings yet
Save Accept All: Privacy Policy
Document2 pages
Save Accept All: Privacy Policy
Luis Angel Gárate Chambilla
No ratings yet
Anais XIV Simpósio Brasileiro de Sensoriamento Remoto, Natal, Brasil, 25-30 Abril 2009, INPE, P. 4247-4254
Document8 pages
Anais XIV Simpósio Brasileiro de Sensoriamento Remoto, Natal, Brasil, 25-30 Abril 2009, INPE, P. 4247-4254
Fábio Melo
No ratings yet
Implementing Active Directory: Lesson 2
Document36 pages
Implementing Active Directory: Lesson 2
Deepak Malusare
No ratings yet
PostgreSQL Architecture 2
Document5 pages
PostgreSQL Architecture 2
Stephen Efange
No ratings yet
Feedback: Your Answer Is Correct. The Correct Answer Is: It Contains A Fixed Structure
Document6 pages
Feedback: Your Answer Is Correct. The Correct Answer Is: It Contains A Fixed Structure
Mark De Guzman
No ratings yet
DIVQ.E212323 - Circuit Breakers, Molded Case and Circuit-Breaker Enclosures - UL Product IQ
Document1 page
DIVQ.E212323 - Circuit Breakers, Molded Case and Circuit-Breaker Enclosures - UL Product IQ
Rahul Kumar Singh (IPR and Product Safety Compliance)
No ratings yet
04 Power Center 8 (1) .6 - Pushdown Optimization
Document74 pages
04 Power Center 8 (1) .6 - Pushdown Optimization
m_loo58
No ratings yet
Framework of Autonetics IN Attendance Muster Survey and Summarization
Document10 pages
Framework of Autonetics IN Attendance Muster Survey and Summarization
ramalingam r
No ratings yet
Clinical Data Management Systems
Document29 pages
Clinical Data Management Systems
hima
No ratings yet
Introduction To Triggers: Rehab Duwairi
Document54 pages
Introduction To Triggers: Rehab Duwairi
Mohammed Z. Aljezawi
No ratings yet
Health Check Report For Oracle 10g Database
Document51 pages
Health Check Report For Oracle 10g Database
wambah
No ratings yet
Normalization
Document48 pages
Normalization
Ahmad Fuaddin Ross
No ratings yet
Louis Gottschalk History and Historical Sources
Document7 pages
Louis Gottschalk History and Historical Sources
Razel Bayangos Sevilleno
No ratings yet
Hadoop Cluster Setup
Document10 pages
Hadoop Cluster Setup
bispsolutions
No ratings yet
Find The Minimum or Maximum Value Across Several Columns?: Case When Col1 Col2 Then Col1 Else Col2 End As Newcol
Document9 pages
Find The Minimum or Maximum Value Across Several Columns?: Case When Col1 Col2 Then Col1 Else Col2 End As Newcol
balakrishna6
No ratings yet
Cloudera Manager Backup and Data Recovery
Document22 pages
Cloudera Manager Backup and Data Recovery
sunita
No ratings yet
Data Warehouse Implementation of Examination Datab
Document6 pages
Data Warehouse Implementation of Examination Datab
Ahmad Ershad
No ratings yet
Domino Commands
Document3 pages
Domino Commands
Ashish Daga
100% (3)
Difference Between LSMW, BDC & Bapi
Document10 pages
Difference Between LSMW, BDC & Bapi
Antonio Manca
No ratings yet