Welcome to Scribd!

19CS4701D

Uploaded by

0% found this document useful (0 votes)

1 views2 pages

The document provides information about a Big Data course offered at the 4th year, 2nd semester level. The course introduces fundamental concepts of big data including HDFS, MapReduce, Spark, and Hive. It aims to help students understand big data storage and processing (CO1, CO2), apply Hive for working with big data and generating reports (CO3), and design recommender systems using analytics (CO4). The syllabus is divided into 5 units that cover topics such as Hadoop architecture, MapReduce, HDFS, Hive, and Spark, with a final unit focusing on recommendation systems. References and online resources are also provided.

Original Description:

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

1 views2 pages

19CS4701D

Uploaded by

Soundarrajan OGP

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

Big Data

Course Code 19CS4701D Year IV Semester II

Course Program
Branch CSE Course Type Theory
Category Elective-VI
Data mining
Credits 3 L-T-P 3-0-0 Prerequisites
Continuous
Semester End
Internal 30 70 Total Marks: 100
Evaluation:
Evaluation :

Course Outcomes

Upon successful completion of the course, the student will be able to

CO1 Understand the basic concepts of big data L2

Apply the concept of HDFS, Map reduce,Spark for storing and processing of
CO2 L3
Big data
CO3 Apply Hive for working with Big data and formulate an efficient report L3

CO4 Apply various analytics mechanisms to design a recommender system. L3

Syllabus

Unit Mapped
Contents
No. CO
Meet Hadoop: Data, Data Storage and Analysis, Querying All Your
data, Beyond Batch, Comparison with Other Systems: Relational
database Management Systems, Grid Computing, Volunteer
Computing, A Brief History of Apache Hadoop.
I CO1,CO2
Map Reduce: A Weather Dataset: Data Format, Analyzing the data
with Unix Tools, Analyzing the Data with Hadoop: Map and Reduce,
Java Map Reduce, Scaling Out: Data Flow, Combiner Functions,
Running a Distributed Map Reduce Job.

The Hadoop Distributed Filesystem: The Design of HDFS, HDFS

II
Concepts, The Command Line Interface, Hadoop File systems, The Java CO1,CO2
Interface, Data Flow, Parallel Copying with distcp.

Hive: Hive Shell, An Example, Running Hive: Configuring Hive, Hive

Services, The Metastore, Comparison with Traditional Databases:
Schema on Read Versus Schema on write, Updates, transactions, and
III Indexes, SQL-on Hadoop Alternatives, CO1,CO3
HiveQL: Data Types, Operators and Functions and Tables: managed
Tables and External Tables, Partitions and Buckets, Storage Formats,
Importing Data, Altering Tables and Dropping Tables.
Spark: Installing Spark, An Example: Spark Applications, Jobs, Stages,
and Tasks, A Scala Standalone Application, A Java Example, A Python
Example, Resilient Distributed Datasets: Creation, Transformations and
IV Actions, Persistence, Serialization, Shared Variables: Broadcast CO1,CO2
Variables, Accumulators, Anatomy of a Spark Job: Run: Job
Submission, DAG Construction, Task Scheduling, Task Execution.

Use case Study: Recommendation Systems: Introduction, A Model for

V Recommendation Systems, Collaborative Filtering System and Content CO1,CO4
Based Recommendations.

Learning Resources

Text Book

1. Hadoop: The Definitive Guide, Tom White, Fourth Edition, 2015, O’Reilly.

2. Big Data Analytics, RadhaShankarmani, M Vijayalakshmi, Second Edition, 2017, Wiley

References

1. Hadoop Essentials: A Quantitative Approach, Henry H. Liu, First Edition, 2012, PerfMath
Publishers

2. Big Data and Analytics, Seema Acharya, SubhashiniChellappan, First Edition, 2015,
Wiley.

3. Big data analytics with R and Hadoop, VigneshPrajapati, First Edition, 2013, SPD.

4. Spark: The Definitive Guide :Big Data Processing Made simple, Bill Chambers and
MateiZaharia, First Edition, 2018, O’Reilly

e-Resources and other Digital Material

1. https://nptel.ac.in/courses/106/104/106104189/
2.https://www.coursera.org/specializations/big-data
3..https://www.edx.org/course/big-data-fundamentals

Numerical Python: A Practical Techniques Approach for Industry
From Everand
Numerical Python: A Practical Techniques Approach for Industry
Robert Johansson
No ratings yet
Lic
Document19 pages
Lic
Prince Shaik
50% (2)
CV For Admin Jobs
Document2 pages
CV For Admin Jobs
Anonymous ATBBcKJIc
No ratings yet
DBA - Oracle Golden Gate 12 - Bidirectional Replication - Activ
Document14 pages
DBA - Oracle Golden Gate 12 - Bidirectional Replication - Activ
wish_new
No ratings yet
Student Support Material For All Student - Class - XII - CS
Document238 pages
Student Support Material For All Student - Class - XII - CS
Kaviya Sankar
No ratings yet
Big Data Syllabus For Theory and Lab
Document4 pages
Big Data Syllabus For Theory and Lab
chetana tukkoji
No ratings yet
Microcontroller Prototypes With Arduino
Document355 pages
Microcontroller Prototypes With Arduino
hen2877
100% (3)
AVRStudio C Programming With Arduino RevC PDF
Document40 pages
AVRStudio C Programming With Arduino RevC PDF
Eduardo Garcia Breijo
No ratings yet
Big Data Syllabus
Document2 pages
Big Data Syllabus
Avinash Bommina
No ratings yet
IV Yr II Sem Lesson Plans
Document19 pages
IV Yr II Sem Lesson Plans
bagaverupesh8
No ratings yet
AIADS 7th Sem Syllabus Signed
Document19 pages
AIADS 7th Sem Syllabus Signed
himanshu24ai018
No ratings yet
Syllabus PDF
Document2 pages
Syllabus PDF
Jv s
No ratings yet
Syllabus
Document2 pages
Syllabus
manishpspk101
No ratings yet
Big Data Analytics
Document3 pages
Big Data Analytics
tirth_diwani
No ratings yet
Big Data Storge Management
Document4 pages
Big Data Storge Management
V Harsha Shastri
No ratings yet
Bcse 0157
Document1 page
Bcse 0157
Praful Yadav
No ratings yet
Bigdata Syllabus
Document3 pages
Bigdata Syllabus
Sankar Terli
No ratings yet
Big Data Management Syllabus
Document5 pages
Big Data Management Syllabus
ANOOPATICS Y
No ratings yet
Mtech-Syllabus-Data Science - Sem1
Document25 pages
Mtech-Syllabus-Data Science - Sem1
reshmaitagi
No ratings yet
Advanced Big Data Analytics
Document2 pages
Advanced Big Data Analytics
V Harsha Shastri
No ratings yet
17CSCS2T2
Document2 pages
17CSCS2T2
Soundarrajan OGP
No ratings yet
3rd & 4th Sem MCA Syllabus Updated
Document98 pages
3rd & 4th Sem MCA Syllabus Updated
prsh22mca
No ratings yet
20IT503 - Big Data Analytics - Unit4
Document73 pages
20IT503 - Big Data Analytics - Unit4
5023-Monish Kumar K
No ratings yet
Big Data Theory
Document3 pages
Big Data Theory
lathasivasankari.v
No ratings yet
Data Structures
Document2 pages
Data Structures
Talla Vivek
No ratings yet
Big Data Analytics-Syllabus
Document3 pages
Big Data Analytics-Syllabus
Dual Dave
No ratings yet
III Sem Syllabus RNSIT New
Document19 pages
III Sem Syllabus RNSIT New
Mahesha S N Reddy
No ratings yet
113 Ce 74
Document4 pages
113 Ce 74
boremshiva1201
No ratings yet
17ci18 - Big Data Analytics
Document2 pages
17ci18 - Big Data Analytics
viju001
No ratings yet
TY DSA Syallbus
Document5 pages
TY DSA Syallbus
jay
No ratings yet
BDA - Unit-1
Document24 pages
BDA - Unit-1
Aishwarya Rayasam
No ratings yet
Handout MCAIIISem CS508 BigData ManishaJailia JulyDec2022
Document3 pages
Handout MCAIIISem CS508 BigData ManishaJailia JulyDec2022
Sanjali Pandey
No ratings yet
Big Data
Document2 pages
Big Data
POLU SRINIVASA REDDY
No ratings yet
Datascience and Machine Learning
Document8 pages
Datascience and Machine Learning
suman
No ratings yet
Syllabus For M. Sc. (CS) IV-Semester: The Bhopal School of Social Sciences, Bhopal
Document32 pages
Syllabus For M. Sc. (CS) IV-Semester: The Bhopal School of Social Sciences, Bhopal
Anu Mathane
No ratings yet
2nd Sem PYTHON FROM ZERO To Hero
Document4 pages
2nd Sem PYTHON FROM ZERO To Hero
ɪɴᴅɪᴀɴ ɢᴀᴍɪɴɢ
No ratings yet
III-II Big Data Analytics Question Bank
Document3 pages
III-II Big Data Analytics Question Bank
UDAY REDDY
No ratings yet
CC ZG522 Course Handout
Document6 pages
CC ZG522 Course Handout
2023mt03587
No ratings yet
Information Technology s7 & s8
Document317 pages
Information Technology s7 & s8
AKHIL HAKKIM
No ratings yet
Big Data
Document4 pages
Big Data
aryan kothambia
No ratings yet
TBC 401 Data Analytics Using Python
Document2 pages
TBC 401 Data Analytics Using Python
Viyan Singh
No ratings yet
Big Data Analytics Syllabus
Document2 pages
Big Data Analytics Syllabus
Saiyed Faiayaz Waris
No ratings yet
310251: Data Science and Big Data Analytics
Document2 pages
310251: Data Science and Big Data Analytics
sameersutane03
No ratings yet
Business Analytics
Document35 pages
Business Analytics
ish tandon
No ratings yet
Applied Natural Language Processing
Document3 pages
Applied Natural Language Processing
kirankohli040600
No ratings yet
3rd Semister Syallabus
Document11 pages
3rd Semister Syallabus
Nikhil Mahajan
No ratings yet
Department of Computer Engineering
Document6 pages
Department of Computer Engineering
Jayaprabha Kanase
No ratings yet
Data Structure Syllabus
Document6 pages
Data Structure Syllabus
darshansjadhav369
No ratings yet
With Effect From 2017-2018admitted Batch Onwards
Document32 pages
With Effect From 2017-2018admitted Batch Onwards
Andy Razor
No ratings yet
Tyit - Big Data and Next Gen - Syllabus
Document2 pages
Tyit - Big Data and Next Gen - Syllabus
jiya singh
No ratings yet
TE Computer 2019 Course 22.06.2021-52-99
Document48 pages
TE Computer 2019 Course 22.06.2021-52-99
omchaudhari7559
No ratings yet
Class - Xii: Split-Up Syllabus Sub: Computer Science
Document3 pages
Class - Xii: Split-Up Syllabus Sub: Computer Science
Tech Army
No ratings yet
Textbook Syllabus
Document2 pages
Textbook Syllabus
Benazir R
No ratings yet
Syllabus: Chandigarh University, Gharuan
Document2 pages
Syllabus: Chandigarh University, Gharuan
sunil sharma
No ratings yet
Bda Aids Syllabus
Document3 pages
Bda Aids Syllabus
mohammadkhaja.shaik
No ratings yet
Gujarat Technological University
Document8 pages
Gujarat Technological University
udit
No ratings yet
Big Data Analytics
Document19 pages
Big Data Analytics
bagaverupesh8
No ratings yet
Data Structures Course Handout
Document2 pages
Data Structures Course Handout
22951a67h8
No ratings yet
CSE 201 DS Course Handout
Document11 pages
CSE 201 DS Course Handout
chennakesava13579
No ratings yet
Big Data Analytics With Lab
Document3 pages
Big Data Analytics With Lab
Keerthana K
No ratings yet
Course Title 2UST504 Python For Data Science
Document4 pages
Course Title 2UST504 Python For Data Science
Noh Naim
No ratings yet
A Comparative Study On Apache Spark and Map Reduce With Performance Analysis Using KNN and Page Rank Algorithm
Document6 pages
A Comparative Study On Apache Spark and Map Reduce With Performance Analysis Using KNN and Page Rank Algorithm
Editor IJTSRD
No ratings yet
Big Data Syllabus
Document4 pages
Big Data Syllabus
JAJULAHARIBABU
No ratings yet
Bcse207l - Programming-For-Data-Science - TH - 1.0 - 71 - Bcse207l - 66 Acp
Document2 pages
Bcse207l - Programming-For-Data-Science - TH - 1.0 - 71 - Bcse207l - 66 Acp
b20126381
No ratings yet
Format For Course Curriculum
Document3 pages
Format For Course Curriculum
Akshat Gupta
No ratings yet
DSP 2812 Manual
Document74 pages
DSP 2812 Manual
Viggnesh Venkatakrishnan
100% (1)
Evermotion Archmodels 101 PDF
Document2 pages
Evermotion Archmodels 101 PDF
Jason
No ratings yet
Configure In-App Approval Notifications With BI Publisher: White Paper / October 24, 2019
Document36 pages
Configure In-App Approval Notifications With BI Publisher: White Paper / October 24, 2019
Rafeek Abd Elmonsef
No ratings yet
17 Javalogging
Document30 pages
17 Javalogging
api-3748699
No ratings yet
What Is The Web Service Protocol Stack
Document3 pages
What Is The Web Service Protocol Stack
MallikarjunaScribd
No ratings yet
IT Internship Report
Document69 pages
IT Internship Report
TUMUHIMBISE LUCKY
100% (1)
Cataclysm GD - Búsqueda de Google
Document1 page
Cataclysm GD - Búsqueda de Google
hansgamer kristeg
No ratings yet
Pengembangan Aplikasi Android Untuk Pembelajaran Pneumatik: Anwar Setiadi, Pitoyo Yuliatmojo,, Diat Nurhidayat
Document5 pages
Pengembangan Aplikasi Android Untuk Pembelajaran Pneumatik: Anwar Setiadi, Pitoyo Yuliatmojo,, Diat Nurhidayat
Puryadi Physics
No ratings yet
Adnan Anwar Dev Architect
Document10 pages
Adnan Anwar Dev Architect
phani
No ratings yet
Unit-1 Cloud Computing
Document17 pages
Unit-1 Cloud Computing
kavya sri g
No ratings yet
Sidharth
Document3 pages
Sidharth
Sidharth Chugh
No ratings yet
Control Tutorials For MATLAB and Simulink - Motor Position
Document6 pages
Control Tutorials For MATLAB and Simulink - Motor Position
UmairRashid
No ratings yet
01 - CSI SAP2000 Ultimate 20
Document6 pages
01 - CSI SAP2000 Ultimate 20
heru wijaya
No ratings yet
Lq-300 Users Guide
Document120 pages
Lq-300 Users Guide
dieubimat
No ratings yet
Netbackup Troubleshooting Commands
Document4 pages
Netbackup Troubleshooting Commands
amsreeku
No ratings yet
5 2 B A Introductiontocadmodelingskills
Document15 pages
5 2 B A Introductiontocadmodelingskills
api-312666393
No ratings yet
Sampling Theory: Fourier Theory Made Easy
Document39 pages
Sampling Theory: Fourier Theory Made Easy
Tumzangwana
No ratings yet
bq2407x (2,3,4,5,9) PDF
Document50 pages
bq2407x (2,3,4,5,9) PDF
tiendung
No ratings yet
Group Report Assignment Online
Document17 pages
Group Report Assignment Online
Serena Barbieri
No ratings yet
Generate Fuzzy Inference System Output Surface - MATLAB Gensurf
Document4 pages
Generate Fuzzy Inference System Output Surface - MATLAB Gensurf
Edward Wuncler III
No ratings yet
La5668 PDF
Document4 pages
La5668 PDF
jcgabbi
No ratings yet
Network Design Research Paper
Document7 pages
Network Design Research Paper
gvzyr86v
100% (1)
Fit1047 Exam Revision
Document27 pages
Fit1047 Exam Revision
twist mcgee
No ratings yet
Log SSH
Document2 pages
Log SSH
Hieronymus Elvancy
No ratings yet
SIL19 - 018 Sleep Mode Control Via TACHOLINK
Document5 pages
SIL19 - 018 Sleep Mode Control Via TACHOLINK
Jose Maria Lopez Gaona
No ratings yet