0% found this document useful (0 votes)

19 views3 pages

CSE443

The document outlines the course curriculum for 'Fundamentals of Big Data Analytics' at the undergraduate level, detailing course objectives, prerequisites, syllabus modules, learning outcomes, practical assignments, and assessment schemes. The course aims to equip students with skills in data analysis, visualization, and machine learning techniques applicable to big data. It includes hands-on practicals using tools like Hadoop, Pig, and Hive, and emphasizes both theoretical and practical assessments.

Uploaded by

nitishkumarojha933

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

19 views3 pages

CSE443

Uploaded by

nitishkumarojha933

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Annexure ‘CD – 01’

FORMAT FOR COURSE CURRICULUM

Course Title: Fundamental of Big Data Analytics

Credit Units:4 L T P/S SW/FW TOTAL
CREDIT
Course Level: UG UNITS
3 0 2 0 4
Course Code: CSE443

Course Objectives:
This course is designed for students who have no previous knowledge of data analytics but wish to acquire these skills. The students will learn how to analyze
large data sets and identify patterns that will improve any company’s and organization decision-making process. After completing the course, they will be able
to.

• Capture, categorize, simplify, normalize, and prepare data to be processed

• Work with and analyze large data sets
• Visually represent analysis’s conclusions to technical and non-technical audiences
• Use the most common algorithms, to make sense of large amounts of data, which are applicable to most business and management problems

Pre-requisites:
• Knowledge of database and OOP concepts

Course Contents/Syllabus: Weightage (%)

Module I : Introduction to Bigdata and Hadoop
Understanding What is Bigdata, Analyzing limitations and solutions of existing data analytics, Understanding Hadoop and its
20%
features, Hadoop Ecosystem, Understanding 2.X core components, 3.x core components, difference between 1.x,2,x and 3,x
Hadoop components, Performing Read and Write in Hadoop, Rack Awareness policy.
Module II : Hadoop Architecture and HDFS
Hadoop 2.x cluster architecture, Federation Architecture, High Availability Architecture, Modes of Hadoop cluster,
20%
Understanding basis Hadoop commands, Hadoop 2.x configuration files and its parameters, MapReduce flow chart, Analysing
different use cases of MapReduce programming, difference between traditional and MapReduce way, Execution flow of
MapReduce applications, Input split in MapReduce, Combiner and Patitioners in MapReduce. Input Formats in Hadoop,
Counters, Joins and Custom Input Formats in MapReduce.
.
Module III : Data Management in Big Data
Understanding the concepts of Pig and Pig Latin, analyzing datasets using pig, Understanding hive, hive demand and its
20%
components, architecture and applications of Hive, Understanding HBase and its architecture, Sqoop, Flume, Oozie,
Zookeeper.
Module IV: Data Mining in Big Data
Introduction: Sources, modes of availability, inaccuracies, and uses of data. Data Objects and Attributes: Descriptive Statistics;
Visualization; and Data Similarity and Dissimilarity. Pre-processing of Data Cleaning for Missing and Noisy Data; Data 20%
Reduction – Discrete Wavelet Transform, Principal Component Analysis, Partial Least Square Method, Attribute Subset
Selection; and Data Transformation and Discretization.

Module V: Machine Learning in Big Data

Machine Learning Techniques for data analysis, Introduction and Concepts of Supervised Learning with Regression and
Classification techniques, Naïve Bayesian Classifier, K-means Clustering, Association Rules, Decision Trees, Time Series 20%
Analysis, Text Analytics

Course Learning Outcomes:

1. Able to understand the importance of Big Data
2. Design and development of Big data environment
3. Able to understand the various tools for Big Data
4. Understanding of Big data handling and Management
5. Able to understand various algorithms for Big Data

List of practical’s:
1. Install Hadoop and Deploy Map-Reduce on System.
2. Write a MapReduce script to count the occurrence of each word in a file.
3. Write a MapReduce script to find the max and min temperature recorded in last 50 years.
4. Write a MapReduce script to implement map side and reduce side joins.
5. Write a pig script to analyses the twitter data.
6. Write a hive script to analyses last 10 years of crime data.
7. Write the script how can you get the structured dataset from the rdbms using the sqoop.
8. Write script how can you get the unstructured dataset from different sources using flume.
9. How can you create a database, table and insert data into the base?
10. How to run an application using oozie.

Pedagogy for Course Delivery:

The class will be taught using theory and case studies of latest processors. Apart from assigning the casestudies, the course instructor will
cover the quantitative approach for classification of modern processors.

Assessment/ Examination Scheme:

Theory L/T (%) Lab/Practical/Studio (%) Total

75% 25% 100%

Theory Assessment (L&T):

Continuous Assessment/Internal Assessment 40% End Term Examination
60%
Components (Drop down) Attendance Class Test HA Quiz EE

Weightage (%) 5 15 10 10 60

Lab/ Practical/ Studio Assessment:

Continuous Assessment/Internal Assessment 40% End Term

Examination
60%
Components (Drop Performance Lab Viva Attendance EE
down Record
Weightage (%) 15 10 10 5 60

Text Reading:
• White, Tom. Hadoop: The definitive guide. " O'Reilly Media, Inc.", 2012.
• Mayer-Schönberger, Viktor, and Kenneth Cukier. Big data: A revolution that will transform how we live, work, and think. Houghton
Mifflin Harcourt, 2013..
• Prajapati, Vignesh. Big data analytics with R and Hadoop. Packt Publishing Ltd, 2013..
References:
• Lam, Chuck. Hadoop in action. Manning Publications Co., 2010.
• Holmes, Alex. Hadoop in practice. Manning Publications Co., 2012.
• Raschka, Sebastian, and Vahid Mirjalili. Python machine learning. Packt Publishing Ltd, 2017.

Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
2 pages
Big Data Analytics Course
No ratings yet
Big Data Analytics Course
19 pages
Final Lesson Plan
No ratings yet
Final Lesson Plan
8 pages
Big Data and Hadoop Training Course
No ratings yet
Big Data and Hadoop Training Course
9 pages
Big Data Processing with Hadoop Course
No ratings yet
Big Data Processing with Hadoop Course
6 pages
Big Data Curriculum for CS & CSE Students
No ratings yet
Big Data Curriculum for CS & CSE Students
2 pages
BDA Syllabus
No ratings yet
BDA Syllabus
2 pages
Big Data and Analytics Syllabus 2021
No ratings yet
Big Data and Analytics Syllabus 2021
3 pages
IOT Analytics - AI361
No ratings yet
IOT Analytics - AI361
3 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
4 pages
6th Sem - Big Data - IsE
No ratings yet
6th Sem - Big Data - IsE
5 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
4 pages
Big Data and Hadoop Course Overview
No ratings yet
Big Data and Hadoop Course Overview
6 pages
17cs17 - Vcs314 - Big Data Systems
No ratings yet
17cs17 - Vcs314 - Big Data Systems
5 pages
Big Data Analytics
No ratings yet
Big Data Analytics
4 pages
Big Data Technology E1UJ502B
No ratings yet
Big Data Technology E1UJ502B
11 pages
Experiment Pgno
No ratings yet
Experiment Pgno
50 pages
BDA Syllabus - Sem VII - Mumbai University
No ratings yet
BDA Syllabus - Sem VII - Mumbai University
3 pages
Bda Report
No ratings yet
Bda Report
5 pages
Big Data Analytics Syllabus - Chandigarh U.
No ratings yet
Big Data Analytics Syllabus - Chandigarh U.
2 pages
Big Data Processibg
No ratings yet
Big Data Processibg
2 pages
Big Data Analytics Syllabus
No ratings yet
Big Data Analytics Syllabus
3 pages
Big Data Analytics
No ratings yet
Big Data Analytics
3 pages
Skill Enhancement Courses Overview
No ratings yet
Skill Enhancement Courses Overview
42 pages
Big Data Analytics Course Syllabus
No ratings yet
Big Data Analytics Course Syllabus
4 pages
Big Data Analytics Course Syllabus
No ratings yet
Big Data Analytics Course Syllabus
4 pages
Hadoop Essentials for Big Data Solutions
No ratings yet
Hadoop Essentials for Big Data Solutions
2 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
2 pages
Bca Bigdata Fifth - Sem Approved Syllabus
No ratings yet
Bca Bigdata Fifth - Sem Approved Syllabus
23 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
4 pages
Big Data Analytics Syllabus for B.Tech
No ratings yet
Big Data Analytics Syllabus for B.Tech
19 pages
22cs702 Data Analytics Unit-2.Dcm
No ratings yet
22cs702 Data Analytics Unit-2.Dcm
73 pages
CCS334 BDA Syllabus
No ratings yet
CCS334 BDA Syllabus
5 pages
Syllabus of Big Data Analysis - Proposed
No ratings yet
Syllabus of Big Data Analysis - Proposed
2 pages
Big Data Hadoop - Course Curriculum - V1
No ratings yet
Big Data Hadoop - Course Curriculum - V1
7 pages
BDA Syllabus
No ratings yet
BDA Syllabus
5 pages
Big Data Analytics
No ratings yet
Big Data Analytics
2 pages
Introduction of Subject
No ratings yet
Introduction of Subject
28 pages
Introduction To Data Analytics Syllabus
No ratings yet
Introduction To Data Analytics Syllabus
3 pages
SEM VII BDA Syllabus Theory
No ratings yet
SEM VII BDA Syllabus Theory
4 pages
MCA III Sem Syallbus 2025-26 Batch 6.10.25
No ratings yet
MCA III Sem Syallbus 2025-26 Batch 6.10.25
12 pages
Data Bots Training Courses
100% (1)
Data Bots Training Courses
36 pages
22IS61 Big Data Analytics 2025
No ratings yet
22IS61 Big Data Analytics 2025
4 pages
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
No ratings yet
Gujarat Technological University: Sr. No. Content Total Hrs % Weightage 1 13
3 pages
BDA Syllabus
No ratings yet
BDA Syllabus
3 pages
Big Data Course Overview and Tools
No ratings yet
Big Data Course Overview and Tools
2 pages
Syllabus
No ratings yet
Syllabus
7 pages
Big Data Analytics Lab Overview
No ratings yet
Big Data Analytics Lab Overview
19 pages
Bda Syllabus
No ratings yet
Bda Syllabus
3 pages
Big Data Analytics Syllabus - 22UAI603C - 204 - 2025
No ratings yet
Big Data Analytics Syllabus - 22UAI603C - 204 - 2025
2 pages
Big Data analyticsNEW SYLLABUS FRAMING
No ratings yet
Big Data analyticsNEW SYLLABUS FRAMING
3 pages
Specialised Programme On Big Data and Machine Learning - 8 Weeks
No ratings yet
Specialised Programme On Big Data and Machine Learning - 8 Weeks
6 pages
Big Data Analytics Course Overview
No ratings yet
Big Data Analytics Course Overview
3 pages
Dseclzg522-Bds Course Handout
No ratings yet
Dseclzg522-Bds Course Handout
6 pages
Microsoft Word - B.tech. 3rd Yr CSE (DS) 2022 23 Big Data
No ratings yet
Microsoft Word - B.tech. 3rd Yr CSE (DS) 2022 23 Big Data
2 pages
Bigdata
No ratings yet
Bigdata
2 pages
JD - Research Analyst II - Ken Research PVT LTD
No ratings yet
JD - Research Analyst II - Ken Research PVT LTD
2 pages
This Is The Last Time I Was Just Wondering
No ratings yet
This Is The Last Time I Was Just Wondering
4 pages
HANDS-ON-CHAPTER-5 ANSWER KEY (ORACLE 11g JOAN CASTEEL)
No ratings yet
HANDS-ON-CHAPTER-5 ANSWER KEY (ORACLE 11g JOAN CASTEEL)
3 pages
Mayank Agarwal Data Analytics - Updated 2
No ratings yet
Mayank Agarwal Data Analytics - Updated 2
4 pages
Module 5
No ratings yet
Module 5
38 pages
Python Thread Synchronization Guide
No ratings yet
Python Thread Synchronization Guide
26 pages
Sample Format of Baseline Data Presentation of SBDPO
No ratings yet
Sample Format of Baseline Data Presentation of SBDPO
2 pages
Ext 507 (How To Conduct Evaluation)
No ratings yet
Ext 507 (How To Conduct Evaluation)
20 pages
Introduction to Quantitative Research
No ratings yet
Introduction to Quantitative Research
7 pages
Class 8 - CH-2 Database Using OpenOffice - Orgbase
No ratings yet
Class 8 - CH-2 Database Using OpenOffice - Orgbase
2 pages
Shivani Nagar Resume
No ratings yet
Shivani Nagar Resume
1 page
Rapport - PDF: Rapport To PDF: Description
No ratings yet
Rapport - PDF: Rapport To PDF: Description
2 pages
Bcs Higher Education Qualifications BCS Level 4 Certificate in IT
No ratings yet
Bcs Higher Education Qualifications BCS Level 4 Certificate in IT
5 pages
Multi-Tenant Data Architecture For SaaS
No ratings yet
Multi-Tenant Data Architecture For SaaS
7 pages
Scenario
No ratings yet
Scenario
2 pages
Lecture 12 Database - Systems
No ratings yet
Lecture 12 Database - Systems
52 pages
Vikas Tiwari Resume
No ratings yet
Vikas Tiwari Resume
3 pages
2.conceptualizing and Operationalizing of Research Framework
No ratings yet
2.conceptualizing and Operationalizing of Research Framework
12 pages
DBMS Assignment: Library & Student Data
No ratings yet
DBMS Assignment: Library & Student Data
13 pages
Database Design For Health and Fitness Tracking Applications
No ratings yet
Database Design For Health and Fitness Tracking Applications
30 pages
Data Warehousing Course Overview
No ratings yet
Data Warehousing Course Overview
36 pages
ICT101 - Course Outlines
No ratings yet
ICT101 - Course Outlines
4 pages
Rdbms Lab. - Module-1 EXPERIMENT - 1&2&3
No ratings yet
Rdbms Lab. - Module-1 EXPERIMENT - 1&2&3
14 pages
Validating The SDTM Dataset PDF
No ratings yet
Validating The SDTM Dataset PDF
12 pages
A Systematic Review of K-12 Cybersecurity Educatio
No ratings yet
A Systematic Review of K-12 Cybersecurity Educatio
13 pages
Simplified SQL Server Backup Solutions
No ratings yet
Simplified SQL Server Backup Solutions
25 pages
SQL DML and DDL Command Overview
No ratings yet
SQL DML and DDL Command Overview
10 pages
Log
No ratings yet
Log
123 pages
MSSQL Server DBA Resume Summary
No ratings yet
MSSQL Server DBA Resume Summary
7 pages
Analyzing A Separation, A Film Directed by Asghar Farhadi
No ratings yet
Analyzing A Separation, A Film Directed by Asghar Farhadi
6 pages

CSE443

Uploaded by

CSE443

Uploaded by

Annexure ‘CD – 01’

FORMAT FOR COURSE CURRICULUM

Course Title: Fundamental of Big Data Analytics

• Capture, categorize, simplify, normalize, and prepare data to be processed

Course Contents/Syllabus: Weightage (%)

Module V: Machine Learning in Big Data

Course Learning Outcomes:

Pedagogy for Course Delivery:

Assessment/ Examination Scheme:

Theory L/T (%) Lab/Practical/Studio (%) Total

75% 25% 100%

Theory Assessment (L&T):

Lab/ Practical/ Studio Assessment:

Continuous Assessment/Internal Assessment 40% End Term

You might also like