0% found this document useful (0 votes)

36 views4 pages

DMBI All Pyqs

The document outlines various theory and numerical questions related to Data Warehousing, Data Mining, Classification, Association Rule Mining, Clustering, and Business Intelligence across six modules. It includes repeated questions, short notes, and practical applications such as algorithms and classification tasks. The focus is on understanding concepts, processes, and techniques used in data analysis and mining.

Uploaded by

xie.himanshu29

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

36 views4 pages

DMBI All Pyqs

Uploaded by

xie.himanshu29

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

DMBI pyqs

Module 1: Introduction to Data Warehousing and Data Mining

Theory Questions:

1. What is Data Mining? Explain KDD process with diagram.

2. What do you mean by data mining? Explain KDD process with help of a suitable diagram.
(REPEATED)
3. What is Data warehousing Architecture?
4. Draw and list the components of a typical Data warehouse architecture. (REPEATED)
5. Compare and contrast between OLTP and OLAP.
6. Give the difference between OLAP and OLTP. (REPEATED)
7. What is OLAP? Explain various OLAP operations with neat labeled diagram.
8. List out stages in Data Mining with neat labelled diagram.

Numerical Questions: None

Module 2: Data Preprocessing and Data Exploration

Theory Questions:

1. What is noisy data? How to handle it?

2. Describe different steps involved in data preprocessing.
3. Explain different types of attributes used in data exploration with example.
4. What are the different types of summary data?
5. Explain concept of information gain and gini value used in decision tree.
6. What is an outlier? Explain various methods for performing outlier analysis. (REPEATED x3)
7. What is an outlier? List types of outliers. Describe methods used for outlier analysis.
8. Types of attributes – (Short note)
9. Bootstrapping – (Short note)

Numerical Questions:

1) Perform binning and smoothing techniques for the following data:

Data = {12, 15, 14, 10, 8, 13, 11, 9, 20, 18, 19, 25, 30}
- Use bin mean and bin boundary methods
2) Given the following data:
Marks = {45, 56, 47, 55, 62, 53, 59, 61, 52}
- Calculate mean, median, standard deviation, variance, skewness, and draw a box plot.

Module 3: Classification & Prediction

Theory Questions:

1. Explain working of decision tree based classifier (ID3 algorithm).

2. Explain concept of information gain and gini value used in decision tree. (Also listed in
Module 2)
3. Decision Tree Induction – (Short note)
4. Explain Naive Bayes Classifier.
5. Random Forest Algorithm – (Short note)
6. Cross Validation – (Short note)
7. BI Architecture – (Short note)

Numerical Questions:

1) Use Naive Bayes Classifier to classify a tuple using the dataset below:
Play Tennis Dataset:
Attributes: Outlook, Temperature, Humidity, Wind
Class: Play (Yes/No)
- Classify tuple: (Sunny, Cool, High, Strong)
2) Use Naive Bayes Algorithm to classify a tuple using this new dataset:
Attributes: Fever, Cough, Headache → Disease (Yes/No)
- Classify (Yes, No, Yes)
3) Construct a Decision Tree using ID3 Algorithm on the following dataset:
Attributes: Weather, Temp, Humidity, Wind
Class: Play (Yes/No)

Module 4: Association Rule Mining

Theory Questions:

1. What is market basket analysis? Explain with use case. (REPEATED x2)
2. Explain mining of Multilevel and Multidimensional association rules (REPEATED x2)
3. FP-Growth Algorithm – (Short note)
Numerical Questions:

1) Use Apriori algorithm to find frequent itemsets and strong association rules:
Transactions:
T1: {Bread, Milk}
T2: {Bread, Diaper, Beer, Eggs}
T3: {Milk, Diaper, Beer, Coke}
T4: {Bread, Milk, Diaper, Beer}
T5: {Bread, Milk, Diaper, Coke}
- Use min_sup = 2, min_conf = 60%
2) Use Apriori algorithm to find itemsets:
T1: {A, B, D}
T2: {B, C, E}
T3: {A, B, D, E}
T4: {A, B, C, E}
3) Generate strong association rules from the frequent itemset:
Frequent Itemset: {Milk, Diaper, Beer}
Support: 50%, Confidence: 75%
- Generate all rules above threshold

Module 5: Clustering and Outlier Detection

Theory Questions:

1. Explain steps in hierarchical clustering algorithm.

2. Compare Star Schema and Snowflake Schema (REPEATED x2)
3. Explain K-means algorithm with example
4. DBSCAN algorithm – explain with example
5. BIRCH Algorithm – (Short note)

Numerical Questions:

1. Apply K-means algorithm using Manhattan Distance:

Points: {(2,10), (2,5), (8,4), (5,8), (7,5), (6,4)}
k = 2, Initial Centroids: (2,10) and (5,8)
2. Apply K-means algorithm to the dataset:
Values = {2, 4, 10, 12, 3, 20, 30, 11, 25}
- Cluster into 3 clusters
3. Perform Hierarchical Clustering using single linkage for:
Points: {(1,1), (2,1), (4,3), (5,4), (3,3), (2,5), (3,4), (6,8), (7,9), (8,10)}

Module 6: Business Intelligence and Applications

Theory Questions:

1. Design a BI system for fraud detection

2. Dimensional Modelling – (Short note)
3. BI Architectures – (Short note)
4. Compare Star vs Snowflake Schema (Already repeated above)
5. Short Notes (any 4):
o FP-Growth
o Dimensional Modelling
o Cross Validation
o BI Architectures
o Random Forest
o BIRCH

Numerical Questions: None

Data Mining and Warehousing Concepts
No ratings yet
Data Mining and Warehousing Concepts
8 pages
Data Mining Exam Prep Guide
No ratings yet
Data Mining Exam Prep Guide
4 pages
Comprehensive Data Mining Question Bank
No ratings yet
Comprehensive Data Mining Question Bank
5 pages
DWDM Unit Wise Question Bank
No ratings yet
DWDM Unit Wise Question Bank
8 pages
DWM Questions
No ratings yet
DWM Questions
5 pages
DMBI Sample Questions
No ratings yet
DMBI Sample Questions
7 pages
Data Mining & Warehousing Exam Questions
No ratings yet
Data Mining & Warehousing Exam Questions
8 pages
Data Mining & Business Intelligence Q&A
No ratings yet
Data Mining & Business Intelligence Q&A
3 pages
Data Mining and OLAP Questions 2023
No ratings yet
Data Mining and OLAP Questions 2023
2 pages
Seperated
No ratings yet
Seperated
11 pages
DM 100
No ratings yet
DM 100
17 pages
Data Mining & Business Intelligence Q&A
No ratings yet
Data Mining & Business Intelligence Q&A
12 pages
Data Mining & Warehouse Q&A
No ratings yet
Data Mining & Warehouse Q&A
4 pages
DWM PYQs
No ratings yet
DWM PYQs
7 pages
Data Mining Concepts and Techniques
No ratings yet
Data Mining Concepts and Techniques
6 pages
Data Warehousing and Mining Exam 2019
No ratings yet
Data Warehousing and Mining Exam 2019
4 pages
DMBI-Viva Sample Questions
No ratings yet
DMBI-Viva Sample Questions
2 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
13 pages
Sample Question DMW
No ratings yet
Sample Question DMW
4 pages
Data Warehouse and Mining Techniques Guide
No ratings yet
Data Warehouse and Mining Techniques Guide
6 pages
Data Mining-I Course Guidelines
No ratings yet
Data Mining-I Course Guidelines
3 pages
Data Warehousing and Mining Concepts Guide
No ratings yet
Data Warehousing and Mining Concepts Guide
4 pages
DWDM Unitwise Questions
No ratings yet
DWDM Unitwise Questions
3 pages
Vi Sem Bca Qbank - Wcms - Fds
50% (2)
Vi Sem Bca Qbank - Wcms - Fds
11 pages
Data Warehousing and Data Mining Assignment 3
No ratings yet
Data Warehousing and Data Mining Assignment 3
2 pages
Data Warehousing & Mining Question Bank 2019
No ratings yet
Data Warehousing & Mining Question Bank 2019
6 pages
Data Mining Concepts and Techniques Guide
No ratings yet
Data Mining Concepts and Techniques Guide
4 pages
Data Warehousing and Data Mining Unit - I Data Warehousing, Business Analysis and On-Line Analytical Processing (Olap) PART A (2 Marks)
No ratings yet
Data Warehousing and Data Mining Unit - I Data Warehousing, Business Analysis and On-Line Analytical Processing (Olap) PART A (2 Marks)
5 pages
Data Mining Exam Paper Summer 2023
No ratings yet
Data Mining Exam Paper Summer 2023
3 pages
new-Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan 25
No ratings yet
new-Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan 25
3 pages
Database and Data Mining Concepts Guide
No ratings yet
Database and Data Mining Concepts Guide
6 pages
CSE Data Warehousing Q&A Guide
No ratings yet
CSE Data Warehousing Q&A Guide
3 pages
DMDW Question Bank
No ratings yet
DMDW Question Bank
17 pages
Data Mining & Business Intelligence Syllabus
No ratings yet
Data Mining & Business Intelligence Syllabus
4 pages
Bi QB
No ratings yet
Bi QB
3 pages
SEM 5 - Comps, IOT, CYBER, CS - Data Warehousing & Mining - 2024 MAY To 2022 DEC PYQ - Aeraxia - in
No ratings yet
SEM 5 - Comps, IOT, CYBER, CS - Data Warehousing & Mining - 2024 MAY To 2022 DEC PYQ - Aeraxia - in
10 pages
Question Bank Semester: IV Sem Subject: Data Science Sub Code: 17MCA441 SL - No. Questions Marks
No ratings yet
Question Bank Semester: IV Sem Subject: Data Science Sub Code: 17MCA441 SL - No. Questions Marks
4 pages
Data Warehousing & Mining Q&A Guide
No ratings yet
Data Warehousing & Mining Q&A Guide
22 pages
DMBI
No ratings yet
DMBI
1 page
Data Mining Syllabus and Question
No ratings yet
Data Mining Syllabus and Question
6 pages
Wa0001
No ratings yet
Wa0001
6 pages
Data Warehousing & Mining Exam Paper
No ratings yet
Data Warehousing & Mining Exam Paper
2 pages
DWDM
No ratings yet
DWDM
14 pages
Gujarat Technological University: Subject Name: Elective I - Data Warehousing & Data Mining (DWDM) Subject Code: 640005
No ratings yet
Gujarat Technological University: Subject Name: Elective I - Data Warehousing & Data Mining (DWDM) Subject Code: 640005
5 pages
Data Mining Lab Manual for CSE Students
No ratings yet
Data Mining Lab Manual for CSE Students
24 pages
R23-DWDM Syllabus
No ratings yet
R23-DWDM Syllabus
5 pages
CS-DM Module - 1
No ratings yet
CS-DM Module - 1
27 pages
Module 4-6 DWM QUESTION BANK
No ratings yet
Module 4-6 DWM QUESTION BANK
25 pages
Comprehensive Data Mining Question Bank
No ratings yet
Comprehensive Data Mining Question Bank
10 pages
Data Mining Course Plan - SRM University
No ratings yet
Data Mining Course Plan - SRM University
5 pages
Cs1004: Data Warehousing and Mining Two Marks Questions and Answers Unit I
No ratings yet
Cs1004: Data Warehousing and Mining Two Marks Questions and Answers Unit I
31 pages
Data Warehousing and Clustering Concepts
No ratings yet
Data Warehousing and Clustering Concepts
9 pages
R23!3!1 DWDM Final Syllabus On 21-06-2025
No ratings yet
R23!3!1 DWDM Final Syllabus On 21-06-2025
5 pages
Data Mining Course Outline and Practical Guide
No ratings yet
Data Mining Course Outline and Practical Guide
5 pages
No-Code AI & ML Course Overview
No ratings yet
No-Code AI & ML Course Overview
1 page
Digital Gram Panchayath
No ratings yet
Digital Gram Panchayath
26 pages
Digital Tools in Art History Research
No ratings yet
Digital Tools in Art History Research
26 pages
AyushiTiwari2214506380Enhancing Financial Security
No ratings yet
AyushiTiwari2214506380Enhancing Financial Security
10 pages
Epic Chronicles
No ratings yet
Epic Chronicles
6 pages
Online Food Ordering System Project
No ratings yet
Online Food Ordering System Project
20 pages
Mining Git Repositories with Doris
No ratings yet
Mining Git Repositories with Doris
43 pages
Python Data Analysis Interview Notes Real World Scenarios
No ratings yet
Python Data Analysis Interview Notes Real World Scenarios
5 pages
User Print Profile Mahjabeen 1
No ratings yet
User Print Profile Mahjabeen 1
1 page
Difference Between Model and Modeling
No ratings yet
Difference Between Model and Modeling
2 pages
Technology Career Objective and Skills
No ratings yet
Technology Career Objective and Skills
3 pages
Bachelor of Library and Information Science
No ratings yet
Bachelor of Library and Information Science
13 pages
JD For AIML Engineer
No ratings yet
JD For AIML Engineer
3 pages
Text Analysis for Students
No ratings yet
Text Analysis for Students
11 pages
Pinaccle
No ratings yet
Pinaccle
3 pages
Data Science in Digital Marketing Transforming Strategies
No ratings yet
Data Science in Digital Marketing Transforming Strategies
9 pages
ICS Assignment 1 Submission Guidelines
No ratings yet
ICS Assignment 1 Submission Guidelines
2 pages
Blowfish, RC 4
No ratings yet
Blowfish, RC 4
10 pages
Introduction to Blockchain Basics
100% (1)
Introduction to Blockchain Basics
181 pages
CV Ashish Dangi
No ratings yet
CV Ashish Dangi
2 pages
Abhishek Prasad: Java Developer Profile
No ratings yet
Abhishek Prasad: Java Developer Profile
1 page
Unit-05 CNS PDF Notes - 22430585 - 2023 - 09 - 06 - 18 - 29
No ratings yet
Unit-05 CNS PDF Notes - 22430585 - 2023 - 09 - 06 - 18 - 29
5 pages
BSC SEM 6 Core - DSE Syllabus
No ratings yet
BSC SEM 6 Core - DSE Syllabus
9 pages
Federated-Learning Based Privacy Preservation and Fraud-Enabled Blockchain IoMT System For Healthcare
No ratings yet
Federated-Learning Based Privacy Preservation and Fraud-Enabled Blockchain IoMT System For Healthcare
9 pages
IET Final Year Project - Making YouTube Transcript
No ratings yet
IET Final Year Project - Making YouTube Transcript
63 pages
Madhurikumari 2yr Exp
No ratings yet
Madhurikumari 2yr Exp
1 page
Multimedia Resources
No ratings yet
Multimedia Resources
7 pages
Smart College Chatbot with ML & Python
No ratings yet
Smart College Chatbot with ML & Python
6 pages
Automatic Classification of Algorithm Citation Functions in Scientific Literature TKDE2019
No ratings yet
Automatic Classification of Algorithm Citation Functions in Scientific Literature TKDE2019
16 pages
Data Analysis Resume
No ratings yet
Data Analysis Resume
2 pages

DMBI All Pyqs

Uploaded by

DMBI All Pyqs

Uploaded by

DMBI pyqs

Module 1: Introduction to Data Warehousing and Data Mining

1. What is Data Mining? Explain KDD process with diagram.

Numerical Questions: None

Module 2: Data Preprocessing and Data Exploration

1. What is noisy data? How to handle it?

1) Perform binning and smoothing techniques for the following data:

Module 3: Classification & Prediction

1. Explain working of decision tree based classifier (ID3 algorithm).

Module 4: Association Rule Mining

Module 5: Clustering and Outlier Detection

1. Explain steps in hierarchical clustering algorithm.

1. Apply K-means algorithm using Manhattan Distance:

Module 6: Business Intelligence and Applications

1. Design a BI system for fraud detection

Numerical Questions: None

You might also like