Welcome to Scribd!

Data Mining

Uploaded by

ساره عبد المجيد المراكبى عبد المجيد احمد Unknown

0% found this document useful (0 votes)

3 views12 pages

Data mining involves discovering patterns and insights from data. It draws on techniques from statistics, computer science, and management. Data is gathered and selected from an enterprise data model and evaluated for mining results. Various techniques can be used, including classification, clustering, and association rules. Data preparation is important and includes cleaning, transformation, and outlier removal. Tools like Excel, Weka, and R can be used to perform data mining following best practices around business understanding, modeling, and evaluation. Common myths and mistakes involve issues like selecting the wrong problem or lacking business knowledge.

Original Description:

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

3 views12 pages

Data Mining

Uploaded by

ساره عبد المجيد المراكبى عبد المجيد احمد Unknown

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 12

Search inside document

Chapter 4 :

Data Mining
Introduction:-
Data Mining:-
is the art and science of discovering knowledge, insights, and patterns in
data.
 Patterns must be : valid – novel – potentially useful – understandable.
 Data mining the knowledge of data quality – data organizing from Database area.
 Data mining draws modeling – analytical techniques from Statistics and Computer Science
(Artificial Intelligence).
 Data mining draws the knowledge of decision-making from Business Management.

Target:-
is a large retail chain that crunches data to develop insights that help target marketing
and advertising campaigns.
Gathering & Selecting Data:-
Enterprise Data Model (EDM ):
is a unified, high-level model of all the data stored in an
organization’s databases.
 The EDM is usually inclusive of the data generated from all internal
systems.
 The EDM provides the basic menu of data to create a data warehouse for a
particular decision-making purpose.
 The EDM help imagine what relevant external data should be gathered to
provide context and develop good predictive relationship with the internal
data.
Evaluation Data Mining Results:-
Classification:- is the main category of supervised learning activity.
 Predictive accuracy = (correct prediction) / total predictions.
 When a true positive data point is positive → true positive (TP)
 When a true negative data point is negative → true negative (TN)
 When a true positive data point is negative → false negative (FN)
 When a true negative data point is positive → false positive (FP)
 Predictive accuracy = (TP + TN) / (TP + TN + FP + FN)
Data Mining Techniques:-

Techniques

Supervised Unsupervised
Learning Learning

Classification Machine Classification Clustering Association

Learning Statistics Analysis Rules

Decision Neural
Regression
Trees Networks
Data Cleansing & Preparation:-
1. Duplicate data needs to be removed.
2. Missing value need to be filled in, or those rows should be
removed.
3. Data elements should be comparable:
a) Transformed from one unit to another.
b) Comparable overtime.
c) Stored at the same granularity to ensure comparability.
4. Continuous values may need to be binned into a few
buckets to help with some analyses.
5. Outlier data elements need to be removed after careful
review, to avoid the skewing of results.
6. Data may need to be selected to increase information
density.
7. Ensure that the data is representative of the phenomena
under analysis by correcting for any biases in the selection
of data.
Outputs of Data Mining:-
 Decision Tree (Business Rule)
 Related Format
 Population “Centroid”
 Artificial Neural Networks (ANN)
 Cluster Analysis (Segmentation Technique)
 The K-means Technique
Tools & Platforms for Data Mining:-
1. Simple or Sophisticated.
2. Stand-alone or Embedded.
3. Open source or Commercial.
4. User Interface.
5. Data Formats.
Programs:-
1. Excel
2. Weka
3. R
4. IBM’S SPSS Modeler
Data Mining Best Practices:-
1.Business Understanding
2.Data Understanding
3.Data Preparation
4.Modeling
5.Model Evaluation
6.Dissemination & Rollout
Myths about Data Mining:-
 Data Mining is about algorithms.
 Data Mining is about predictive accuracy.
 Data Mining requires a data warehouse.
 Data Mining requires large quantities of data.
 Data Mining requires a technology expert.
Data Mining Mistakes:-
 Selecting the wrong problem for data mining.
 Buried under mountains of data without clear metadata.
 Disorganized data mining.
 Insufficient business knowledge.
 Incompatibility of data mining tools and datasets.
 Looking only at aggregated results and not at individual
records or predictions.
 Not measuring your results differently from the way your
sponsor measures them.

Unit3 - Machine Learning With Big Data
Document74 pages
Unit3 - Machine Learning With Big Data
Gunjan Suman
No ratings yet
BA Notes From Lecture
Document9 pages
BA Notes From Lecture
akashsharma9011328268
No ratings yet
Dmbi Assignment 3
Document5 pages
Dmbi Assignment 3
Kanishk Test
No ratings yet
Data Mining Chapter 1
Document12 pages
Data Mining Chapter 1
Rony saha
0% (1)
UNIT I - Introduction - DataScience - New
Document34 pages
UNIT I - Introduction - DataScience - New
Sid S
No ratings yet
Data Science Course Curriculum 27 Feb 2023
Document21 pages
Data Science Course Curriculum 27 Feb 2023
thugorigin
No ratings yet
Unit 1 - Big Data Technologies
Document89 pages
Unit 1 - Big Data Technologies
prakash N
No ratings yet
Lab Assignment 1 Title: Data Wrangling I: Problem Statement
Document12 pages
Lab Assignment 1 Title: Data Wrangling I: Problem Statement
Mr. Legendperson
No ratings yet
Teit Cbgs Dmbi Lab Manual FH 2015
Document60 pages
Teit Cbgs Dmbi Lab Manual FH 2015
Soumya Pandey
No ratings yet
ML Lect1
Document51 pages
ML Lect1
physics lover
100% (1)
QB 10 Marker
Document19 pages
QB 10 Marker
yashpatelykp
No ratings yet
Prediction: All Topics in Scanned Copy "Adaptive Business Intelligence" by Zbigniewmichlewicz Martin Schmidt)
Document46 pages
Prediction: All Topics in Scanned Copy "Adaptive Business Intelligence" by Zbigniewmichlewicz Martin Schmidt)
rash
No ratings yet
Unit 2
Document30 pages
Unit 2
Dakshkohli31 Kohli
No ratings yet
KMBN IT01 LM Consolidated
Document123 pages
KMBN IT01 LM Consolidated
sparsh sharma
No ratings yet
Lesson 5 Data Wrangling in Data Science.
Document11 pages
Lesson 5 Data Wrangling in Data Science.
Victor Ajraebrill
No ratings yet
DM-Model Question Paper Solutions
Document27 pages
DM-Model Question Paper Solutions
csumant94
No ratings yet
III CS Datamining - Unlocked
Document68 pages
III CS Datamining - Unlocked
Jana Jana
No ratings yet
Data Mining (Viva)
Document18 pages
Data Mining (Viva)
Anubhav Shrivastava
No ratings yet
BI Chapter 04 - Unlocked
Document47 pages
BI Chapter 04 - Unlocked
Jawaher Albaddawi
No ratings yet
Data Warehousing and Data Mining
Document18 pages
Data Warehousing and Data Mining
lskannan47
No ratings yet
Building Good Training Sets UNIT 1 PART2
Document46 pages
Building Good Training Sets UNIT 1 PART2
Aditya Sharma
No ratings yet
DIgitization Week 7
Document6 pages
DIgitization Week 7
Ilion Barboso
No ratings yet
Data Mining
Document7 pages
Data Mining
Mano
No ratings yet
Introduction To Data Science
Document33 pages
Introduction To Data Science
fachriome
No ratings yet
DA1SHRUTI202
Document4 pages
DA1SHRUTI202
Shruti Tyagi
No ratings yet
Chapter 2 Data Preprocessing
Document23 pages
Chapter 2 Data Preprocessing
liyu agye
No ratings yet
DATA MINING Notes (Upate)
Document25 pages
DATA MINING Notes (Upate)
black smith
No ratings yet
DWDMunit 2
Document27 pages
DWDMunit 2
Gopl Kuppa
No ratings yet
Marketing Analytics: Dr. Farzana Nahid Assistant Professor, Marketing & Int. Business Department
Document26 pages
Marketing Analytics: Dr. Farzana Nahid Assistant Professor, Marketing & Int. Business Department
ashikur rahman
No ratings yet
Understanding Data Mining
Document21 pages
Understanding Data Mining
Yah yah yahhhhh
No ratings yet
Data Mining: Fundamentals and Applications
From Everand
Data Mining: Fundamentals and Applications
Fouad Sabry
No ratings yet
Data Mining
Document135 pages
Data Mining
Dewsun Riseon
No ratings yet
Class3 DataPreprocessing 21sept2020
Document10 pages
Class3 DataPreprocessing 21sept2020
Rajat Gupta
No ratings yet
Bda Unit 1
Document24 pages
Bda Unit 1
balamurugan.170202
No ratings yet
Topics in Module-3-: ML & Cloud Computing For Iot
Document149 pages
Topics in Module-3-: ML & Cloud Computing For Iot
sdot1209
No ratings yet
Data Mining Fall-2019 Qs Ans
Document10 pages
Data Mining Fall-2019 Qs Ans
Happy Plants BD
No ratings yet
DATA MINING Notes
Document37 pages
DATA MINING Notes
black smith
No ratings yet
Mastering Machine Learning Basics: A Beginner's Companion
From Everand
Mastering Machine Learning Basics: A Beginner's Companion
Moss Adelle Louise
No ratings yet
Statistics For Data Science - 1
Document38 pages
Statistics For Data Science - 1
Akash Srivastava
100% (1)
DM - Weka Reprot
Document18 pages
DM - Weka Reprot
MR. SIDDHESH KATHALE
No ratings yet
Semi Supervised Learning
Document86 pages
Semi Supervised Learning
chaudharylalit025
No ratings yet
Data Mining University Answer
Document10 pages
Data Mining University Answer
oozed12
No ratings yet
Module 1
Document35 pages
Module 1
Jha Jee
No ratings yet
Advanced Data Analytics Assignment
Document6 pages
Advanced Data Analytics Assignment
Olwethu N Mahlathini (Lethu)
No ratings yet
DMjoy
Document9 pages
DMjoy
amitsinghofficial11
No ratings yet
Group A Assignment No2 Writeup
Document9 pages
Group A Assignment No2 Writeup
403 Chaudhari Sanika Sagar
No ratings yet
1708443470801
Document71 pages
1708443470801
Ronald Cruz
No ratings yet
Machine Learning
Document41 pages
Machine Learning
Abhinandan Ghosh
No ratings yet
Class3-9 DataPreprocessing 22Aug-06Sept2019
Document53 pages
Class3-9 DataPreprocessing 22Aug-06Sept2019
Saili Mishra
No ratings yet
Data Mining Questions
Document7 pages
Data Mining Questions
Pritam Saha
No ratings yet
Unit Iii
Document3 pages
Unit Iii
112 Pranav Khot
No ratings yet
Why Data Mining
Document5 pages
Why Data Mining
Muhammad Tehseen Qureshi
No ratings yet
Data Mining 1
Document36 pages
Data Mining 1
nirman kumar
No ratings yet
DATA MINING and MACHINE LEARNING. PREDICTIVE TECHNIQUES: ENSEMBLE METHODS, BOOSTING, BAGGING, RANDOM FOREST, DECISION TREES and REGRESSION TREES.: Examples with MATLAB
From Everand
DATA MINING and MACHINE LEARNING. PREDICTIVE TECHNIQUES: ENSEMBLE METHODS, BOOSTING, BAGGING, RANDOM FOREST, DECISION TREES and REGRESSION TREES.: Examples with MATLAB
César Pérez López
No ratings yet
Data Mining and Data Analysis UNIT-1 Notes For Print
Document22 pages
Data Mining and Data Analysis UNIT-1 Notes For Print
padma
No ratings yet
DS Mod 1 To 2 Complete Notes
Document63 pages
DS Mod 1 To 2 Complete Notes
Anish Choudhary
No ratings yet
Bi 20soeit11002 Antala Krishnaa
Document5 pages
Bi 20soeit11002 Antala Krishnaa
Krishna Antala
No ratings yet
Knowledge Discovery in Databases
Document17 pages
Knowledge Discovery in Databases
Sarvesh Dharme
No ratings yet
Data Mining Questions
Document24 pages
Data Mining Questions
mahi
No ratings yet
Assignment 2
Document5 pages
Assignment 2
Dipankar Gogoi
No ratings yet
Big Data Primer
Document17 pages
Big Data Primer
ساره عبد المجيد المراكبى عبد المجيد احمد Unknown
No ratings yet
Association Rule Mining
Document17 pages
Association Rule Mining
ساره عبد المجيد المراكبى عبد المجيد احمد Unknown
No ratings yet
15-Social Network Analysis
Document18 pages
15-Social Network Analysis
ساره عبد المجيد المراكبى عبد المجيد احمد Unknown
No ratings yet
Text Mining
Document12 pages
Text Mining
ساره عبد المجيد المراكبى عبد المجيد احمد Unknown
No ratings yet
Greek Lesson Plan
Document4 pages
Greek Lesson Plan
api-316223486
No ratings yet
Assessment Protocol
Document3 pages
Assessment Protocol
api-534366946
No ratings yet
CS2032 DWM QB PDF
Document5 pages
CS2032 DWM QB PDF
velkarthi92
No ratings yet
Chuchuness
Document1 page
Chuchuness
NoemiRodrigo
No ratings yet
Oral and Literature Traditions Among Black Americans Living in Poverty
Document14 pages
Oral and Literature Traditions Among Black Americans Living in Poverty
Anonymous GQXLOjndTb
No ratings yet
Previewpdf
Document32 pages
Previewpdf
thanhtung
No ratings yet
Kurt Lewin's 3-Stage Model in Org Change
Document5 pages
Kurt Lewin's 3-Stage Model in Org Change
Dinah Valencia
0% (1)
Literacy and Numeracy Intervention Plan Salvacion Es
Document3 pages
Literacy and Numeracy Intervention Plan Salvacion Es
Jay Ar Lanon Egang
No ratings yet
Research Paper
Document20 pages
Research Paper
khalid7861
No ratings yet
Spanish Verbs - Conditional Tense: El Condicional
Document3 pages
Spanish Verbs - Conditional Tense: El Condicional
Zantaye Thomas
No ratings yet
1 Providing Confidence To Introvert Students in Foreign Languages Major
Document18 pages
1 Providing Confidence To Introvert Students in Foreign Languages Major
DILSON SARMIENTO
No ratings yet
Ammar & Excercises Book
Document97 pages
Ammar & Excercises Book
Fernandez Merary
100% (2)
GOALS FOR CONDUCTING NURSING RESEARCH The Importance of Nursing Research Cannot Be Stressed Enough
Document4 pages
GOALS FOR CONDUCTING NURSING RESEARCH The Importance of Nursing Research Cannot Be Stressed Enough
Tess De Vera
No ratings yet
Title - Nuanced Metrics For Measuring Unintended Bias With Real Data For Text Classification
Document1 page
Title - Nuanced Metrics For Measuring Unintended Bias With Real Data For Text Classification
Yash Agrawal
No ratings yet
The Effects of A Nonlinear Pedagogy
Document9 pages
The Effects of A Nonlinear Pedagogy
Mario Ruiz
No ratings yet
(JSTOR) Literal Meaning and Logical Theory by Jerrold J. Katz
Document32 pages
(JSTOR) Literal Meaning and Logical Theory by Jerrold J. Katz
Hasan El Talliss
No ratings yet
FR Birthday Dialogue
Document2 pages
FR Birthday Dialogue
Guen
No ratings yet
Letter of Recommendation-Celeste Tafe
Document1 page
Letter of Recommendation-Celeste Tafe
api-707119267
No ratings yet
Unit 8 - Language Summary - Jobs and Workplaces
Document1 page
Unit 8 - Language Summary - Jobs and Workplaces
Jheriimel Mediina
No ratings yet
Math Lesson Plan - Finding Perimeter
Document12 pages
Math Lesson Plan - Finding Perimeter
api-302768850
No ratings yet
CJS210 Wk5 Checkpoint - The Personal Side of Policing
Document4 pages
CJS210 Wk5 Checkpoint - The Personal Side of Policing
tj_hance_642306767
100% (1)
How To Build A Positive School Culture
Document7 pages
How To Build A Positive School Culture
api-269311977
No ratings yet
Using AI Tools To Lesson Plan - Edutopia
Document21 pages
Using AI Tools To Lesson Plan - Edutopia
alraclitas
No ratings yet
LP Oral Com
Document7 pages
LP Oral Com
JanrayBernal
100% (1)
Eapp Activity: Ganilyn D. Ponciano. STEM 12-A September 30, 2021
Document1 page
Eapp Activity: Ganilyn D. Ponciano. STEM 12-A September 30, 2021
Ganilyn Ponciano
No ratings yet
Constructivism
Document5 pages
Constructivism
Maria Dominique Dalisay
No ratings yet
Writing A Short Poem Applying The Various Elements and Literary Devices Exploring Innovative Techniques
Document15 pages
Writing A Short Poem Applying The Various Elements and Literary Devices Exploring Innovative Techniques
Jenny Mengote
No ratings yet
Diagramatical Analisis-Lee L. Kantemwein 2007
Document27 pages
Diagramatical Analisis-Lee L. Kantemwein 2007
julio
100% (1)
Artficial Inteligence Notes
Document57 pages
Artficial Inteligence Notes
Garima Chadha
100% (2)
Plan de Lectie Engleza Pregatitoar
Document5 pages
Plan de Lectie Engleza Pregatitoar
Alexa Alex
100% (1)