Data Mining Process

Uploaded by

akash

0% found this document useful (0 votes)

20 views2 pages

Data mining process detail explanation

Original Title

Data mining process

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Data mining process detail explanation

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

20 views2 pages

Data Mining Process

Uploaded by

akash

Data mining process detail explanation

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

Data mining process:

The data mining process is divided into two parts i.e. Data Preprocessing and Data Mining.
Data Preprocessing involves data cleaning, integration, reduction, and transformation. The
data mining part performs data mining, pattern evaluation, and knowledge representation of
data.
Data preprocessing: Many factors determine the usefulness of data such as accuracy,
completeness, consistency, and timeliness. The data has to be quality if it satisfies the
intended purpose. Thus preprocessing is crucial in the data mining process. The major steps
involved in data preprocessing are explained below.

1) Data Cleaning
Data cleaning is the first step in data mining. It holds importance as dirty data if used directly
in mining can confuse procedures and produce inaccurate results. This step involves the
removal of noisy or incomplete data from the collection. Many methods that generally clean
data by themselves are available but they are not robust.

2) Data Integration
When multiple heterogeneous data sources such as databases, data cubes, or files are
combined for analysis, this process is called data integration. This can help in improving the
accuracy and speed of the data mining process. Different databases have different naming
conventions of variables, causing redundancies in the databases. Additional Data Cleaning
can be performed to remove the redundancies and inconsistencies from the data integration
without affecting the reliability of data.

3) Data Reduction
This technique is applied to obtain relevant data for analysis from the collection of data. The
size of the representation is much smaller in volume while maintaining integrity. Data
Reduction is performed using methods such as Naive Bayes, Decision Trees, Neural
networks, etc.
4) Data Transformation
In this process, data is transformed into a form suitable for the data mining process. Data is
consolidated so that the mining process is more efficient and the patterns are easier to
understand. Data Transformation involves Data Mapping and code generation process.
5) Data Mining
Data Mining is a process to identify interesting patterns and knowledge from a large amount
of data. In these steps, intelligent patterns are applied to extract the data patterns. The data is
represented in the form of patterns and models are structured using classification and
clustering techniques.
6) Pattern Evaluation
This step involves identifying interesting patterns representing the knowledge based on
interestingness measures. Data summarization and visualization methods are used to make
the data understandable to the user.
7) Knowledge Representation
Knowledge representation is a step where data visualization and knowledge representation
tools are used to represent the mined data. Data is visualized in the form of reports, tables,
etc.

Data MiningBA
Document8 pages
Data MiningBA
naveen_b_r
No ratings yet
UCS551 Chapter 3 - Data Management and Data Quality
Document27 pages
UCS551 Chapter 3 - Data Management and Data Quality
Fatin Hulwani
No ratings yet
Adm Q&a
Document13 pages
Adm Q&a
pranavi gn
No ratings yet
Datawarehousing
Document10 pages
Datawarehousing
Harshit Jain
No ratings yet
Knowledge Discovery in Databases
Document17 pages
Knowledge Discovery in Databases
Sarvesh Dharme
No ratings yet
Sathyapriya Thesis NEW
Document47 pages
Sathyapriya Thesis NEW
Mukesh Lavan
No ratings yet
Data Mining: Extracting Knowledge from Large Amounts of Data
Document5 pages
Data Mining: Extracting Knowledge from Large Amounts of Data
Dipankar Gogoi
No ratings yet
Stages in Data Mining
Document11 pages
Stages in Data Mining
Yusuf mohammed
No ratings yet
A) Data Cleaning
Document7 pages
A) Data Cleaning
Aziz Ur Rehman
No ratings yet
Data Preprocessing Techniques for Data Mining
Document5 pages
Data Preprocessing Techniques for Data Mining
Akash Sudan
No ratings yet
DATA PRE-PROCESSING TECHNIQUES
Document9 pages
DATA PRE-PROCESSING TECHNIQUES
Ashitha Ashi
No ratings yet
Data Preparation: January 2017
Document15 pages
Data Preparation: January 2017
ghaghagha
No ratings yet
Data Science2
Document7 pages
Data Science2
Kaushal
No ratings yet
R Programming Unit-2
Document29 pages
R Programming Unit-2
padma
No ratings yet
BDA Class1
Document33 pages
BDA Class1
Neeraj Sivadas K
No ratings yet
Data Mining: Key Learning Outcomes and Tasks
Document14 pages
Data Mining: Key Learning Outcomes and Tasks
Ma. Jessabel Azurin
No ratings yet
Unit 2 DWDM
Document14 pages
Unit 2 DWDM
brijendersinghkhalsa
No ratings yet
Unit 2: Big Data Analytics
Document45 pages
Unit 2: Big Data Analytics
Prabha Joshi
No ratings yet
Data Preparation For Data Mining: Shichao Zhang and Chengqi Zhang
Document8 pages
Data Preparation For Data Mining: Shichao Zhang and Chengqi Zhang
Andika Saputra
No ratings yet
Advance Database With Lab: Professor & Head (Department of Software Engineering)
Document5 pages
Advance Database With Lab: Professor & Head (Department of Software Engineering)
Mahmud Rana
No ratings yet
Data Binning
Document9 pages
Data Binning
Nithish Raj
No ratings yet
Data Processing in Research
Document31 pages
Data Processing in Research
Adv .Rashbana thansi V M
No ratings yet
1.data Mining Functionalities
Document14 pages
1.data Mining Functionalities
Sai Deekshith
No ratings yet
1708443470801
Document71 pages
1708443470801
Ronald Cruz
No ratings yet
Data Mining - Unit - 3
Document62 pages
Data Mining - Unit - 3
sunil star
No ratings yet
Recommender System - Module 2 - Data Mining Techniques in Recommender System
Document58 pages
Recommender System - Module 2 - Data Mining Techniques in Recommender System
DainikMitra
No ratings yet
Recommender System - Module 2 - Data Mining Techniques in Recommender System
Document58 pages
Recommender System - Module 2 - Data Mining Techniques in Recommender System
DainikMitra
No ratings yet
Unit 3: by Dr. Anand Vyas
Document20 pages
Unit 3: by Dr. Anand Vyas
Prince Singh
No ratings yet
Data Mining
Document40 pages
Data Mining
kangmo Abel
No ratings yet
Datamining Unit 2 Part2
Document11 pages
Datamining Unit 2 Part2
Bhasutkar Mahesh
No ratings yet
DM Unit-1 Notes
Document47 pages
DM Unit-1 Notes
balijagudam shashank
No ratings yet
WEKA Tool & Its Report on NSL-KDD Data Set
Document18 pages
WEKA Tool & Its Report on NSL-KDD Data Set
MR. SIDDHESH KATHALE
No ratings yet
Unit - 2 Machine Learning
Document42 pages
Unit - 2 Machine Learning
Nishtha Singh
No ratings yet
Lecture 6-Data Mining and Warehousing
Document7 pages
Lecture 6-Data Mining and Warehousing
Kelvin Teto
No ratings yet
DSS Chapter on Decision Support Systems
Document62 pages
DSS Chapter on Decision Support Systems
sgsoni
No ratings yet
Data Cleaning
Document6 pages
Data Cleaning
andrew stankovik
No ratings yet
Dwdm-Unit-1 R16
Document17 pages
Dwdm-Unit-1 R16
Manaswini Bhaskaruni
No ratings yet
Data Cleaning, Integration, and Data Transformation Techniques
Document7 pages
Data Cleaning, Integration, and Data Transformation Techniques
samforresume
No ratings yet
Assignment 1: Aim: Preprocess Data Using Python. Objective
Document7 pages
Assignment 1: Aim: Preprocess Data Using Python. Objective
Abhinay Surve
No ratings yet
Unit - I
Document22 pages
Unit - I
Dev
No ratings yet
Lecture 6 23-24
Document20 pages
Lecture 6 23-24
Bekzat Sagyndykov
No ratings yet
DMW UNIT 1 Pessondranath
Document29 pages
DMW UNIT 1 Pessondranath
2344Atharva Patil
No ratings yet
DM&W File
Document18 pages
DM&W File
Prerna Rawal
No ratings yet
Data Preparation
Document17 pages
Data Preparation
Joyce Choy
No ratings yet
Lec 2 Preparing The Data
Document4 pages
Lec 2 Preparing The Data
Alia butt
No ratings yet
Unit-2 Introduction To Data Mining
Document11 pages
Unit-2 Introduction To Data Mining
Khal Drago
No ratings yet
Dmdw-Unit-1 R16
Document17 pages
Dmdw-Unit-1 R16
Arun
No ratings yet
Data Mining
Document7 pages
Data Mining
Mano
No ratings yet
Data Mining and Data Analysis UNIT-1 Notes For Print
Document22 pages
Data Mining and Data Analysis UNIT-1 Notes For Print
padma
No ratings yet
Unit 1
Document11 pages
Unit 1
Kushal settulari
No ratings yet
Introduction to Data Mining - Analyzing Vast Amounts of Daily Data
Document14 pages
Introduction to Data Mining - Analyzing Vast Amounts of Daily Data
Songa Sowjanya
No ratings yet
Data Science for Beginners
From Everand
Data Science for Beginners
Tom Lesley
No ratings yet
Research Methodology (Data Analysis)
Document7 pages
Research Methodology (Data Analysis)
Masood Shaikh
No ratings yet
DW&BI PR2,3
Document6 pages
DW&BI PR2,3
Dhanraj Deore
No ratings yet
Data Mining
Document135 pages
Data Mining
Dewsun Riseon
No ratings yet
Data Mining and Warehouse
Document30 pages
Data Mining and Warehouse
noelbaptist827
No ratings yet
Chapter-1 - Introduction To Data Mining
Document10 pages
Chapter-1 - Introduction To Data Mining
Mustefa Mohammed
No ratings yet
Data Mining and Its Techniques: A Review Paper: Maria Shoukat (MS Student)
Document7 pages
Data Mining and Its Techniques: A Review Paper: Maria Shoukat (MS Student)
mariashoukat
No ratings yet
UNIT - 2 .DataScience 04.09.18
Document53 pages
UNIT - 2 .DataScience 04.09.18
Raghavendra Rao
No ratings yet
Data Mining Questions
Document24 pages
Data Mining Questions
mahi
No ratings yet
Consolidated Balance Sheet Particulars Note 31-Mar-21 PERCENTAGE 31-Mar-20
Document4 pages
Consolidated Balance Sheet Particulars Note 31-Mar-21 PERCENTAGE 31-Mar-20
akash
No ratings yet
B2.2 Death Rates From Air Pollution Digital Business
Document24 pages
B2.2 Death Rates From Air Pollution Digital Business
akash
No ratings yet
B2.2 - Death Rates From Air Pollution - Digital Business 1
Document24 pages
B2.2 - Death Rates From Air Pollution - Digital Business 1
akash
No ratings yet
Abd Cca-3 Quiz
Document3 pages
Abd Cca-3 Quiz
akash
No ratings yet
Direct and Indirect Cost Quiz
Document7 pages
Direct and Indirect Cost Quiz
akash
No ratings yet
B3.2 - Cricket Data Analysis - Digital Business
Document18 pages
B3.2 - Cricket Data Analysis - Digital Business
akash
No ratings yet
B2.2 - Death Rates From Air Pollution - Digital Business
Document24 pages
B2.2 - Death Rates From Air Pollution - Digital Business
akash
No ratings yet
B2 - BDPM - CCA - 2 New
Document6 pages
B2 - BDPM - CCA - 2 New
akash
No ratings yet
BDPM Presentation
Document5 pages
BDPM Presentation
akash
No ratings yet
BA-2.2-R Programming
Document21 pages
BA-2.2-R Programming
akash
No ratings yet
Ba 2.2 Ofss
Document33 pages
Ba 2.2 Ofss
akash
No ratings yet
DS Cca2 Ba2.2
Document12 pages
DS Cca2 Ba2.2
akash
No ratings yet
BA-2.2-Data Mining
Document18 pages
BA-2.2-Data Mining
akash
No ratings yet
Bearings
Document26 pages
Bearings
tmscorreia
No ratings yet
Why Am I Getting Temperature Divergence in AMG Solver
Document7 pages
Why Am I Getting Temperature Divergence in AMG Solver
Sulaiman
No ratings yet
- Bài nghe gồm 20 câu chia làm 3 phần - Thí sinh được nghe 2 lần, đĩa CD tự chạy 2 lần
Document11 pages
- Bài nghe gồm 20 câu chia làm 3 phần - Thí sinh được nghe 2 lần, đĩa CD tự chạy 2 lần
Hồng Nhung
No ratings yet
Estatement 2020022506
Document1 page
Estatement 2020022506
ALL IN ONE. BOOLIWOOd SONG
No ratings yet
Principle Principle Principle
Document12 pages
Principle Principle Principle
Darshana Juvekar
No ratings yet
Sodium Lignosulfonate MSDS: Section 1: Chemical Product and Company Identification
Document5 pages
Sodium Lignosulfonate MSDS: Section 1: Chemical Product and Company Identification
YasdiOK
No ratings yet
Percent Composition
Document4 pages
Percent Composition
Tshiamo Motaung
No ratings yet
HER201 Flex Tiles Set 01 - Vehicles
Document3 pages
HER201 Flex Tiles Set 01 - Vehicles
Douglas Mears
100% (2)
Attendance Challenge Toolkit
Document19 pages
Attendance Challenge Toolkit
api-197489652
No ratings yet
China Holidays, Public Holidays Calendar in 2020 - 2021 - 2022
Document15 pages
China Holidays, Public Holidays Calendar in 2020 - 2021 - 2022
eric retko
No ratings yet
Hdpe Guide PDF
Document81 pages
Hdpe Guide PDF
balot
No ratings yet
School Canteen Satisfaction Survey Results
Document2 pages
School Canteen Satisfaction Survey Results
Ella Pastorin
No ratings yet
Build Pulse Oximeter Instructions
Document3 pages
Build Pulse Oximeter Instructions
PrabhuDev
No ratings yet
CHAPTER 8 The Rise of Instrumental Music - 141-152
Document8 pages
CHAPTER 8 The Rise of Instrumental Music - 141-152
Aleksandre Roderick-Lorenz
No ratings yet
Assessment of Fiber Optic Pressure Sensors: NUREG/CR-6312
Document133 pages
Assessment of Fiber Optic Pressure Sensors: NUREG/CR-6312
abhrajitsaha
No ratings yet
Heat and Mass Chapter 2
Document49 pages
Heat and Mass Chapter 2
Mvelo Phungula
No ratings yet
Thermodynamics 1 Initial Draft 1
Document230 pages
Thermodynamics 1 Initial Draft 1
john pakingan
No ratings yet
Toyota c1391 Alomejor y Otros Prius Abs
Document27 pages
Toyota c1391 Alomejor y Otros Prius Abs
acb . b
No ratings yet
Shri Mata Vaishno Devi Shrine Board - Welcome To Online Servicesjj
Document2 pages
Shri Mata Vaishno Devi Shrine Board - Welcome To Online Servicesjj
eternal diagnostics
No ratings yet
Ruminations by Other People
Document31 pages
Ruminations by Other People
dhultstrom
No ratings yet
CA ruling on fertilizer dispute
Document16 pages
CA ruling on fertilizer dispute
Ruby Anna Torres
No ratings yet
PP 1
Document33 pages
PP 1
Vishnu Ingle
No ratings yet
1ST Quarter Exam Mapeh 8
Document7 pages
1ST Quarter Exam Mapeh 8
John Rey Manolo Baylosis
No ratings yet
1 An Overview of Physical and Phase Change
Document5 pages
1 An Overview of Physical and Phase Change
Gede Krishna
No ratings yet
Warsaw Pact Order of Battle - 1989
Document61 pages
Warsaw Pact Order of Battle - 1989
Zero Knight
100% (1)
Chapter 2. COST I
Document8 pages
Chapter 2. COST I
yebegashet
No ratings yet
342 Mechanical and Fluid Drive Maintenance Course Description
Document2 pages
342 Mechanical and Fluid Drive Maintenance Course Description
aa256850
No ratings yet
003 Elect - Electrical Earthing System Installation PDF
Document110 pages
003 Elect - Electrical Earthing System Installation PDF
bisworupm
No ratings yet
Constructors in Java
Document5 pages
Constructors in Java
Anonymous GqTzzkOf
No ratings yet
San Diego Quick Assessment
Document56 pages
San Diego Quick Assessment
Liz
No ratings yet