Welcome to Scribd!

Data Preprocessing

Uploaded by

0% found this document useful (0 votes)

5 views1 page

The document discusses five common data preprocessing techniques: data cleaning which involves removing missing or inconsistent data; data integration which combines data from multiple sources; data transformation which converts data into a format suitable for analysis; data reduction which selects a relevant subset of data; and data discretization which converts numerical to categorical data.

Original Description:

Original Title

2. Data Preprocessing

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

5 views1 page

Data Preprocessing

Uploaded by

Dipesh Pandit

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 1

Search inside document

Data Preprocessing Techniques

• Dᴀᴛᴀ ᴄʟᴇᴀɴɪɴɢ: This step involves identifying and removing missing, inconsistent, or
irrelevant data. This can include removing duplicate records, filling in missing values,
and handling outliers.
• Dᴀᴛᴀ Iɴᴛᴇɢʀᴀᴛɪᴏɴ: This step combines data from multiple sources, such as databases,
spreadsheets, and text files. Integration aims to create a single, consistent view of the
data.
• Dᴀᴛᴀ ᴛʀᴀɴsғᴏʀᴍᴀᴛɪᴏɴ: This step involves converting the data into a format that is
more suitable for data mining task. This can include normalizing numerical data, creating
dummy variables, and encoding categorical data.
• Dᴀᴛᴀ Rᴇᴅᴜᴄᴛɪᴏɴ: This step is used to select a subset of the data relevant to the data
mining task. This can include feature selection (selecting a subset of the variables) or
feature extraction (extracting new variables from the data).
• Dᴀᴛᴀ ᴅɪsᴄʀᴇᴛɪᴢᴀᴛɪᴏɴ: This step is used to convert continuous numerical data into
categorical data, which can be used for decision trees and other categorical data mining
techniques

Steps For Data Processing
Document10 pages
Steps For Data Processing
arshuyas
No ratings yet
BDA Class1
Document33 pages
BDA Class1
Neeraj Sivadas K
No ratings yet
Down 2
Document61 pages
Down 2
pavunkumar
No ratings yet
Data Mining
Document5 pages
Data Mining
Namra Sarfraz
No ratings yet
Datawarehousing
Document10 pages
Datawarehousing
Harshit Jain
No ratings yet
Dw&bi PR2,3
Document6 pages
Dw&bi PR2,3
Dhanraj Deore
No ratings yet
DATA Mining
Document21 pages
DATA Mining
Robi BM
No ratings yet
Bi Lesson 6
Document36 pages
Bi Lesson 6
calebgaichuhie254
No ratings yet
Unit 3 Data Warehouse
Document17 pages
Unit 3 Data Warehouse
Vanshika Chauhan
No ratings yet
Data Science2
Document7 pages
Data Science2
Kaushal
No ratings yet
Data Science PDF
Document11 pages
Data Science PDF
sredhar s
No ratings yet
R Programming Unit-2
Document29 pages
R Programming Unit-2
padma
No ratings yet
Dataminig ch1 30006
Document4 pages
Dataminig ch1 30006
Rehman Ali
No ratings yet
Module 2
Document8 pages
Module 2
Sayan Majumder
No ratings yet
Unit - 2 Machine Learning
Document42 pages
Unit - 2 Machine Learning
Nishtha Singh
No ratings yet
Data Prep Roc Es
Document31 pages
Data Prep Roc Es
M sindhu
No ratings yet
Unit 2
Document11 pages
Unit 2
NAKKA PUNEETH
No ratings yet
Data Mining Unit-1 Lect-4
Document49 pages
Data Mining Unit-1 Lect-4
Pooja Reddy
No ratings yet
Week 3
Document23 pages
Week 3
Muneeba Mehmood
No ratings yet
Module 1
Document36 pages
Module 1
Mhd Aslam
No ratings yet
Data Preprocessing
Document33 pages
Data Preprocessing
Stephen Paul
No ratings yet
Pre Processing
Document60 pages
Pre Processing
vani_V_prakash
No ratings yet
What Is Data Mining: Effective Data Collection Warehousing
Document21 pages
What Is Data Mining: Effective Data Collection Warehousing
ysakhare69
No ratings yet
Week 2 - Data Analytics Life Cycle
Document41 pages
Week 2 - Data Analytics Life Cycle
Alif Luqman
No ratings yet
Big Data Categories-Life Cycle
Document15 pages
Big Data Categories-Life Cycle
shweta sinha
No ratings yet
02.data Preprocessing PDF
Document31 pages
02.data Preprocessing PDF
sunil
100% (1)
Data Preprocessing
Document12 pages
Data Preprocessing
Prashant Sahu
No ratings yet
Lab Assignment 1 Title: Data Wrangling I: Problem Statement
Document12 pages
Lab Assignment 1 Title: Data Wrangling I: Problem Statement
Mr. Legendperson
No ratings yet
4.1 - Data Preprocessing
Document28 pages
4.1 - Data Preprocessing
mactabios23
No ratings yet
Math211101020
Document12 pages
Math211101020
Saba Shaheen
No ratings yet
1.data Mining Functionalities
Document14 pages
1.data Mining Functionalities
Sai Deekshith
No ratings yet
Assignment 1: Aim: Preprocess Data Using Python. Objective
Document7 pages
Assignment 1: Aim: Preprocess Data Using Python. Objective
Abhinay Surve
No ratings yet
Adm Q&a
Document13 pages
Adm Q&a
pranavi gn
No ratings yet
Term Paper
Document5 pages
Term Paper
Akash Sudan
No ratings yet
Major Issues in Data Mining
Document5 pages
Major Issues in Data Mining
Gaurav Jaiswal
No ratings yet
Unit 2 Data Analytics
Document16 pages
Unit 2 Data Analytics
Tinku The Blogger
No ratings yet
Lesson 1 Introduction To Data Mining: Jennifer O. Contreras Coloma
Document40 pages
Lesson 1 Introduction To Data Mining: Jennifer O. Contreras Coloma
Omer Husham
No ratings yet
468 - DM Bok 2
Document157 pages
468 - DM Bok 2
alexander acosta
No ratings yet
Data Mining - Prashant
Document10 pages
Data Mining - Prashant
Kunal Kubal
No ratings yet
Module 2
Document42 pages
Module 2
hiremathsumith99
No ratings yet
Assignment 2
Document5 pages
Assignment 2
Dipankar Gogoi
No ratings yet
Chapter 1
Document55 pages
Chapter 1
Bikila Seketa
No ratings yet
Chapter 1&2
Document91 pages
Chapter 1&2
Bikila Seketa
No ratings yet
Data Mining and Warehouse
Document30 pages
Data Mining and Warehouse
noelbaptist827
No ratings yet
2 Data Science - Managing Data
Document37 pages
2 Data Science - Managing Data
Anushka Kundu
No ratings yet
IV-cse DM Viva Questions
Document10 pages
IV-cse DM Viva Questions
Imtiyaz Ali
No ratings yet
Big Data - Unit - 3
Document20 pages
Big Data - Unit - 3
Amanpreet Dutta
No ratings yet
Chapter 2-2
Document34 pages
Chapter 2-2
mazu1
No ratings yet
Data Binning
Document9 pages
Data Binning
Nithish Raj
No ratings yet
03-Data Preprocessing 2021
Document33 pages
03-Data Preprocessing 2021
Lakshmi Priya B
No ratings yet
Data MiningBA
Document8 pages
Data MiningBA
naveen_b_r
No ratings yet
Data Preprocessing AND Data Cleansing: By-Ahtesham Ullah Khan 1604610013 CS-3 Yr
Document12 pages
Data Preprocessing AND Data Cleansing: By-Ahtesham Ullah Khan 1604610013 CS-3 Yr
Ali Khan
No ratings yet
Chapter Two Data Science: by Abdulaziz Oumer
Document29 pages
Chapter Two Data Science: by Abdulaziz Oumer
Abduro Yasin
No ratings yet
Machine Learning Introduction
Document20 pages
Machine Learning Introduction
nada1914465
No ratings yet
Untitled Document
Document5 pages
Untitled Document
Noel Ony
No ratings yet
Module 2 Introduction To Data Mining
Document19 pages
Module 2 Introduction To Data Mining
dhruu2503
No ratings yet
Unit I - Part I Notes
Document33 pages
Unit I - Part I Notes
Manju Ancy John Immanuel
100% (6)
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
Document7 pages
Ques 1.give Some Examples of Data Preprocessing Techniques?: Assignment - DWDM Submitted By-Tanya Sikka 1719210284
Sachin Chauhan
No ratings yet
Classification and Prediction Lecture-22,23,24,25,26,27, 28: Dr. Sudhir Sharma Manipal University Jaipur
Document43 pages
Classification and Prediction Lecture-22,23,24,25,26,27, 28: Dr. Sudhir Sharma Manipal University Jaipur
Aatmaj Salunke
No ratings yet
Data Preprocessing: Enhancing Data for Analysis. The Art of Preprocessing
From Everand
Data Preprocessing: Enhancing Data for Analysis. The Art of Preprocessing
Daniel Garfield
No ratings yet
Hyperparameter Tuning
Document9 pages
Hyperparameter Tuning
Dipesh Pandit
No ratings yet
Evaluation
Document18 pages
Evaluation
Dipesh Pandit
No ratings yet
AC Coordination Complexes
Document17 pages
AC Coordination Complexes
Dipesh Pandit
No ratings yet
Reaction Mechanism
Document55 pages
Reaction Mechanism
Dipesh Pandit
No ratings yet
Unit:4, Engineering Polymers
Document49 pages
Unit:4, Engineering Polymers
Dipesh Pandit
No ratings yet
Environmental Chemistry
Document9 pages
Environmental Chemistry
Dipesh Pandit
No ratings yet