Welcome to Scribd!

Data Scaling

Uploaded by

0% found this document useful (0 votes)

9 views5 pages

Data scaling is important for modeling because input variables may have different units or scales that can increase difficulty. There are two main scaling methods: normalization rescales data from the original range to between 0 and 1, while standardization rescales data to have a mean of 0 and standard deviation of 1. Both require estimating minimum/maximum values for normalization or mean and standard deviation for standardization.

Original Description:

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

9 views5 pages

Data Scaling

Uploaded by

dhananjaya.geo

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 5

Search inside document

Data Scaling

Why we need to scale data?

● Input variables may have different units (e.g. feet, kilometers, and hours) that, in turn, may
mean the variables have different scales
● Differences in the scales across input variables may increase the difﬁculty of the problem
being modeled
● Whether input variables require scaling depends on the speciﬁcs of your problem and of
each variable
● Problems can be complex and it may not be clear how to best scale input data
Types of Scaling methods

● Normalization:
○ Rescaling of the data from the original range so that all values are within the range of 0 and 1
○ It is also known as MinMax Scaler

● Standardization:
○ Standardizing a dataset involves rescaling the distribution of values so that the mean of observed
values is 0 and the standard deviation is 1
○ Standardization assumes that your observations ﬁt a Normal distribution
Normalization

● Normalization requires that you know or are able to accurately estimate the minimum
and maximum observable values
● Normalization Formula:
○ y = (x - min) / (max - min)
● Generally, we import MinMaxScaler from sklearn.preprocessing for Normalization
● The default scale for the MinMaxScaler is to rescale variables into the range [0,1],
although a preferred scale can be speciﬁed
Standardization

● Standardization requires that you know or are able to accurately estimate the mean and
standard deviation of observable values
● Standardization Formula:
○ y = (x - mean) / standard_deviation
● Generally, we import StandardScaler from sklearn.preprocessing for Standardization
● This can be thought of as subtracting the mean value or centering the data

Psychological Statistics Notes
Document10 pages
Psychological Statistics Notes
Santos Tmc
No ratings yet
Chapter5 Measures of Variability
Document31 pages
Chapter5 Measures of Variability
vels schoolg12
No ratings yet
An Overview of The Guide To The Expression of Uncertainty in Measurement
Document15 pages
An Overview of The Guide To The Expression of Uncertainty in Measurement
eamecl
No ratings yet
02.data Preprocessing PDF
Document31 pages
02.data Preprocessing PDF
sunil
100% (1)
Statistical Quality Control: Simple Applications of Statistics in TQM
Document57 pages
Statistical Quality Control: Simple Applications of Statistics in TQM
Harpreet Singh Panesar
No ratings yet
Unit 2 ML 2019
Document91 pages
Unit 2 ML 2019
Pratham MURKUTE
No ratings yet
ML Unit 2
Document90 pages
ML Unit 2
Aanchal Padmavat
No ratings yet
Pattern Recognition - Unit 2
Document31 pages
Pattern Recognition - Unit 2
Priyansh Kumar
No ratings yet
Untitled
Document128 pages
Untitled
P.V.S. VEERANJANEYULU
No ratings yet
Fundamental of ML Week 3
Document16 pages
Fundamental of ML Week 3
Raj Physio
No ratings yet
Data Transformation
Document16 pages
Data Transformation
Avudaiappan S
No ratings yet
Unit 4
Document33 pages
Unit 4
PaiEducation
No ratings yet
Lecture 4
Document33 pages
Lecture 4
Venkat ram Reddy
No ratings yet
Quantitative Methods For Management
Document118 pages
Quantitative Methods For Management
Arnav bedi
No ratings yet
Introduction To Statistics
Document42 pages
Introduction To Statistics
Geetu Sodhi
No ratings yet
Standardization & Normalization In: ML With Python Example
Document8 pages
Standardization & Normalization In: ML With Python Example
George Iskander
No ratings yet
Unit 3
Document110 pages
Unit 3
Nishanth Nuthi
No ratings yet
Name: Vijay Patel Class: SYBSC-IT Div: B Roll No.: 4163 Assignment Questions
Document19 pages
Name: Vijay Patel Class: SYBSC-IT Div: B Roll No.: 4163 Assignment Questions
White Rock
No ratings yet
Change of Origin and Scale
Document11 pages
Change of Origin and Scale
Sanjana Prabhu
No ratings yet
Feature Scaling in Machine Learning
Document4 pages
Feature Scaling in Machine Learning
Varun Bhayana
No ratings yet
Quality Control Parameters and Methods
Document33 pages
Quality Control Parameters and Methods
Sanskar Agrawal
No ratings yet
4 - Finding and Fixing Data Quality Issues
Document48 pages
4 - Finding and Fixing Data Quality Issues
mkz01041
No ratings yet
Instructor'S Manual: Statistical Techniques in Financial Management
Document3 pages
Instructor'S Manual: Statistical Techniques in Financial Management
joebloggs1888
No ratings yet
Data Preprocessing
Document38 pages
Data Preprocessing
Pradhana Riza
No ratings yet
DMDW 5
Document25 pages
DMDW 5
Anu agarwal
No ratings yet
Illustrating Normal Curve
Document11 pages
Illustrating Normal Curve
Dan Moneva
No ratings yet
Basic Statistical Descriptions of Data: Dr. Amiya Ranjan Panda
Document35 pages
Basic Statistical Descriptions of Data: Dr. Amiya Ranjan Panda
Anu agarwal
No ratings yet
Statistical QC
Document57 pages
Statistical QC
Jigar Nagvadia
No ratings yet
utf-8''C2M1 Assignment
Document24 pages
utf-8''C2M1 Assignment
Sarah Mendes
No ratings yet
Mathematical Analysis
Document46 pages
Mathematical Analysis
Gilbert Dwasi
100% (1)
I. Models and Cost Functions: ML Notations
Document13 pages
I. Models and Cost Functions: ML Notations
sst sharun
No ratings yet
Exploring The Model
Document13 pages
Exploring The Model
sst sharun
No ratings yet
Fiches Machine Learning
Document21 pages
Fiches Machine Learning
Rhysand Re
No ratings yet
Machine Learning - Lec4 - 5
Document41 pages
Machine Learning - Lec4 - 5
Deepali Koirala
No ratings yet
Data Preprocessing
Document56 pages
Data Preprocessing
Raksa Kun
No ratings yet
000 Statistical Quality Control-Lec 3
Document72 pages
000 Statistical Quality Control-Lec 3
Arwa Hussein
No ratings yet
Unit 2
Document37 pages
Unit 2
Poorna
No ratings yet
Data Analysis From Theoretical To Implementation: Lecture #7/8 Inference Normal Distribution &
Document21 pages
Data Analysis From Theoretical To Implementation: Lecture #7/8 Inference Normal Distribution &
mohamed
No ratings yet
PR2 Lesson 6 Data Analysis Using
Document30 pages
PR2 Lesson 6 Data Analysis Using
Niño Rapfaele
No ratings yet
UNIT2SVMKNN
Document31 pages
UNIT2SVMKNN
Aditya Sharma
No ratings yet
Measures of Dispersion
Document1 page
Measures of Dispersion
Nell Ahito
No ratings yet
Week2 Class3
Document19 pages
Week2 Class3
Mayra Martinez
No ratings yet
20 - Levels of Measurement, Central Tendency Dispersion
Document35 pages
20 - Levels of Measurement, Central Tendency Dispersion
Rahul Jaju
No ratings yet
ML Notes
Document14 pages
ML Notes
zomukoza
No ratings yet
04 - Descriptive Statistical Measures
Document42 pages
04 - Descriptive Statistical Measures
hu mirza
No ratings yet
Chapter 4 Stat 3
Document17 pages
Chapter 4 Stat 3
Anne Monique Bagabaldo
No ratings yet
Introduction To Data Science With R Programming
Document12 pages
Introduction To Data Science With R Programming
Vimal Kumar
No ratings yet
Descriptive Statistics
Document40 pages
Descriptive Statistics
BALAVENKATRAGAVAN RAMESH
No ratings yet
Simple Linear Regression
Document29 pages
Simple Linear Regression
shishir
No ratings yet
Unit 7
Document43 pages
Unit 7
Yuvraj Rana
No ratings yet
3 Regression
Document23 pages
3 Regression
JOJO
100% (1)
SPC-Training For CQ
Document41 pages
SPC-Training For CQ
Ranish Bera
No ratings yet
Data Mining - Classification & Prediction
Document5 pages
Data Mining - Classification & Prediction
Tdx mentor
No ratings yet
Intelligent Instrumentation and DAQ
Document20 pages
Intelligent Instrumentation and DAQ
Tofeeque Unar
No ratings yet
Fundamental of ML Week 2
Document12 pages
Fundamental of ML Week 2
Raj Physio
No ratings yet
Machine Learning Notes
Document27 pages
Machine Learning Notes
abdhatemsh
No ratings yet
Statistical Process Control
Document39 pages
Statistical Process Control
Rishik Reddy
No ratings yet
Math4E Week 7 - Lecture 6
Document19 pages
Math4E Week 7 - Lecture 6
John Cris Lustria Püblico
No ratings yet
ADS EXP Assignments
Document38 pages
ADS EXP Assignments
neha.3228.sharma
No ratings yet
Data Scaling and Normalization
From Everand
Data Scaling and Normalization
Chuck Sherman
No ratings yet
Statistics For Data Analysis
Document7 pages
Statistics For Data Analysis
dhananjaya.geo
No ratings yet
Python Introduction
Document6 pages
Python Introduction
dhananjaya.geo
No ratings yet
Variable Analysis
Document4 pages
Variable Analysis
dhananjaya.geo
No ratings yet
AEO2023 Release Presentation
Document25 pages
AEO2023 Release Presentation
dhananjaya.geo
No ratings yet