Welcome to Scribd!

Skip carousel

Performance Metrics Part-4: Dr. Gaurav Dixit

Uploaded by

Aniket Sujay

0% found this document useful (0 votes)

2 views12 pages

Original Title

Lecture 19

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

2 views12 pages

Performance Metrics Part-4: Dr. Gaurav Dixit

Uploaded by

Aniket Sujay

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 12

Search inside document

PERFORMANCE METRICS Part-4

LECTURE 19

DR. GAURAV DIXIT

DEPARTMENT OF MANAGEMENT STUDIES

1
PERFORMANCE METRICS

• Open RStudio
• Asymmetric Misclassification Costs
– When misclassification error for a class of interest is more costly than
for the other class
– Example, misclassifying a customer as false positive who is actually
likely to respond to the promotional offering
• Opportunity cost of foregone sale vs. costs of making an offer (profit of ₹20 for a ₹
100 item vs. ₹1 scenario)
– Misclassification rate is not appropriate metric in this case

2
PERFORMANCE METRICS

• Asymmetric Misclassification Costs

– Other considerations
• Costs of analyzing data
• Actual net value impact per record
• New Goal : minimization of costs or maximization of profits

• Open Excel
• How to improve actual classifications by incorporating
asymmetric misclassification costs?
• Change the rules of classification e.g. cutoff value

3
PERFORMANCE METRICS

• Performance Metrics based on asymmetric misclassification

costs
𝑐0𝑛0 1+𝑐1𝑛1 0
average misclassification cost = , ,
𝑛

– Measures average cost of misclassification per observation

– Where ci is cost of misclassifying a class i observation

4
PERFORMANCE METRICS

• Ratio of costs (c0/c1)

• Future misclassification costs
– Prior Probabilities (p0/p1)
– (p0/p1)* (c0/c1)
• Lift curve incorporating costs
• Open RStudio
• Lift vs.
– No. of records or cutoff value?

5
PERFORMANCE METRICS

• Asymmetric misclassification costs for m classes (m>2)

– Classification matrix will be ‘m×m’
– m prior probabilities
– m(m-1) misclassification costs
– Matrix for misclassification costs becomes complicated
– Lift chart not usable for multiclass scenario

6
PERFORMANCE METRICS

• Oversampling of rare class members

– Simple random sampling vs. stratified sampling
• Oversampling approach
1. Sample more rare class observations (equivalent of oversampling
without replacement)
• Lack of adequate no. of rare class observations
• Ratio of costs is difficult to determine
2. Replicate existing rare class observations (equivalent of oversampling
with replacement)

7
PERFORMANCE METRICS

• Typical solution adopted by analysts

– Sample equal no. of members from both the classes
• Oversampling adjustment for performance evaluation
– Score
1. Validation partition without oversampling
2. Oversampled validation partition and then remove the oversampling effects by
adjusting weights

8
PERFORMANCE METRICS

• Typical steps in rare class scenario

1. Build the candidate models on training partition with 50% class 1
observations and 50% class 0 observations
2. Validate the models with the validation partition drawn using simple
random sample taken from original dataset
• Detailed steps
1. Separate the class 1 and class 0 observations into two strata (distinct
sets)
2. Half the records from class 1 stratum are randomly selected into
training partition

9
PERFORMANCE METRICS

• Detailed steps
3. Remaining class 1 records are reserved for validation partition
4. Randomly select class 0 records for training partition equal to no. of
class 1 records in step 2
5. Randomly select class 0 records to maintain the original ratio of class
0 to class 1 records for validation partition
6. For test partition, a random sample can be taken from validation
partition

10
Key References

• Data Science and Big Data Analytics: Discovering, Analyzing,

Visualizing and Presenting Data by EMC Education Services
(2015)
• Data Mining for Business Intelligence: Concepts, Techniques,
and Applications in Microsoft Office Excel with XLMiner by
Shmueli, G., Patel, N. R., & Bruce, P. C. (2010)

11
Thanks…

Actex SRM Spring 2019 Sample
Document55 pages
Actex SRM Spring 2019 Sample
Tyler Lorenzi
No ratings yet
Machine Learning Interview Questions.
Document43 pages
Machine Learning Interview Questions.
hari krishna reddy
100% (1)
Measures of Position and Variability
Document36 pages
Measures of Position and Variability
api-339611548
100% (1)
Performance Metrics Part-5: Dr. Gaurav Dixit
Document9 pages
Performance Metrics Part-5: Dr. Gaurav Dixit
Aniket Sujay
No ratings yet
Performance Metrics: Dr. Gaurav Dixit
Document9 pages
Performance Metrics: Dr. Gaurav Dixit
Aniket Sujay
No ratings yet
Lecture8 Model Assessment Students
Document37 pages
Lecture8 Model Assessment Students
翁江靖
No ratings yet
08 Practical
Document24 pages
08 Practical
林山山
No ratings yet
Data Splitting and Bias Variance Tradeoff
Document14 pages
Data Splitting and Bias Variance Tradeoff
Eileen Lovegood
No ratings yet
Data Mining: Practical Machine Learning Tools and Techniques
Document73 pages
Data Mining: Practical Machine Learning Tools and Techniques
Arvind
No ratings yet
7 ML
Document38 pages
7 ML
nandukannanmelath
No ratings yet
Feature Selection: Slide 1
Document29 pages
Feature Selection: Slide 1
Prathik Narayan
No ratings yet
Learning From Imbalanced Data
Document54 pages
Learning From Imbalanced Data
STYX
No ratings yet
Customer Churn Presentation
Document28 pages
Customer Churn Presentation
thejaswinsivakumar123
No ratings yet
Chap3 Part1 Classification
Document38 pages
Chap3 Part1 Classification
houcem.swissi
No ratings yet
Data Mining Data Transformations: Gergely Lukács
Document51 pages
Data Mining Data Transformations: Gergely Lukács
Blazs
No ratings yet
Chapter 2 Data Preprocessing
Document23 pages
Chapter 2 Data Preprocessing
liyu agye
No ratings yet
CSO504 Machine Learning: Evaluation and Error Analysis Validation and Regularization Koustav Rudra 22/08/2022
Document28 pages
CSO504 Machine Learning: Evaluation and Error Analysis Validation and Regularization Koustav Rudra 22/08/2022
Being IITian
No ratings yet
Multi Criteria
Document15 pages
Multi Criteria
Ahmad Afandi Hrp
No ratings yet
Lec - 4
Document43 pages
Lec - 4
Yonatan tamiru
No ratings yet
L5 SubjectReview
Document18 pages
L5 SubjectReview
Shaiba Shoshi
No ratings yet
Types of Machine Learning Algorithms
Document14 pages
Types of Machine Learning Algorithms
Vipin Rajput
No ratings yet
Reference Material III 10-Jan-2020 3.boundary Value Testing
Document43 pages
Reference Material III 10-Jan-2020 3.boundary Value Testing
Medarametla Sreeram
No ratings yet
AI Capstone Project - Notes-Part2
Document8 pages
AI Capstone Project - Notes-Part2
minha.fathima737373
No ratings yet
Module - 2 Ver 1.4
Document35 pages
Module - 2 Ver 1.4
Pranav B
No ratings yet
Untitled
Document128 pages
Untitled
P.V.S. VEERANJANEYULU
No ratings yet
Kenny-230718-The Ultimate Machine Learning Cheat Sheet
Document20 pages
Kenny-230718-The Ultimate Machine Learning Cheat Sheet
vanjchao
No ratings yet
Unit 2
Document28 pages
Unit 2
LOGESH WARAN P
No ratings yet
Capstone Presentation SB
Document7 pages
Capstone Presentation SB
rohitppandey91
No ratings yet
P-2.1.2 Cross Validation and Regularization
Document37 pages
P-2.1.2 Cross Validation and Regularization
Puneet Parihar
No ratings yet
CHP 3
Document70 pages
CHP 3
its9918k
No ratings yet
Chapter 10
Document31 pages
Chapter 10
shiva kulshrestha
No ratings yet
Theory in Machine Learning
Document47 pages
Theory in Machine Learning
Sreetam Ganguly
100% (2)
Pattern Recognition Application
Document43 pages
Pattern Recognition Application
Khaled Omar
No ratings yet
Big Data Lesson 2 Lucrezia Noli
Document21 pages
Big Data Lesson 2 Lucrezia Noli
Reyansh Sharma
No ratings yet
Chap2 SupervisedLearning
Document24 pages
Chap2 SupervisedLearning
Nguyễn Phương Nam
No ratings yet
Lecture 7
Document19 pages
Lecture 7
huichloemail
No ratings yet
Neal Zhang
Document33 pages
Neal Zhang
saurabh_34
No ratings yet
5224 Measure Phase 2
Document41 pages
5224 Measure Phase 2
Gark Lop
No ratings yet
Data Mining Process: Dr. Gaurav Dixit
Document18 pages
Data Mining Process: Dr. Gaurav Dixit
Parmarth Khanna
No ratings yet
In5490 Classification
Document85 pages
In5490 Classification
sherin joyson
No ratings yet
DM - Ch4 - Classification (Part1)
Document20 pages
DM - Ch4 - Classification (Part1)
C.RadhiyaDevi
No ratings yet
ISLR Chap 5 Shaheryar
Document11 pages
ISLR Chap 5 Shaheryar
Shaheryar Zahur
No ratings yet
10 AI Success Metric and Performance Indicators
Document30 pages
10 AI Success Metric and Performance Indicators
Shampa Nasrin
No ratings yet
02.data Preprocessing PDF
Document31 pages
02.data Preprocessing PDF
sunil
100% (1)
ML 1 Lecture 2
Document50 pages
ML 1 Lecture 2
Annayah Usman
No ratings yet
Exploring The Model
Document13 pages
Exploring The Model
sst sharun
No ratings yet
I. Models and Cost Functions: ML Notations
Document13 pages
I. Models and Cost Functions: ML Notations
sst sharun
No ratings yet
Cheatsheet 232
Document2 pages
Cheatsheet 232
ff8005636
No ratings yet
Classification: Evaluation: Data Mining and Text Mining (UIC 583 at Politecnico Di Milano)
Document53 pages
Classification: Evaluation: Data Mining and Text Mining (UIC 583 at Politecnico Di Milano)
asdassdcca
No ratings yet
RO47002 - Lecture 2C - Hyperparameters and Cross-Validation
Document10 pages
RO47002 - Lecture 2C - Hyperparameters and Cross-Validation
Haia Al Sharif
No ratings yet
Clase10 11
Document18 pages
Clase10 11
Magdalena
No ratings yet
Modelling and Evaluation
Document70 pages
Modelling and Evaluation
ANIMESH KUMAR
No ratings yet
CSO504 Machine Learning: Evaluation and Error Analysis Regularization Koustav Rudra 24/08/2022
Document36 pages
CSO504 Machine Learning: Evaluation and Error Analysis Regularization Koustav Rudra 24/08/2022
Being IITian
No ratings yet
Churn Prediction Report
Document4 pages
Churn Prediction Report
Ause El
No ratings yet
Week 4 Lecture Slides BUS265 2023
Document45 pages
Week 4 Lecture Slides BUS265 2023
Alberto Lugo Gonzalez
No ratings yet
Deep Learning Workout: I. Selected Architecture
Document3 pages
Deep Learning Workout: I. Selected Architecture
ArmadaDefrente
No ratings yet
Feature Engg Pre Processing Python
Document68 pages
Feature Engg Pre Processing Python
Gaurav Rohilla
No ratings yet
MIS410 Lecture9-10
Document40 pages
MIS410 Lecture9-10
Ahanaf Rasheed
No ratings yet
Lecture 05: Feature Engineering: Ms. Mehroz Sadiq
Document69 pages
Lecture 05: Feature Engineering: Ms. Mehroz Sadiq
uxama
No ratings yet
Module 5 Advanced Classification Techniques
Document40 pages
Module 5 Advanced Classification Techniques
Saurabh Jagtap
No ratings yet
Supervised and Unsupervised Learning: Ciro Donalek Ay/Bi 199 - April 2011
Document69 pages
Supervised and Unsupervised Learning: Ciro Donalek Ay/Bi 199 - April 2011
Emmanuel Harris
No ratings yet
Data Science for Beginners: Tips and Tricks for Effective Machine Learning/ Part 4
From Everand
Data Science for Beginners: Tips and Tricks for Effective Machine Learning/ Part 4
Tom Lesley
No ratings yet
Hawking Radiation1 - VIVEK KUMAR
Document5 pages
Hawking Radiation1 - VIVEK KUMAR
Aniket Sujay
No ratings yet
Microfluidics Technologies of The Future and LOC Writeup - Kumar Rishabh
Document3 pages
Microfluidics Technologies of The Future and LOC Writeup - Kumar Rishabh
Aniket Sujay
No ratings yet
Crystal Growth
Document20 pages
Crystal Growth
Aniket Sujay
No ratings yet
Machine Learning Technique K-Nearest Neighbors (K-NN) : Dr. Gaurav Dixit
Document7 pages
Machine Learning Technique K-Nearest Neighbors (K-NN) : Dr. Gaurav Dixit
Aniket Sujay
No ratings yet
Basic Statistics Using R Part-2: Dr. Gaurav Dixit
Document13 pages
Basic Statistics Using R Part-2: Dr. Gaurav Dixit
Aniket Sujay
No ratings yet
Multiple Linear Regression Part-3: Lectures 24
Document7 pages
Multiple Linear Regression Part-3: Lectures 24
Aniket Sujay
No ratings yet
Dr. Gaurav Dixit: Department of Management Studies
Document26 pages
Dr. Gaurav Dixit: Department of Management Studies
Aniket Sujay
No ratings yet
Multiple Linear Regression Part-4: Lectures 25
Document7 pages
Multiple Linear Regression Part-4: Lectures 25
Aniket Sujay
No ratings yet
Prediction Performance: Dr. Gaurav Dixit
Document9 pages
Prediction Performance: Dr. Gaurav Dixit
Aniket Sujay
No ratings yet
Performance Metrics: Dr. Gaurav Dixit
Document9 pages
Performance Metrics: Dr. Gaurav Dixit
Aniket Sujay
No ratings yet
Multiple Linear Regression-Part V Exhaustive Search: Dr. Gaurav Dixit
Document10 pages
Multiple Linear Regression-Part V Exhaustive Search: Dr. Gaurav Dixit
Aniket Sujay
No ratings yet
Chapter 6 Thermal Oxidation - III
Document26 pages
Chapter 6 Thermal Oxidation - III
Aniket Sujay
No ratings yet
Multiple Linear Regression: Lectures 22
Document11 pages
Multiple Linear Regression: Lectures 22
Aniket Sujay
No ratings yet
Electrical and Thermal Conduction in Solids
Document81 pages
Electrical and Thermal Conduction in Solids
Aniket Sujay
100% (1)
Sentiment Analysis From H El Reviews: Data Mining For Business Intelligence
Document13 pages
Sentiment Analysis From H El Reviews: Data Mining For Business Intelligence
Aniket Sujay
No ratings yet
BTP REPORT - Samila
Document30 pages
BTP REPORT - Samila
Aniket Sujay
No ratings yet
Deep Learning in Astronomy - VIVEK KUMAR
Document6 pages
Deep Learning in Astronomy - VIVEK KUMAR
Aniket Sujay
No ratings yet
Data Analytics 2017 2 30 60050
Document6 pages
Data Analytics 2017 2 30 60050
Aniket Sujay
No ratings yet
B.Tech Project: Supervised Predictive Modeling of Space Weather Events Using Remote Sensing Observations
Document21 pages
B.Tech Project: Supervised Predictive Modeling of Space Weather Events Using Remote Sensing Observations
Aniket Sujay
No ratings yet
BTP Report
Document14 pages
BTP Report
Aniket Sujay
No ratings yet
ML 03
Document42 pages
ML 03
Dreadqueen Rathian
No ratings yet
Applied Sciences: Tooth Root Bending Strength of Gears: Dimensional Effect For Small Gears Having A Module Below 5 MM
Document11 pages
Applied Sciences: Tooth Root Bending Strength of Gears: Dimensional Effect For Small Gears Having A Module Below 5 MM
Juan
No ratings yet
Assessment of The Level of Confidence of Female SPS Students in Luis Palad Integrated High School
Document33 pages
Assessment of The Level of Confidence of Female SPS Students in Luis Palad Integrated High School
Junell Mathew Catilo
100% (1)
About The MS Regress Package
Document38 pages
About The MS Regress Package
Dom DeSicilia
No ratings yet
Impact of Social Media Advertising On Consumer Buy
Document19 pages
Impact of Social Media Advertising On Consumer Buy
Kishan Mundhada
No ratings yet
Life Insurance Mathematics
Document6 pages
Life Insurance Mathematics
durgasainath
No ratings yet
Sampling Methods in Social Research
Document6 pages
Sampling Methods in Social Research
Aftab Chaudhry
No ratings yet
Lesson 6 Measures of Relative Dispersion Power Point
Document8 pages
Lesson 6 Measures of Relative Dispersion Power Point
Joyce Laru-an
No ratings yet
#9 Stability Guidelines June 98
Document114 pages
#9 Stability Guidelines June 98
Mihajlo Aćimović
No ratings yet
Life Table: Concept, Types and Preparation: Prepared by Dr. Anup K Mishra
Document13 pages
Life Table: Concept, Types and Preparation: Prepared by Dr. Anup K Mishra
Aniket Sen
No ratings yet
P.1 Biasedness - The Bias of On Estimator Is Defined As:: Chapter Two Estimators
Document8 pages
P.1 Biasedness - The Bias of On Estimator Is Defined As:: Chapter Two Estimators
Ferekkan
No ratings yet
Worksheet 3 For Eng
Document2 pages
Worksheet 3 For Eng
Admasu
No ratings yet
Research
Document63 pages
Research
Diether Simangca
No ratings yet
Personality Social Psychology: Stressful Life Events, Personality, and Health: An Inquiry Into Hardiness
Document11 pages
Personality Social Psychology: Stressful Life Events, Personality, and Health: An Inquiry Into Hardiness
Aigo Seiga Castro
No ratings yet
Activity-4-1 Salosagcol, Leobert Yancy G
Document2 pages
Activity-4-1 Salosagcol, Leobert Yancy G
Leobert Yancy Salosagcol
No ratings yet
0329 Henssge Estimationofthetimesincedeath 2
Document9 pages
0329 Henssge Estimationofthetimesincedeath 2
Ranny
No ratings yet
Let,, ., Be A Random Sample From ( ,) - Construct A (1) Confidence Interval For
Document5 pages
Let,, ., Be A Random Sample From ( ,) - Construct A (1) Confidence Interval For
Rayan H Barwari
No ratings yet
Chapter 7 Notes
Document12 pages
Chapter 7 Notes
Mary Zurlo Blancha
No ratings yet
Statistics and Probability Problems
Document4 pages
Statistics and Probability Problems
José Germán
No ratings yet
Neuralnetworks 1
Document65 pages
Neuralnetworks 1
rdsraj
No ratings yet
Activity Instruction: Do As Directed. Chi-Square Test
Document2 pages
Activity Instruction: Do As Directed. Chi-Square Test
lea bendijo
No ratings yet
Data Mining (Viva)
Document18 pages
Data Mining (Viva)
Anubhav Shrivastava
No ratings yet
Research
Document12 pages
Research
Erms Delos Santos Burgos
No ratings yet
202003241550010566rajeev Pandey Probability Theory
Document74 pages
202003241550010566rajeev Pandey Probability Theory
Rex Vimal Raj
No ratings yet
Project Report ON: "Event Management As A Strategic Marketing Tool - The Launch of A Product"
Document57 pages
Project Report ON: "Event Management As A Strategic Marketing Tool - The Launch of A Product"
Madhurima Mitra
No ratings yet
Teachers and Students' Readiness in Conducting School-Based Research
Document14 pages
Teachers and Students' Readiness in Conducting School-Based Research
Psychology and Education: A Multidisciplinary Journal
No ratings yet
Predicting Bankruptcy Through Financial Statement Analysis
Document21 pages
Predicting Bankruptcy Through Financial Statement Analysis
Rashed Tarique
No ratings yet
CH 07
Document20 pages
CH 07
Abhijeet Tripathi
No ratings yet