Lecture Testmodels

Uploaded by

sowmyasanthavel

0% found this document useful (0 votes)

4 views31 pages

Original Title

Lecture-testModels

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

4 views31 pages

Lecture Testmodels

Uploaded by

sowmyasanthavel

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 31

Search inside document

Evaluating Machine

Learning Methods

This file is adapted with materials from: http://pages.cs.wisc.edu/~dpage/cs760/ by David Page

Test Sets

• How can we get an unbiased estimate of the accuracy of a learned model?

• When learning a model, you should pretend that you don’t have the
test data yet. (In some applications, it is reasonable to assume that
you have access to the feature vector x but not the y part of each test
instance).
• If the test set labels influence the learned model in any way, accuracy
estimates will be biased.
Learning Curves

• How does the accuracy of a learning method change as a function of

the training-set size?
Validation (Tuning) sets
• Suppose we want unbiased estimates of accuracy the learning process.
Partition training data into separate training/validation sets.
Limitations of using a single training/test partition
Random Resampling
• We can address the second issue by repeatedly randomly partitioning the
available data into training and test sets.
Stratified Sampling
• When randomly selecting training or validation sets, we may want to
ensure that class proportions are maintained in each selected set.
Cross Validation
Cross Validation Example
• Suppose we have 100 instances, and we want to estimate accuracy with
cross validation.
Cross Validation
Internal Cross Validation
• Instead of a single validation set, we can use cross-validation within a
training set to select a model.
Example: Using Internal Cross Validation to Select k in k-NN
Confusion Matrices
• How can we understand what types of mistakes a learned model makes?

Figure from vision.jhu.edu

Confusion Matrix for 2-class Problems
Is Accuracy an adequate measure of predictive performance?
Other Accuracy Metrics
ROC Curves
• A Receiver Operating Characteristic (ROC) curve plots the TP-rate vs. the
FP-rate as a threshold on the confidence of an instance being positive is
varied.
ROC Curve Example
ROC Curves and Misclassification Costs
Algorithm for Creating an ROC Curve
Plotting an ROC Curve
• Does a low false-positive rate indicate that most positive predictions (i.e.
predictions with confidence > some threshold) are correct?
Other Accuracy Metrics
Precision/Recall Curves
• A precision/recall curve plots the precision vs. recall (TP-rate) as a
threshold on the confidence of an instance being positive is varied.
How Do We Get one ROC/PR Curve When We Do Cross Validation?
Comments on ROC and PR Curves
To Avoid Cross-Validation Pitfalls, Ask:
• Is my held-aside test data really representative of going out to collect new data?
• Did I repeat my entire data processing procedure on every fold of
cross-validation, using only the training data for that fold?
• On each fold of cross-validation, did I ever access in any way the label of a test
case?
• Any preprocessing done over entire data set (feature selection, parameter
tuning, threshold selection) must not use labels

• Have I modified my algorithm so many times, or tried so many

approaches, on this same date set that I (the human) am overfitting
it?
• Have I continually modified my preprocessing or learning algorithm until I got
some improvement on this data set?
• If so, I really need to get some additional data now to at least test on.

Machine Learning Interview Questions.
Document43 pages
Machine Learning Interview Questions.
hari krishna reddy
100% (1)
ML MU Unit 2
Document84 pages
ML MU Unit 2
Paulos K
100% (3)
ML MU Unit 2
Document42 pages
ML MU Unit 2
Paulos K
100% (2)
K Fold and Other Cross-Validation Techniques
Document10 pages
K Fold and Other Cross-Validation Techniques
HaidarAli
No ratings yet
Cross Validation LN 12
Document11 pages
Cross Validation LN 12
M S Prasad
No ratings yet
Kami Export - 13. Model Evaluation
Document25 pages
Kami Export - 13. Model Evaluation
YENI SRI MAHARANI -
100% (1)
Cross-Validation in Machine Learning
Document18 pages
Cross-Validation in Machine Learning
Priya dharshini.G
No ratings yet
MIS410 Lecture9-10
Document40 pages
MIS410 Lecture9-10
Ahanaf Rasheed
No ratings yet
Unit 2
Document28 pages
Unit 2
LOGESH WARAN P
No ratings yet
Learning Best Practices For Model Evaluation and Hyperparameter Tuning
Document17 pages
Learning Best Practices For Model Evaluation and Hyperparameter Tuning
sanjeev dev
No ratings yet
Machine Learning: Lecture 13: Model Validation Techniques, Overfitting, Underfitting
Document26 pages
Machine Learning: Lecture 13: Model Validation Techniques, Overfitting, Underfitting
Md Fazle Rabby
100% (2)
CSC4307 - Slides - Part5 - Model Selection Techniques - CrossValidation
Document20 pages
CSC4307 - Slides - Part5 - Model Selection Techniques - CrossValidation
Idris Abdurrasheed
No ratings yet
Cross Validation LN 12
Document11 pages
Cross Validation LN 12
M S Prasad
No ratings yet
Cross Validation: Chandan B K Mrs. S Asst Professor, Department of Computer Science Engineering
Document21 pages
Cross Validation: Chandan B K Mrs. S Asst Professor, Department of Computer Science Engineering
Chandan BK
No ratings yet
CSL0777 L08
Document29 pages
CSL0777 L08
Konkobo Ulrich Arthur
No ratings yet
P-2.1.2 Cross Validation and Regularization
Document37 pages
P-2.1.2 Cross Validation and Regularization
Puneet Parihar
No ratings yet
Accuracy Measures
Document61 pages
Accuracy Measures
Sanoop Mallissery
No ratings yet
Data Mining: Practical Machine Learning Tools and Techniques
Document73 pages
Data Mining: Practical Machine Learning Tools and Techniques
Arvind
No ratings yet
Week 10 - PROG 8510 Week 10
Document16 pages
Week 10 - PROG 8510 Week 10
Vineel Kumar
No ratings yet
Cross Validation Explained
Document8 pages
Cross Validation Explained
nathanlgrossman
No ratings yet
Module 5 Advanced Classification Techniques
Document40 pages
Module 5 Advanced Classification Techniques
Saurabh Jagtap
No ratings yet
Unit6 Part3 General Procedure
Document19 pages
Unit6 Part3 General Procedure
tamanna sharma
No ratings yet
Training Evaluation
Document42 pages
Training Evaluation
Raksa Kun
No ratings yet
ML 1 2 3
Document54 pages
ML 1 2 3
Shoba Natesh
No ratings yet
Data Splitting and Bias Variance Tradeoff
Document14 pages
Data Splitting and Bias Variance Tradeoff
Eileen Lovegood
No ratings yet
Why Do We Use Cross Validation Set in Our Models?
Document2 pages
Why Do We Use Cross Validation Set in Our Models?
vinay kumar
No ratings yet
ML - Chapter 6 - Model Evaluation
Document65 pages
ML - Chapter 6 - Model Evaluation
Yohannes Dereje
No ratings yet
MIS410 Lecture8toLecture10
Document13 pages
MIS410 Lecture8toLecture10
Ahanaf Rasheed
No ratings yet
Modelling and Evaluation
Document70 pages
Modelling and Evaluation
ANIMESH KUMAR
No ratings yet
Machine Learning-Lecture 02
Document28 pages
Machine Learning-Lecture 02
Amna Arooj
No ratings yet
Week11-Lecture 11ML Algorithms Metrics - Updated
Document29 pages
Week11-Lecture 11ML Algorithms Metrics - Updated
fgfdgfdgfd
No ratings yet
Data Science Q&A - Latest Ed (2020) - 5 - 1
Document2 pages
Data Science Q&A - Latest Ed (2020) - 5 - 1
M K
No ratings yet
ML 5
Document14 pages
ML 5
dibloa
No ratings yet
7 ML
Document38 pages
7 ML
nandukannanmelath
No ratings yet
College Physics: Machine Learning
Document49 pages
College Physics: Machine Learning
Simarpreet
No ratings yet
Mi Unit 5 2m
Document3 pages
Mi Unit 5 2m
B Sakthivel
No ratings yet
Types of Machine Learning Algorithms
Document14 pages
Types of Machine Learning Algorithms
Vipin Rajput
No ratings yet
Final Project Report
Document17 pages
Final Project Report
Jamila Hamdi
No ratings yet
Cross Validation Thesis
Document5 pages
Cross Validation Thesis
afcnftqep
100% (3)
Model Selection: Dr.K.Murugan Assistant Professor Senior VIT, Vellore
Document35 pages
Model Selection: Dr.K.Murugan Assistant Professor Senior VIT, Vellore
Chidvi Reddy
No ratings yet
Unit III 1
Document21 pages
Unit III 1
mananrawat537
No ratings yet
All Notes
Document6 pages
All Notes
tiajung humtsoe
No ratings yet
Data Mining Models and Evaluation Techniques
Document59 pages
Data Mining Models and Evaluation Techniques
spsberry8
No ratings yet
Cross Validation
Document5 pages
Cross Validation
gigimi5380
No ratings yet
Lecture 16
Document36 pages
Lecture 16
Abood Fazil
No ratings yet
Data Mining - Credibility: Evaluating What's Been Learned
Document36 pages
Data Mining - Credibility: Evaluating What's Been Learned
sebastian quintero
No ratings yet
Data Mining Assignment Help
Document5 pages
Data Mining Assignment Help
Statistics Homework Solver
No ratings yet
Unit 3 (ML)
Document26 pages
Unit 3 (ML)
BHAVIN THUMAR
No ratings yet
Cross Validation
Document18 pages
Cross Validation
Vijay Mani
No ratings yet
CSO504 Machine Learning: Evaluation and Error Analysis Validation and Regularization Koustav Rudra 22/08/2022
Document28 pages
CSO504 Machine Learning: Evaluation and Error Analysis Validation and Regularization Koustav Rudra 22/08/2022
Being IITian
No ratings yet
AI Capstone Project - Notes-Part2
Document8 pages
AI Capstone Project - Notes-Part2
minha.fathima737373
No ratings yet
CE802 Pilot
Document2 pages
CE802 Pilot
prenithjohnsamuel
No ratings yet
Practical - Regression
Document114 pages
Practical - Regression
whitenegrogotchicks.619
No ratings yet
ML3 - Evaluation
Document65 pages
ML3 - Evaluation
param_email
100% (1)
Data Mining: How To Estimate A Classifier Performance (E.g. Accuracy) ?
Document15 pages
Data Mining: How To Estimate A Classifier Performance (E.g. Accuracy) ?
vijayganesh pinisetti
No ratings yet
Chapter IV - Model Evaluation
Document26 pages
Chapter IV - Model Evaluation
Halbeega Waayaha
No ratings yet
MC4301 - ML Unit 2 (Model Evaluation and Feature Engineering)
Document40 pages
MC4301 - ML Unit 2 (Model Evaluation and Feature Engineering)
prathab031
No ratings yet
Unit7 SGC
Document11 pages
Unit7 SGC
Swastik Biswas
No ratings yet
Cross-Validation and Model Selection
Document46 pages
Cross-Validation and Model Selection
neelam sanjeev kumar
No ratings yet
Data Science for Beginners: Tips and Tricks for Effective Machine Learning/ Part 4
From Everand
Data Science for Beginners: Tips and Tricks for Effective Machine Learning/ Part 4
Tom Lesley
No ratings yet
Middle
Document7 pages
Middle
Syafiqah Pika
No ratings yet
WoE Methopd For Landslide Susceptibility MAp in Tandikek and Damarbancah - IJSR
Document8 pages
WoE Methopd For Landslide Susceptibility MAp in Tandikek and Damarbancah - IJSR
Dian Ayu
No ratings yet
GAN How To Detect Deepfake
Document6 pages
GAN How To Detect Deepfake
Brigada Osint
No ratings yet
AIML Internship Report
Document53 pages
AIML Internship Report
Bhavay
No ratings yet
Sfar Score
Document8 pages
Sfar Score
prabu
No ratings yet
Lab#7 Lab#8
Document2 pages
Lab#7 Lab#8
F219135 Ahmad Shayan
No ratings yet
Q1-What's The Trade-Off Between Bias and Variance?
Document5 pages
Q1-What's The Trade-Off Between Bias and Variance?
morry123
100% (1)
A New Improved Graphical and Quantitative Method For
Document9 pages
A New Improved Graphical and Quantitative Method For
y zhang
No ratings yet
Acute Appendicitis Diagnosis Using Artificial Neural Networks
Document7 pages
Acute Appendicitis Diagnosis Using Artificial Neural Networks
Neider Salazar Caro
No ratings yet
A Statistical Approach For Sea Cliff Hazard and Setback Lines
Document58 pages
A Statistical Approach For Sea Cliff Hazard and Setback Lines
Melvin Leisner
No ratings yet
Comp Sci - IJCSE - Conditional Naive-Bayes - Pushpalatha - Aish
Document10 pages
Comp Sci - IJCSE - Conditional Naive-Bayes - Pushpalatha - Aish
iaset123
No ratings yet
Interpretable Machine Learning
Document80 pages
Interpretable Machine Learning
Tomasz Mikołajczyk
No ratings yet
Hassan2022 Novel Machine Learning Approach For The Prediction of Hernia Recurrence, Surgical Complication, and 30-Day Readmission After Abdominal Wall Reconstruction
Document10 pages
Hassan2022 Novel Machine Learning Approach For The Prediction of Hernia Recurrence, Surgical Complication, and 30-Day Readmission After Abdominal Wall Reconstruction
Eham Arora
No ratings yet
ML3 - Evaluation
Document65 pages
ML3 - Evaluation
param_email
100% (1)
RIP Correlation. Introducing The Predictive Power Score: Sign Up and Get An Extra One For Free
Document11 pages
RIP Correlation. Introducing The Predictive Power Score: Sign Up and Get An Extra One For Free
Vikash Rryder
No ratings yet
SORF Manual V1
Document14 pages
SORF Manual V1
İpek OMUR
No ratings yet
PROD-screen - A Screen For Prodromal Symptoms of Psychosis
Document13 pages
PROD-screen - A Screen For Prodromal Symptoms of Psychosis
jaykumarranjan
No ratings yet
A Comparative Study of Biometric Technologies With
Document6 pages
A Comparative Study of Biometric Technologies With
murtazabannu
No ratings yet
Detecting Depression and Mental Illness On Social Media
Document7 pages
Detecting Depression and Mental Illness On Social Media
Airlangga Assessment Center Channel
No ratings yet
Arribas 2016
Document19 pages
Arribas 2016
Gabriella Nurahmani Putri
No ratings yet
Student Graduation Using DataMining
Document207 pages
Student Graduation Using DataMining
Daniel
No ratings yet
Spatial Prediction of Landslide Susceptibility Using Hybrid - 2020 - Science of
Document14 pages
Spatial Prediction of Landslide Susceptibility Using Hybrid - 2020 - Science of
jikku joy
No ratings yet
Review 2
Document13 pages
Review 2
Nithyasri A
No ratings yet
Practice Question de Laurentis, Chapter 5 Validating Rating Models
Document6 pages
Practice Question de Laurentis, Chapter 5 Validating Rating Models
Black Mamba
No ratings yet
Mass Volume Curve
Document29 pages
Mass Volume Curve
DeepakGujraniya
No ratings yet
Benchmarking State-Of-The-Art Classification Algorithms For Credit Scoring: A Ten-Year Update
Document30 pages
Benchmarking State-Of-The-Art Classification Algorithms For Credit Scoring: A Ten-Year Update
maha
No ratings yet
Important Notice - This Is The December 13, 2021 Project Statement. If Today Is Not December 13, 2021, See Your Test Center Administrator Immediately
Document17 pages
Important Notice - This Is The December 13, 2021 Project Statement. If Today Is Not December 13, 2021, See Your Test Center Administrator Immediately
iii Sai
No ratings yet
Extensive Deep Learning Model To Enhance Electrocardio - 2023 - Computer Methods
Document15 pages
Extensive Deep Learning Model To Enhance Electrocardio - 2023 - Computer Methods
doy
No ratings yet
Palm Vein Technology PDF
Document57 pages
Palm Vein Technology PDF
Bhudev Sharma
83% (12)
A Survey of Machine Learning Models For Financial Time Series Forecasting
Document18 pages
A Survey of Machine Learning Models For Financial Time Series Forecasting
marcmyomyint1663
No ratings yet