Welcome to Scribd!

Tut 03

Uploaded by

0% found this document useful (0 votes)

1 views34 pages

This document provides an overview of the CSC411: Optimization for Machine Learning course offered at the University of Toronto from September 20-26, 2018. The summary discusses cross-validation techniques for validating machine learning models, including hold-out validation, k-fold cross-validation, and their advantages and disadvantages. K-fold cross-validation partitions the training data into k subsets, uses k-1 for training and the remaining subset for validation, and repeats this process k times. While more computationally expensive, it makes better use of the data than hold-out validation. The document provides tips for applying k-fold cross-validation in practice.

Original Description:

Original Title

tut03

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

1 views34 pages

Tut 03

Uploaded by

JustSaint

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 34

Search inside document

CSC411: Optimization for Machine Learning

University of Toronto

September 20–26, 2018

1
based on slides by Eleni Triantafillou, Ladislav Rampasek, Jake Snell, Kevin
Swersky, Shenlong Wang and other
!

!
!

!
θ∗ = θ (θ) θ
! θ∈R
! :R →R
(θ) − (θ)
! θ
! θ
!
θ

! ( , )
( | , θ)
! − log ( | , θ)
!
∂ (θ ∗ )
∂θ =
! θ
!

! ∂ ∂ ∂
∇θ = ( ∂θ , ∂θ , ..., ∂θ )
η
! θ
! = :
! δ ← −η∇θ −
! θ ←θ− +δ
η
! θ
! = :
! η (θ − η ∇θ − ) < (θ )
! δ ← −η ∇θ −
! θ ←θ− +δ
α∈[ , )

! θ
! δ
! = :
! δ ← −η∇θ − +αδ −
! θ ←θ− +δ

α
η
! θ
!

! δ ← −η∇θ −
! θ ←θ− +δ
!
!
| (θ + ) − (θ )| < ϵ
! ∥∇θ ∥ < ϵ
!
!

∇
!

∂ ((θ , . . . , θ + ϵ, . . . , θ )) − ((θ , . . . , θ − ϵ, . . . , θ ))
≈
∂θ ϵ

!
!

!
θ θ
∈[ , ]

( θ + ( − )θ ) ≤ (θ ) + ( − ) (θ )

! α α≥
! +
!
!
!
! ( ) ( ) , θ) ( ) ) log ( ) , θ)
(θ) = − log ( = | +( − ( = |
− log σ(θ)
!

!
Cross-Validation
Cross-Validation: Why Validate?
So far:
Learning as Optimization
Goal: Optimize model complexity (for the task)
while minimizing under/overfitting

We want our model to generalize well without

overfitting.
We can ensure this by validating the model.
Types of Validation
Hold-Out Validation: Split data into training and
validation sets.
• Usually 30% as hold-out set.
Original Training Set

Validation

Problems:
• Waste of dataset
• Estimation of error rate might be misleading
Types of Validation
• Cross-Validation: Random subsampling

Figure from
Bishop, C.M.
(2006).
Pattern
Recognition
and Machine
Learning.
Springer

Problem:
• More computationally expensive than hold-
out validation.
Variants of Cross-Validation
Leave-p-out: Use p examples as the validation set, and
the rest as training; repeat for all configurations of
examples.

Problem:
𝑁
• Exhaustive. We have to train and test 𝑝
times,
where N is the # of training examples.
Variants of Cross-Validation
K-fold: Partition training data into K equally
sized subsamples. For each fold, use the other K-
1 subsamples as training data with the last
subsample as validation.
K-fold Cross-Validation
• Think of it like leave-p-out but without
combinatoric amounts of training/testing.

Advantages:
• All observations are used for both training and
validation. Each observation is used for
validation exactly once.
• Non-exhaustive: More tractable than leave-p-
out
K-fold Cross-Validation
Problems:
• Expensive for large N, K (since we train/test K
models on N examples).
– But there are some efficient hacks to save time…
• Can still overfit if we validate too many models!
– Solution: Hold out an additional test set before doing
any model selection, and check that the best model
performs well on this additional set (nested cross-
validation). => Cross-Validception
Practical Tips for Using K-fold Cross-Val
Q: How many folds do we need?
A: With larger K, …
• Error estimation tends to be more accurate
• But, computation time will be greater

In practice:
• Usually use K ≈ 10
• BUT, larger dataset => choose smaller K

AP Computer Science A Exam Review
Document110 pages
AP Computer Science A Exam Review
Pamela Smith
100% (1)
Painless Pre-Algebra
From Everand
Painless Pre-Algebra
Amy Stahl
Rating: 3 out of 5 stars
3/5 (2)
Z Test Sample Problems
Document15 pages
Z Test Sample Problems
Arjhay Gironella
No ratings yet
Master Fundamental Concepts of Math Olympiad: Maths, #1
From Everand
Master Fundamental Concepts of Math Olympiad: Maths, #1
Subbalakshmi Devaki
No ratings yet
Business Statistics Etf1100 Notes Business Statistics Etf1100 Notes
Document56 pages
Business Statistics Etf1100 Notes Business Statistics Etf1100 Notes
Ishan Malakar
No ratings yet
MCS-011: Problem Solving and Programming
From Everand
MCS-011: Problem Solving and Programming
Dr. DK Sukhani
No ratings yet
Amazing Java: Learn Java Quickly
From Everand
Amazing Java: Learn Java Quickly
Andrei Besedin
No ratings yet
Research Methodology ch.4
Document19 pages
Research Methodology ch.4
wanderer6499
No ratings yet
Introduction To Support Vector Machines: BTR Workshop Fall 2006
Document88 pages
Introduction To Support Vector Machines: BTR Workshop Fall 2006
Helkia Pasaribu
No ratings yet
CS 2750 Machine Learning
Document14 pages
CS 2750 Machine Learning
ravigobi
No ratings yet
Introduction To Support Vector Machines: BTR Workshop Fall 2006
Document88 pages
Introduction To Support Vector Machines: BTR Workshop Fall 2006
Anonymous PKVCsG
No ratings yet
MachineLearning PDF
Document94 pages
MachineLearning PDF
Kamal Boulefra
No ratings yet
Lecture 5
Document31 pages
Lecture 5
ChatGeePeeTee
No ratings yet
L4 - Logistic Regression - B
Document45 pages
L4 - Logistic Regression - B
Bùi Tấn Phát
No ratings yet
Statistics Chapter3
Document60 pages
Statistics Chapter3
Zhiye Tang
100% (1)
Lab 4: Logistic Regression: PSTAT 131/231, Winter 2019
Document10 pages
Lab 4: Logistic Regression: PSTAT 131/231, Winter 2019
vidish laheri
No ratings yet
Essentials of Machine Learning - Lesson 02
Document15 pages
Essentials of Machine Learning - Lesson 02
e1840006
No ratings yet
Russell & Norvig Ch. 5: - Constraint Satisfaction Offers A Powerful Problem-Solving Paradigm
Document20 pages
Russell & Norvig Ch. 5: - Constraint Satisfaction Offers A Powerful Problem-Solving Paradigm
irinarm
No ratings yet
04 Optim ML 2
Document66 pages
04 Optim ML 2
Sourabh Agrawal
No ratings yet
Progression Linaire
Document187 pages
Progression Linaire
Abdelkrim Betouche
No ratings yet
CSO504 Machine Learning: Evaluation and Error Analysis Regularization Koustav Rudra 24/08/2022
Document36 pages
CSO504 Machine Learning: Evaluation and Error Analysis Regularization Koustav Rudra 24/08/2022
Being IITian
No ratings yet
Formula of Vitamin D IU With This Information Is Vuex
Document16 pages
Formula of Vitamin D IU With This Information Is Vuex
Vijayalakshmi Rai
No ratings yet
CSC411: Optimization For Machine Learning: September 20-26, 2018
Document23 pages
CSC411: Optimization For Machine Learning: September 20-26, 2018
john bianco
No ratings yet
Simulation: Hadley Wickham
Document23 pages
Simulation: Hadley Wickham
Mubanga
No ratings yet
Ensemble Methods
Document15 pages
Ensemble Methods
isaias.prestes
No ratings yet
Programming Paradigms CSI2120 - Winter 2019: Jochen Lang EECS, University of Ottawa Canada
Document26 pages
Programming Paradigms CSI2120 - Winter 2019: Jochen Lang EECS, University of Ottawa Canada
aziz spam
No ratings yet
Formal Verification of Programs With Arrays: Vu An Hoa Assoc. Prof. Chin Wei Ngan
Document25 pages
Formal Verification of Programs With Arrays: Vu An Hoa Assoc. Prof. Chin Wei Ngan
anhoa1
No ratings yet
ML4 Linear Models
Document34 pages
ML4 Linear Models
Gonzalo Contreras
No ratings yet
Bark08 Ghahramani Samlbb 01
Document26 pages
Bark08 Ghahramani Samlbb 01
Shifath Nafis
No ratings yet
Model Evaluation
Document80 pages
Model Evaluation
Deva Hema D
No ratings yet
Postech Maxent
Document74 pages
Postech Maxent
Kry Rivadeneira
No ratings yet
Matlab Review: Daegun Won
Document21 pages
Matlab Review: Daegun Won
أيمن الكزة
No ratings yet
07 SVMs
Document68 pages
07 SVMs
nguyen van truong
No ratings yet
Bias-Variance Trade-Off
Document28 pages
Bias-Variance Trade-Off
Roudra Chakraborty
No ratings yet
K - Nearest Neighbours Classifier / Regressor
Document35 pages
K - Nearest Neighbours Classifier / Regressor
Smit
No ratings yet
Classification 2
Document18 pages
Classification 2
pppchan23100
No ratings yet
1 ModuleEcontent - Session5
Document24 pages
1 ModuleEcontent - Session5
devesh verma
No ratings yet
Lecture8 - Learning Theory
Document19 pages
Lecture8 - Learning Theory
Packet Mancer
No ratings yet
18 DL Regularization
Document41 pages
18 DL Regularization
spanishbear75
No ratings yet
Stats101A - Chapter 3
Document54 pages
Stats101A - Chapter 3
Zhen Wang
No ratings yet
L23 FeatureDetection
Document29 pages
L23 FeatureDetection
tirumareddybhavya
No ratings yet
019 Exercise02-Probability-ANSWERS
Document3 pages
019 Exercise02-Probability-ANSWERS
Namit
100% (1)
Chapter 8: Learning: By, Safa Hamdare
Document46 pages
Chapter 8: Learning: By, Safa Hamdare
Divya Shetty
No ratings yet
CSO504 Machine Learning: Evaluation and Error Analysis Validation and Regularization Koustav Rudra 22/08/2022
Document28 pages
CSO504 Machine Learning: Evaluation and Error Analysis Validation and Regularization Koustav Rudra 22/08/2022
Being IITian
No ratings yet
Summary
Document7 pages
Summary
Yvann Sinson
No ratings yet
CSE546: Naïve Bayes: Winter 2012
Document35 pages
CSE546: Naïve Bayes: Winter 2012
ChrisRoby
No ratings yet
Ap Exam Supplement: Specifically Developed For This Year's AP Exam
Document7 pages
Ap Exam Supplement: Specifically Developed For This Year's AP Exam
Gan Penton
No ratings yet
Week 1 PDF
Document41 pages
Week 1 PDF
Tanapat Lapanun
No ratings yet
Vectorized Logistic Regression
Document33 pages
Vectorized Logistic Regression
Alberto Simões
No ratings yet
Lesson 4 Linear Assumptions
Document27 pages
Lesson 4 Linear Assumptions
maartenwilders
No ratings yet
Modelo VECM para Series Financieras-1
Document30 pages
Modelo VECM para Series Financieras-1
Cuenta descargas
No ratings yet
Session 1 Tuning Curve
Document14 pages
Session 1 Tuning Curve
marimarxan
No ratings yet
Aam Lecture
Document29 pages
Aam Lecture
Ahly Zamalek Masry
No ratings yet
Hybrid Machine Learning Algorithms: Umar Syed Princeton University
Document64 pages
Hybrid Machine Learning Algorithms: Umar Syed Princeton University
BaNếp
No ratings yet
Machine Learning and Statistical Natural Language Processing
Document27 pages
Machine Learning and Statistical Natural Language Processing
pajadhav
No ratings yet
Algoritma Perancangan Saintifik-3 GFH
Document9 pages
Algoritma Perancangan Saintifik-3 GFH
Mustikautsar Dian
No ratings yet
Computational Data Analysis: Machine Learning
Document26 pages
Computational Data Analysis: Machine Learning
Vikash Movva
No ratings yet
Tutorial 1
Document24 pages
Tutorial 1
karly yu
No ratings yet
EEL 6935 Data Analytics: Probability Theory
Document11 pages
EEL 6935 Data Analytics: Probability Theory
AlMuthanna Nassar
No ratings yet
Computational Tractability Asymptotic Order of Growth Implementing Gale-Shapley Survey of Common Running
Document80 pages
Computational Tractability Asymptotic Order of Growth Implementing Gale-Shapley Survey of Common Running
Qacim Kiyani
No ratings yet
F12 - 2023 - Statistical Module
Document30 pages
F12 - 2023 - Statistical Module
Abdirahman Nur
No ratings yet
Perceptron Bound Proof
Document27 pages
Perceptron Bound Proof
Ephrem
No ratings yet
Linear Regression: Jia-Bin Huang Virginia Tech
Document59 pages
Linear Regression: Jia-Bin Huang Virginia Tech
Mr. Raghunath Reddy
No ratings yet
Lec 03
Document42 pages
Lec 03
JustSaint
No ratings yet
Thesis Arend-Jan Tissing
Document40 pages
Thesis Arend-Jan Tissing
JustSaint
No ratings yet
Designdoc Lab4 KHAN M
Document51 pages
Designdoc Lab4 KHAN M
JustSaint
No ratings yet
Usermanual Lab4 KHAN M
Document5 pages
Usermanual Lab4 KHAN M
JustSaint
No ratings yet
Exam 1 Spring 2023 Donald
Document8 pages
Exam 1 Spring 2023 Donald
Geoffrey Wu
No ratings yet
Uncertainty: CSE-345: Artificial Intelligence
Document30 pages
Uncertainty: CSE-345: Artificial Intelligence
Fariha Oisy
No ratings yet
Statis Prak
Document6 pages
Statis Prak
Zaharaa
No ratings yet
Question Bank
Document1 page
Question Bank
Sayantan Pal
No ratings yet
Solutions To Selected Exercises: Categorical Data Analysis, 3Rd Edition
Document30 pages
Solutions To Selected Exercises: Categorical Data Analysis, 3Rd Edition
Lise
No ratings yet
Discrete Random Variables MS 1.: IB Questionbank Maths SL 1
Document8 pages
Discrete Random Variables MS 1.: IB Questionbank Maths SL 1
Kumar Verma
No ratings yet
Managerial Decisions Under Uncertainty
Document29 pages
Managerial Decisions Under Uncertainty
ki
No ratings yet
ArticleText 93587 2 10 202104111
Document25 pages
ArticleText 93587 2 10 202104111
Sam Lugo
No ratings yet
Exer Design Based Estimation
Document9 pages
Exer Design Based Estimation
Jhoanne Ynion
No ratings yet
ETM 421Hw3
Document3 pages
ETM 421Hw3
Waqas Sarwar
No ratings yet
Risks: Predicting Motor Insurance Claims Using Telematics Data-Xgboost Versus Logistic Regression
Document16 pages
Risks: Predicting Motor Insurance Claims Using Telematics Data-Xgboost Versus Logistic Regression
vijayamba
No ratings yet
Adventure in Statistics 1st Edition Field Test Bank
Document3 pages
Adventure in Statistics 1st Edition Field Test Bank
jeffreybergmdogrzcxqpya
100% (13)
Conditional and Singular Normal Distribution
Document5 pages
Conditional and Singular Normal Distribution
Om
No ratings yet
Probability and Statistics
Document27 pages
Probability and Statistics
Michael Rodriguez
No ratings yet
Vector Error Correction Model
Document13 pages
Vector Error Correction Model
redha
No ratings yet
Mathematics T, Term 3, 2015
Document3 pages
Mathematics T, Term 3, 2015
Loo Siaw Choon
No ratings yet
Estimation of Multinomial Logit Models in R: The Mlogit Packages
Document73 pages
Estimation of Multinomial Logit Models in R: The Mlogit Packages
Carlos Eduardo Melo Martínez
No ratings yet
Geor Intro
Document24 pages
Geor Intro
Sílvio De Castro Silveira
No ratings yet
Probability - Binomial Distribution
Document20 pages
Probability - Binomial Distribution
Khishignyam Chuluunbaatar
No ratings yet
Stats Finals
Document7 pages
Stats Finals
Catalina Perry
100% (1)
Psychological Assessment - Reliability & Validity
Document56 pages
Psychological Assessment - Reliability & Validity
Aly
No ratings yet
AP Statistics Chapter 11: Inference For Distributions of Categorical Data 11.1 - Chi-Square ( ) Goodness of Fit Test
Document2 pages
AP Statistics Chapter 11: Inference For Distributions of Categorical Data 11.1 - Chi-Square ( ) Goodness of Fit Test
Rhivia Lorat
No ratings yet
Statistic Hypothesis Testing
Document17 pages
Statistic Hypothesis Testing
Francis
No ratings yet
Elementary Statistics in Social Research Essentials 3rd Edition Levin Solutions Manual
Document26 pages
Elementary Statistics in Social Research Essentials 3rd Edition Levin Solutions Manual
ChristopherArnoldoqek
100% (57)
Random Variables CH2 Muqaibel
Document62 pages
Random Variables CH2 Muqaibel
bamlakadere
No ratings yet
Mb0050 SLM Unit12
Document22 pages
Mb0050 SLM Unit12
Margabandhu Narasimhan
No ratings yet
Chapter7 Printable PDF
Document25 pages
Chapter7 Printable PDF
QQ
No ratings yet