Welcome to Scribd!

Linear Regression-1: Prof. Asim Tewari IIT Bombay

Uploaded by

0% found this document useful (0 votes)

26 views27 pages

This document discusses linear regression. It explains that linear regression finds the linear relationship between an input variable x and output variable y. The coefficients are estimated to minimize the residual sum of squares between the actual y values and predicted y values from the linear model. Linear regression assumes a linear relationship and that the random errors have a mean of zero and are independent of x. The estimated coefficients are unbiased estimates of the true coefficients that define the population linear regression model.

Original Description:

Original Title

Lecture 8 Linear Regression 1

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

26 views27 pages

Linear Regression-1: Prof. Asim Tewari IIT Bombay

Uploaded by

Scion Of Virikvas

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 27

Search inside document

Linear Regression-1

Prof. Asim Tewari

IIT Bombay

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Supervised learning
• Other factors:
1. Data heterogeneity: some algorithms require input to be numerical
and scaled to similar range (eg. SVM, NN methods. On the other
hand decision tree etc. Can handle heterogeneous data.
2. Redundancy in data (highly correlated input variables)
3. Presence of interactions and non-linearities

Eg. Of supervised learning :linear regression, logistic regression, SVM,

naive Bayes, linear discriminant analysis, decision tree, k-nearest
neighbor algo, neural network etc.
Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Unsupervised learning
• Test of inferring a function to describe hidden structure.
• Eg. - Clustering (K-mean, mixture models, hierarchies clustering)
- Anomaly detection etc.

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Regression
• Extract a relationship from data

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Regression

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Linear Regression
• It assumes a linear relation between input x and output y

Approximately modeled
β0 and β1 are unknown
coefficients or parameters
which are estimated from
training data.

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Linear Regression

Prediction (estimate) of Y
Estimating the coefficients:
• Training data (x1, y1), (x2, y2)... and (xn, yn)
• n data pair
• we need β0 and β1 ^ such that the linear model fits the data well
• measure of data fits the data well or closeness?
- One possible closeness measure is least square criterion
- represents ith residual
Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Linear Regression
Residual sum of squares (RSS)

Minimize RSS is least square criterion

By minimizing RSS we can find

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Linear Regression

The RSS Value is minimum

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Accuracy and Precision
• Accuracy refers to the closeness of
a measured value to a standard or
known value. Accuracy is a
description of systematic errors, a
measure of statistical bias.
• Precision refers to the closeness of
two or more measurements to
each other. Precision is a
description of random errors, a
measure of statistical variability.

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Accuracy Vs. Precision

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Linear Regression
• True relation between X and Y
Y=f(x) + €
Mean zero
random error Independent of x
If f(x) is linear then
and are analogous to estimation of population mean from sample
mean
I.e.. and are unbiased estimate of true β0 and β1

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Linear Regression

A simulated data set. Left: The red line represents the true relationship, f(X) = 2+3X,
which is known as the population regression line. The blue line is the least squares
line; it is the least squares estimate for f(X) based on the observed data, shown in
black

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Linear Regression

The population regression line is again shown in red, and the least squares line in
dark blue. In light blue, ten least squares lines are shown, each computed on the
basis of a separate random set of observations. Each least squares line is different,
but on average, the least squares lines are quite close to the population regression
line.

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Concepts of Population and Sample
• Mean
• Variance
• Covariance

• Population and Sample

• Population mean and variance
• Sample mean and variance

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Mean and Variance

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Variance and Covariance

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Variance of sum of random variables

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Variance and Covariance

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Variance of mean

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Population and sample

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Sample mean

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining
Sample Variance

Asim Tewari, IIT Bombay ME 781: Statistical Machine Learning and Data Mining

Advanced Mathematical Applications in Data Science
From Everand
Advanced Mathematical Applications in Data Science
Biswadip Basu Mallik
No ratings yet
Random Sample Consensus: Robust Estimation in Computer Vision
From Everand
Random Sample Consensus: Robust Estimation in Computer Vision
Fouad Sabry
No ratings yet
Linear Regression-2: Prof. Asim Tewari IIT Bombay
Document19 pages
Linear Regression-2: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
L 3 Mean Variance
Document14 pages
L 3 Mean Variance
Jathin Sreevas
No ratings yet
L 7 Dissimilarity Measures
Document16 pages
L 7 Dissimilarity Measures
Scion Of Virikvas
No ratings yet
Linear Regression-3: Prof. Asim Tewari IIT Bombay
Document50 pages
Linear Regression-3: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
19 Assessing Model Accuracy
Document16 pages
19 Assessing Model Accuracy
Scion Of Virikvas
No ratings yet
Classification: Prof. Asim Tewari IIT Bombay
Document35 pages
Classification: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
L - 2 - Data Scale
Document20 pages
L - 2 - Data Scale
Jathin Sreevas
No ratings yet
L 4 5 Probability
Document45 pages
L 4 5 Probability
Scion Of Virikvas
No ratings yet
Confusion Matrix: Prof. Asim Tewari IIT Bombay
Document8 pages
Confusion Matrix: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
L 9 Linear Regression 1
Document19 pages
L 9 Linear Regression 1
Scion Of Virikvas
No ratings yet
Data Scales and Representation: Prof. Asim Tewari IIT Bombay
Document27 pages
Data Scales and Representation: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
23 Tree-Based Methods
Document35 pages
23 Tree-Based Methods
Scion Of Virikvas
No ratings yet
L - 2 - High-Dimensional Space
Document20 pages
L - 2 - High-Dimensional Space
Jathin Sreevas
No ratings yet
Resampling Methods: Prof. Asim Tewari IIT Bombay
Document15 pages
Resampling Methods: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
Applied Statistic For Machine Learning: First Session
Document33 pages
Applied Statistic For Machine Learning: First Session
Ehsan Maminjad
No ratings yet
EECS6893 BigDataAnalytics Lecture4
Document58 pages
EECS6893 BigDataAnalytics Lecture4
CHRISTOPHER EVAN HARJONO
No ratings yet
UNIT-III Lecture Notes
Document18 pages
UNIT-III Lecture Notes
nikhilsinha789
No ratings yet
16 Linear Regression - CP, AIC, BIC, and Adjusted R2 - PCA
Document83 pages
16 Linear Regression - CP, AIC, BIC, and Adjusted R2 - PCA
Scion Of Virikvas
No ratings yet
Machine Learning Presentation
Document18 pages
Machine Learning Presentation
Lallu Bhai YT
No ratings yet
Module 06 Sampling
Document42 pages
Module 06 Sampling
sarah shan
No ratings yet
ML PDF
Document17 pages
ML PDF
Rohit Khanna
No ratings yet
Linear Regression
Document20 pages
Linear Regression
e1840006
No ratings yet
02 DataCategorization
Document41 pages
02 DataCategorization
akhilvasishta muthukur
No ratings yet
The Risk of Machine Learning
Document66 pages
The Risk of Machine Learning
adeeyo
No ratings yet
ML Interview Questions
Document21 pages
ML Interview Questions
lefela6421
No ratings yet
Nonuniform Negative Sampling and Log Odds Correction With Rare Events Data
Document32 pages
Nonuniform Negative Sampling and Log Odds Correction With Rare Events Data
Confused Soul
No ratings yet
SOM-based Generating of Association Rules
Document5 pages
SOM-based Generating of Association Rules
Kishor Peddi
No ratings yet
Statistical Process Control: Relating Applied Statistics To Quality Control
Document92 pages
Statistical Process Control: Relating Applied Statistics To Quality Control
Hombing Haryanto
No ratings yet
Welcome To The Change of The Generation: Coders Eduyear
Document9 pages
Welcome To The Change of The Generation: Coders Eduyear
Kirti Talreja
No ratings yet
A Comparitive Study On Different Classification Algorithms Using Airline Dataset
Document4 pages
A Comparitive Study On Different Classification Algorithms Using Airline Dataset
Editor IJRITCC
No ratings yet
Week 2: Machine Learning Intro: Instructor: Ting Sun
Document21 pages
Week 2: Machine Learning Intro: Instructor: Ting Sun
Wenbo Pan
No ratings yet
Lecture 5 - Interval Estimation
Document76 pages
Lecture 5 - Interval Estimation
Sanaiya Jokhi
No ratings yet
Machine Learning: Dr. Windhya Rankothge (PHD - Upf, Barcelona)
Document44 pages
Machine Learning: Dr. Windhya Rankothge (PHD - Upf, Barcelona)
Ayola Jayamaha
No ratings yet
Machine Learning: Jaya Sil
Document22 pages
Machine Learning: Jaya Sil
Sreetam Ganguly
No ratings yet
Math For ML Mastery
Document7 pages
Math For ML Mastery
Varun Gehlot
No ratings yet
Mathematics in The Modern World
Document75 pages
Mathematics in The Modern World
HlgBorilla
No ratings yet
To Statistical Inference: by Dr. Saddam Hussain
Document25 pages
To Statistical Inference: by Dr. Saddam Hussain
kamranfms
No ratings yet
Day 2. Lecture - Machinelearning
Document32 pages
Day 2. Lecture - Machinelearning
cifeblog
No ratings yet
Game Hex
Document1 page
Game Hex
getek25273
No ratings yet
Session 1 - Data - Information
Document42 pages
Session 1 - Data - Information
Sanaiya Jokhi
No ratings yet
Chapter 11 Part 1 - Arima (Box-Jenkin) - 2023
Document20 pages
Chapter 11 Part 1 - Arima (Box-Jenkin) - 2023
chau.nguyenminh2003
No ratings yet
Activity 1
Document13 pages
Activity 1
biradararun333
No ratings yet
Unit No.02 - Feature Extraction and Selection
Document17 pages
Unit No.02 - Feature Extraction and Selection
SMHC23 Akshay Dandade
No ratings yet
Day 2 - Sesi 1 - Pengantar ML
Document28 pages
Day 2 - Sesi 1 - Pengantar ML
Dheeka Hani Soeroso
No ratings yet
Notes 2
Document22 pages
Notes 2
Abhi Reddy
No ratings yet
Class BSC Book Statistics All Chpter Wise Notes
Document128 pages
Class BSC Book Statistics All Chpter Wise Notes
rahil saddique
67% (49)
Business Statistics and Analytics
Document22 pages
Business Statistics and Analytics
Sohail Khan
No ratings yet
Machine Learning and Statistics: What's The Connection?: Chris Williams
Document20 pages
Machine Learning and Statistics: What's The Connection?: Chris Williams
DevendraReddyPoreddy
No ratings yet
Association Rule Mining With R
Document58 pages
Association Rule Mining With R
wirapong chansanam
No ratings yet
Introduction To Statistics
Document27 pages
Introduction To Statistics
Meiva Marthaulina Lestari
75% (4)
Lecture Note 1 - Definitions of Terms
Document3 pages
Lecture Note 1 - Definitions of Terms
laine_2187
No ratings yet
02 DataCategorization
Document41 pages
02 DataCategorization
ARUOS Soura
No ratings yet
Talts 2018 Simulation
Document26 pages
Talts 2018 Simulation
Donlapark Pornnopparath
No ratings yet
Contrast Data Mining: Methods and Applications
Document143 pages
Contrast Data Mining: Methods and Applications
poguy
No ratings yet
Statistic
Document13 pages
Statistic
nandaaungwdn
No ratings yet
Handwritten Signature Verification Using Instance Based Learning
Document4 pages
Handwritten Signature Verification Using Instance Based Learning
surendiran123
No ratings yet
Power Analysis - Statistics Descr
Document1 page
Power Analysis - Statistics Descr
tico_eco
No ratings yet
02 DataCategorization - 2
Document44 pages
02 DataCategorization - 2
iartificial711
No ratings yet
L - 1 - 2 - Emerging Trends in Artificial Intelligence and Data Science
Document106 pages
L - 1 - 2 - Emerging Trends in Artificial Intelligence and Data Science
Scion Of Virikvas
No ratings yet
ME 781 Statistical Machine Learning and Data Mining-Outline
Document2 pages
ME 781 Statistical Machine Learning and Data Mining-Outline
Scion Of Virikvas
No ratings yet
00 ME781 Merged Till SVM
Document604 pages
00 ME781 Merged Till SVM
Scion Of Virikvas
No ratings yet
Data Scales and Representation: Prof. Asim Tewari IIT Bombay
Document27 pages
Data Scales and Representation: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
L 9 Linear Regression 1
Document19 pages
L 9 Linear Regression 1
Scion Of Virikvas
No ratings yet
16 Linear Regression - CP, AIC, BIC, and Adjusted R2 - PCA
Document83 pages
16 Linear Regression - CP, AIC, BIC, and Adjusted R2 - PCA
Scion Of Virikvas
No ratings yet
L 4 5 Probability
Document45 pages
L 4 5 Probability
Scion Of Virikvas
No ratings yet
Set Theory: Prof. Asim Tewari IIT Bombay
Document22 pages
Set Theory: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
24 Support Vector Machine
Document14 pages
24 Support Vector Machine
Scion Of Virikvas
No ratings yet
21 K-Nearest Neighbors Regression
Document8 pages
21 K-Nearest Neighbors Regression
Scion Of Virikvas
No ratings yet
Resampling Methods: Prof. Asim Tewari IIT Bombay
Document15 pages
Resampling Methods: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
Confusion Matrix: Prof. Asim Tewari IIT Bombay
Document8 pages
Confusion Matrix: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
23 Tree-Based Methods
Document35 pages
23 Tree-Based Methods
Scion Of Virikvas
No ratings yet
One-Dimensional Heat Conduction Equation - Long Cylinder
Document9 pages
One-Dimensional Heat Conduction Equation - Long Cylinder
Scion Of Virikvas
No ratings yet
ME 781 - Statistical Machine: Learning and Data Mining
Document2 pages
ME 781 - Statistical Machine: Learning and Data Mining
Scion Of Virikvas
No ratings yet
Classification: Prof. Asim Tewari IIT Bombay
Document35 pages
Classification: Prof. Asim Tewari IIT Bombay
Scion Of Virikvas
No ratings yet
One-Dimensional Heat Conduction Equation - Plane Wall
Document15 pages
One-Dimensional Heat Conduction Equation - Plane Wall
Scion Of Virikvas
No ratings yet
Conservation of Momentum-8 Derivation: Udydzv
Document15 pages
Conservation of Momentum-8 Derivation: Udydzv
Scion Of Virikvas
No ratings yet
CBSE Class11 Maths Notes 13 Limits and Derivatives
Document7 pages
CBSE Class11 Maths Notes 13 Limits and Derivatives
Roy
0% (1)
Payback Profile:: Suncor Uses Bently Nevada To Increase Profitability - Part 2
Document6 pages
Payback Profile:: Suncor Uses Bently Nevada To Increase Profitability - Part 2
Hatem Abdelrahman
No ratings yet
Vibration Problems
Document18 pages
Vibration Problems
Karthick Ram
No ratings yet
Declare Index in Pega
Document46 pages
Declare Index in Pega
Nisha Agarwal 3
No ratings yet
AS #3 Earth and Life
Document12 pages
AS #3 Earth and Life
Johndale Delos Reyes Solar
No ratings yet
PS4 Fonte
Document53 pages
PS4 Fonte
Edson Henrique
No ratings yet
Variante en Dynpro
Document8 pages
Variante en Dynpro
otracuentaaux6
No ratings yet
Experiment No 2
Document11 pages
Experiment No 2
Nicole De Leon Miday
No ratings yet
MiR100 Quick Start hw5.0 Rev.1.8 en
Document27 pages
MiR100 Quick Start hw5.0 Rev.1.8 en
Felipe Marçal
No ratings yet
FRCcalc - Software For Design of Fiber Reinforced Concrete Elements
Document10 pages
FRCcalc - Software For Design of Fiber Reinforced Concrete Elements
Dan Mace
No ratings yet
Thesis Pediatric Head Injury
Document24 pages
Thesis Pediatric Head Injury
Saif Rahman
No ratings yet
Sampling and Reconstruction of Analog Signals Using Various
Document11 pages
Sampling and Reconstruction of Analog Signals Using Various
Chandrahas Godavarthi
No ratings yet
Numerical Modeling of Helical Pile PDF
Document12 pages
Numerical Modeling of Helical Pile PDF
Hizb Ullah
No ratings yet
DESIGN OF BEAM Bending Moment On A Beam Basic Formulae
Document4 pages
DESIGN OF BEAM Bending Moment On A Beam Basic Formulae
George Karasp
No ratings yet
Matlab Fundamental 1
Document5 pages
Matlab Fundamental 1
duc anh
No ratings yet
Python 3 - Functions and OOPs - 22
Document5 pages
Python 3 - Functions and OOPs - 22
Senthil Lakshmi
100% (4)
No Fines Concrete
Document5 pages
No Fines Concrete
danny
No ratings yet
What Are Some Industrial Robot Basics?
Document4 pages
What Are Some Industrial Robot Basics?
maheswaran muthu
No ratings yet
Mathematics Research Paper Sample
Document7 pages
Mathematics Research Paper Sample
xwrcmecnd
100% (1)
Environmental and Health Impact Assessment of Liquid Organic Hydrogen Carrier (LOHC) Systems - Challenges and Preliminary Results 2015
Document11 pages
Environmental and Health Impact Assessment of Liquid Organic Hydrogen Carrier (LOHC) Systems - Challenges and Preliminary Results 2015
Ar Di
No ratings yet
Mo's Algorithm
Document16 pages
Mo's Algorithm
Amar Malik
No ratings yet
Brookfield Viscosimetro PDF
Document59 pages
Brookfield Viscosimetro PDF
Kike Bayona
No ratings yet
csc1201 Lecture13
Document23 pages
csc1201 Lecture13
Richard Coronel
No ratings yet
Samsung RS275-RS277 - Refrigerator Training
Document93 pages
Samsung RS275-RS277 - Refrigerator Training
blackwellbert
92% (13)
Mathematics: Quarter 3 - Week 8 - Module 8 Solving Word Problems Involving Measurement of Surface Area
Document12 pages
Mathematics: Quarter 3 - Week 8 - Module 8 Solving Word Problems Involving Measurement of Surface Area
Jonathan Mercado
0% (1)
Your Results For - Multiple Choice Questions
Document4 pages
Your Results For - Multiple Choice Questions
HUAWEI HUAWEI
No ratings yet
Todas As Práticas Do Logixpro Português
Document79 pages
Todas As Práticas Do Logixpro Português
FelipeRenan
67% (3)
Tips For Proving Trig Identities
Document1 page
Tips For Proving Trig Identities
Salvadora1
No ratings yet
E.5 Engine Room Ventilation System
Document5 pages
E.5 Engine Room Ventilation System
ednsmn
100% (1)
Types Roof Trusses: Building Technology 3 2012
Document34 pages
Types Roof Trusses: Building Technology 3 2012
Arnav Dasaur
No ratings yet