Professional Documents
Culture Documents
Regresión Lineal - Método de Los Minimos Cuadrados
Regresión Lineal - Método de Los Minimos Cuadrados
En el primer caso se dice que existe una dependencia funcional o exacta entre
las variables x e y, es decir existe una función matemática tal que y = f(x). En el
segundo caso se dice que existe una dependencia estadística o
aproximadamente entre las dos variables, y≅f(x). Y en el último caso diríamos
que las variables son independientes.
1 L.R.H
Laboratorio de física 1
Las técnicas de regresión tienen por objeto modelizar, es decir, encontrar una
función que aproxime lo máximo posible la relación de dependencia estadística
entre variables y predecir los valores de una de ellas: y (variable dependiente)
a partir de los de la otra (o las otras): x(variables(s) independiente(s)). La
regresión es lineal cuando el modelo función de regresión seleccionado es una
recta. En cualquier otro caso se dice regresión no lineal.
El procedimiento será:
1. Elegir un tipo de función o curva que creamos que mejor relaciona las dos
variables; esto lo podemos hacer observando la nube de puntos.
2. Obtener la ecuación de la curva, de entre las infinitas de dicho tipo que hay
en el plano, que mejor se adapte al conjunto de puntos. El objetivo de
obtener esa ecuación será predecir el valor de la variable y dado un valor x0
de la variable x.
3. Obtener una medida del grado de esta asociación o correlación. Esto me
dará la fiabilidad de las predicciones que haga con esta ecuación.
2 L.R.H
Laboratorio de física 1
Como se puede observar, para cada xi tenemos una diferencia entre los dos
valores de Y, que llamaremos residuo: εi = yi - yi*.
( ) = ∑ ( y − f (x
n n n
Ψ = ∑ ε = ∑ yi − y
i
2 * 2
i i i a1 ,...,a r ) )
i= 1 i=1 i= 1
∂Ψ ∂Ψ ∂Ψ
= 0, = 0,.......... =0
∂ a1 ∂ a2 ∂ ar
3 L.R.H
Laboratorio de física 1
n n
Ψ = ∑ ( y i − ( b + mxi ) ) = ∑ ( y i − b − mxi )
2 2
i= 1 i= 1
∂Ψ
= − 2∑ ( y i − b − mxi ) = 0
∂b i
∂Ψ
= − 2∑ ( y i − b − mxi ) xi = 0
∂m i
que nos dará un sistema de dos ecuaciones normales y dos incógnitas (b,m).
Resolviendo el sistema:
(1) ∑i
y i = ∑ b + m∑ xi
i i
2
(2) ∑ i
xi y i = b ∑ x i + m∑
i i
xi
∑ y i − m∑ xi
de (1) ⇒ − Nb = − ∑ i
y i + m∑ xi → b =
i
i
N
i
∑ xi y i − m∑ xi2 N ∑ xi y i − ∑ y i ∑ xi
de (2) ⇒ b= i i
⇒ m= i i i
∑ i
xi
N∑
x − ∑ xi
2
2
i
i i
b=
∑ x∑ xy − ∑ y∑ x2
(∑ x) − N ∑ x 2 2
4 L.R.H
Laboratorio de física 1
∑ ∑ 2
( y i − mxi − b) 2 xi
Nσ
∆m= σ = i
∆b= ∆m i
2 N− 2 N
N ∑ xi2 − ∑ xi
i i
establece una medida del grado de asociación lineal entre la variable respuesta
y la recta de regresión estimada.
Lo primero es tener presente cuales son las ecuaciones para el ajuste, para
esto las escribimos en nuestra hoja de cálculo.
5 L.R.H
Laboratorio de física 1
y = mx + b ∑ x ∑ y − N ∑ xy 2
m= ∑ x ∑ xy − ∑ y ∑ x
b=
( ∑ x) 2 − N ∑ x2 ( ∑ x) 2 − N ∑ x2
Parámetros de error en ajuste lineal
∑ ∆x ∑ ∆y
σ x= σ y= σ = σ 2
+ m 2σ 2
N N y x
Nσ 2 σ 2 ∑ x2
∆m= ∆b=
N ∑ x2 − ( ∑ x) 2 N ∑ x2 − ( ∑ x)
2
∑ x∑ y
Coeficiente de correlación ∑ xy −
r= N
2
∑ x 2
−
1
( ∑ x ) ∑ y 2
−
1
( ∑ y ) 2
N N
Ejemplo
Para visualizar este método tomaremos la simulación del movimiento de un
proyectil el cual es lanzado con cierta inclinación respecto a la horizontal y bajo
la acción solamente de la fuerza gravitatoria su trayectoria se mantiene en el
plano vertical y es parabólica. Con el fin de mejorar la simulación se ha
introducido un pequeño ruido para generar una nube de puntos con una cierta
tendencia que nos permita hacer el ajuste correspondiente.
La interfaz devuelve los datos en un archivo que puede ser leído por cualquier
paquete estadístico, para nuestro caso vamos a elegir la extensión del archivo
como “*.xls” para ser leído en Excel.
6 L.R.H
Laboratorio de física 1
Hay algunas cosas que usted puede hacer a su hoja de cálculo para hacerla
más fácil de leer. Esto ayudará considerablemente a su profesor en la
evaluación de su informe de laboratorio y ayudará a encontrar posibles errores.
Aquí discutimos algunos de los detalles que usted puede incluir para mejorar la
apariencia de su hoja de cálculo.
Ahora tenemos espacio para agregar un título a nuestra tabla de datos. Debido
a que estamos observando el movimiento de una esfera cuando es lanzada en
el plano (x,y) con una velocidad inicial, simple titulamos la tabla de datos como
"Movimiento en el plano x,y". Ponga este título en la celda B1. Necesitamos
7 L.R.H
Laboratorio de física 1
8 L.R.H
Laboratorio de física 1
Creando un gráfico
Crear un gráfico en Microsoft Office Excel es rápido y sencillo. Excel
proporciona una variedad de tipos de gráficos entre los que puede elegir. Para
obtener más información acerca de los tipos de gráficos que puede utilizar, vea
Tipos de gráficos disponibles.
9 L.R.H
Laboratorio de física 1
10 L.R.H
Laboratorio de física 1
que los datos (como se muestra abajo), o como una hoja nueva.
12. Una vista preliminar del gráfico debería aparecer en la ventana.
∑ tx − ∑ x∑ t
r= N
∑ t − N ( ∑ t ) ∑ x − N ( ∑ x )
2 1 2 2 1 2
11 L.R.H
Laboratorio de física 1
Note que el resultado (0 cm2) se muestra en la celda F4. Podríamos repetir este
proceso para cada valor de xi en la tabla e ingresar una nueva fórmula para
cada uno. Sin embargo la mejor (y mas rápida) manera es primero activar la
celda que se desea copiar y colocar el cursor en la esquina derecha de la celda
hasta que salga una cruz, en este momento se tira la celda para abajo hasta la
ultima celda en donde queremos copiar la formula.
12 L.R.H
Laboratorio de física 1
Cuando se ha copiado la fórmula, haga clic en una celda vacía en donde usted
desea que aparezca la ecuación. En dicha celda, escriba un apóstrofe ( ' ) el
cual forzará que los contenidos de la celda aparezcan como texto. Luego
pegue la fórmula haciendo clic en el Botón Pegar, .
Como se puede observar en las formulas en casi todas hay que calcular
sumatorias. En el menú podemos ver el signo de sumatoria “∑” haciendo clic,
automáticamente el programa indica en el cuadro las posibles celdas que
intervienen en la sumatoria, permitiendo al usuario rectificar su escogencia.
13 L.R.H
Laboratorio de física 1
Vamos a trabajar por el momento con el movimiento a lo largo del eje x. Para
mejor claridad podemos colocar el símbolo ∑ en la celda derecha de donde se
hace la operación para un mejor entendimiento de la tabla.
El paso a seguir es ahora hacer los cálculos con las formulas de ajuste lineal
de mínimos cuadrados ya que nuestro grafico nos permite intuir que esa es la
tendencia de la nube de puntos.
14 L.R.H
Laboratorio de física 1
Haciendo el calculo σ que hay que hacer una raíz cuadrada, veamos la
formula.:
15 L.R.H
Laboratorio de física 1
16 L.R.H
Laboratorio de física 1
y = a m x m + a m − 1 x m − 1 + ... + a1 x + a 0
en donde los a j j = 0,1,..., m son los coeficientes del polinomio, o sea, los
valores que deseamos hallar.
17 L.R.H
Laboratorio de física 1
( )
N N
∑ ε i = ∑ a m x i + a m − 1 xi
2 m m− 1 2
E= + ... + a1 xi + a 0 − y i
i= 1 i= 1
∂ E ( a m , a m − 1 ,..., a1 , a 0 )
= 0
∂ a0
∂ E ( a m , a m − 1 ,..., a1 , a 0 )
= 0
∂ a1
:
∂ E ( a m , a m − 1 ,..., a1 , a 0 )
= 0
∂ am
18 L.R.H
Laboratorio de física 1
∂E
( )
N
= 2∑ a m xi + a m − 1 x i + ... + a1 xi + a 0 − y i
m m− 1
0=
∂ a0 i= 1
∂E
( )
N
= 2∑ a m xi + a m − 1 x i + ... + a1 xi + a 0 − y i ( xi )
m m− 1
0=
∂ a1 i= 1
:
∂E
( )
n
= 2∑ a m x i + a m − 1 x i + ... + a1 xi + a 0 − y i ( xi )
m m− 1 j
0=
∂aj i= 1
:
∂E
( )
n
= 2∑ a m xi + a m − 1 xi + ... + a1 x i + a 0 − y i ( xi )
m m− 1 m
0=
∂ am i= 1
N N N N N
∑ y i = a n ∑ xi + a n − 1 ⋅ ∑ xi + ... + a1 ⋅ ∑ xi + a 0 ∑ 1
m m− 1
i= 1 i= 1 i= 1 i= 1 i= 1
N N N N N
∑ y i x i = a m ∑ xi + a m − 1 ∑ xi + ... + a1 ∑ xi + a 0 ∑ xi
m+ 1 m 2
i= 1 i= 1 i= 1 i= 1 i= 1
:
N N N N N
∑ y i xi = a m ∑ xi + a m − 1 ∑ xi + ... + a1 ∑ xi + a 0 ∑ xi
j m+ j m − 1+ j 1+ j j
i= 1 i= 1 i= 1 i= 1 i= 1
:
N N N N N
∑ y i xi = a m ∑ xi + a m − 1 ∑ xi + ... + a1 ∑ xi + a 0 ∑ xi
m m+ j m − 1+ m 1+ m m
i= 1 i= 1 i= 1 i= 1 i= 1
N 0 N N N
N 0
∑ xi ∑ ∑ ∑ ∑ y i xi
1 2 m
xi xi xi
i =N1 i= 1
N
i= 1
n N
i= 1
a 0 i =N1
m+ 1 1
∑i = 1 i ∑ ∑ ∑i = 1 xi a1 ∑i = 1 yi xi
1 2 3
x xi xi
i= 1 i= 1
N 2 N N N ⊗ a2 = N
∑ xi ∑ xi
3
∑ xi
4
∑i = 1 i ∑i = 1 i i
x
m+ 2
y x
2
i= 1 i= 1 i= 1
a
N m m N
2m m
N N N
∑ xi ∑ ∑ ∑i = 1 xi ∑ y i xi
m+ 1 m+ 2
xi xi
i= 1 i= 1 i= 1 i= 1
19 L.R.H
Laboratorio de física 1
N 0 N N N
N 0
∑ xi ∑ ∑ ∑i = 1 ∑i = 1 yi xi
1 2 m
xi xi xi
a0 i =N1 i= 1
N
i= 1
n N N
m+ 1 1
∑i = 1 i ∑ ∑ ∑i = 1 xi ∑i = 1 yi xi
a x
1
xi
2
xi
3
1 i= 1 i= 1
a 2 = Inv N 2 N N N ⊗ N
∑ xi ∑ xi
3
∑ xi
4
∑i = 1 i ∑i = 1 i i
x
m+ 2
y x
2
i= 1 i= 1 i= 1
a m
N m N N N
2m N m
∑ xi ∑ ∑ ∑i = 1 xi ∑i = 1 yi xi
m+ 1 m+ 2
xi xi
i= 1 i= 1 i= 1
En caso general, uno puede tener una familia de funciones f que dependen
de varios parámetros α 1 , α 2 ,..., α m reales:
fα
1 ,α 2 ,...,α m
( x)
y desea encontrar entre dicha familia de funciones la que mejor aproxima los
datos experimentales.
N N
E= ∑ εi =∑
2
( f ( xi ) − yi )
2
i= 1 i= 1
20 L.R.H
Laboratorio de física 1
La que resulta una función de los parámetros α 1 , α 2 ,..., α m , ya que para cada
conjunto de parámetros obtenemos una función f y por ende un conjunto de
distancias ε i . Entonces E resulta ser una función de los parámetros
α 1 ,α 2 ,...,α m o sea E (α 1 , α 2 ,..., α m ) .
∂ E (α 1 ,α 2 ,..., α )
m
= 0
∂α 1
:
∂ E (α ,α ,..., α )
1 2 m
= 0
∂α m
Hay situaciones en las que no todos los datos tienen la misma importancia en
el cálculo de E. Un ejemplo es cuando hay más incertidumbre asociada a una
medición que a las demás. En ese caso uno puede desear que dicha medición
tenga menos importancia en el momento de aproximar los datos por rectas o
curvas que las restantes. Un posible procedimiento a seguir es el siguiente.
∑ 2
E= ε i wi
i= 1
21 L.R.H
Laboratorio de física 1
Como ejemplo, para el caso de las rectas del tipo forma y = ax obtenemos
N
∑ wi xi y i
a= i= 1
N
∑ 2
wi x i
i= 1
N N N N
∑ wi ∑ wi xi y i − ∑ wi y i ∑ wi xi
a = i= 1 i= 1 i= 1 i= 1
2
N N N
∑ wi ∑ wi xi 2 − ∑ wi xi
i= 1 i= 1 i= 1
N N N N
∑ wi y i ∑ wi xi 2 − ∑ wi xi y i ∑ wi xi
b = i= 1 i= 1 i= 1 i= 1
2
N N N
∑ wi ∑ wi xi 2 − ∑ wi xi
i= 1 i= 1 i= 1
22 L.R.H