Regresión Lineal - Método de Los Minimos Cuadrados

Laboratorio de física 1
Introducción al método de mínimos cuadrados
Interpolación y ajuste de curvas

En ocasiones se tienen una serie de datos y se desconoce la función que los
ha generado y se desea saber cuál es ésta. Lo primero que se debe hacer es
graficar los puntos según sea el caso, para conocer su comportamiento y de
esta forma decidir cuál método es más apropiado utilizar con fines predictivos.
Existen varios métodos aquí nos dedicaremos únicamente a mínimos
cuadrados.
Ajuste para una recta
La nube de puntos de una representación de datos en papel milimetrado nos

permitía visualizar la relación entre dos variables x e y.
Al representar el diagrama de dispersión de los datos podemos encontrar las

siguientes situaciones:
• Distribuciones estadísticas para las que la nube de puntos se dispone de tal

forma que existe una función matemática cuyos puntos son una parte de su
representación gráfica.
• Sin coincidir exactamente sus puntos con las de una gráfica de una función
matemática, se aproximan a ella con mayor o menor intensidad.
• La nube de puntos presenta un aspecto tal que no existe concentración de
puntos hacia ninguna gráfica matemática, distribuyéndose de una forma
uniforme en una región del plano.
En el primer caso se dice que existe una dependencia funcional o exacta entre
las variables x e y, es decir existe una función matemática tal que y = f(x). En el
segundo caso se dice que existe una dependencia estadística o
aproximadamente entre las dos variables, y≅f(x). Y en el último caso diríamos
que las variables son independientes.
Es el segundo caso del que se ocupa la teoría de la regresión.
1 L.R.H
Las técnicas de regresión tienen por objeto modelizar, es decir, encontrar una
función que aproxime lo máximo posible la relación de dependencia estadística
entre variables y predecir los valores de una de ellas: y (variable dependiente)
a partir de los de la otra (o las otras): x(variables(s) independiente(s)). La
regresión es lineal cuando el modelo función de regresión seleccionado es una
recta. En cualquier otro caso se dice regresión no lineal.
El procedimiento será:
1. Elegir un tipo de función o curva que creamos que mejor relaciona las dos
variables; esto lo podemos hacer observando la nube de puntos.
2. Obtener la ecuación de la curva, de entre las infinitas de dicho tipo que hay
en el plano, que mejor se adapte al conjunto de puntos. El objetivo de
obtener esa ecuación será predecir el valor de la variable y dado un valor x0
de la variable x.
3. Obtener una medida del grado de esta asociación o correlación. Esto me
dará la fiabilidad de las predicciones que haga con esta ecuación.
El segundo punto del procedimiento se conoce como el problema del ajuste y

se pueden emplear diferente métodos matemáticos para ello, tenemos:
• Método de los mínimos cuadrados.

• Método de los polinomios ortogonales.
• Método de los momentos.
• Método de la curva logística.
Ajuste de curvas por mínimos cuadrados

La regresión por mínimos cuadrados, es una técnica cuyo objetivo es derivar
una curva que minimice la discrepancia entre los puntos y la curva. Algunas
suposiciones estadísticas inherentes en los procedimientos por mínimos
cuadrados lineales son:
1. Cada x tiene un valor fijo, no es aleatorio y es conocido sin error.
2. Los valores y son valores aleatorios independientes y todos tienen la
misma varianza.
3. Los valores de y para una x dada deben ser normalmente distribuidos.
4. La regresión de y contra x no es la misma que la de x contra y.
Método de los mínimos cuadrados.

Dados los puntos (x1,y1), (x2,y2),...,(xn,yn), supongamos que hemos elegido una
función y=f(x|a1,...,ar) que queremos ajustar a ese conjunto de puntos y en la
que intervienen r parámetros (a1,...,ar). Consideramos la nube de puntos
correspondiente:
2 L.R.H
Para cada valor de x, (xi ) tenemos dos valores de y:
• El valor observado en la muestra (o en la nube de puntos ) yi.

• Otro que denominamos teórico, yi*, que se obtendría al sustituir x=xi en la
función.
Como se puede observar, para cada xi tenemos una diferencia entre los dos
valores de Y, que llamaremos residuo: εi = yi - yi*.
El método de los mínimos cuadrados consiste en determinar los parámetros

(a1,...,ar) de tal forma que los residuos sean mínimos. Es decir, buscaremos
minimizar la expresión:
( ) = ∑ ( y − f (x
n n n
Ψ = ∑ ε = ∑ yi − y
i
2 * 2
i i i a1 ,...,a r ) )
i= 1 i=1 i= 1
es decir, minimizamos la suma de las distancias verticales de los puntos a la

curva.
La condición necesaria para obtener el mínimo es que las primeras
derivadas parciales respecto a cada uno de los parámetros se anulen, es decir,
∂Ψ ∂Ψ ∂Ψ
= 0, = 0,.......... =0
∂ a1 ∂ a2 ∂ ar
resolviendo este sistema, denominado sistema de ecuaciones normales,

quedan determinados (a1,...,ar), así como la correspondiente función.
Modelo de regresión lineal simple

En el modelo de regresión lineal simple la función elegida para aproximar la
relación entre las variables es una recta, es decir y=b+mx, donde b,m son los
parámetros. A esta recta la llamaremos recta de regresión de y sobre x.
3 L.R.H
Vamos a deducir su ecuación usando el método de los mínimos cuadrados.

Dado un valor de X, xi, tenemos los dos valores de Y, el observado, yi , y el
teórico, yi* = b + mxi. Así pues, hemos de minimizar:
n n
Ψ = ∑ ( y i − ( b + mxi ) ) = ∑ ( y i − b − mxi )
2 2
i= 1 i= 1
que derivando respecto a a y a m e igualando a cero:
∂Ψ 
= − 2∑ ( y i − b − mxi ) = 0 
∂b i 

∂Ψ
= − 2∑ ( y i − b − mxi ) xi = 0
∂m i 
que nos dará un sistema de dos ecuaciones normales y dos incógnitas (b,m).
Resolviendo el sistema:
(1) ∑i
y i = ∑ b + m∑ xi
i i


2
(2) ∑ i
xi y i = b ∑ x i + m∑
i i
xi 

Se obtiene así, un sistema de dos ecuaciones con dos incógnitas b y m cuya

solución es
∑ y i − m∑ xi
de (1) ⇒ − Nb = − ∑ i
y i + m∑ xi  → b =
i
i
N
i
∑ xi y i − m∑ xi2 N ∑ xi y i − ∑ y i ∑ xi
de (2) ⇒ b= i i
⇒ m= i i i
∑ i
xi
N∑
 
x −  ∑ xi 
2
2
i
i  i 
de (1) tenemos el intercepto b:
b=
∑ x∑ xy − ∑ y∑ x2
(∑ x) − N ∑ x 2 2
Expresiones más elaboradas nos permiten determinar el error de b, ∆b y el

error de m, ∆m
4 L.R.H
∑ ∑ 2
( y i − mxi − b) 2 xi
Nσ
∆m= σ = i
∆b= ∆m i
 
2 N− 2 N
N ∑ xi2 −  ∑ xi 
i  i 
La pendiente de la recta se escribirá b±∆b, y la ordenada en el origen m±∆m.

Véase las reglas para expresar una medida y su error de una magnitud.
El coeficiente de correlación es otro parámetro para el estudio de una

distribución bidimensional, que nos indica el grado de dependencia entre las
variables X e Y. El coeficiente de correlación r es un número que se obtiene
mediante la fórmula.
∑ xi ∑ y i
∑ xi y i − N
r=
 ∑ xi − N ( ∑ xi )   ∑ y i − N ( ∑ y i ) 
 2 1 2  2 1 2
establece una medida del grado de asociación lineal entre la variable respuesta
y la recta de regresión estimada.
El coeficiente de correlación puede valer cualquier número comprendido entre

-1 y +1.
• Cuando r=1, la correlación lineal es perfecta, directa.

• Cuando r=-1, la correlación lineal es perfecta, inversa
• Cuando r=0, no existe correlación alguna, independencia total de los
valores X e Y
Como hacer el ajuste de mínimos cuadrados en Excel.
Lo primero es tener presente cuales son las ecuaciones para el ajuste, para
esto las escribimos en nuestra hoja de cálculo.
5 L.R.H
Ajuste lineal Pendiente Ordenada en origen
y = mx + b ∑ x ∑ y − N ∑ xy 2
m= ∑ x ∑ xy − ∑ y ∑ x
b=
( ∑ x) 2 − N ∑ x2 ( ∑ x) 2 − N ∑ x2
Parámetros de error en ajuste lineal
∑ ∆x ∑ ∆y
σ x= σ y= σ = σ 2
+ m 2σ 2
N N y x
Error ordenada en origen

Error pendiente
Nσ 2 σ 2 ∑ x2
∆m= ∆b=
N ∑ x2 − ( ∑ x) 2 N ∑ x2 − ( ∑ x)
2
∑ x∑ y
Coeficiente de correlación ∑ xy −
r= N
 2 
 ∑ x 2
−
1
( ∑ x )   ∑ y 2
−
1
( ∑ y ) 2 
N  N 
Ejemplo
Para visualizar este método tomaremos la simulación del movimiento de un
proyectil el cual es lanzado con cierta inclinación respecto a la horizontal y bajo
la acción solamente de la fuerza gravitatoria su trayectoria se mantiene en el
plano vertical y es parabólica. Con el fin de mejorar la simulación se ha
introducido un pequeño ruido para generar una nube de puntos con una cierta
tendencia que nos permita hacer el ajuste correspondiente.
La interfaz devuelve los datos en un archivo que puede ser leído por cualquier
paquete estadístico, para nuestro caso vamos a elegir la extensión del archivo
como “*.xls” para ser leído en Excel.
Ahora podemos abrir el archivo generado con el programa Excel
6 L.R.H
Hay algunas cosas que usted puede hacer a su hoja de cálculo para hacerla
más fácil de leer. Esto ayudará considerablemente a su profesor en la
evaluación de su informe de laboratorio y ayudará a encontrar posibles errores.
Aquí discutimos algunos de los detalles que usted puede incluir para mejorar la
apariencia de su hoja de cálculo.
Crear Títulos y Encabezados de Columna
Usted puede mover los contenidos de las celdas resaltando (seleccionando)

las celdas deseadas. Luego con el ratón, haga clic en el borde de las celdas
resaltadas y use el ratón para moverlas a un espacio no ocupado. Por ejemplo,
aquí movimos los datos desde las celdas A1:C15 hacia A4:C18 como se
muestra a la derecha.
Ahora tenemos espacio para agregar un título a nuestra tabla de datos. Debido
a que estamos observando el movimiento de una esfera cuando es lanzada en
el plano (x,y) con una velocidad inicial, simple titulamos la tabla de datos como
"Movimiento en el plano x,y". Ponga este título en la celda B1. Necesitamos
7 L.R.H
también encabezados de columna. En la celda B2 escriba "ti", en C2 “xi” y en

D2 “yi”.
Agregar unidades a los encabezados

Los encabezados no contienen las unidades para los datos de las columnas.
¿la longitud significa 1 cm, 1m o 1pulgadas? Obviamente se necesitan las
unidades. La mejor manera de hacer esto es poner las unidades entre
paréntesis bajo el encabezado. Para mantener el encabezado y las unidades
en la misma celda, primero escriba el encabezado y luego presione
simultáneamente las teclas <ALT>+<ENTER>. Esto agregará una línea nueva
dentro de la celda, permitiendo escribir las unidades debajo del encabezado.
8 L.R.H
Creando un gráfico
Crear un gráfico en Microsoft Office Excel es rápido y sencillo. Excel
proporciona una variedad de tipos de gráficos entre los que puede elegir. Para
obtener más información acerca de los tipos de gráficos que puede utilizar, vea
Tipos de gráficos disponibles.
1. Seleccione los datos que desea graficar en nuestro caso primero

haremos la pareja de datos (x,t) y luego (y,t).
2. En la barra del menú, haga clic en el asistente para gráficos.
3. Una ventana Tipo de Gráfico (paso 1 de 4) se abrirá. Escoja

la opción XY (Scatter),. No seleccione un
subtipo que conecta los puntos con líneas o curvas suaves.
Presione el botón.
4. Una ventana Datos Fuente para el Gráfico (paso 2 de 4) se

abrirá. Haga clic en la pestaña Series ubicada cerca del
tope de la ventana.
5. Luego haga clic en el botón Agregar, . Esto causará que
cuadros de datos, como los mostrados aquí, aparezcan. Luego haga
clic en el botón Cerrar Diálogo, , en el lado derecho del cuadro
Valores X. Esto minimizará temporalmente la ventana de diálogo de
manera que usted pueda seleccionar los valores-x que desea graficar en
el eje horizontal.
6. Cuando la ventana de dialogo se achica, usted puede usar el ratón para

seleccionar los valores de x que se incluirán en el eje horizontal. Note
que cuando las celdas han sido seleccionadas, sus referencias aparecen
en el cuadro de Valores-X. Cuando haya terminado haga clic en el
botón Expandir Diálogo que devolverá la ventana de diálogo a su
tamaño máximo.
9 L.R.H
7. Haga clic en el botón Terminar Diálogo, , en el final derecho del

cuadro de Valores Y y repita el procedimiento del Paso 7 para los
valores y que se incluirán en el eje vertical
8. Una vista preliminar del gráfico debería aparecer en la ventana. Haga
clic en el botón > Siguiente.
9. Una nueva ventana de para Opciones de Gráfico (paso 3 de 4) se abrirá.
Aquí usted puede agregar un título y encabezados para los ejes del
gráfico. Es importante que usted no se salte este paso, así que tómese
un par de segundos para rellenar estos cuadros de texto con títulos
descriptivos.
Cuando usted haya terminado, haga clic en el botón > Siguiente.
10 L.R.H
10. Una nueva ventana de Ubicación del Gráfico (Paso 4 de 4) se abrirá.

Aquí usted puede decidir donde ubicar su gráfico. Si usted quiere que el
gráfico aparezca en su propia página, seleccione la opción: "Como una
hoja nueva"
Si usted quiere que el gráfico aparezca en la misma página que sus

datos, seleccione la opción: "Como un objeto en hoja 1"
11. Luego de hacer clic en el botón Finalizar, el gráfico en la misma página
que los datos (como se muestra abajo), o como una hoja nueva.
12. Una vista preliminar del gráfico debería aparecer en la ventana.
Como hacer el ajuste de mínimos cuadrados?

Debemos tener presente las formulas que nos permiten hacer el ajuste de la
curva, por ejemplo para el calculo de la correlación.
∑ tx − ∑ x∑ t
r= N
 ∑ t − N ( ∑ t )   ∑ x − N ( ∑ x ) 
 2 1 2  2 1 2
Es necesario ir ordenando nuestros cálculos lo mas adecuado es trabajar en

una hoja de calculo como Excel. En la siguiente tabla se muestra por ejemplo
xi2, para esto es necesario introducir una formula observe que se inicia con el
signo igual en seguida se hace clic sobre las celdas que van a operar
11 L.R.H
C4*(multiplicada) C4. Las operaciones básicas se hacer con los siguientes

operadores (+ suma,- resta,* multiplicación y,/ división).
Note que el resultado (0 cm2) se muestra en la celda F4. Podríamos repetir este
proceso para cada valor de xi en la tabla e ingresar una nueva fórmula para
cada uno. Sin embargo la mejor (y mas rápida) manera es primero activar la
celda que se desea copiar y colocar el cursor en la esquina derecha de la celda
hasta que salga una cruz, en este momento se tira la celda para abajo hasta la
ultima celda en donde queremos copiar la formula.
Mostrar Fórmulas de Ejemplo

La hoja de cálculo está ahora en una forma que es fácil de leer, pero todavía
podemos hacerla más fácil de ser evaluada por su profesor. Por ejemplo,
podemos mostrar una ecuación de ejemplo para cada tipo de fórmula usada en
la hoja de cálculo. Para hacer esto, desde la barra de fórmulas seleccione la
ecuación que usted desea mostrar como texto, como se muestra a la derecha.
Con la fórmula resaltada, haga clic en el Botón Copiar, , y luego presione la
tecla <ENTER>. No se salte el último paso, usted debe presionar la tecla
<ENTER>.
12 L.R.H
Cuando se ha copiado la fórmula, haga clic en una celda vacía en donde usted
desea que aparezca la ecuación. En dicha celda, escriba un apóstrofe ( ' ) el
cual forzará que los contenidos de la celda aparezcan como texto. Luego
pegue la fórmula haciendo clic en el Botón Pegar, .
Uso de Cifras Significativas Correctas

Por defecto la planilla muestra el número máximo de cifras decimales. Sin
embargo, el número de decimales mostrados puede ser forzado en forma
manual usando el Botón Incrementar Decimales, y el Botón Disminuir
Decimales, , dependiendo de cada situación. Por ejemplo, la imagen a la
derecha muestra como usar el Botón Disminuir Decimales para reducir el
número de decimales en la respuesta.
En esta simulación tomaremos la incertidumbre en el tiempo como ±0,001s y

para las medidas de distancia ±0,01cm entonces nuestra tabla de datos
quedara de la siguiente forma:
Para facilitar el estudio del movimiento de un proyectil, este se descompone en

movimiento horizontal y vertical.
Como se puede observar en las formulas en casi todas hay que calcular
sumatorias. En el menú podemos ver el signo de sumatoria “∑” haciendo clic,
automáticamente el programa indica en el cuadro las posibles celdas que
intervienen en la sumatoria, permitiendo al usuario rectificar su escogencia.
13 L.R.H
Movimiento horizontal del proyectil
Vamos a trabajar por el momento con el movimiento a lo largo del eje x. Para
mejor claridad podemos colocar el símbolo ∑ en la celda derecha de donde se
hace la operación para un mejor entendimiento de la tabla.
El paso a seguir es ahora hacer los cálculos con las formulas de ajuste lineal
de mínimos cuadrados ya que nuestro grafico nos permite intuir que esa es la
tendencia de la nube de puntos.
14 L.R.H
Haciendo el calculo σ que hay que hacer una raíz cuadrada, veamos la
formula.:
Terminando todos los cálculos tenemos:
15 L.R.H
De manera que la recta buscada es
A continuación se presentan x =los 24t − 163,de

85,valores 38 la y medida, de la y del modelo y
i i
del error en la aproximación:
Lo cual puede apreciarse gráficamente:
16 L.R.H
Aproximación por polinomios de grado m
Calculemos ahora la mejor aproximación de un conjunto de valores

experimentales ( x1 , y1 ) , ( x 2 , y 2 ) ,..., ( x N , y N ) por un polinomio de grado m.
Podemos expresar la relación entre ambas magnitudes de la siguiente forma:
y = a m x m + a m − 1 x m − 1 + ... + a1 x + a 0
en donde los a j j = 0,1,..., m son los coeficientes del polinomio, o sea, los
valores que deseamos hallar.
Procedamos de la misma manera que en el caso anterior.
17 L.R.H
Ahora, la distancia de cada punto del gráfico al polinomio tendrá la expresión

m m− 1
ε i = a m xi + a m − 1 x i + ... + a1 xi + a 0 − y i . Nuevamente calculemos la suma de las
distancias de cada punto del gráfico al polinomio elevada al cuadrado, que nos
da una idea de cuan cerca esta el polinomio de los datos experimentales. La
misma estará dada por la siguiente expresión:
( )
N N
∑ ε i = ∑ a m x i + a m − 1 xi
2 m m− 1 2
E= + ... + a1 xi + a 0 − y i
i= 1 i= 1
Observemos que la desviación cuadrática de los puntos respecto al polinomio

es una función del polinomio, cada polinomio (o sea cada conjunto de
coeficientes a j j = 0,1,..., m ) genera distancias de cada punto a dicho
polinomio y por ende un valor de su suma al cuadrado. Lo que deseamos
obtener es del polinomio (o sea el conjunto de coeficientes a j j = 0,1,..., m ) que
minimice dicha función, o sea, obtener el polinomio de grado m que, en cierto
sentido, esté más cerca de los puntos experimentales.
En los casos anteriores, cuando teníamos rectas pasan por el origen, la
función E dependía de una sola variable, a, y encontrar el valor que la
minimizaba fue una tarea sencilla; luego, para rectas generales la función E
dependía de dos variables, a y b, y encontrar los valores que la minimizaba fue
un poco más complicado. En este caso general, la función E depende de m+1
variables a j j = 0,1,..., m y debemos encontrar el conjunto de valores que la
minimizan. El trabajo actual es un poco más complicado, aunque es una simple
generalización del procedimiento anterior al caso de m+1 variables. Para lograr
dicho objetivo, debemos imponer la siguiente condición de extremo:
 ∂ E ( a m , a m − 1 ,..., a1 , a 0 )
 = 0
∂ a0

 ∂ E ( a m , a m − 1 ,..., a1 , a 0 )
 = 0
 ∂ a1
:

 ∂ E ( a m , a m − 1 ,..., a1 , a 0 )
 = 0
 ∂ am
Calculando dichas derivadas parciales de la expresión de E como función

las m+1 variables a j j = 0,1,..., m , obtenemos:
18 L.R.H
∂E
( )
N
= 2∑ a m xi + a m − 1 x i + ... + a1 xi + a 0 − y i
m m− 1
0=
∂ a0 i= 1
∂E
( )
N
= 2∑ a m xi + a m − 1 x i + ... + a1 xi + a 0 − y i ( xi )
m m− 1
0=
∂ a1 i= 1
:
∂E
( )
n
= 2∑ a m x i + a m − 1 x i + ... + a1 xi + a 0 − y i ( xi )
m m− 1 j
0=
∂aj i= 1
:
∂E
( )
n
= 2∑ a m xi + a m − 1 xi + ... + a1 x i + a 0 − y i ( xi )
m m− 1 m
0=
∂ am i= 1
Dichas ecuaciones pueden ser rescritas de la siguiente manera:
N N N N N
∑ y i = a n ∑ xi + a n − 1 ⋅ ∑ xi + ... + a1 ⋅ ∑ xi + a 0 ∑ 1
m m− 1
i= 1 i= 1 i= 1 i= 1 i= 1
N N N N N
∑ y i x i = a m ∑ xi + a m − 1 ∑ xi + ... + a1 ∑ xi + a 0 ∑ xi
m+ 1 m 2
i= 1 i= 1 i= 1 i= 1 i= 1
:
N N N N N
∑ y i xi = a m ∑ xi + a m − 1 ∑ xi + ... + a1 ∑ xi + a 0 ∑ xi
j m+ j m − 1+ j 1+ j j
i= 1 i= 1 i= 1 i= 1 i= 1
:
N N N N N
∑ y i xi = a m ∑ xi + a m − 1 ∑ xi + ... + a1 ∑ xi + a 0 ∑ xi
m m+ j m − 1+ m 1+ m m
i= 1 i= 1 i= 1 i= 1 i= 1
O, para ganar claridad pueden ser escritas en forma matricial de la siguiente

manera.
 N 0 N N N
  N 0
 ∑ xi ∑ ∑ ∑  ∑ y i xi 
1 2 m
xi xi  xi 
 i =N1 i= 1
N
i= 1
n N
i= 1
  a 0   i =N1 
 m+ 1   1
 ∑i = 1 i ∑ ∑ ∑i = 1 xi   a1   ∑i = 1 yi xi 
1 2 3
x xi xi 
i= 1 i= 1
 N 2 N N N  ⊗  a2  =  N 
 ∑ xi ∑ xi
3
∑ xi
4
 ∑i = 1 i    ∑i = 1 i i 
x
m+ 2
    y x
2
 i= 1 i= 1 i= 1  
       a    
 N m  m  N
2m  m
N N N
 ∑ xi ∑ ∑ ∑i = 1 xi   ∑ y i xi 
m+ 1 m+ 2
xi xi 
 i= 1 i= 1 i= 1  i= 1 
Por lo tanto, la solución del sistema es
19 L.R.H
 N 0 N N N
  N 0
 ∑ xi ∑ ∑ ∑i = 1   ∑i = 1 yi xi 
1 2 m
xi xi  xi
 a0   i =N1 i= 1
N
i= 1
n N   N 
 m+ 1   1
 ∑i = 1 i ∑ ∑ ∑i = 1 xi   ∑i = 1 yi xi 
a  x
1
xi
2
xi
3

 1 i= 1 i= 1
 a 2  = Inv  N 2 N N N ⊗  N 
   ∑ xi ∑ xi
3
∑ xi
4
 ∑i = 1 i   ∑i = 1 i i 
x
m+ 2
  y x
2
    i= 1 i= 1 i= 1
 a m           
 N m N N N
2m   N m
 ∑ xi ∑ ∑ ∑i = 1 xi   ∑i = 1 yi xi 
m+ 1 m+ 2
xi xi 
 i= 1 i= 1 i= 1
En donde Inv [A] significa la matriz inversa de A. En conclusión hemos

encontrado el conjunto de coeficientes a j j = 0,1,..., m del polinomio de grado
m− 1
m de la forma y = a m x + a m − 1 x + ... + a1 x + a 0 que mejor aproxima los datos
m
experimentales. Llegamos a la conclusión los coeficientes del polinomio de que

minimiza la suma de las distancias al cuadrado de los valores experimentales
al polinomio (el polinomio que en cierto modo más se aproxima a los valores
experimentales) tienen las expresiones anteriormente calculadas.
Aproximación por familias arbitrarias de funciones

En todos los ejemplos anteriores procuramos aproximar un conjunto de datos
experimentales ( x1 , y1 ) , ( x 2 , y 2 ) ,..., ( x N , y N ) por una recta o polinomio. En
definitiva, teníamos un conjunto de posibles rectas o polinomios
parametrizados por un conjunto de parámetros. Por ejemplo a es el parámetro
que describe las rectas que pasan por el origen; a y b es el conjunto de
parámetros que describen las rectas generales, y los coeficientes de los
polinomios son los parámetros que describen a los polinomios.
En caso general, uno puede tener una familia de funciones f que dependen
de varios parámetros α 1 , α 2 ,..., α m reales:
fα
1 ,α 2 ,...,α m
( x)
y desea encontrar entre dicha familia de funciones la que mejor aproxima los
datos experimentales.
El método de mínimos cuadrados es aplicable en dicha situación. Para ello

uno debe considerar las distancias ε i = f ( xi ) − y i de los puntos experimentales
a la curva de ajuste. Nuevamente consideramos la suma de todas las
distancias elevadas al cuadrado:
N N
E= ∑ εi =∑
2
( f ( xi ) − yi )
2
i= 1 i= 1
20 L.R.H
La que resulta una función de los parámetros α 1 , α 2 ,..., α m , ya que para cada
conjunto de parámetros obtenemos una función f y por ende un conjunto de
distancias ε i . Entonces E resulta ser una función de los parámetros
α 1 ,α 2 ,...,α m o sea E (α 1 , α 2 ,..., α m ) .
El método de mínimos cuadrados consiste en minimizar E, por lo que se

debe hacer es imponer la siguiente condición de extremo:
 ∂ E (α 1 ,α 2 ,..., α )

m
= 0
∂α 1

:
 ∂ E (α ,α ,..., α )
 1 2 m
= 0
 ∂α m
Obtenemos la solución del problema (los parámetros α 1 , α 2 ,..., α m ) al resolver

dicho sistema. Además hay que asegurarse de obtener una solución que
corresponda efectivamente a un mínimo de E.
La dificultad radica en que generalmente el sistema anterior es un sistema muy

complicado de resolver, por lo general no lineal. Afortunadamente disponemos
de muchos métodos numéricos para obtener una solución aproximada del
mismo.
Mínimos cuadrados ponderados

En todos los ejemplos anteriores calculamos las distancias de los datos
experimentales ε i a una familia de rectas, polinomios o curvas que dependían
de ciertos parámetros. Seguidamente sumamos todas las distancias elevadas
al cuadrados, y al resultado lo llamamos E. Luego encontramos los parámetros
de las rectas o curvas que minimizaban dicha expresión.
Hay situaciones en las que no todos los datos tienen la misma importancia en
el cálculo de E. Un ejemplo es cuando hay más incertidumbre asociada a una
medición que a las demás. En ese caso uno puede desear que dicha medición
tenga menos importancia en el momento de aproximar los datos por rectas o
curvas que las restantes. Un posible procedimiento a seguir es el siguiente.
A cada medición se le asocia un peso wi . Típicamente, se le suele asociar a

cada medición un peso que sea inversamente proporcional a la incertidumbre
1
asociada a dicha medida elevada al cuadrado wi = ( ∆ y ) 2 , aunque otras
i
elecciones son posibles.
En la definición de E, tenemos en cuenta dicho peso:

N
∑ 2
E= ε i wi
i= 1
21 L.R.H
El resto del procedimiento es exactamente igual al de los casos anteriores, o

sea minimizamos la expresión obtenida para E, teniendo en cuenta los factores
wi . Observemos que el desarrollo de E es análogo al caso anterior con la
diferencia que cada sumando queda multiplicado por el factor de peso wi . O
N
sea, cada vez que tenemos una sumatoria del tipo ∑
i= 1
....i la misma se
N
transformará a una suma del tipo ∑
i= 1
....i wi .
Como ejemplo, para el caso de las rectas del tipo forma y = ax obtenemos
N
∑ wi xi y i
a= i= 1
N
∑ 2
wi x i
i= 1
Para el caso de las rectas del tipo forma y = ax + b obtenemos:

(cabe observar que el factor N en las fórmulas anteriores provenía de hacer
N N
N= ∑
i= 1
1 y en los nuevos cálculos se transforma en ∑ wi )
i= 1
 N  N   N  N 
 ∑ wi   ∑ wi xi y i  −  ∑ wi y i   ∑ wi xi 
a =  i= 1   i= 1   i= 1   i= 1
2

 N  N   N 
 ∑ wi   ∑ wi xi 2  −  ∑ wi xi 
 i= 1   i= 1   i= 1 
 N  N   N  N 
 ∑ wi y i   ∑ wi xi 2  −  ∑ wi xi y i   ∑ wi xi 
b =  i= 1   i= 1   i= 1   i= 1
2

 N  N   N 
 ∑ wi   ∑ wi xi 2  −  ∑ wi xi 
 i= 1   i= 1   i= 1 
Los métodos y resultados en los demás casos son análogos.
22 L.R.H

Regresión Lineal - Método de Los Minimos Cuadrados

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Regresión Lineal - Método de Los Minimos Cuadrados

Uploaded by

Copyright:

Available Formats

Laboratorio de física 1

Introducción al método de mínimos cuadrados

Interpolación y ajuste de curvas

Ajuste para una recta

La nube de puntos de una representación de datos en papel milimetrado nos

Al representar el diagrama de dispersión de los datos podemos encontrar las

• Distribuciones estadísticas para las que la nube de puntos se dispone de tal

Es el segundo caso del que se ocupa la teoría de la regresión.

El segundo punto del procedimiento se conoce como el problema del ajuste y

• Método de los mínimos cuadrados.

Ajuste de curvas por mínimos cuadrados

Método de los mínimos cuadrados.

Para cada valor de x, (xi ) tenemos dos valores de y:

• El valor observado en la muestra (o en la nube de puntos ) yi.

El método de los mínimos cuadrados consiste en determinar los parámetros

es decir, minimizamos la suma de las distancias verticales de los puntos a la

resolviendo este sistema, denominado sistema de ecuaciones normales,

Modelo de regresión lineal simple

Vamos a deducir su ecuación usando el método de los mínimos cuadrados.

que derivando respecto a a y a m e igualando a cero:

Se obtiene así, un sistema de dos ecuaciones con dos incógnitas b y m cuya

de (1) tenemos el intercepto b:

Expresiones más elaboradas nos permiten determinar el error de b, ∆b y el

La pendiente de la recta se escribirá b±∆b, y la ordenada en el origen m±∆m.

El coeficiente de correlación es otro parámetro para el estudio de una

El coeficiente de correlación puede valer cualquier número comprendido entre

• Cuando r=1, la correlación lineal es perfecta, directa.

Como hacer el ajuste de mínimos cuadrados en Excel.

Ajuste lineal Pendiente Ordenada en origen

Error ordenada en origen

Ahora podemos abrir el archivo generado con el programa Excel

Crear Títulos y Encabezados de Columna

Usted puede mover los contenidos de las celdas resaltando (seleccionando)

también encabezados de columna. En la celda B2 escriba "ti", en C2 “xi” y en

Agregar unidades a los encabezados

1. Seleccione los datos que desea graficar en nuestro caso primero

2. En la barra del menú, haga clic en el asistente para gráficos.

3. Una ventana Tipo de Gráfico (paso 1 de 4) se abrirá. Escoja

4. Una ventana Datos Fuente para el Gráfico (paso 2 de 4) se

6. Cuando la ventana de dialogo se achica, usted puede usar el ratón para

7. Haga clic en el botón Terminar Diálogo, , en el final derecho del

Cuando usted haya terminado, haga clic en el botón > Siguiente.

10. Una nueva ventana de Ubicación del Gráfico (Paso 4 de 4) se abrirá.

Si usted quiere que el gráfico aparezca en la misma página que sus

11. Luego de hacer clic en el botón Finalizar, el gráfico en la misma página

Como hacer el ajuste de mínimos cuadrados?

Es necesario ir ordenando nuestros cálculos lo mas adecuado es trabajar en

C4*(multiplicada) C4. Las operaciones básicas se hacer con los siguientes

Mostrar Fórmulas de Ejemplo

Uso de Cifras Significativas Correctas

En esta simulación tomaremos la incertidumbre en el tiempo como ±0,001s y

Para facilitar el estudio del movimiento de un proyectil, este se descompone en

Movimiento horizontal del proyectil

Terminando todos los cálculos tenemos:

De manera que la recta buscada es

A continuación se presentan x =los 24t − 163,de

Lo cual puede apreciarse gráficamente:

Aproximación por polinomios de grado m

Calculemos ahora la mejor aproximación de un conjunto de valores

Procedamos de la misma manera que en el caso anterior.

Ahora, la distancia de cada punto del gráfico al polinomio tendrá la expresión

Observemos que la desviación cuadrática de los puntos respecto al polinomio

Calculando dichas derivadas parciales de la expresión de E como función

Dichas ecuaciones pueden ser rescritas de la siguiente manera: