You are on page 1of 8

Regresión Por Mínimos Cuadrados:

Regresión Lineal y Polinomial


Klever Herrera 1
kherreraj@est.ups.edu.ec
Claudio Nieves 2
cnievesm@est.ups.edu.ec
Ronald Piña 3
rpiñag@est.ups.edu.ec
Jhonnathan Sisa 4
jsisa@est.ups.edu.ec

Resumen - En el presente trabajo se study of regression by least squares to


pretende profundizar con el estudio teórico- focusing primarily on linear and polynomial
práctico de la regresión por mínimos regression, so it must have a set of data for
cuadrados enfocándonos fundamentalmente analysis and which allow a better and faster
en la regresión lineal y polinomial, por lo que representation through an equation resulting
se deberá disponer de un conjunto de datos from the proposed data, which must comply
para el análisis y de los cuales se permita una with spending envelope or as close as possible
mejor y más rápida representación mediante to the data analyzed.
una ecuación resultante de los datos Linear models are a simplified explanation of
propuestos, la cual deberá cumplir con pasar reality, much more agile and with a much
sobre o lo más cercano posible a los datos more extensive theoretical support from
analizados. mathematics and statistics. It is, therefore,
Los modelos lineales son una explicación that this method offers greater reliability in
simplificada de la realidad, mucho más ágiles the option of finding an equation
y con un soporte teórico mucho más extenso representing a certain group of analyzed
por parte de la matemática y la estadística. data...
Por ello es que este método nos ofrece una
mayor confiabilidad en la opción de
encontrar una ecuación que represente a un Key words: data, method, regression,
cierto grupo de datos analizados… polynomial, least squares, etc.

Palabras Clave: datos, método,


regresión, polinomial, mínimos cuadrados,
etc.

Abstract - In this paper is intended to


deepen with the theoretical/experimental
1
R. L Piña está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, rpinag@est.ups.edu.ec
K. M. Herrera está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador,
kherreraj@est.ups.edu.ec
J. J. Sisa está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, jsisa@est.ups.edu.ec
C. A. Nieves está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador,
cnievesm@est.ups.edu.ec
I. INTRODDUCION si un polinomio de interpolación de sexto grado
se ajusta a estos datos expuestos para el caso,
El análisis de la regresión lineal es una entonces pasará exactamente a través de todos
técnica estadística que nos permite estudiar la los puntos. [1]
relación entre las variables. Se adapta en un
amplia aspecto variedad de posibilidades o
situaciones expuestas. II. MARCO TEORICO
En si es la realización de experimentos,
a menudo tabulamos datos en la forma de pares La regresión lineal permite trabajar con
ordenados (𝒙𝟏 , 𝒚𝟏 ), (𝒙𝟐 , 𝒚𝟐 ),….., una variable a nivel de intervalo o razón. De la
(𝒙𝒏 , 𝒚𝒏 )donde cada 𝒙𝒊 es diferente. Dados los misma manera, es posible analizar la relación
datos, frecuentemente deseamos poder entre dos o más variables a través de
extrapolar o predecir y a partir de x calculando ecuaciones, lo que se denomina regresión
un modelo matemático, es decir, una función múltiple o regresión lineal múltiple.
que se aproxime o "ajuste" a los datos. En otras
palabras, queremos encontrar una función f(x)
tal que,
𝒇(𝒙𝟏 ) ≈ 𝒚𝟏 , 𝒇(𝒙𝟐 ) ≈ 𝒚𝟐 ,…,𝒇(𝒙𝒏 ) ≈ 𝒚𝒏

Sin embargo, es natural que no solamente


deseemos cualquier función, sino una función
que se ajuste a los datos tanto como sea posible.
Para el análisis que se presenta
enseguida, concentraremos nuestra atención
sobre el problema de encontrar un polinomio
lineal f(x) = a + bx o línea recta que "se ajuste
de la mejor manera" a los datos (𝒙𝟏 , 𝒚𝟏 ),
(𝒙𝟐 , 𝒚𝟐 ),….., (𝒙𝒏 , 𝒚𝒏 ). El procedimiento para
calcular
esta función lineal se conoce como el método
de los mínimos cuadrados. Grafica 1 - Regresión Lineal [2]

En los datos que tienen errores Expresándolo en forma simple, la


sustanciales, la interpolación polinomial es regresión lineal es una técnica que permite
inapropiada y puede dar resultados poco cuantificar la relación que puede ser observada
satisfactorios cuando se utiliza para predecir cuando se grafica un diagrama de puntos
valores intermedios. Con frecuencia los datos dispersos correspondientes a dos variables,
experimentales son de este tipo. Para los casos cuya tendencia general es rectilínea; relación
en que se presenta una variabilidad que cabe compendiar mediante una ecuación
significativa, realizada mediante una “del mejor ajuste” de la forma:
inspección visual de esos datos sugiere una
posible relación entre y y x, es decir, la 𝒚 = 𝒂𝟎 + 𝒂𝟏 𝒙 + e (1)
tendencia general indica que valores altos de y
están asociados con valores altos de x. Ahora,
1
R. L Piña está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, rpinag@est.ups.edu.ec
K. M. Herrera está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, kherreraj@est.ups.edu.ec
J. J. Sisa está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, jsisa@est.ups.edu.ec
C. A. Nieves está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, cnievesm@est.ups.edu.ec
Una estrategia eficaz para ajustar una mejor
línea es el criterio minimax. En esta técnica, la
línea se elige de manera que minimice la
máxima distancia a que un punto se encuentra
de la línea.
𝒏 𝒏

∑|𝒆𝒊 | = ∑|𝒚𝒊 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 | (𝟐)


𝒊=𝟏 𝒊=𝟏

Deberá tomarse en cuenta que el principio


Grafica 2 - Datos que muestran un Error significativo
minimax es, en algunas ocasiones, es adecuado
[3]
para ajustar una función simple a una función
complicada (Carnahan, Luther y Wilkes,
1969).
La estrategia que supera las deficiencias de los
procedimientos mencionados consiste en
minimizar la suma de los cuadrados de los
residuos entre la y medida y la y calculada con
el modelo lineal
𝒏

𝑺𝒓 = ∑(𝒚𝒊 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 )𝟐 (𝟑)
𝒊=𝟏
Grafica 3 - Ajuste polinomial oscilando más allá del
rango de los datos [3]

Grafica 4 - Resultado satisfactorio luego de la


regresión por mínimos cuadrados [3]

2
R. L Piña está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, rpinag@est.ups.edu.ec
K. M. Herrera está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, kherreraj@est.ups.edu.ec
J. J. Sisa está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, jsisa@est.ups.edu.ec
C. A. Nieves está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, cnievesm@est.ups.edu.ec
Ajuste de una línea recta por mínimos Éstas se llaman ecuaciones normales, y se
cuadrados [3] resuelven simultáneamente, quedando
expresadas como:
Para determinar los valores de 𝒂𝟎 y 𝒂𝟏 , la
ecuación se deriva la ecuación (3) con respecto 𝒏 ∑ 𝒚𝒊 𝒙𝒊 −∑ 𝒙𝒊 ∑ 𝒚𝒊
𝒂𝟏 = (12)
a cada uno de los coeficientes: 𝒏 ∑ 𝒙𝟐𝒊 − (∑ 𝒙𝒊 )𝟐

𝝏𝑺𝒓 ̅ − 𝒂𝟏 𝒙
𝒂𝟎 = 𝒚 ̅ (13)
= −𝟐 ∑(𝒚𝒊 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 ) (4)
𝝏𝒂𝟎
En la ecuación (13) los valores de 𝒚 ̅ y 𝒙 ̅
𝝏𝑺𝒓 corresponden a las medias obtenidas de los
= −𝟐 ∑[(𝒚𝒊 − 𝒂𝟎 − 𝒂𝟏 𝒙𝒊 )𝒙𝒊 ] (5)
𝝏𝒂𝟏 datos que se presentan para el análisis para cada
una de las dos variables y y x respectivamente.
Se observa que se ha obviado los símbolos de
la sumatoria; a menos que se indique otra cosa, De este modo se culmina con la
todas las sumatorias van desde i = 1 hasta n. regresión lineal, al obtener como resultado la
Procedemos igualar estas derivadas a cero, ecuación que se aproxime a la mayor cantidad
dando como resultado un 𝑺𝒓 mínimo. Al hacer de puntos expuestos en el plano, utilizados
esto, las ecuaciones quedan expresadas como: durante el análisis; dando como resultado una
ecuación:
𝟎 = ∑ 𝒚𝒊 − ∑ 𝒂𝟎 − ∑ 𝒂𝟏 𝒙𝒊 (6)
𝒚 = 𝒂𝟎 + 𝒂𝟏 𝒙 + 𝒆 (14)
𝟎 = ∑ 𝒚𝒊 𝒙𝒊 − ∑ 𝒂𝟎 𝒙𝒊 − ∑ 𝒂𝟏 𝒙𝟐𝒊 (7)

Procedemos a expresar las ecuaciones (6) y (7)


respectivamente como: PROCEDIMIENTO DE CALCULOS

∑ 𝒚𝒊 = ∑ 𝒂𝟎 + ∑ 𝒂𝟏 𝒙𝒊 (8) El valor de “𝒂𝟎 ” (que puede ser


negativo, positivo o igual a cero) es llamado el
∑ 𝒚𝒊 𝒙𝒊 = ∑ 𝒂𝟎 𝒙𝒊 + ∑ 𝒂𝟏 𝒙𝟐𝒊 (9) intercepto; en tanto que el valor de “𝒂𝟏 ” (el cual
puede ser negativo o positivo) se denomina la
pendiente o coeficiente de regresión.
Ahora, si observamos que ∑ 𝒂𝟎 = 𝒏𝒂𝟎 ,
expresamos las ecuaciones como un conjunto El procedimiento para obtener valores de “𝒂𝟎 ”
de dos ecuaciones lineales simultáneas, con dos y “𝒂𝟏 ” para una serie de pares de datos de “x”
incógnitas (𝒂𝟎 y 𝒂𝟏 ): y de “y” es como sigue: [4]

∑ 𝒚𝒊 = 𝒏𝒂𝟎 + (∑ 𝒙𝒊 ) 𝒂𝟏 (10) 1. Calcular, para cada par de valores de


“x” e “y”, las cantidades “x²”, “y²”, y
∑ 𝒚𝒊 𝒙𝒊 = (∑ 𝒙𝒊 ) 𝒂𝟎 + (∑ 𝒙𝟐𝒊 )𝒂𝟏 (11) “x.y”.
2. Obtenga las sumatorias (∑) de estos
valores para todos los pares de datos de
“x” e “y”, así como las sumas del total
de los valores de “x” e “y”. Se puede
3
R. L Piña está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, rpinag@est.ups.edu.ec
K. M. Herrera está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, kherreraj@est.ups.edu.ec
J. J. Sisa está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, jsisa@est.ups.edu.ec
C. A. Nieves está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, cnievesm@est.ups.edu.ec
dejar expresado en una tabla mediante
las siguientes distinciones:

Tabla 1 - Registro de Cálculos para la Regresión


Lineal [2]

n x 𝒙𝟐 y 𝒚𝟐 (x)(y)
1 … … … … …
2 … … … … …
3 … … … … …
- … … … … … Grafica 5 - Puntos de Datos [1]
- … … … … …
- … … … … … Descripción: Datos expuestos como pares
- … … … … … ordenados graficados en el plano cartesiano.

n ∑ 𝒙 ∑ 𝒙𝟐 ∑ 𝒚 ∑ 𝒚𝟐 ∑(𝒙)(𝒚)

3. Estime la pendiente (𝒂𝟏 ) por medio de


la relación:

𝒏 ∑ 𝒚𝒊 𝒙 𝒊 − ∑ 𝒙 𝒊 ∑ 𝒚𝒊
𝒂𝟏 =
𝒏 ∑ 𝒙𝟐𝒊 − (∑ 𝒙𝒊 )𝟐

4. Estime el intercepto (𝒂𝟎 ) por medio de


la relación: Grafica 6 - Línea que se ajusta a los datos expuestos
[1]
̅ − 𝒂𝟏 𝒙
𝒂𝟎 = 𝒚 ̅
Descripción: Línea que se ajusta a la mayoría
5. Finalmente reescribir la ecuación con de los puntos de datos graficados,
los datos obtenidos en el cálculo: permitiéndonos encontrar una ecuación de a
aproximación igual a 𝒇(𝒙) = 𝒂𝟎 + 𝒂𝟏 𝒙 + 𝒆 o
𝒚 = 𝒂𝟎 + 𝒂𝟏 𝒙 bien solamente 𝒇(𝒙) = 𝒂𝟎 + 𝒂𝟏 𝒙 que se le
omite el error en caso de no requerir su cálculo.

INTERPRETACIÓN GEOMÉTRICA

Regresión Lineal:

4
R. L Piña está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, rpinag@est.ups.edu.ec
K. M. Herrera está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, kherreraj@est.ups.edu.ec
J. J. Sisa está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, jsisa@est.ups.edu.ec
C. A. Nieves está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, cnievesm@est.ups.edu.ec
CODIFICACIÓN EN MATLAB PARA syms X Y
X = 0:0.1:20;
REGRESION DE MINIMOS
Y = a0 + a1*X;
CUADRADOS plot(X,Y,'-b')
title('ecuacion de la recta');
xlabel('x');
1. Regresión Lineal: ylabel('y')
clc grid on
clear all
close all % REGRESION POLINOMIAL

disp('UNIVERSIDAD POLITECNICA else


SALESIANA- PRACTICA DE LABORATORIO canti = input('Ingrese la
2'); cantidad de pares ordenados que
disp('---------------------------- desee: ');
---------------------------------- disp('Ingrese los pares
-----'); ordenados: ')
disp('NOMBRE:RONAL PIÑA; KLEVER i = 0;
HERRERA; CLAUDIO NIEVES; xi1 = 0;
JHONNATHAN SISA '); yi1 = 0;
disp('FECHA: ');date() xyi1 = 0;
disp('AJUSTE MEDIANTE REGRESION xci2 = 0;
LINEAL Y POLINOMIAL'); xci3 = 0;
disp('---------------------------- xci4 = 0;
---------------------------------- xyi2 = 0;
-----'); while i<canti
condicion = input('Desea un ajuste x1 = input('x: ');
mediante una recta(1-si,0-no): '); y1 = input('y: ');
if condicion == 1 xc2 = x1^2;
cant = input('Ingrese la xc3 = x1^3;
cantidad de pares ordenados que xc4 = x1^4;
desee: '); xy1 = x1*y1;
disp('Ingrese los pares f = xc2*y1;
ordenados: ')
i = 0; i = i+1;
xi = 0;
yi = 0; xi1 = x1 + xi1;
xyi = 0; yi1 = y1 + yi1;
xci = 0;
while i<cant
xci2 = xc2 + xci2;
x = input('x: ');
xci3 = xc3 + xci3;
y = input('y: ');
xci4 = xc4 + xci4;
xy = x*y;
xc = x^2;
i = i+1; xyi1 = xy1 + xyi1;
xi = x + xi; xyi2 = f + xyi2;
yi = y + yi;
xyi = xy + xyi; end
xci = xc + xci; A = [canti xi1 xci2; xi1 xci2
end xci3; xci2 xci3 xci4];
a1 = ((cant*xyi)- B = [yi1; xyi1; xyi2];
(xi*yi))/((cant*xci)-(xi)^2); C = inv(A)*B
a0 = (yi/cant)-a1*(xi/cant); A0 = C(1:1:1)
A1 = C(2:1:2)
5
R. L Piña está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, rpinag@est.ups.edu.ec
K. M. Herrera está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, kherreraj@est.ups.edu.ec
J. J. Sisa está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, jsisa@est.ups.edu.ec
C. A. Nieves está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, cnievesm@est.ups.edu.ec
A2 = C(3:1:3)
syms X1 Y1
X1 = 0:0.1:20;
Y1 = A0 + A1*X1+A2*X1.^2;
plot(X1,Y1,'-b')
title('ecuacion de la curva');
xlabel('x');
ylabel('y')
grid on
end
EJEMPLO DE REGRESION LINEAL. -

Grafico 9- Regresión polinomial.

Grafico 7- Regresión lineal con 4 puntos.

Grafico 10- Aproximación a los puntos, regresión


polinomial.

Grafico 8- Grafico de la recta aproximada a las


coordenadas dadas.

EJEMPLO DE REGRESION POLINOMIAL. –

6
R. L Piña está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, rpinag@est.ups.edu.ec
K. M. Herrera está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, kherreraj@est.ups.edu.ec
J. J. Sisa está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, jsisa@est.ups.edu.ec
C. A. Nieves está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, cnievesm@est.ups.edu.ec
Available: http://www.fao.org/docrep/.
III. CONCLUSIONES [Último acceso: 1983].

 El proceso de regresión lineal nos


ayuda a encontrar una ecuación
solución por así llamarla, la cual abarca
a todos los datos de estudio permitiendo
como solución representar dichos datos
mediante la recta resultante la que nos
agiliza la representación gráfica, que en
vez de hacerlo por pares ordenados se
reemplaza por la ecuación solución
resultante en un intervalo designado, al
término de la finalización del proceso
realizado.
 El ajuste de curvas en ingeniería tiene
como aplicación principal a partir de
una serie de datos experimentales
realizar análisis de tendencias y pruebas
de comprobación de hipótesis
planteadas mediante el estudio
estadístico...
 Para realizar el método de regresión
lineal podemos utilizar software de
programación como por ejemplo
Matlab en el que podemos desarrollar
algoritmos que nos permitirán la
visualización, análisis y cálculo
numérico de los datos propuestos.

IV. REFERENCIAS

[1] J. M. D. Dennis J. Zill, Matematicas


Avanzadas para Ingenieria 2, Mexico,
D.F.: McGraw-Hill, Interamericana, 2008.
[2] G. González, «Regresión Lineal,» Práctica
de Laboratorio, Cuenca, 2017.
[3] S. C. Chapra, Metodos Numericos para
Ingenieros, Mexico, D. F.: Mc Graw-Hill
Interamericana, 2007.
[4] D. d. E. p. l. Pesca, «Depositos de
Documentos de la FAO,» 2017. [En línea].

7
R. L Piña está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, rpinag@est.ups.edu.ec
K. M. Herrera está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, kherreraj@est.ups.edu.ec
J. J. Sisa está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, jsisa@est.ups.edu.ec
C. A. Nieves está cursando Ingeniería Mecánica Automotriz, Universidad Politécnica Salesiana, Cuenca, Ecuador, cnievesm@est.ups.edu.ec