Regresion Lineal

REGRESIN
LINEAL.
Realizado por:
Gissel Flores.
Profesor:
Ing. Nestor Asmal.
Curso:
3ero de
Bachillerato B

2

INTRODUCCIN.
En estadstica la regresin lineal modela, en la forma de una ecuacin matemtica, lar elacin
entre dos variables X e Y. Se adapta a una amplia variedad de situaciones. E n la investigacin
social, el anlisis de regresin se utiliza para predecir un amplio rango de fenmenos, desde
medidas econmicas hasta diferentes aspectos de comportamiento humano. En el contexto de
la investigacin de mercados puede utilizarse para determinar en cul de diferentes medios de
comunicacin puede resultar ms eficaz invertir; o para predecir el nmero de ventas de un
determinado producto.
En fsica se utiliza para caracterizar la relacin entre variables o para calibrar medidas, etc.
Tanto en el caso de dos variables (regresin simple) como en el de ms de dos variables
(regresin mltiple), el anlisis de regresin lineal puede utilizarse para explorar y cuantificar la
relacin entre una variable llamada dependiente o criterio (y) y una o ms variables llamadas
independientes o predictorias (
), as como para desarrollar una ecuacin lineal con

fines predictivos. Adems, el anlisis de regresin lleva asociados una serie de procedimientos
de diagnostico (anlisis de los residuos, puntos de influencia) que informan sobre la estabilidad
e idoneidad del anlisis y que proporcionan pistas sobre como perfeccionarlo.

Objetivo: Proporcionar los fundamentos del anlisis de regresin, fomentar la comprensin
de cuando y como utilizar el anlisis de regresin lineal, y como interpretar los resultados.
Determinar la relacin de dependencia que tiene una variable respecto a otra.
Ajustar la distribucin de frecuencias de una lnea, es decir, determinar la forma de la
lnea de regresin.
Predecir un dato desconocido de una variable partiendo de los datos conocidos de
otra variable.
1. QU SON LAS UNIDADES Z?
En estadstica tambin se las conoce como PUNTUACIONES NORMALIZADAS. Es el nmero de
grupo.
Las puntuaciones que se han transformado o convertido en distancias de desviacin estndar,
onocen como puntuaciones Z, e.d., Z determina la posicin relativa de una
puntuacin dentro de su propia distribucin.
diferencia en unidades de desviacin tpica al dividir por ella.
Las cantidades de las unidades Z son a-dimensionales, e.d., son independientes de las unidades
empleadas. x -
Z = ------- = media aritmtica de la distribucin
S S = desviacin tpica de la distribucin

2. PROPIEDADES DE LAS UNIDADES Z:

3

Si se transforma una distribucin en unidades Z, no vara la forma de la distribucin
original (si es asimtrica, lo seguir siendo).
La media de los valores de Z = 0
La S
2
= S = 1.
Z
2
= N.

3. LA TRANSFORMADA Z.

Con la llegada de las computadoras digitales, rpidas y baratas, se ha renovado el nfasis
en el anlisis y diseo de sistemas digitales, que representan una clase importante de sistemas
en ingeniera. Gran parte del mpetu inicial de clculo finito se debi a la necesidad de llevar
todo a cabo interpolaciones y aproximar derivadas e integrales. Ms tarde, se inventaron
mtodos numricos para la solucin de ecuaciones diferenciales.

Como la transformada z se relaciona con las sucesiones, primero revisamos la notacin
asociada con las sucesiones. Una sucesin finita *
= {
}.
Observamos que el conjunto de nmeros est ordenado, as que la posicin en la
sucesin es importante. La posicin est identificada con el ndice de posicin k es un entero.
Si el nmero de elementos del conjunto es infinito tenemos entonces una sucesin infinita.
*
= {
+.

Cuando tratamos con muestras de funciones de tiempo t, es necesario contar con
medios que nos permitan tener t<0. Para hacer esto, permitimos que la sucesin de nmeros
se extienda al infinito en ambos sentidos de la posicin inicial
y escribimos
*
= {
+.
Las sucesiones *
para las cuales
=0 (k<0) son llamadas sucesiones causales por

analoga con las funciones causales f(t)H(t) de tiempo continuo, definido como:

f(t)H(t)= 0 (t < 0)
f(t) (t 0)

Mientras que para algunas sucesiones finitas es posible especificar la sucesin haciendo
una lista de todos los elementos del conjunto, lo normal es que una sucesin este especificada
por una frmula de su elemento general

4. REGRESIN SIMPLE
Supongamos que tenemos dos series de n valores, cada uno de ellos de dos variables w
y y:
, ,
. La variables x y y se toman como variables aleatorias. Hemos

demostrado ya que la mejor ecuacin lineal para la prediccin de y, si x esta dodo, se
encuentre por el mtodo de los mismos cuadrados. El valor de y obtenido de esta forma,
digamos, y= a+bx, se llama la regresin de y en x. Las ecuaciones normales para la
determinacin de a y b son:
,

Por el contrario, si conocemos y y queremos predecir x, utilizamos la ecuacin lineal x=
A+By, llamada la regresin de x en y. El mtodo de los mnimos cuadrados nos da esta vez las
siguientes ecuaciones normales para la determinacin de a y b:

.
Se observar que los papeles de x y y han cambiado.
5. REGRESION LINEAL MULTIPLE
4

En muchos casos prcticos, una variable puede depender de ms de una variable
independiente. Si las variables de este tipo cambian al azar completamente, se puede usar la
regresin simple como en el caso de una variable independiente, aun cuando esto produce
cierta prdida en la precisin de nuestro clculo. Sin embargo, si las variables independientes
tienden a variar de acuerdo con algn patrn o norma, la regresin simple da lugar a
resultados confusos, y se tiene que emplear la regresin mltiple. La diferencia entre ambos
mtodos radica en el hecho de que la regresin mltiple establece el efecto de una variable
independiente, y las otras variables del mismo tipo de mantienen constantes, en tanto que la
regresin simple no controla a las otras variables.
Un ejemplo de problema de regresin mltiple lo proporciona la influencia de las
temperaturas del aire y del enfriante en la eficiencia de un motor. Puesto que el clima influye,
las dos temperaturas tiendes a ser bajas o altas al mismo tiempo, y una sola correlacin
mltiple es la que logra esto.
Ecuacin de regresin
Considere el caso general de una relacin lineal entre el valor del medio de la variable
dependiente y, y las variables independientes
, ,
, esto se puede expresar as:

Y=

Donde
es una constante y
, ,
son los coeficientes parciales de regresin.

Esta ecuacin representa un plano en (k+1) dimensiones.

6. EMPLEO DE MATRICES
Como se ha visto la regresin lineal mltiple da lugar a una serie de ecuaciones
simultneas que tienen que ser resueltas. Tales ecuaciones se pueden representar de la
siguiente forma matricial compacta: AX=B, donde Ay B son matrices provenientes de datos
experimentales, y X es el vector desconocido (los coeficientes de regresin que deben ser
determinados).

En el caso que solo intervengan dos coeficientes
,

A=
X=
B=
y

7. CORRELACIN
Cabe destacar el hecho de que como se ha ajustado una relacin de lnea a un nmero
de observaciones, esto no significa que los datos fsicos sigan realmente una lnea recta. Por
ejemplo, puede haber una relacin cclica (o de cualquier otra forma) en la que se muestre un
incremento general de y con x, que se podra representar mediante una recta. En la figura se
presenta un ejemplo de esto, y resulta evidente que, aun cuando se ha ajustado una lnea que
satisface el valor mnimo de la suma de los cuadrados de las desviaciones, su suma es grande.
Por tanto, es posible distinguir las desviaciones de las observaciones y en lo referente a su
media. La diferencia que existe entre ambas variaciones, expresada en una forma matemtica
adecuada, da la cantidad de variacin producida por la regresin, y cuanto mayor sea dicha
cantidad, tanto mejor ser el ajuste.
5

Por consiguiente, es claro que despus de realizar la operacin de ajustas la mejor lnea
se debe hacer una prueba de la bondad de ajuste. Sin embargo, antes de hacer esto, es
pertinente comentar de manera ms detallada la variacin respecto a la line a de regresin.

8. CORRELACIN SIMPLE
Una medida para la regresin lineal entre dos variables x y y se describe como el
coeficiente de correlacin simple; esta dada por la formula:
r=
()()
()
()

Donde x y y son las medias muestrales de x y y. El coeficiente de correlacin muestral r
provee una estimacin emprica del coeficiente de correlacin poblacional p.
Si r=0 las variables se dice que estn en un sentido probabilstico, pues es posible, por
ejemplo, que la varianza de y dependa de x, y as sucesivamente. Si suponemos que tenemos
una distribucin normal conjunta de las variables aleatorias x y y, podemos probar la
significacin de r. Calculamos la cantidad t=
()

MEDIA
Este es el tipo de promedio ms comn, el cual a menudo se denomina simplemente,
promedio o media, siendo este ultimo trmino el que se empleara con ms frecuencia aqu. La
media es un valor tal que la suma de las desviaciones o diferencias entre las observaciones y
dicho valor es cero; por tanto, equivale a la suma de las observaciones dividida entre el
nmero de ellas: X=
donde
es una observacin o medida, N el nmero total de

observaciones y x, la media.

9. DESVIACION ESTANDAR
Si bien la variancia es una medida fundamental de dispersin, no es del todo prctica y
conveniente, dado que sus unidades son los cuadrados de las unidades de la variable. Ms an,
muchas caractersticas numricas de las distribuciones se expresan directamente en trminos
de la raz cuadrada de la variancia. Por lo tanto, es preferible referirse a dicha raz cuadrada
con el nombre de desviacin estndar . Esta cantidad es entonces la desviacin media
cuadrtica de la desviacin y siempre es positiva. Sus unidades son las mismas que las de la
variable. Es por tanto: = (

6

10. DESVIACION ESTANDAR DE LA MEDIA
Se utiliza la siguiente frmula, la cual es la unin de las frmulas de media y desviacin
estndar:

()
Como generalmente sucede, N es muy grande ,es trminos de las desviaciones

estndares:
. Esta ecuacin se puede aplicar tambin al muestreo con reposicin,

tanto en el caso de una poblacin finita como en el de una infinita.
11. FUNCION GAUSSIANA
La distribucin de estos errores se puede derivar de consideraciones matemticas y est
dada por la llamada funcin gaussiana: y=
en el cual X es el error (esto es, la desviacin

a partir de la media o valor verdadero); y es la probabilidad de que ocurra este error (o en
trminos ms estrictos, de un error en el intervalo que va de X a X + X): e es la base de
logaritmos naturales: C es la constante que determina como se ver ms adelante, la altura
mxima de la curca; y h es la constante de dispersin de la curva, es decir, expresa la precisin
de la medicin, y se conoce como la constante de precisin.
La constante gaussiana, dada por l anterior ecuacin, puede considerarse desde ahora
perspectiva, a saber, como una frmula (aproximada) emprica para la distribucin de
numerosas cantidades fsicas que tienen una magnitud que vara de manera continua. Ambas
funciones son muy importantes en el trabajo estadstico.

12. CONCLUSIONES Y RECOMENDACIONES:
Pudimos efectuar comparaciones de coeficientes y formulas estadsticas de las distintas
variables que analizamos. Para realizar un anlisis estadstico de comparacin es necesaria la
aplicacin de formulas matemticas. Regresin y correlacin lineal son dos herramientas para
investigar la dependencia de una variable dependiente y en funcin de una variable
independiente x. y = f(x), y = variable dependiente que se desea explicar o predecir, tambin se
llama regresor o respuesta, x = variable independiente, tambin se llama variable explicativa,
regresor o predictor.

13. BIBLIOGRAFA:

Clculo de Probabilidades y Estadstica.H.FERNANDES-ABASCAL, MARTA M. GUIJARRO,
JOS LUIS ROJO y JOS A. SANZ.
Matemtica y Estadstica para Economistas. GERARD TINTNER y CHARLES B. MILHAM.
Matemtica Avanzada para Ingenieros de Glyn James.

Regresion Lineal

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Regresion Lineal

Uploaded by

Copyright:

Available Formats

REGRESIN

), as como para desarrollar una ecuacin lineal con

para las cuales

=0 (k<0) son llamadas sucesiones causales por

. La variables x y y se toman como variables aleatorias. Hemos

, esto se puede expresar as:

son los coeficientes parciales de regresin.

es una observacin o medida, N el nmero total de

Como generalmente sucede, N es muy grande ,es trminos de las desviaciones

. Esta ecuacin se puede aplicar tambin al muestreo con reposicin,

en el cual X es el error (esto es, la desviacin

You might also like