You are on page 1of 21

UNIDAD 3 - PASO 4 – ANALIZAR INFORMACIÓN A TRAVÉS DE LAS

MEDIDAS BIVARIANTES

PRESENTADO POR:

FERNANDO AUGUSTO GOMEZ


COD: 88.199.375

TUTOR: STEFFI LUZ PEÑA

GRUPO: 204040_252

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


ESTADISTICA DESCRIPTIVA
CUCUTA
2017
INTRODUCCION
La industria siempre va a necesitar que se resuelvan problemas que impliquen conjunto de
variables, cuando hay existe una relación entre ambas. Se necesita poder determinar modelos
que den explicación a esta relacion. Cuando, simultáneamente, contemplamos dos variables
continuas, aunque por extensión se pueden emplear para variables discretas cuantitativas,
surgen preguntas y problemas específicos. Se utilizaran estadísticos descriptivos y técnicas
de estimación para responder estas preguntas, y técnicas de contraste de hipótesis especiales
para resolver dichos problemas. Estos métodos mayormente se encuentran encuadrados entre
si con las técnicas de regresión y correlacion. Estas técnicas se encargan del análisis de los
datos para tener conocimientos sobre que es y que las relacionan entre si a dos o mas variables
de una población.
JUSTIFICACION

Gracias a este análisis podemos certificar que en nuestra vida son necesarios los métodos
estadísticos. En muchas áreas de nuestra historia como país hemos utilizados ciertos métodos,
como es el caso del ejemplo utilizado para la realización de este trabajo, ¨ víctimas del
conflicto armado en Colombia¨ nos han proporcionado los medios para la información
basados en los datos obtenidos y lograr ver la eficacia con la que se puede hacer este proceso.

OBJETIVOS
 estimar la recta de regresión por el método de mínimos cuadrados e interpretar su
ajuste.

 dibujar un diagrama de dispersión.


 Representar la recta que define la relación lineal entre dos variables.
 Determinar la relación entre dos o más variables a partir de la regresión lineal
simple y la regresión múltiple.
 Saber calcular la correlación entre dos variables.
Regresión y Correlación lineal Simple
-Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas.

Hay que seleccionar las variables “población cantidad de personas” y “producción en


millones”

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación


entre las variables.
Para realizar el diagrama de dispersión hay que utilizar funciones de Excel:
Primero debemos ordenar las variables:
Después seleccionar el grafico de dispersión:

Produccion Millones
80,000,000
y = 6.8457x - 3E+08
70,000,000
R² = 1
60,000,000

50,000,000

40,000,000

30,000,000

20,000,000

10,000,000

-
- 10,000,000 20,000,000 30,000,000 40,000,000 50,000,000 60,000,000

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. Es confiable?
y=6,8457x-3E+08
R² = 1 =100%
R2 = coeficiente de determinación, nos indica un confiabilidad de 100% en el modelo
matemático

4. Determine el porcentaje de explicación del modelo y el grado de relación de


las dos variables.
Coeficiente de correlación √1 =1 es una correlación Perfecta.

5. Análisis y conclusiones, a partir de los resultados obtenidos y aplicados al problema o


situación Estudiada.
Variables (X población cantidad), (Y Producción en Millones). Las variables se
correlacionan de manera perfecta, por lo tanto estas variables son validad para realizar
un análisis relacional.
CONCLUSIONES
Los métodos de correlación y regresión son de uso frecuente en diferentes casos de la vida.
Dado que no analizan la industria aportando datos que no son requeridos habitualmente, pero
aportan racionalidad a lo que veremos con detalle en las metodologías multivariadas,
comenzando por la más sencilla: la regresión múltiple. Se debe tener en cuenta que
habitualmente puede ser correcto predecir el valor de Y dentro del rango observado de X,
procedimiento llamado interpolación, sin embargo, es incorrecto extrapolar, es decir predecir
el valor de Y fuera del rango observado de X aplicando la ecuación de regresión, dado que
fuera de los valores observados la función puede cambiar.
REFERENCIAS BIBLIOGRAFICAS

 William Mendenhall y Dennos D. Wackerly. Estadística Matemática con:


http://www.vitutor.com/estadistica/bi/correlacion.html
 Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de
mercados. México City: Cengage Learning. Páginas 686 – 695.Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9
 Montero, J.M. (2007).Regresión y Correlación Múltiple. Madrid: Paraninfo.
Páginas 191 – 225.Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2
 Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. Paginas.
130 – 172. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

 Churchill, G.A. (2009).Análisis de Correlación y de Regresión Simple. México


City: Cengage Learning. Páginas 675 – 686 Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it
=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

ANEXOS LABORATORIOS

EJERCICIOS DE LABORATORIO

1. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie
de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión
arterial un tiempo después.
X (sal) Y (Tensión)

1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables

CONSECUENCIAS CONSUMO DE SAL.


140

120

100
Tension arterial

y = 6,1062x + 88,128
80 R² = 0,987

60

40

20

0
0 1 2 3 4 5 6
consumo de sal

Las variables tienen una asociación lineal debido a su coeficiente 𝑅 2


Coeficiente de correlación es muy confiable en un 98%.
b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. ¿Es confiable?
De acuerdo al análisis del laboratorio en Excel:
𝑌 = 6.1062𝑥 + 88.128
Con un valor
𝑅 2 = 0.987
Coeficiente de correlación es muy confiable en un 98%.
c. Determine el grado de relación de las dos variables.

El grado de relación de las variables es:


𝑅 = √0.987 = 0.99
Igual al 0.99

d. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial


esperada?

𝑦 = 6,1062𝑥 + 88,128
𝑌 = 6,1062(4,8) + 88,128
𝑌 = 117.43

2. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado,


se ha considerado que era importante ir anotando periódicamente el tiempo medio
(medido en minutos) que se utiliza para realizar una pieza y el número de días desde
que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los
operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de
producción.
Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.

PROCESO ARTESANAL
50
45
40
35
30
Y 25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
X

Se tiene una asociación aproximadamente potencial.

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. Es confiable?
PROCESO ARTESANAL
50
45
40
35
Y 30
25
y = 126,1x-0,433
20
R² = 0,9807
15
10
0 10 20 30 40 50 60 70 80
X

𝑌 = 126,1𝑋 −0,433
El modelo es muy confiable ya que 𝑅 2 = 0,9807

c. Determine el grado de correlación de las dos variables.


𝑅 2 = 0,9807
𝑅 = √0,9807 = 0,9903
𝑅(%) = 99,03%

d. ¿Qué tiempo deberá tardarse un empleado cuando lleven 80 días?


𝑌 = 126,1𝑋 −0,433
𝑌 = 126,1(80−0,433 )
𝑌 = 18,9093

3. Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que


permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello
selecciona 10 niños y realiza las mediciones respectivas.
A continuación se presentan los resultados:

Estatura (cm) 120 124 107 118 112 110 115 104 110 116

Peso ( kg) 24 23 19 24 21 19 22 16 20 23

a. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.
Como variable independiente el peso y dependiente la estatura:
NUTRICIONISTA
125

120

115

110

105

100
15 17 19 21 23 25

b. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. Es confiable?

NUTRICIONISTA
130

125

y = 2.1576x + 68.074
120
R² = 0.8329

115

110

105

100
15 17 19 21 23 25

Si es confiable el modelo:
𝑌 = 2,1576𝑋 + 68,074

c. Determine el grado de correlación de las dos variables.


𝑅 2 = 0,8329
𝑅 2 (%) = 83,29%
𝑅 = √0,8329 = 0,9126
𝑅 = 91,26%

d. ¿Cuál es el peso que debería tener un estudiante que mida 120 cm?
𝑌 = 2,1576𝑋 + 68,074
120 = 2,1576𝑋 + 68,074
𝑋 = 24,0665

LABORATORIO

EJERCICIOS

4. Se quiere estudiar la asociación entre consumo de sal y tensión arterial. A una serie
de voluntarios se les administra distintas dosis de sal en su dieta y se mide su tensión
arterial un tiempo después.

Y
X (sal)
(Tensión)
1,6 98
2,3 102
3,3 109
4,2 113
4,6 115
5,0 120

e. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables

Y (TENSIÓN)
125
120
115
110
y = 4,3714x + 94,2
105 R² = 0,9793
100
95
90
85
80
0 1 2 3 4 5 6 7
Las variables tienen una asociación lineal debido a su coeficiente 𝑅 2

f. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. Es confiable?
De acuerdo al análisis del laboratorio en Excel:

𝑌 = 4.37𝑋 + 94.2
Con un valor
𝑅 2 = 0.9793
Es decir un 97.93% de confiabilidad del modelo.

g. Determine el grado de relación de las dos variables.

El porcentaje de explicación es 97,93%


El grado de relación de las variables es:
𝑅 = √0.9793 = 0.9895
Igual al 98,95%.

h. Si a un paciente se le administra una dosis de sal de 4,8. ¿Cuál es la tensión arterial


esperada?

𝑌 = 4.37𝑋 + 94.2
𝑌 = 4.37(4,8) + 94.2
𝑌 = 115,176

5. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado,


se ha considerado que era importante ir anotando periódicamente el tiempo medio
(medido en minutos) que se utiliza para realizar una pieza y el número de días desde
que empezó dicho proceso de fabricación. Con ello, se pretende analizar como los
operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso de
producción.
Los siguientes datos representan dicha situación:

X 12 23 35 42 53 65 70
Y 45 30 27 25 23 21 20

e. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.

proceso artesanal
50
45
40
35
30
Y 25
20
15
10
5
0
0 10 20 30 40 50 60 70 80
X

Se tiene una asociación aproximadamente potencial.

f. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. Es confiable?

proceso artesanal
50
45
40
35
Y 30
25
y = 126.1x-0.433
20
R² = 0.9807
15
10
0 10 20 30 40 50 60 70 80
X
𝑌 = 126,1𝑋 −0,433
El modelo es muy confiable ya que 𝑅 2 = 0,9807

g. Determine el grado de correlación de las dos variables.


𝑅 2 = 0,9807
𝑅 = √0,9807 = 0,9903
𝑅(%) = 99,03%

h. Que tiempo deberá tardarse un empleado cuando lleven 80 días?


𝑌 = 126,1𝑋 −0,433
𝑌 = 126,1(80−0,433 )
𝑌 = 18,9093

6. Una Nutricionista de un hogar infantil desea encontrar un modelo matemático que


permita determinar la relación entre el peso y la estatura de sus estudiantes. Para ello
selecciona 10 niños y realiza las mediciones respectivas.
A continuación se presentan los resultados:

Estatura (cm) 120 124 107 118 112 110 115 104 110 116

Peso ( kg) 24 23 19 24 21 19 22 16 20 23

e. Identifique la variable dependiente (y) y la variable independiente (x), realice el


diagrama de dispersión y determine el tipo de asociación entre las variables.
Como variable independiente el peso y dependiente la estatura:
Nutricionista
125

120

115

110

105

100
15 17 19 21 23 25

f. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre
la otra. Es confiable?

Nutricionista
130

125

y = 2.1576x + 68.074
120
R² = 0.8329

115

110

105

100
15 17 19 21 23 25

Si es confiable el modelo:
𝑌 = 2,1576𝑋 + 68,074

g. Determine el grado de correlación de las dos variables.


𝑅 2 = 0,8329
𝑅 2 (%) = 83,29%
𝑅 = √0,8329 = 0,9126
𝑅 = 91,26%

h. ¿Cuál es el peso que debería tener un estudiante que mida 120 cm?
𝑌 = 2,1576𝑋 + 68,074
120 = 2,1576𝑋 + 68,074
𝑋 = 24,0665

DESARROLLO.

Regresión y Correlación lineal Simple


A partir de la base de datos suministrada, cada estudiante debe:
-Identificar dos variables cuantitativas de la situación estudiada que puedan estar
relacionadas.
Se seleccionan las variables tasa de desempleo y tasa de empleo:

- Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación


entre las variables.
Al ordenar las variables y realizar el diagrama de dispersión se obtiene lo siguiente:
Se observa que existe un comportamiento lineal entre las variables.

- Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?
Al realizar el modelo matemático que describe el comportamiento de las variables, siguiendo
el procedimiento determinado en el laboratorio se encuentra lo siguiente:

De acuerdo al valor de 𝑅 2 se puede afirmar que el modelo no es confiable, por tanto las
variables no tienen un comportamiento lineal, ni se relacionan entre ellas.

- Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.
Como se tiene que 𝑅 2 = 0,5483, su valor porcentual sería de 𝑅 2 (%) = 54,83%. Por tanto
el valor de 𝑅 = 0,7404 y su valor en porcentaje corresponde a 𝑅(%) = 74,04%

- Relacionar la información obtenida con el problema.


De acuerdo a los valores obtenidos en la regresión de las dos variables, se observa que estas
no tienen ninguna correlación, por tanto se puede afirmar que la tasa de desempleo no tiene
un comportamiento lineal con la tasa de empleo y por tanto no son dos variables que
dependan una de la otra.

You might also like