You are on page 1of 20

ESTADISTICA DESCRIPTIVA

MOMENTO 3

PRESENTADO POR:
MIRIAM EVELIA ROSERO CD: 36.752.129
BENJAMIN ACOSTA CD: 15816693
JESSICA ALEJANDRA CAMELO CD: 1.030.606.085
YENY LORENA PAZ CD:

GRUPO: 100105_142

TUTOR:
HECTOR IVAN BLANCO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


ESCUELA DE CIENCIAS ADMINISTRATIVAS, CONTABLES, ECONMICAS Y DE
NEGOCIOS ECACEN
MAYO- 2016.

INTRODUCCIN.
Por medio del siguiente trabajo se lleva a cabo la aplicacin de conocimientos referentes a la
regresin y determinacin mediante la realizacin de ejercicios empleando las medidas de
regresin y correlacin lineal simple y mltiple con variables cuantitativas que tienen que ver
con el caso estudiado a cerca de los accidentes de trnsito en la ciudad de Medelln.

JUSTIFICACIN.

En el presente informe se compararon datos cuantitativos para determinar su correlacin y de


sta manera analizarla, partiendo de una realidad que conocemos y entendemos se podrn
formular propuestas encaminadas a la transformacin de una realidad.
Mediante un proceso gradual de clasificacin, organizacin y tabulacin de datos hemos
analizado variables cualitativas y cuantitativas, lo que nos permite en ste momento elaborar un
laboratorio apoyados en el anlisis y frmulas del programa Microsoft Excel.
Adems de todo esto el trabajo permite distintas perspectivas que complementan la entrega final,
adquiriendo nuevas experiencias a travs de la ejercitacin de nuestras habilidades
interpretativas y argumentativas que se renen en torno a un tema comn en donde prevalece la
objetividad; todo esto a travs del trabajo colaborativo en donde asumiendo distintos roles
potencializamos nuestras capacidades y aportamos desde nuestras experiencias y fortalezas, con
responsabilidad y compromiso.

OBJETIVOS.

GENERAL
Determinar la correlacin entre dos variables cuantitativas a travs de un laboratorio de regresin
y correlacin lineal
ESPECFICOS

Analizar datos agrupados para encontrar su relacin

Participar en la consolidacin de un trabajo grupal que evidencie los aprendizajes


adquiridos

Determinar la relacin existente entre dos variables cuantitativas a travs de las


herramientas Infostat y Excel

LABORATORIO DE REGRESIN Y CORRELACIN LINEAL.


1-El rendimiento del producto de un proceso qumico est relacionado con la temperatura de
operacin del proceso. Se desea establecer la relacin que existe entre la pureza (y) del oxgeno
producido y el porcentaje de hidrocarburo (x) que est presente en el condensador principal en
un proceso de destilacin, de acuerdo con los siguientes datos:
X
(% de
Hidrocarburos)
0,99
1,02
1,15
1,29
1,46
1,36
0,87
1,23
1,55
1,4
1,19
1,15
0,98
1,01
1,11
1,2
1,26
1,32
1,43
0,95

Y
(Pureza)
90,01
a. Realice el diagrama de dispersin y determine
89,05
el tipo de asociacin entre las variables.
91,43
93,74
96,73
94,45
87,59
91,77
99,42
93,65
93,54
92,52
Posee tendencia
90,56 positiva y relacin directa entre el % de hidrocarburo y la
89,54
pureza puesto
que a medida que l % aumenta la pureza tambin aumenta es
89,85
decir que la pureza si depende del % de hidrocarburo. La ecuacin matemtica
90,39
es confiable93,25
en un 87,74%.
93,41
94,98
b. Encuentre el modelo matemtico que permite
87,33
predecir el efecto de una variable sobre la otra.

Es confiable?
y = 14,947x + 74,283

R = 0,8774

R= coeficiente de determinacin = 87,74% por lo tanto es


confiable
c. Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos
variables.
R= coeficiente de correlacin

R= 0,93% La correlacin es excelente

R= raz cuadrada de 0,8774


d. Cul es el porcentaje de hidrocarburo cuando la pureza del oxgeno es igual a 91,3?
y= pureza.
x= hidrocarburo?.
y= 91,3
91,3= 14,947x+74,283
91,3-74,283=14,947x
17,02/14,947=x
x= 1,13
Cuando el oxgeno es igual a 91,3 el porcentaje del hidrocarburo ser 1,13%.

2- El nmero de libras de vapor (y) consumidas mensualmente por una planta qumica, se
relaciona con la temperatura ambiental promedio (en o F). Para el ao 2014, se registraron los
siguientes valores de temperatura y consumo anual.

Mes

x Temperatura
(F)

y Consumo de
vapor (Lb)

Ene.
Feb.
Mar.
Abr.
May.
Jun.
Jul.
Ago.
Sep.
Oct.
Nov.
Dic.

21
24
32
47
50
59
68
74
62
50
41
30

185,79
214,47
288,03
424,84
455
539
621,55
675,06
562,03
452,93
369,95
273,98

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre las variables.


CONSUMO MENSUAL DE VAPOR POR UNA PLANTA QUIMICA
800
700

f(x) = 9.21x - 6.32


R = 1

600
500

CONSUMO DE VAPOR (LB) 400


300
200
100
0
10

20

30

40

50

60

70

80

TEMPERATURA F

Tendencia positiva, existe una relacin directa entre la temperatura y el consumo


de vapor, por lo tanto el nmero de libras de vapor consumidas mensualmente
por una planta qumica si se relaciona con la temperatura la cual est
representada en F, su correlacin es excelente con un 0,99%, la R = 99,99 lo
que significa que posee un alto grado de confiabilidad.

b. Encuentre el modelo matemtico que permite predecir el efecto de una


otra. Es confiable?
y = 9,2087x - 6,3184

variable sobre la

R = 0,9999

R= coeficiente de determinacin= 99,99 % lo cual es confiable.


c.
Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables.
R= coeficiente de correlacin
R= raz cuadrada de 0,9999%
R= 0,99% La correlacin es excelente

d. Cul es el de consumo de vapor cuando la temperatura es de 70 F?

y= consumo de vapor?
x= temperatura en F
x= 70 F
y= 9,2087(70) + 6,3184
y= 644,609 + 6,3184
y= 650,9.
Cuando la temperatura es igual a 70 F el consumo de vapor ser 650,9%

3-Los investigadores estn estudiando la correlacin entre la obesidad y la respuesta individual


al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se
mide utilizando el umbral de reflejo de reflexin nociceptiva (y) que es una medida de sensacin
de punzada. Obsrvese que ambas, X e Y, son variables aleatorias.

x (porcentaje
de sobrepeso)

y (umbral de reflejo
de flexin
nociceptiva)

89
90
75
30
51
75
62
45
90
20

2
3
4
4,5
5,5
7
9
13
15
14

o b e s id a d y re s p u e s ta in d iv id u a l a l d o lo r
16
14
12
10
UMBRAL DE REFLEJO DE REFELXIN

f(x) = - 0.06x + 11.64


R = 0.11

6
4
2
0
10 20 30 40 50 60 70 80 90 100
% DE SOBREPESO

a-

Realice

el

diagrama de dispersin y determine el tipo de asociacin entre las variables.

b- Ajuste un modelo matemtico que permita predecir el efecto de una variable sobre la otra.
Es confiable?
y = -0,0629x + 11,642
R = 0,1115
Tendencia negativa, existe una relacin inversa entre % de sobrepeso y el umbral de
R= coeficiente de determinacin = 11,15 % por lo tanto no es confiable
reflejo de flexin a medida que aumenta el % de sobrepeso, disminuye el Umbral de
reflejo de flexin,
la correlacin
entre lasdel
dosmodelo
variables
es grado
mnima
un 0,33%,
c-Determine
el porcentaje
de explicacin
y el
decon
relacin
de lastambin
dos
es posible afirmar que este modelo no es recomendable puesto que posee un grado de
variables.
confiabilidad muy bajo por tener un R= 11,15%.
R=coeficiente de correlacin
R= raz cuadrada de 0,1115
R= 0,33% La correlacin es mnima

VEL
OCI
DA
D
(X)

NU
M
ER
O
DE
HE
RI
DO
S
(Y)
66 3 d-Cul es el umbral de reflejo de flexin nociceptiva, cuando hay un porcentaje
111 2 de sobrepeso, de 40?
66
1
80
2
75
8 y= umbral de reflejo de flexin nociceptiva?
66
0 x= porcentaje de sobrepeso
45
0
88
4 X= 40 % Sobrepeso
55
2 y= (-0,0629) (40)+ 11,642
70
6 y= -2,516 + 11,642
105 4 y= 9.126
88
1
69
2
Cuando el porcentaje de sobrepeso es de 40%, el umbral de
48
0
reflejo de flexin nociceptiva es de 9,126.
70
2
83
2
138 3
68
4 REGRESIN Y CORRELACIN LINEAL SIMPLE
77
2
81
5 Identificar dos variables cuantitativas de la situacin estudiada que puedan estar
50
2
relacionadas.
88
4
71
2
NUMERO
Y
55
0 DE HERIDOS DEPENDIENTE
VELOCIDAD
INDEPENDIENTE
X
78
2
80
1
68
1
74
3
75
4
83
9
65
0
60
3
83 15
95
2
86
2
68
0
55
1
88
0
63
2
70
0
78
4
83
2
138 3
55
0
66
2

INDICES ACCIDENTALIDAD EN MEDELLIN


20
15

NUMERO DE HERIDOS 10
5
0
20

f(x) = 0.03x + 0.35


R = 0.05
40

60

80

100

120

140

160

VELOCIDAD
Realizar el
diagrama de dispersin de dichas variables y determinar el tipo de asociacin entre las
variables.

Encuentre el modelo matemtico que permite predecir el efecto de una variable sobre la otra.
Es confiable?
y= 0,033x + 0,3492

R = 0,0453

R = coeficiente de determinacin= 4,53 % por lo tanto no es


confiable.
Determine el porcentaje de explicacin del modelo y el grado de relacin de las dos variables.
R= Coeficiente de correlacin
R= Raz cuadrada de 0,0453
R= 0,21 % No hay correlacin
Relacionar la informacin obtenida con el problema.
En el caso estudiado referente a la accidentabilidad en la Ciudad de Medelln el grado de
confiabilidad entre las variables Velocidad y Nmero de heridos es de 4,53%, lo cual significa

que no es confiable, no existe correlacin entre ellas ya que su coeficiente corresponde a 0,21%,
por lo tanto el nmero de heridos no depende de la velocidad de los conductores.
REGRESIN Y CORRELACIN LINEAL MLTIPLE
Identificar una variable cuantitativa dependiente y varias variables independientes del estudio de
investigacin.
y
x1
NUMERO VELOCID
DE
AD
MUERTOS

0
1
1
0
0
2
1
2
0
1
0
3
1
2
1
0
0
1
1
1
0
2
1
3
1
0

66
111
66
80
75
66
45
88
55
70
105
88
69
48
70
83
138
68
77
81
50
88
71
55
78
80

x2
GRADOS
DE
ALCOHOL
DEL
CONDUCT
OR
1,2
3,0
0,0
0,6
0,0
0,0
3,0
1,4
2,1
0,0
1,6
2,2
3,0
1,1
2,4
0,6
1,6
0,0
0,0
2,1
1,4
2,6
3,0
2,7
0,6
0,0

1
0
1
2
2
2
1
0
0
2
1
4
0
2
0
2
2
1
0
1
0
1
0
0
1
1
0
1
1
0
0
1
0
1
0
1
0
2
1
1

68
74
75
83
65
60
83
95
86
68
55
88
63
70
78
83
138
55
66
108
69
72
74
69
79
65
74
77
51
75
72
77
67
55
40
73
69
70
75
55

2,9
0,6
1,8
0,0
1,1
2,4
0,6
0,0
2,9
1,3
1,4
2,1
0,8
0,0
1,2
3,0
0,0
0,6
1,9
2,7
1,1
2,4
0,6
1,6
0,0
1,4
2,1
0,8
1,1
2,4
0,0
1,6
1,2
3,0
2,7
0,6
0,0
3,0
1,1
2,4

1
0
0
1
0
2
1
1
0
0
2
0
1
0
1
0
0
2
3
1
0
0
1
2
0
1
2
0
1
2
0
1
0
0
1
1
0
0
2
1

69
50
73
38
60
50
100
75
80
95
70
66
69
67
83
70
150
55
66
68
79
79
60
33
85
80
81
62
79
76
80
70
80
83
68
79
79
80
75
66

0,0
1,6
0,0
0,8
0,3
1,1
2,4
0,6
0,0
1,2
3,0
2,7
0,6
1,9
1,1
0,0
0,6
1,6
2,1
0,8
0,5
2,7
1,1
2,4
0,6
1,6
1,4
2,1
0,0
3,0
0,0
0,6
1,9
1,4
0,0
2,7
0,6
1,9
2,5
3,0

0
0
1
1
1
0
2
1
0
1
0
2
1
1

45
77
81
50
88
71
55
78
67
55
40
73
69
70

0,6
0,0
2,7
1,3
2,1
0,0
2,6
3,0
2,7
0,6
1,9
3,0
1,1
2,4

Realizar el diagrama de dispersin de dichas variables.

RELACIN: NUMERO DE MUERTOS Vs VELOCIDAD


4.5
4
3.5
3
2.5
NUEMRO DE MUERTOS

2
1.5
1
0.5
0
20

40

60

80

100

VELOCIDAD

120

140

160

RELACION: NUEMERO DE MUERTOS VS GRADOS DE ALCOHOL


4.5
4
3.5
3
2.5

NUMERO DE MUERTOS

2
1.5
1
0.5
0
0.0

0.5

1.0

1.5

2.0

2.5

3.0

GRADOS DE ALCOHOL

Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

0,264226981
0,069815897
0,053915314
0,82971621
120

ANLISIS DE
VARIANZA
Grados
de
libertad
Regresin

Residuos

117

Total

119

Suma de
cuadrados
6,04547491
7
80,5461917
5
86,5916666
7

Promedio de
los
Valor crtico
cuadrados
F
de F
3,02273745
8 4,39077596 0,014497109
0,68842898
9

3.5

Coeficie
ntes
Intercep 0,69339
cin
6471
Variable 0,00187
X1
0908
Variable 0,21383
X2
7562

Error Estadsti Probabil Inferior Superior Inferior Superior


tpico
co t
idad
95%
95%
95,0%
95,0%
0,34775 1,99391 0,048487 0,00468 1,38211 0,00468 1,382110
6788
2107
59
2397
0544
2397
544
0,00432 0,43274 0,665999 0,01043 0,00669 0,01043 0,00669
3386
1376
3
3148
1332
3148
1332
0,07404 2,88774 0,004623 0,06718 0,36048 0,06718 0,36048
9969
6795
41
5483
9641
5483
9641

y= 0,69339+ (-0,00187x1)+0,21383x2
y= 0,69339-0,00187x1+0,21383x2
Calcular la recta de regresin y el coeficiente de correlacin para probar estadsticamente su
relacin.
R^2=0,0698*100
R^2=6,98%
El modelo matemtico es confiable en un 6,98%
R=0,26
No hay correlacin entre las variables

Relacionar la informacin obtenida con el problema.


Los resultados estadsticos obtenidos indican que no hay relacin entre las variables: nmero de
muertos, grados de alcohol y velocidad, esto lo podemos identificar mediante el modelo
matemtico de regresin mltiple, y= 0,69339-0,00187x1+0,21383x2, a lo cual solo podemos
obtener un 6,98% de confiabilidad, teniendo en cuenta que el intervalo de correlacin es

invalida o no hay correlacin alguna. Por consiguiente e claro decir que los muertos dentro de la
accidentalidad en la ciudad de Medelln no dependieron de los grados de alcohol ni la velocidad.

CONCLUSION
Se puede concluir que se desarroll con claridad todo el trabajo y se cumplieron cada uno de
los lineamientos expuestos por la universidad nacional abierta y a distancia UNAD,
entendiendo cada uno de los procesos para llevar a cabo un desarrollo de una determina da
investigacin.

REFERENCIAS BIBLIOGRFICAS

Estadstica descriptiva. Campus virtual UNAD


http://campus03.unad.edu.co/ecbti04/mod/forum/view.php?id=3900

Ortegn Pava, Milton Fernando. Anlisis de las medidas univariantes


https://www.youtube.com/watch?v=Ktk263q-W-4

Jeanete Buitrago, Cecilia Crdenas. Fundamentos de estadstica. Universidad Santo


Toms, 2013