You are on page 1of 11

PROYECTO FINAL

CARLOS BUGUEÑO ROJO

Instituto IACC

12/08/2018
Desarrollo

1. Utilizando la variable “Tipo de licencia”, se pide:

a. Identifique la población.

Tipo de licencia N° de conductores


A1 29
A2 37
B 114
180

b. Clasifique la variable en estudio.

La variable en estudio “Tipo de licencia” es una variable cualitativa


ordinal porque se puede ordenar, por ejemplo A1, A2, B.

c. Construya un gráfico circular para la variable “Tipo de licencia”. Considere la


table adjunta en la hoja de desarrolla.

Tipo de licencia N° de conductores


A1 29
A2 37
B 114

A1 A2 B

16%

21%
63%
2. Considerando el histograma que se presenta a continuación:

a. Realice la interpretación del histograma.


Para la interpretación del histograma considere los siguientes cuatro aspectos:
la forma de la distribución (coeficiente de asimetría), el rango de la distribución,
la mayor y menor frecuencia.

Edad

Media 36,25
Error típico 0,424415836
Mediana 36
Moda 33
Desviación estándar 5,694135962
Varianza de la muestra 32,42318436
Curtosis 0,018144687
Coeficiente de asimetría -0,112625711
Rango 32
Mínimo 22
Máximo 54
Suma 6525
Cuenta 180

Forma de la distribución: Es una asimetría negativa porque la mayoría de los


datos se encuentran por debajo de la media, dado que su coeficiente de
asimetría es de -0,113 (<0) presenta una baja concentración de los datos.
Rango de la distribución: Es de 32 años según la aplicación del modelo
matemático para el cálculo del rango de la distribución Rg=Ls-Li, entonces
Rg=54-22=32 años, ya que el rango mide la variabilidad en los extremos de la
distribución
La mayor y menor frecuencia: según tabla de distribución de frecuencias anexa
en Excel, la mayor es de 48 y la menor es de 1
El Rango mayor es 27%, es 34-38
El Rango menor es 1%, es 50-54

b. Para la variable “Edad”, interprete las medidas de tendencia central.

Media
36,25 años
Edad promedio de conductores
Mediana
36 años
Edad que divide la distribución en dos; es decir el valor central para las edades
de los conductores.
Moda
36 años
Edad de la mayoría de los conductores

3. Utilizando la información de la base de datos, realice lo siguiente:

a. Construya una tabla bidimensional de frecuencia absoluta que resuma la


información con respecto a las variables “Rango de tiempo” y “Experiencia”.

Cuenta de Experiencia Etiquetas de columna


Etiquetas de fila Alta Baja Media Total general
0,8 - 1,4 2 1 3 6
1,4 - 2,0 25 8 20 53
2,0 - 2,6 38 15 40 93
2,6 - 3,2 11 3 12 26
3,2 - 3,8 2 2
Total general 76 27 77 180

Marca de
Rango tiempo Experiencia fi Fi hi (fi/N) Hi %
Clase
0,8 - 1,4 Baja 1,1 1 1 0,01 0,01 0,56
0,8 - 1,4 Media 1,1 3 4 0,02 0,02 2,22
0,8 - 1,4 Alta 1,1 2 6 0,01 0,03 3,33
1,4 - 2,0 Media 1,7 20 26 0,11 0,14 14,44
1,4 - 2,0 Alta 1,7 25 51 0,14 0,28 28,33
1,4 - 2,0 Baja 1,7 8 59 0,04 0,33 32,78
2,0 - 2,6 Alta 2,3 38 97 0,21 0,54 53,89
2,0 - 2,6 Media 2,3 40 137 0,22 0,76 76,11
2,0 - 2,6 Baja 2,3 15 152 0,08 0,84 84,44
2,6 - 3,2 Alta 2,9 11 163 0,06 0,91 90,56
2,6 - 3,2 Baja 2,9 3 166 0,02 0,92 92,22
2,6 - 3,2 Media 2,9 12 178 0,07 0,99 98,89
3,2 - 3,8 Media 3,5 2 180 0,01 1 100

b. Determine el porcentaje de conductores con experiencia baja o media y si


tienen un tiempo de reacción sobre 1,8 segundos.

Si se toma literalmente el porcentaje de conductores con experiencia


baja y un tiempo de reacción sobre 1.8 segundos entonces sería de un 10%

c. Determine el puntaje promedio de los conductores con experiencia media y un


tiempo de reacción de a lo más 2,3 segundos.

El promedio de conductores con experiencia media y un tiempo de


reacción de a lo más 2,3 seg es de 2.05 conductores
4. Considerando que la variable “Tiempo de reacción” que depende de la variable “Nivel
de alcohol”. Con esta información:

a. Construya un gráfico de dispersión que relacione las variables mencionadas.


Incluya la línea de tendencia lineal con su respectivo coeficiente de
determinación.

4.0

3.5 y = 0.9561x + 1.0126


R² = 0.8494
3.0
Nivel de Alcohol

2.5

2.0
Tiempo
1.5
Linear (Tiempo )
1.0

0.5

0.0
0.0 1.0 2.0 3.0
Tiempo

Resumen

Estadísticas de la regresión
Coeficiente de correlación
múltiple 0,921622499
Coeficiente de determinación
R^2 0,84938803
R^2 ajustado 0,848541895
Error típico 0,15934302
Observaciones 180

ANÁLISIS DE VARIANZA
Suma de Promedio de los Valor crítico
Grados de libertad cuadrados cuadrados F de F
Regresión 1 25,48782255 25,4878226 1003,84497 4,3715E-75
Residuos 178 4,519455223 0,0253902
Total 179 30,00727778
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%

Intercepción -0,707394309 0,063720335 -11,1015472 4,2695E-22 -0,8331388 -0,58164982 -0,8331388 -0,58164982

Tiempo 0,88835774 0,028038486 31,6835127 4,3715E-75 0,83302713 0,94368835 0,83302713 0,94368835

b. Interprete el coeficiente de determinación del modelo de regresión lineal.

El coeficiente de determinación lineal de 0.85 es alto, es decir como


medida de bondad de ajuste es alta e indica que en un 85% el nivel de
alcohol influye en el tiempo de reacción del conductor.

c. Utilizando el modelo lineal, estime el tiempo de reacción de un conductor que


marcó 1,8 gramos por litro de alcohol en la sangre.

Y= 0,9561X+1,0126
Y= 0,9561(1,8)+1,0126
Y= 2,73358
El tiempo de reacción de un conductor que marco 1.8 gramos
de alcohol en la sangre es de aproximadamente 2,73.

5. Considerando que la variable número de conductores seleccionados de un determinado


género en un conjunto de n conductores, es una variable aleatoria con distribución
binomial, realice las siguientes actividades:

a. Construya una tabla de distribución de frecuencias relativas con la variable


género.

Etiquetas de fila Cuenta de Género


Femenino 26,67%
Masculino 73,33%
Total general 100,00%

Símbolo de
Género fi hi Hi %
género
Masculino 1 132 0,73 0,73 73
Femenino 2 48 0,27 1 27
Total 180 1 100

1= Masculino 132
2= Femenino 48
Total 180
b. Si se seleccionan 40 conductores al azar, ¿cuál es la probabilidad de que 25 de
ellos sean de género masculino?

n= 40
k= 25
p= 0,7333
probabilidad= 0,088323725
8,832372512

c. Si se eligen 35 conductores al azar, ¿cuál es la probabilidad de que a lo más 11


de ellos sean de género femenino?

n= 35
k= 11
p= 0,2667
probabilidad= 0,798757829
79,87578291

6. Suponiendo que la base de datos constituye la población y considerando que la variable


“Tiempo de reacción” de los conductores es una variable aleatoria continua y que se
distribuye normalmente, conteste las siguientes preguntas:

a. ¿Cuál es el promedio y la desviación estándar poblacional de la variable tiempo


de reacción de los conductores?

Tiempo

Media 2,232777778
Error típico 0,03166035
Mediana 2,2
Moda 2,1
Desviación estándar 0,424768166
Varianza de la muestra 0,180427995
Curtosis 0,206071483
Coeficiente de asimetría 0,024533701
Rango 2,4
Mínimo 1
Máximo 3,4
Suma 401,9
Cuenta 180
b. ¿Cuál es la probabilidad de que un conductor seleccionado al azar tenga un
tiempo de reacción entre 2,1 y 3,2 segundos?

Miu µ
Sigma σ

µ=

σ2

promedio
poblacional
desviacion estandar poblacional

promedio
(∑fi*xi)/n 2,2 poblacional

desviacion estandar
= (∑(xi-u)elev2)/n-1 = 0 poblacional 0,43

Z1= (2,1)-(2,2)/0,43= -0,23255814

Z2= (3,2)-(2,2)/0,43= 2,325581395

0 1 1,5 2 2,5 3 3,5


2,1 3,2
aplicando tabla de distribución normal
Z2= 0,4898
Z1= 0,091
P(2,1≤X≤3,2)= 0,3988 0,40

la probabilidad de que un
conductor seleccionado al azar
es de 0,40
que porcentualmente
representa el 40%
el 0,40 se obtuvo de la resta de estandarizacion de la variable Z1 y Z2 (Z2 - Z1)
según la curva de distribucion normal de la cual se obtienen las areas de
probabilidad

Z1= 0,091
Z2= 0,4898
Estos numeros se buscan en la tabla de distribución normal
Z1 el area entre 2,1 y 2,2 tiene un valor de 0,091
Z2 el area entre 3,2 y 2,2 tiene un valor de 0,4898
Bibliografía

 IACC (2018). Estadística. Semana 1.


 IACC (2018). Estadística. Semana 2.
 IACC (2018). Estadística. Semana 3.
 IACC (2018). Estadística. Semana 4.
 IACC (2018). Estadística. Semana 5.
 IACC (2018). Estadística. Semana 6.
 IACC (2018). Estadística. Semana 7.
 IACC (2018). Estadística. Semana 8.