You are on page 1of 20

PRACTICAS DE ESTADSTICA CON STATGRAPHICS

PRACTICA 1
Conceptos previos. Manejo de Datos. Grficas. Descripciones univariantes. Transformaciones.
Utilizaremos el siguiente cuestionario para extraer algunas conclusiones: (Diligncialo tomando como
muestra a tus compaeros de curso)
CUESTIONARIO
Edad (en aos) ____
Peso (en kg.) ____
Altura (en cm) ____
Residencia durante el semestre: _____________________________________________
Tiempo que tardas (en minutos) en desplazarte desde tu domicilio actual a clase durante el curso:
____
Medio de transporte que utilizas: ___________________
CONCEPTOS TERICOS QUE HAY QUE SABER
Poblacin: Es el conjunto de entes o individuos en estudio.
Muestra: Es un subconjunto finito de elementos de la poblacin.
Variables: las caractersticas que poseen los elementos de la poblacin y que son objeto de estudio.
Dato: cada valor medido de la variable.
En nuestro caso estudiaremos un conjunto de caractersticas del colectivo de estudiantes de un
programa de la Universidad de Nario (Poblacin).
Tomaremos como muestra el subconjunto de dichas caractersticas correspondientes a los alumnos de
la asignatura de Estadstica y Demografa.
Puedes observar que existen diferencias entre las variables analizadas, por ello se clasifican del
siguiente modo:
TIPOS DE VARIABLES
Cualitativas: aquellas que no son medibles.
Cuantitativas: aquellas que son medibles. Estas se dividen a su vez en:
Discretas: toman valores en un conjunto numerable.
Continuas: toman valores en un conjunto no numerable (los nmeros reales o un intervalo).
DISTRIBUCIONES DE FRECUENCIAS
Frecuencia absoluta f
i
: es el nmero de veces que se repite un mismo dato.
Frecuencia relativa h
i
: h
i
= f
i
/ n, siendo n el nmero total de datos.
Frecuencia acumulada :

i
j
j i
f F
1
Frecuencia relativa acumulada:

i
j
j i
h H
1
Intervalos de clase
Algunas veces es necesario agrupar los datos en un nmero relativamente pequeo de clases que
no se superpongan entre s, de forma que no exista ambigedad con respecto a la clase a que
pertenece una observacin particular. El nmero de observaciones de una clase se llama frecuencia
de clase, si dividimos esta frecuencia por el nmero total de observaciones, se llama frecuencia
relativa de clase. La eleccin del nmero apropiado de clases depende del tamao de la muestra.
Para muestras de tamao moderado, n < 50, se suele elegir un nmero de clases igual a n , o bien
se usa la formula de Sturtges, (se toma el resultado de calcular el logaritmo de n, dividir por el
logaritmo de 2 y sumar 1), en general el nmero de clases no debe sobrepasar de 15, en casos de
muestras muy grandes. Es ms cmodo que la amplitud de todas las clases sea la misma (siempre que
sea posible). Las fronteras de clase se llaman lmites y el promedio aritmtico entre el lmite inferior y
el superior se conoce como marca de clase. (x es el valor que tomamos como representativo)
Distribucin de frecuencias
Llamamos as a una tabla que contiene los diferentes valores que toma la variable de inters (o los
intervalos) y las correspondientes frecuencias.
REPRESENTACIONES GRFICAS USUALES
Histograma
Es la representacin grfica, mediante rectngulos unidos entre s, de las frecuencias ordinarias
(absolutas o relativas) para datos agrupados.
Diagrama de barras (Barcharts)
Es la representacin grfica para datos sin agrupar de las frecuencias (absoluta o relativa)
ordinarias.
Polgono de frecuencias
Se representa de la forma usual, mediante puntos; las frecuencias en el eje de ordenadas y la
variable en el de abscisas. Despus se unen estos puntos por trozos de rectas. Es la representacin
grfica de las frecuencias acumulativas (absolutas o relativas) para datos agrupados.
Diagramas de sectores (Piecharts)
2
Se representan mediante crculos. A cada variable se le asocia el sector circular proporcional a su
frecuencia (es usual en atributos).
Diagramas de tallo y hojas (Stem and Leaf Display)
Es un mtodo semigrfico para variables cuantitativas con pocos datos
1. Se redondean los datos para tener dos o tres dgitos
2. Se disponen en dos columnas separadas por una lnea. La columna de la izquierda se asocia con el
tallo y la otra con las hojas.
3. Cada tallo define una clase y se representa slo una vez. El nmero de hojas representa la
frecuencia de la clase.
DESCRIPCIN NUMRICA DE LOS DATOS
Para datos categricos, la distribucin de frecuencias proporciona un resumen conciso y completo de
la muestra, pero para variables cuantitativas puede complementarse este resumen utilizando medidas
descriptivas numricas extradas de los datos.
Medidas de Posicin
Medidas de tendencia central:
Media (Average): es el promedio aritmtico de las observaciones

1
n
fi x
x
n
i
i

Mediana (Median): es el valor para el cual, cuando todas las observaciones se ordenan de manera
creciente, la mitad de estas es menor que este valor y la otra mitad mayor.
Moda (Mode): es el valor de la observacin cuya frecuencia es mayor.
Medidas no centrales
Los cuartiles dividen al conjunto de datos ordenados en cuatro partes iguales, el rango
intercuartlico es la diferencia entre el tercer y el primer cuartl. Si tenemos muchos datos se utilizan
los percentles, que los dividen en cien partes iguales. Todos son casos particulares de los cuantiles.
Medidas de variabilidad o dispersin
Permiten conocer la dispersin de los datos.
Varianza s
2
: es el promedio del cuadrado de las distancias entre cada observacin y la media del
conjunto de observaciones
n
f x x
s
n
i
i i

1
2
2
) (
3
Cuasi-varianza (Variance):
( )
1
1
2
2 *

n
f x x
s
n
i
i i
Desviacin tpica s: es la raz cuadrada positiva de la varianza.(El Statgraphics calcula la
cuasidesviacin tpica (Std. deviation)).
Recorrido o rango muestral (Range): es la diferencia entre el valor de la observacin mayor y el de
la menor.
Medidas de asimetra y curtosis
Comparan la distribucin con la distribucin normal.
El coeficiente de asimetra (Skewness) nos mide la simetra de la distribucin
3

1
3
1
) (
ns
f x x
g
n
i
i i


( )
( ) ( )
3
1
3
1
2 1 s n n
x x n
g
N
i
i


y el de curtoss o apuntamiento nos dice como es de achatada la distribucin

( )
3
4
1
4
2

ns
f x x
g
n
i
i i

( ) ( )
( ) ( ) ( )
( )
( ) ( ) 3 2
1 3
3 2 1
1
2
4
1
4
2

n n
n
s n n n
x x n n
g
n
i
i
Un grfico basado en los cuartiles
Diagramas de caja y bigotes (Box and Whisker Plot)
Nos sirve para mostrar los posibles datos atpicos, se construye de la forma:
1. Ordenar los datos de la muestra de menor a mayor, obtener el valor mnimo, el mximo y los
cuartiles Q
1
, Q
2
y Q
3
.
2. Dibujar un rectngulo cuyos extremos sean Q
1
y Q
3
, y dibujar la posicin de la mediana con una
lnea.
3. Calcular los lmites admisibles superior e inferior que van a servir para identificar los valores
atpicos

2
5 . 1 . .
2
5 . 1 . .
1 3
3
1 3
1
Q Q
Q S L
Q Q
Q I L

+


4. Considerar como valores atpicos los situados fuera del intervalo (L.I., L.S.), dibujarlos.
5. Dibujar una lnea que vaya desde cada extremo del rectngulo central hasta el valor ms alejado no
atpico.
PROCEDIMIENTO A SEGUIR EN ESTA PRCTICA
4
1. Observa el cuestionario, de las variables analizadas son todas iguales? Encuentras diferencias
entre ellas? Que diferencia observas entre la variable altura y la variable residencia? Y entre la
altura y la edad?
Clasifica las variables del cuestionario.
Encuentra todas las medidas descriptivas que conozcas, de cada una de las variables.
2. Introduce el resultado de la encuesta en un fichero de datos, llamado encuesta.
3. Haz la distribucin de frecuencias para la variable edad, teniendo en cuenta que es una variable
discreta.
4. Haz la distribucin de frecuencias para la variable altura, teniendo en cuenta que es una variable
continua, agrupndola en 5 intervalos. Lo mismo para el peso, pero con 4 intervalos.
5. Para cada variable del cuestionario representa el grfico que consideres ms interesante para su
representacin. Guarda cada uno de ellos en un archivo Word.
Contesta a las siguientes preguntas para cada variable continua: Que opinas de la simetra? Que
opinas del apuntamiento? Crees que la variable est muy dispersa?. Que valor (aproximadamente)
daras como representativo de la variable?
6. Calcula todas las medidas descriptivas que conozcas de cada una de las variables del cuestionario.
Compralas con las respuestas que habas dado al apartado 5. Qu coincide? Qu no coincide?
Compara las diferentes medidas de centralizacin. Cul es la ms adecuada en cada caso?
7. Haz el grfico de caja para la variable altura. Comntalo. Hay alguien en clase ms alto de lo
normal? y ms bajo?
8. Transforma la variable peso dividindola entre 10, a la nueva variable la vamos a llamar
transforma, crea otra variable, transfor2, que sea la variable sumada en 2. Halla la media y la varianza
de transforma y transfor2. Qu relacin tienen con las de peso?
9. Teniendo en cuenta los intervalos utilizados en el apartado 4, haz a mano la tabla de distribucin
conjunta de la variable altura y la variable peso.
5
EJERCICIOS COMPLEMENTARIOS
Resuelve los siguientes problemas con la ayuda del STATGRAPHICS
1. Un tipo de resistencias se fabrica con un valor nominal R = 10.000 W. Estas resistencias son
adquiridas por un cliente que las considera satisfactorias siempre que se encuentren dentro
de una tolerancia de t 15 W respecto del valor nominal. Se han analizado 49 resistencias de
este tipo con dicho valor nominal y han resultado los siguientes valores reales de resistencia,
en W:
9992 9990 9989 10000 9988 9998 9991 9993 9998 9997
9987 9994 10002 10004 10001 9987 9997 9992 9994 9998
9997 10007 9999 10000 10000 9998 9988 9996 9984 9986
9988 10005 9988 9993 10004 10017 10013 9994 10013 9995
10002 10004 9989 10000 10013 1005 9993 9993 10004
Se trata de responder a las preguntas siguientes utilizando el STATGRAPHICS
a) Agrupar estas observaciones en intervalos construyendo la tabla de frecuencias.
b) Construir el polgono de frecuencias relativas acumuladas y contestar a las siguientes preguntas
segn este polgono
- Qu % de resistencias tienen una resistencia inferior a la nominal?
-Cul es el recorrido intercuartlico?
c) Construir el histograma de frecuencias relativas.
d) Considerar la distribucin de las resistencias adquiridas por el cliente. Construir la tabla de
frecuencias correspondiente y el histograma de frecuencias relativas.
e) Calcular la media, mediana y moda, as como la varianza y la desviacin tpica de las dos
distribuciones.
f) En ambas distribuciones, calcular los valores que nos dejan el 25%, 40%, 50%, y 95% de
distribucin por debajo de ellos, respectivamente.
6
PRACTICA 2
Descripcin conjunta de dos variables. Resolucin de problemas
CONCEPTOS TERICOS QUE HAY QUE SABER
DESCRIPCIN CONJUNTA DE DOS VARIABLES
FRECUENCIAS
Tablas de doble entrada
Se da la frecuencia correspondiente a los valores de ambas variables a la vez.
DESCRIPCIN GRFICA
Histograma tridimensional
Es equivalente al bidimensional, los ejes X e Y corresponden a los valores de las variables y el eje Z a
los de la frecuencias conjuntas.
Diagrama de barras tridimensional
Es equivalente al bidimensional utilizando el eje Z para las frecuencias conjuntas.
Diagrama de dispersin o nube de puntos
Es la representacin de una variable en funcin de la otra mediante un punto.
DESCRIPCIN NUMRICA
Medidas de dependencia lineal
Si tenemos dos variables aleatorias X e Y se define
Covarianza: nos mide la relacin lineal entre X e Y,
y x
n
f y x
h y y x x S
ij
j i j i
j i j
j i
i xy

) )( (
,
Coeficiente de correlacin: es un coeficiente adimensional
r X Y
S
s s
xy
x y
( , )
, siendo s
x
y s
y
las desviaciones tpicas de X e Y.
Recta de regresin: Si las variables X e Y estn relacionadas linealmente al dibujarlas en una grfica,
los puntos se agrupan alrededor de una recta de regresin f(x) = a + bx, siendo (b = pendiente (slope)
a = interseccin (intercept))
7
b
S
s
a y bx
xy
x

2
,
PROCEDIMIENTO A SEGUIR EN ESTA PRCTICA
1. Halla el coeficiente de correlacin, la covarianza, y la recta de regresin del peso en funcin de la
altura. Dibjala y comntala. Estas de acuerdo con los resultados?
2. Se quiere investigar si es plausible que el peso de los bebs aumente linealmente en funcin de la
edad. Se tom una muestra de los pesos (en kg.) de bebs de varias edades (en meses), obtenindose
la siguiente tabla:
EDAD PESOS
1 4.5 3.9 4.7 4.9 3.3
2 5.9 6.0 5.8 5.7 5.2 5.3
3 6.3 6.0 5.9 6.4
4 7.2 7.6 6.9 7.5 7.1
5 9.1 8.9 8.7 9.5 9.6
6 10.0 9.9 9.8 10.1 10.5 10.7
a) Halla la ecuacin de la recta de regresin, el coeficiente de correlacin y la covarianza.
b) Predecir el peso para 7, 10 y 15 meses.
3. Se quiere investigar la relacin entre la elasticidad de cierto tipo de plstico y la temperatura de
coccin en su fabricacin. Se tom una muestra de siete medidas sobre elasticidad para cada una de
seis temperaturas, obteniendo:
TEMPERATURA ELASTICIDAD
100 113 118 117 118 112 114 112
110 127 132 128 129 130 126 129
120 136 144 138 139 135 134 137
130 146 156 149 148 151 147 150
140 150 157 156 160 158 151 152
150 160 158 150 153 155 150 151
a) Calcular y representar la recta de regresin de la elasticidad en funcin de la temperatura de
coccin. Crees que es fiable?
b) De la variable elasticidad, calcular la distribucin agrupada en 5 intervalos.
c) Dibujar el histograma de frecuencias.
8
4. Con el objetivo de ver la relacin entre horas trabajadas en un taller y unidades producidas, se
tom una muestra de ambas variables, obtenindose los siguientes resultados:
X=horas de trabajo diariasY=unidades producidas
X
Y
60 60 60 62 62 73 73 74 74 74 75 78 78 80 80 82 82 84 84 84 84
250 240 245 245 250 292 292 298 300 300 300 310 314 310 310 320 336 336 336 340 340
Se pide:
a) De la variable marginal 'horas de trabajo', calcular: Media, mediana, moda y varianza.
b) Determinar en ambas variables el rango intercuartlico. Agrupar la variable X en 5 intervalos e Y
en 4 intervalos y representa grficamente cada variable.
c) Calcular la recta de regresin de las unidades producidas sobre las horas de trabajo. Cul ser la
prediccin de unidades para 70 horas de trabajo?.
5. Sobre 16 individuos se estudian las siguientes caractersticas: el salario semanal (Y, en miles de
pesos), los aos de estudio (X1) y la edad (X2).
Y
X
X
200 200 300 250 175 150 150 300 300 150 175 200 175 100 150 350
1 17 12 17 17 13 8 8 17 12 12 12 8 8 11 13 13
2 28 40 32 32 36 40 30 36 34 34 36 36 40 28 30 40
Se pide:
a) Calcular las medias, medianas y moda de cada una de las variables. Representar grficamente las
tres de forma individual.
b) Cul es el intervalo salarial donde se encuentra el 90% de los individuos?
c) Qu variable tiene mayor dispersin?
d) Estimar el salario para una persona con 15 aos de estudios. Cunto vale el coeficiente de
correlacin lineal entre estas dos variables?
9
PRCTICA 3
Distribuciones de probabilidad
CONCEPTOS TERICOS QUE HAY QUE SABER
VARIABLE ALEATORIA
Se llama variable aleatoria a aquella cuyo valor est determinado por el valor del experimento.
TIPOS DE VARIABLES ALEATORIAS
Se llama v.a. discreta a aquella cuyos valores son un nmero finito de nmeros reales distintos.
Se llama v.a. continua a aquella cuyos valores son un intervalo, o una unin de intervalos sobre la
recta de los nmeros reales. Por tanto, puede tomar valores.
DISTRIBUCIN DE PROBABILIDAD
Se dice que tenemos una distribucin de probabilidad de la v.a. X, cuando asociamos probabilidades
a la v.a. que procede de un espacio de resultados probabilizado.
FUNCIN DE DISTRIBUCIN
Definimos la funcin de distribucin, F, de una v.a. X, como una funcin definida para cada nmero
real x, de la forma:

F(x) = P(X x) - < x <
FUNCIN DE PROBABILIDAD
Dada una v.a. X, de tipo discreto, se llama funcin de probabilidad P(X) a una funcin real, tal que
cuando la v.a. X toma un determinado valor x
i
, es igual a la probabilidad de que ocurra el suceso
que viene asociado a dicho valor x
i
de la variable. Es decir:
P(x
i
) = P( suceso al que representa x
i
, segn la v.a. X)
10
FUNCIN DE DENSIDAD
Se define la funcin de densidad en un punto x, como el lmite de la densidad media de probabilidad
de un intervalo, cuando la longitud del intervalo tiende a cero. Se representa por f(x) y ser:
f(x) = lim F(x + x) - F(x) = F(x)
x0 x
Vemos pues que la funcin de densidad es la derivada de la funcin de distribucin, f(x) = F(x)
ESPERANZA MATEMTICA
Tambin se le llama valor esperado de la distribucin. Es el valor central sobre el que se concentra
la distribucin de probabilidad. Es semejante a la media de una distribucin de frecuencias.

'


continua es a v la si dx X f X
discreta es a v la si i X P X
X E
i i
. . ) (
. . ) (
) (
MODELOS DE PROBABILIDAD
DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
Distribucin de Bernoulli
Realizar una prueba con nicamente dos resultados posibles, A (xito) y
A
(fracaso).
Llamaremos p = P(A) y q = 1 p = P(
A
)

'

caso otro en
x p p
x f
x x
0
1 , 0 ) 1 (
) (
1

'

<
<

1 0
1 0 1
0 0
) (
x si
x si p
x si
x F
11
E(X) = 0q + 1p = p Var(X) = p(1 p) = pq
Distribucin Binomial
Si se tienen n repeticiones independientes de un experimento Bernoulli; dichas probabilidades se
mantienen constantes a lo largo de las n repeticiones.
Se denota X B(n, p)

'

,
_

resto el en
n x si p p
x
n
x f
x n x
0
...., , 1 , 0 ) 1 (
) (
Haciendo 1 p = q:
x n x
n
x
q p
x
n
x F

,
_

0
) (
E(X) = np Var(X) = np(1-p) = npq
Distribucin de Poisson
Se denota X P()
El parmetro que distingue una distribucin se corresponde con la media de la distribucin.

'

caso otro en
x
x
e
x f
x
0
... , 2 , 1 , 0
!
) (

!
) (
x
e
x F
x

E(X) = Var(X) =
DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
12
Distribucin Uniforme
Se denota X U(a, b)

'

caso otro en
b x a si
a b
x f
0
1
) (
dx
a b
x F
x
a

1
) (
2
) (
b a
X E
+

12
) (
) (
2
a b
X Var

Distribucin Exponencial
f(x) = e
-

x
x 0
F(x) = P(X x) =

x
x
dx e
0

= 1 - e
-

x
E(X) =

1
Var(X) =
2
1

Distribucin Normal
Se denota X N(, ) , y se tiene :
2
2
) (
2
1
2
2
1
) (

x
e x f x R
dx e x F
x

2
2
) (
2
1
2
2
1
) (

x R
E(X) = Var(X) =
2
PROCEDIMIENTO A SEGUIR EN ESTA PRCTICA
13
1. a) Dibuja la funcin de densidad de la N(0,1). Seguidamente aade la N(0,0.5). Por ltimo aade la
N(0,3) Qu observas?
b) Dibuja ahora la funcin de distribucin de una N(25,1), aade N(25,3.5) y N(25,21). Modifica los
lmites del eje x a: -35, +85. Qu observas?
c) Utilizando la funcin de distribucin de N(25,21) anota el valor aproximado de F(40) y F(10).
2. a) Dibuja la funcin de probabilidad de un modelo de Poisson de medias 2, 5, 10. Qu ocurre al
aumentar la media?
b) Compara que una Poisson de media 25 se aproxima a una N(25,5). Qu ilustra ese resultado?
3. a) Dibuja una Bi(10,0.1), Bi(10,0.5) y Bi(10,0.9). Idem para n = 50. Qu ocurre al ir aumentando
el tamao de n?
b) Calcula aproximadamente para Bi(50,0.1): p(X 2) y p(X 9).
c) Comprueba que Bi(50,0.1) se aproxima a una Po(5).
4. a) Dibuja la funcin de densidad de los siguientes modelos uniformes: U(0,1), U(0,5) y U(4,6).
Qu observas?
b) Haz lo mismo para las exponenciales: exp(0.5), exp(1) y exp(2). Qu observas?
5. Calcula el valor de x
o
para:
a) X N(0,1), p(X x
o
) = 0.95, p(X x
o
) = 0.05, p(X>x
o
) = 0.05
b) X
2
20
, p(X>x
o
) = 0.05, p(X>x
o
) = 0.95
c) X t
15
, p(X>x
o
) = 0.01, p(X>x
o
) = 0.99
d) X U(8,12), p(X x
o
) = 0.35
e) X Exp(5.3), p(X x
o
) = 6
e)
6. Una centralita recibe unas 300 llamadas cada hora. No puede establecerse ms de 12 conexiones
por minuto. Se pide:
a) Probabilidad de que quede rebasada en un minuto dado.
b) Probabilidad de que reciba una sola llamada en un minuto dado.
7. Se ha comprobado que la duracin de la vida de ciertos elementos sigue una distribucin
exponencial con media 8 meses. Se pide:
a) Calcular la probabilidad de que un elemento tenga una vida entre 5 y 12 meses.
b) El percentil 0.9 de la distribucin.
14
PRACTICA 4
Estimacin. Contraste de hiptesis.
CONCEPTOS TERICOS QUE HAY QUE SABER
ESTIMACIN PUNTUAL
Estimador: Es una funcin de una muestra genrica X
1
,.....,X
n
, que utilizamos para aproximar un
parmetro desconocido de la poblacin. Una Estimacin ser el valor concreto que tomar el
estimador con la muestra concreta obtenida.
MTODOS DE ESTIMACIN
Los mtodos ms usados son:
a) Mtodo de los momentos:
Consiste en tomar como estimadores de los momentos de la poblacin a los momentos de la muestra.
b) Mtodo de mxima verosimilitud.
Es aquel valor que maximiza el valor de la funcin de verosimilitud.
ESTIMACIN POR INTERVALOS
El problema de estimacin por intervalo consiste en determinar un intervalo [a,b] tal que para un
nivel de confianza 1-, verifique que :
P( x [a,b])=1-
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN
NORMAL DE VARIANZA CONOCIDA

1
]
1
x Z
n
x Z
n
/ /
, ,
2 2

Donde Z
a/2
es el valor de la distribucin normal tipificada tal que el valor de la funcin de
distribucin en ese punto es 1-a/2.
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN
NORMAL DE VARIANZA DESCONOCIDA
15

1
]
1
x t
S
n
x t
S
n
/ /
,
2 2
1 1
Donde t
/2
es el valor de la distribucin t-Student tal que el valor de la funcin de distribucin en ese
punto es 1-/2.
CONTRASTE DE HIPTESIS
El problema del contraste de hiptesis consiste en decidir la veracidad de una hiptesis H
o
que
formulemos sobre la distribucin de la poblacin en base a los datos muestrales y la teora de la
probabilidad.
CONTRASTE DE UNA HIPTESIS NULA
CONTRASTE DE LA MEDIA DE UNA POBLACIN NORMAL CON VARIANZA
CONOCIDA
Contraste:
H
H
0 0
1 0
:
:

El contraste queda de la siguiente forma:


Si
[ ]
X
n
Z Z


0
2 2
,
aceptamos la hiptesis nula, y en caso contrario rechazamos H
o
.
Donde Z
/2
es el valor de la distribucin normal tipificada tal que el valor de la funcin de
distribucin en ese punto es 1 - /2.
CONTRASTE DE LA MEDIA DE UNA POBLACIN NORMAL CON VARIANZA
DESCONOCIDA
16
Contraste:
H
H
0 0
1 0
:
:

El contraste queda de la siguiente forma:


Si
X
S
n t t


0
2 2
1 ,
Aceptamos la hiptesis nula, y en caso contrario rechazamos H
o
.
Donde t
/2
es el valor de la distribucin t-Student con n-1 grados de libertad tal que el valor de la
funcin de distribucin en ese punto es 1-/2.
CONTRASTE DE LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES
NORMALES CON VARIANZAS CONOCIDAS
Contraste:
H
H
X Y
X Y
0 0
1 0
:
:




El contraste queda de la siguiente forma:
Si
[ ]
X Y
n n
Z Z
X
X
Y
Y

+



0
2 2
2 2
,
aceptamos la hiptesis nula, y en caso contrario rechazamos H
o
.
Donde Z
/2
es el valor de la distribucin normal tipificada tal que el valor de la funcin de
distribucin en ese punto es 1 - /2.
CONTRASTE DE UNA COLA
CONTRASTE DE LA MEDIA DE UNA POBLACIN NORMAL CON VARIANZA
CONOCIDA
17
Contraste:
H
H
0 0
1 0
:
:

<
El contraste queda de la siguiente forma:
Si
X
n
Z

>


0
aceptamos la hiptesis nula, y en caso contrario rechazamos H
o
.
Donde -Z

es el valor de la distribucin normal tipificada tal que el valor de la funcin de distribucin


en ese punto es .
CONTRASTE DE LA MEDIA DE UNA POBLACIN NORMAL CON VARIANZA
DESCONOCIDA
Contraste:
H
H
0 0
1 0
:
:

>
El contraste queda de la siguiente forma:
Si
X
S
n t

<

0
1
aceptamos la hiptesis nula, y en caso contrario rechazamos H
o
.
Donde t

es el valor de la distribucin t-Student con n-1 grados de libertad tal que el valor de la
funcin de distribucin en ese punto es 1 - .
PROCEDIMIENTO A SEGUIR EN ESTA PRCTICA.
1. En el men principal selecciona:
H. DISTRIBUTION FUNCTIONS (con INTRO).
5. Random generation (INTRO).
Genera dos muestras aleatorias de tamao 50 de una distribucin normal con la media y la varianza
que tu quieras. Para ello repite dos veces el siguiente procedimiento:
-Selecciona la opcin 14 (Normal )
-Especifica la media, la varianza y el tamao de la muestra.
18
-Especfica el nombre de la variable (muestra1 y muestra2 respectivamente) y el archivo
donde vas a guardarlas.
2. Haz un breve anlisis descriptivo de las dos muestras usando las tcnicas de las prcticas
anteriores.
3. Mediante la opcin:
G.ESTIMATION AND TESTING (INTRO)
Con: 1. One sample analysis.
a) Contrasta la hiptesis de que la media poblacional de la muestra1 es realmente la que t has
impuesto a un nivel de confianza del 98% suponiendo varianza desconocida.
b) Contrasta la hipotesis de que la media poblacional de la muestra2 es menor o igual que el valor que
tu has impuesto para la media a un nivel de confianza del 96%.
c) construye un intervalo de confianza para la media de la poblacin de la muestra1 al 99%.
Con: 2. Two sample analysis
a) construye un intervalo de confianza para la diferencia de medias, del 95%.
b) Para distintos niveles de confianza (3 niveles) contrasta la hipotesis de que las medias
poblacionales de ambas muestras son iguales.
EJERCICIOS COMPLEMENTARIOS
1. Con el objetivo de ver la relacin entre horas trabajadas en un taller y unidades producidas, se
tom una muestra de ambas variables, obtenindose los siguientes resultados:
X=horas de trabajo diariasY=unidades producidas
X
Y
60 60 60 62 62 73 73 74 74 74 75 78 78 80 80 82 82 84 84 84 84
250 240 245 245 250 292 292 298 300 300 300 310 314 310 310 320 336 336 336 340 340
Se pide, suponiendo normalidad:
a) Calcular el intervalo de confianza para la media poblacional de las horas trabajadas al nivel de
significacin de 0.05.
b) Contrastar la hiptesis de que la media poblacional de las unidades producidas es de 65 con un
nivel de confianza de 0.99.
2. Sobre 16 individuos se estudian las siguientes caractersticas: el salario quincenal (Y, en miles de
pesos), los aos de estudio (X1) y la edad (X2).
Y
X
X
200 200 300 250 175 150 150 300 300 150 175 200 175 100 150 350
1 17 12 17 17 13 8 8 17 12 12 12 8 8 11 13 13
2 28 40 32 32 36 40 30 36 34 34 36 36 40 28 30 40
Se pide:
19
a) Calcular el intervalo de confianza para la varianza poblacional de la variable 'aos de estudios' al
nivel de confianza de 0.95.
b) Contrastar, con un nivel de significacin de 0.01, la hiptesis de que la media poblacional de la
variable salario quincenal es menor a 310.
3. Para realizar un estudio sobre la formacin bsica en la asignatura de Matemticas de los
estudiantes de ADEM, se tom una muestra de 20 alumnos y alumnas que cursaron las asignaturas
de Estadstica y Matemticas resultando:
Estadstica
Matemticas
1 5 3 3 3 3 4 5 5 5 5 5 5 6 6 5 6 5 7 7 7 5 7 5 8 9 5
1 3 5 4 5 4 6 5 6 4 5 5 6 5 6 5 7 6 5 7 7 6 5 8
. . . . . . .
. . . .
Se pide:
a) Obtener un diagrama de caja de ambas variables. Cules son los valores atpicos? Y el porcentaje
de aprobados en cada asignatura?.
b) Representar grficamente las notas de ambas asignaturas por separado considerando 5 intervalos
de amplitud por variable.
c) Cunto vale el cuadrado del coeficiente de correlacin lineal entre ambas variables?. Calcular la
recta de regresin de la asignatura Estadstica sobre Matemticas.
d) Contrastar la hiptesis de que no hay diferencias significativas entre ambas variables con una
confianza de 0.98.
e) Calcular el intervalo de confianza para la varianza de la variable Estadstica.
20

You might also like