You are on page 1of 7

Mtodos de Regresin

Ciencias y Tcnicas Estadsticas


Prctica 1. Curso 2007 / 2008
t-Student y Anova 1F

1.
1.1.

t-Student
Excel

1. Se tienen datos experimentales correspondientes a 17 individuos de los que se ha recogido el valor que presentan en dos variables, una de ellas cuantitativa (respuesta=Rta) y otra dicotmica
(explicativa=Exp). Se supone que la variable respuesta para cada grupo que forma la variable explicativa es Normal. Los datos se encuentran en "datos_introduccion[dos_grupos].xls".
Dichos datos se muestran, adems, en la tabla siguiente:
Rta
15
15
25
25
25
33
43

Exp
1
1
1
1
1
1
1

Rta
15
16
16
25
28
28
28
28
35
43

Exp
2
2
2
2
2
2
2
2
2
2

Los clculos hay que realizarlos con Excel y/o calculadora indicando en cada apartado qu
funciones de Excel se han utilizado. (Cuando sea necesario Herramientas / Anlisis de datos,
activar previamente Herramientas / Complementos / Herramientas para anlisis).
a)
b)

Calcular los estadsticos descriptivos bsicos x1 ; x2 ; sb1 y sb2 :


Cul es la medida del efecto en este caso?

c)

Calcular un IC90 % para la diferencia de medias poblacional


de varianzas.

d)

Calcular un IC90 % para la diferencia de medias poblacional


igualdad de varianzas.

e)

Realizar el test t-Student para contrastar H0 : 1 = 2 vs. Ha : 1 6= 2 suponiendo


igualdad de varianzas con un nivel de signicacin del 0; 10. Calcular el p-valor asociado.

f)

Realizar el test t-Student (Satterthwaite) para contrastar H0 : 1 = 2 vs. Ha : 1 6= 2


suponiendo no igualdad de varianzas con un nivel de signicacin del 0; 10. Calcular el
p-valor asociado.
1

suponiendo igualdad

suponiendo no

g)

Realizar el test F-Fisher-Snedecor para contrastar H0 : 21 =


nivel de signicacin del 0; 10: Calcular el p-valor asociado.

2
2

vs. Ha :

2
1

6=

2
2

con un

h) A la vista del resultado obtenido en el apartado anterior, que test hay que utilizar para
contrastar H0 : 1 = 2 vs. Ha : 1 =
6
2 : t-Student o t-Student (Satterthwaite)?
SOLUCION:
1. a)

Las medias y las cuasi-desviaciones tpicas de la variable cuantitativa (respuesta=Rta)


para cada uno de los grupos de la variable dicotmica (explicativa=Exp) son
n1
1 X
x1 =
xi1 = ______
n1 i1=1

x2 =
v
u
u
sb1 = t

v
u
u
sb2 = t

n2
1 X
xi2 = ______
n2 i2=1

1
n1

n1
X

(xi1

x1 ) = ______

n2
X

(xi2

x2 ) = ______

1 i1=1
1

n2

1 i2=1

siendo n1 el tamao muestral del grupo 1, n2 el tamao muestral del grupo 2, xi1 los
valores de la variable Rta para el grupo 1 y xi2 los valores de la variable Rta para el
grupo 2.
Las funciones utilizadas en Excel son ________________.
b)

La medida del efecto en este caso es ________ que se estima por ________:

c)

Para calcular el IC90 % para la diferencia de medias poblacional se necesita calcular en


primer lugar el error estndar de la diferencia de medias que, en el supuesto de igualdad
de varianzas, es
s
EE X 1

que se estima por


d X1
EE

X2 =

X2 =

sb2

1
1
+
n1
n2

1
1
+
n1
n2

siendo sb2 la varianza conjunta ("pooled variance") que tiene por expresin
con lo que

sb2 =

d X1
EE

(n1 1) sb21 + (n2


(n1 1) + (n2
X2 =

sb2

1) sb22
= ______
1)

1
1
+
n1
n2

= ______

En segundo lugar para calcular el IC deseado se necesita el valor de la t-Student t =2;gl


para
= ______ (conanza del 90 %) y con grados de libertad gl = (n1 1) +
(n2 1) = n1 + n2 2 = ______, que resulta ser t =2;gl = ______, con lo que el
intervalo de conanza buscado es
IC90 % (

2)

X1
2

X2

d X1

=2;gl EE

X2

= _______________
Observar que el intervalo anterior cubre al cero para la diferencia de medias poblacionales
de los dos grupos.
El valor t
d)

=2;gl

= ______ se consigue en Excel con la funcin __________.

Para calcular el IC90 % para la diferencia de medias poblacional se necesita calcular


en primer lugar el error estndar de la diferencia de medias que, en el supuesto de no
igualdad de varianzas, es
s
EE X 1

X2 =

2
1

n1

2
2

n2

que se estima por


d X1
EE

con lo que

s
q
2
2
2
2
d X 2 = sb1 + sb2
d X 1 + EE
= EE
n1
n2

X2

d X1
EE

X2 =

sb21
sb2
+ 2 = ______
n1
n2

En segundo lugar para calcular el IC deseado se necesita el valor de la t-Student t =2;gl


para = 0; 10 (conanza del 90 %) y con grados de libertad gl dados por la siguiente
expresin
4
d X1 X2
EE
= ______
gl =
4
4
1 d
1 d
X
EE
X
+
EE
2
1
n1 1
n2 1
que resulta ser t

=2;gl

= ______, con lo que el intervalo de conanza buscado es

IC90 % (

2)

X1

X2

d X1

=2;gl EE

X2

= _______________:

Observar que el intervalo anterior cubre al cero para la diferencia de medias poblacionales
de los dos grupos.
El valor t
e)

=2;gl

= _____ se consigue en Excel con la funcin _____________.

Para llevar a cabo el contraste requerido se construye el estadstico de contraste experimental t dado por
t=

X1 X2
x1 x2
=r
d X1 X2
EE
sb2 n11 + n12

= ______

que bajo la hiptesis nula sigue una distribucin t-Student con grados de libertad gl =
n1 + n2 2 = ______, que tiene asociado un p valor = ______, que al ser
mayor que 0,10 nos lleva a ______ la hiptesis nula. Observar la concordancia con
el hecho de que el IC90 % para la diferencia de medias cubriese al valor _____. El
p valor = ______ asociado a t = ______ se consigue en Excel con la funcin
__________.
Este contraste se puede realizar en Excel con _______________.

f)

Para llevar a cabo el contraste requerido se construye el estadstico de contraste experimental t dado por
t=

X1 X2
x1 x2
=q 2
= ______
d
s
b1
s
b22
EE X 1 X 2
+
n1
n2

que bajo la hiptesis nula sigue una distribucin t-Student con grados de libertad
gl =

1
n1

d
EE

d
1 EE

X1

X1 +

X2
1
n2

d
1 EE

= ______
X2

que tiene asociado un p valor = ______, que al ser mayor que 0,10 nos lleva a
______ la hiptesis nula. Observar la concordancia con el hecho de que el IC90 % para
la diferencia de medias cubriese al valor ______. El p valor = ______ asociado
a t = ______ se consigue en Excel con la funcin ________________.
Este contraste se puede realizar en Excel con ________________.
g)

Para llevar a cabo el contraste requerido se construye el estadstico de contraste experimental F dado por
max sb21 ; sb22
F =
= ______
m n fb
s21 ; sb22 g

que bajo la hiptesis nula sigue una distribucin F-Fisher-Snedecor con gln= n1 1 =
______ los grados de libertad del numerador y gld = n2 1 = ______ los grados de
libertad del denominador, que tiene asociado un p valor = ______, que al ser mayor
que 0,10 nos lleva a ______ la hiptesis nula. El p valor = ______ asociado a
F = ______ se consigue en Excel con la funcin ________________.
Este contraste se puede realizar en Excel con _________________, aunque el
p-valor que da es unilateral.
h)

1.2.

Dado que en el apartado anterior _________________, se tendra que utilizar


el test _______________.

SPSS

2. Recuperar con SPSS los datos del chero datos_introduccion[dos_grupos].xls.


a)

Indicar los mens y submens que se han utilizado.

b)

Guardar la sintaxis que se genera, al realizar el apartado anterior, en un chero con


nombre student.sps. En este chero se ir aadiendo la sintaxis que se genere en este
ejercicio.

c)

Indicar los mens y submens que hay que utilizar para calcular un IC90 % para la
diferencia de medias poblacional 1
2 suponiendo igualdad de varianzas y sin suponer
igualdad de varianzas. Guardar la sintaxis en el mismo chero .sps e ir aadiendo
comentarios en l.

d)

Se puede realizar el test t-Student para contrastar H0 : 1 = 2 vs. Ha : 1 6= 2


suponiendo igualdad de varianzas con un nivel de signicacin del 0; 10 y calcular el
p-valor asociado?
4

2.
2.1.

e)

Se puede realizar el test t-Student (Satterthwaite) para contrastar H0 : 1 = 2 vs.


Ha : 1 6= 2 suponiendo no igualdad de varianzas con un nivel de signicacin del 0; 10
y calcular el p-valor asociado?

f)

Qu test utiliza SPSS para contrastar H0 : 21 =


signicacin del 0; 05? Calcular el p-valor asociado.

g)

Concuerdan todos los resultados que da SPSS con los obtenidos con Excel? Qu diferencias hay?

2
2

vs. Ha :

2
1

6=

2
2

con un nivel de

Anova 1 Factor
Excel

3. En el chero "datos_introduccion[frecardiaca].xls" se encuentra informacin relativa a 40


individuos a los que se les realiz una prueba de esfuerzo. En este ejercicio slo se considera la
variable explicativa Status (tipo de entrenamiento) como nominal y la variable respuesta FC2
(frecuencia cardiaca tras el ejercicio) como cuantitativa. Los datos necesarios se muestran en
la siguiente tabla:
FC2 Status FC2 Status FC2 Status
155
1
165
2
126
3
154
1
148
2
128
3
148
1
128
2
120
3
132
1
126
2
126
3
126
1
160
2
116
3
132
1
136
2
142
3
156
1
158
2
144
3
138
1
142
2
112
3
158
1
134
2
116
3
144
1
148
2
120
3
144
1
146
2
122
3
136
1
132
3
134
1
142
1
138
1
140
1
136
1
Asumir que la variable respuesta para cada grupo que forma la variable explicativa es Normal.
Los clculos hay que realizarlos con Excel y/o calculadora indicando en cada apartado qu
funciones de Excel se han utilizado.
a)

Por qu se llama Anlisis de la Varianza si se estn comparando medias?

b)

Realizar el test Anova 1 Factor para contrastar H0 :


es distinta. Calcular el p-valor asociado.

c)

Disponer la informacin del test Anova 1 Factor de la forma habitual mediante una Tabla
de Anova.
5

vs. Ha : alguna media

d)

Qu se concluye con el test anterior?

e)

Qu condiciones de aplicabilidad se tienen que vericar para poder aplicar el Anova 1


factor? Cmo se verican?

f)

Calcular el coeciente de determinacin.

SOLUCIN:
3. a)

_________________________________________
_________________________________________.

b)

Las sumas de cuadrados son un paso previo para el clculo del Anova. Si se denotan
por r al nmero de grupos de la variable explicativa, por nm al nmero de individuos en
cada grupo m = 1; :::; r, x:m la media de cada grupo y x::la media global, se tiene que la
suma de cuadrados entre los grupos SCE ("between"), la suma de cuadrados dentro de
los grupos SCD ("within") y la suma de cuadrados total SCT se calculan del siguiente
modo
r
X
2
SCE =
nm (x:m x:: )
m=1

SCD =

nm
r X
X

(xim

x:m ) =

m=1 i=1

SCT =

nm
r X
X

x2im

m=1 i=1

nm
r X
X

(xim

r
X

nm x2:m

m=1

x:: ) = SCE + SCD

m=1 i=1

Para los datos del ejemplo

SCE = _______________
SCD = ______________
SCT = _____
A continuacin se calculan los grados de libertad entre grupos GLE, dentro de los grupos
GLD y total GLT segn las expresiones
GLE = r

1 = _____

GLD = n

r = _____

GLT = GLE + GLD = n

1 = _____

El cuadrado medio entre los grupos CM E y el cuadrado medio dentro de los grupos
CMD se calculan como
SCE
CM E =
= _____
GLE
SCD
CM D =
= _____
GLD
El estadstico de contraste F del Anova 1 factor se construye como
F =

CM E
= _____
CM D

que se distribuye segn una F-Fisher-Snedecor con GLE = _____ grados de libertad
del numerador y GLD = _____ grados de libertad del denominador, que tiene asociado
un p-valor _____.
Este contraste se puede realizar en Excel con Herramientas / Anlisis de Datos / Anlisis
de la varianza de un factor.
6

c)

La Tabla Anova con la informacin obtenida en el apartado anterior es

Entre
Dentro
Total
d)

Suma Cuadrados
SCE=_____
SCD=_____
SCT=_____

GL
GLE=__
GLD=__
GLT=__

Cuadrado Medio
CME=_____
CMD=_____

F
F=_____

p-valor
____

_________________________________________
_________________________________________.

e)

_________________________________________
_________________________________________.

f ) Una medida relativa de la variabilidad explicada por los grupos es el cociente


R2 =

SCE
= ______
SCT

con lo que se tendra que la variabilidad de la variable respuesta es explicada por la


variable que forma los grupos en un ______ %.

2.2.

SPSS

4. Recuperar con SPSS los datos del chero datos_introduccion[frecardiaca].xls.


a)

Indicar los mens y submens que se han utilizado.

b)

Guardar la sintaxis que se genera, al realizar el apartado anterior, en un chero con


nombre anova.sps. En este chero se ir aadiendo la sintaxis que se genere en este
ejercicio.

c)

Indicar los mens y submens que hay que utilizar para realizar el test Anova 1 Factor
para contrastar H0 : 1 = 2 = 3 vs. Ha : alguna media es distinta. (de FC2 por
STATUS). Calcular el p-valor asociado. Guardar la sintaxis en el mismo chero .sps e
ir aadiendo comentarios en l.

d)

Indicar los mens y submens que hay que utilizar para vericar las hiptesis necesarias
para utilizar Anova 1 factor. Guardar sintaxis con comentarios.

e)

Concuerdan todos los resultados que da SPSS con los obtenidos con Excel? Qu diferencias hay?

f)

Se puede aplicar el test de Anova 1 factor a dos grupos? Cul es el test resultante?

You might also like