You are on page 1of 73

PRCTICA 1: EJEMPLO DE ENCUESTA

Para realizar esta prctica hemos abierto el programa SPSS y hemos introducido los datos que se nos solicitaban. Para ello, hemos abierto el archivo de datos encuesta; a continuacin mostramos el archivo de datos encuesta:

1. Calcular una nueva variable que indique la altura en metros de cada sujeto. Para calcular lo que se nos pide en el enunciado seguiremos el procedimiento siguiente: primero seleccionamos en la barra de herramientas del SPSS la opcin transformar, calcular

Una vez abierto el cuadro de dilogo calcular variable, creamos la nueva variable de destino alturam; a continuacin introducimos la altura en centmetros en expresin numrica y / 100; nos quedara esta expresin: altura / 100, aceptamos. Nos quedara as:

Antes de acabar debemos comprobar que las columnas de la vista de variables estn correctas. Debemos fijarnos sobretodo en la anchura de la variable, en los decimales y en la medida. Como hemos creado una nueva variable, hay que cambiar la anchura de la misma a 4 y determinar cmo se mide la nueva variable; en este caso, como es una variable cuantitativa pondremos que la medida es escala. 2. Calcular una nueva variable que indique el porcentaje de masa corporal de cada sujeto - peso(kg)/altura(cm)*100 . Para realizar este clculo realizaremos el mismo procedimiento que en el ejercicio anterior. Primero seleccionamos de la barra de tareas la opcin transformar, calcular.

Abierto el cuadro de dilogo creamos la nueva variable destino masa y aadimos en expresin numrica las variables peso en kg. / altura en cm. * 100. Quedara as:

Igual que antes tenemos que corregir los datos que por defecto nos aparecen en la vista de variables; la anchura la cambiaremos a 5, porque contamos los nmeros y el decimal. En medida hay que poner que es escala porque es una variable cuantitativa. 3. Recodificar en la misma variable las puntuaciones de la prueba de segundos transcurridos como acierto/error. Considerar hasta 15 segundos como acierto y el resto error. Para realizar el siguiente ejercicio lo primero que debemos hacer es cambiar la etiqueta de valor de la variable segundos transcurridos, asignando el acierto como 1 y el error como 2. Esto quedara de la siguiente forma:

continuacin

tenemos

que

seleccionar

la

opcin:

Transformar, recodificar en misma variable.

Una vez tenemos hecho esto nos aparece el siguiente cuadro de dilogo:

Como segundos

vemos

hemos

aadido

en

variables debemos

numricas pinchar en

transcurridos;

seguidamente

valores antiguos y nuevos para determinar el criterio a seguir.

Aqu consideramos de 0 a 15 como acierto y le asignamos el valor nuevo 1; a todos los dems valores le asignamos un 2. De esta forma cuando nos vamos a la vista de datos, en lugar de aparecer los segundos nos aparecer un 1 o un 2, dependiendo de la respuesta que se haya dado. 4. Recodificar en una variable nueva los valores obtenidos para metros cuadrados de aula, considerando las categoras siguientes: pequea, menos de 100 metros; normal, entre 100 y 150 metros y grande, mas de 150 metros. En este ejercicio se nos pide algo diferente al ejercicio anterior; se nos pide que creemos una nueva variable. Lo que tenemos que hacer es ir a transformar, recodificar en distintas variables , aadir la variable superficie y en variable de resultado poner el nombre de la nueva variable que vamos a crear, en este caso, aula2. Podemos cambiar aqu el nombre de la etiqueta o bien hacerlo despus en la vista de variables.

Una vez realizado esto volvemos a ir a valores antiguos y nuevos.

5. Cuntos alumnos y porcentaje, creen que deben subir 40 o ms escalones?. Comenta los estadsticos utilizados. Para realizar este ejercicio debemos pedir una tabla de frecuencias ya que queremos saber el nmero de alumnos que creen que suben 40 escalones o ms. Para pedir la tabla de frecuencias nos vamos al men: analizar, estadsticos descriptivos, frecuencias.

Una vez realizado esto obtenemos la siguiente tabla:

N. escalones? Frecuencia 2 7 6 2 2 1 1 30 1 2 3 6 1 5 1 1 71 Porcentaje 2,8 9,9 8,5 2,8 2,8 1,4 1,4 42,3 1,4 2,8 4,2 8,5 1,4 7,0 1,4 1,4 100,0 Porcentaje vlido 2,8 9,9 8,5 2,8 2,8 1,4 1,4 42,3 1,4 2,8 4,2 8,5 1,4 7,0 1,4 1,4 100,0 Porcentaje acumulado 2,8 12,7 21,1 23,9 26,8 28,2 29,6 71,8 73,2 76,1 80,3 88,7 90,1 97,2 98,6 100,0

Vlidos

Estadsticos N. escalones? N Vlidos Perdidos 71 0

26 30 32 35 36 37 38 40 45 46 48 50 52 60 70 90 Total

Como se nos pide el nmero y el porcentaje de slo los que suben 40 o ms debemos desechar los casos que no cumplen el criterio. Esto es as:
N. escalones? Frecuencia 30 1 2 3 6 1 5 1 1 50 Porcentaje vlido 42,3 1,4 2,8 4,2 8,5 1,4 7,0 1,4 1,4 70,4

Vlidos

40 45 46 48 50 52 60 70 90 Total

Viendo las frecuencias podemos decir que hay 50 (sumamos todas las frecuencias) que creen subir 40 o ms escalones. El porcentaje que representan es el 70,4%.

6. Obtener los descriptivos indicadores y grficos- mas adecuados para la variable porcentaje de masa corporal. Comenta los estadsticos utilizados. El primer paso que debemos realizar es identificar el tipo de variable con la que estamos trabajando; como es una variable cuantitativa podemos pedirle todos los indicadores. Vamos a calcular: los valores extremos (mnimo y mximo), la media, la desviacin tpica, la curtosis y la asimetra. El grfico que utilizamos para esta variable cuantitativa que es masa corporal es el histograma. El procedimiento a seguir es el siguiente: analizar, estadsticos descriptivos: opciones.

El grafico corporal.

lo

pedimos

de la

siguiente forma:

grficos,

histograma y aadimos la variable porcentaje de masa

Realizado esto obtenemos las siguientes tablas de resultados:

Estadsticos descriptivos N Mnimo Mximo Media Desv. tp. Asimetra Curtosis Estadstico Estadstico Estadstico Estadstico Estadstico Estadstico Error tpico Estadstico Error tpico porcentaje de masa corporal N vlido (segn lista) 71 71 26,67 47,02 34,2912 3,88499 ,724 ,285 ,804 ,563

16 14 12 10 8 6 4 2 0
,0 9 2 ,0 7 2 ,0 1 3 ,0 5 3 ,0 3 3 ,0 7 3 ,0 9 3 ,0 3 4 ,0 1 4

Desv. tp. = 3,88 Media = 34,3 N = 71,00


,0 7 4 ,0 5 4

porcentaje de masa corporal

Con los resultados obtenidos podemos decir que, en cuanto a la tendencia central, la media del porcentaje de masa corporal de los alumnos es de 34,29, por lo que deducimos que la mayora de alumnos se concentran en torno a ese valor.

En cuanto a la variabilidad podemos decir que los datos no estn muy dispersos, se concentran en torno a la media. Posee una amplitud de 20,35. Para finalizar si hablamos de la forma de la distribucin podemos sealar que muestra una distribucin asimtrica positiva, ya que la mayora de las puntuaciones se concentran en la parte izquierda de la grfica y se dispersan ms por la derecha. Adems esto se ve reforzado por el resultado de la tabla, que nos dice que la simetra es 0,724. La curtosis, cuyo resultado es 0,804, muestra una distribucin leptocrtica (relativamente alta y estrecha). 7. Obtener los descriptivos indicadores y grficos- ms adecuados para la variable 15, comparando entre hombres y mujeres. Comenta los estadsticos utilizados. Este ejercicio nos pide que comparemos la variable nota final de la asignatura para hombres y mujeres; por eso el primero paso que debemos realizar es segmentar el archivo, comparar los grupos.

Una vez segmentado el archivo nos vamos a men: analizar, estadsticos descriptivos, frecuencias, descriptivos y solicitamos la moda, la mediana, la amplitud, el mnimo y el mximo. Los resultados que obtenemos son:

10

Estadsticos Nota final asignatura? Hombre N Mediana Moda Rango Mnimo Mximo N Mediana Moda Rango Mnimo Mximo Vlidos Perdidos 27 0 2,00 2 3 1 4 44 0 2,00 2 4 1 5

Mujer

Vlidos Perdidos

Nota final asignatura? Sexo del encuestado? Hombre Vlidos Frecuencia 4 16 6 1 27 2 34 7 1 44 Porcentaje 14,8 59,3 22,2 3,7 100,0 4,5 77,3 15,9 2,3 100,0 Porcentaje vlido 14,8 59,3 22,2 3,7 100,0 4,5 77,3 15,9 2,3 100,0 Porcentaje acumulado 14,8 74,1 96,3 100,0 4,5 81,8 97,7 100,0

Mujer

Vlidos

Suspenso Aprobado Notable Sobresaliente Total Suspenso Aprobado Notable Matricula Total

El grfico que solicitamos es el diagrama de barras puesto que es el ms indicado para variables cuasi-cuantitativas.

11

Nota final asignatura?


SEXO: 1 Hombre
20 40

Nota final asignatura?


SEXO: 2 Mujer

30

10

20

Frecuencia

Frecuencia

10

0 Suspenso Aprobado Notable Sobresaliente

0 Suspenso Aprobado Notable Matricula

Nota final asignatura?

Nota final asignatura?

Vemos que en ambos casos coinciden la moda y la mediana. Observando las grficas vemos que los hombres suspenden ms que las mujeres pero tienen ms notables. Las mujeres no obtienen sobresalientes pero es porque obtienen matrcula, mientras que los hombres slo obtienen sobresalientes.

12

PRCTICA 2: ANLISIS EXPLORATORIO DE DATOS


1. Solicitar el grfico de tallo y hojas para la variable Metros cuadrados del aula. Para realizar este ejercicio debemos seguir los pasos que exponemos a continuacin : seleccionar analizar, estadsticos descriptivos y explorar.

Como el ejercicio nos pide que hallemos el grfico para la variable metros cuadrados del aula, es sta la que debemos introducir en dependientes. A continuacin, en grficos, seleccionamos slo el diagrama de tallo y hojas, puesto que no se nos pide ningn otro ms. Quedara as:

13

Los resultados que se obtiene tras aplicar lo anteriormente citado son los siguientes:
Resumen del procesamiento de los casos Casos Perdidos N Porcentaje 0 ,0%

N Metros cuadrados del aula?

Vlidos Porcentaje 71 100,0%

Total Porcentaje 71 100,0%

14

Descriptivos Metros cuadrados del aula? Media Intervalo de confianza Lmite inferior para la media al 95% Lmite superior Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Estadstico 124,38 105,82 142,94 116,69 110,00 6147,868 78,408 30 400 370 80,00 1,582 3,078 Error tp. 9,305

,285 ,563

Metros cuadrados del aula? Stem-and-Leaf Plot Frequency 6,00 23,00 20,00 11,00 5,00 2,00 Stem width: Each leaf: 100 1 case(s) Stem & 0 . 0 . 1 . 1 . 2 . 2 . Leaf 333344 55556666666777777777899 00001111222233344444 55555555558 00034 55 (>=300)

4,00 Extremes

Al mirar el grfico, podemos fijarnos en la simetra, la curtosis, etc. de la variable, y podemos deducir que existe una distribucin leptocrtica, puesto que la distribucin de resultados es muy alta alrededor de la media y menor cuanto ms se aleja de ella. Tambin podemos observar la distribucin, que presenta cierta asimetra, y puesto que est algo ms desplazada hacia la izquierda podramos decir que se trata de una asimetra positiva.

15

2. Solicitar el diagrama de cajas de la variable peso en Kilogramos En este ejercicio hemos de ir tambin al men analizar, estadsticos descriptivos, explorar, seleccionando la variable peso en kilogramos, y en lugar de solicitar el grafico de Tallo y hojas, desactivamos dicha opcin y activamos la opcin de Diagramas de cajas, y obtenemos estos resultados:
Resumen del procesamiento de los casos Casos Perdidos N Porcentaje 0 .0%

Peso en kg

Vlidos N Porcentaje 71 100.0%

Total Porcentaje 71 100.0%

Descriptivos Peso en kg Media Intervalo de confianza Lmite inferior para la media al 95% Lmite superior Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis
90

Estadstico 57,35 55,56 59,15 56,98 56,00 57,460 7,580 44 79 35 9,00 ,752 ,644

Error tp. ,900

,285 ,563

80

60 66 40 5

70

60

50

40
N= 71

16
Peso en kg

La caja representa los casos ms cercanos a la media. La lnea de dentro de la caja representa la mediana, que en este caso, parece coincidir o se acerca mucho a la media. El ancho de la caja determina el apuntamiento de la variable, podemos afirmar el ancho de la caja no es excesivo. En referencia a los bigotes que acompaan a la caja, podemos decir que representan la asimetra de la variable, que se mide con la distancia entre el bigote superior y la mediana y viceversa. En este caso es mucho ms larga la distancia entre la mediana y el bigote superior, por lo que tenemos que decir que existe una asimetra positiva. que hay una distribucin mesocrtica, ya que los casos se muestran agrupados y

3. Solicitar el grfico de tallo y hojas y el diagrama de cajas de la variable altura en centmetros comparndola para ambos sexos. Interpreta y razn los resultados para la tendencia central, variabilidad, forma de la curva y/o valores extremos. Puesto que se nos pide que comparemos dos grupos, lo primero que debemos hacer es segmentar el archivo. Para ello nos vamos al men datos, segmentar archivo, comparar casos . Introducimos la variable sexo para que fragmente el archivo segn este criterio.

17

Una vez segmentado el archivo, nos vamos al men analizar, estadsticos descriptivos, explorar e introducimos la variable altura en centmetros como dependiente.

Pulsamos seguidamente en grficos y seleccionamos los grficos de tallo y hojas y el diagrama de cajas.

18

Obtenemos las siguientes tablas:


Resumen del procesamiento de los casos
Sexo del encuestado? N Altura en cm. Hombre Mujer 27 44 Vlidos Porcentaje 100,0% 100,0% N 0 0 Casos Perdidos Porcentaje ,0% ,0%

N 27 44

Total Porcentaje 100,0% 100,0%

Descriptivos Sexo del encuestado? Hombre Estadstico 170,78 Lmite inferior Lmite superior 168,52 173,04 170,86 170,00 32,718 5,720 160 180 20 9,00 -,055 -,783 164,66 Lmite inferior Lmite superior 163,31 166,01 164,68 165,00 19,625 4,430 155 ,448 ,872 ,668 Error tp. 1,101

Altura en cm.

Media Intervalo de confianza para la media al 95%

Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Mujer Media Intervalo de confianza para la media al 95%

Media recortada al 5% Mediana Varianza Desv. tp. Mnimo

19

Mximo Rango Amplitud intercuartil Asimetra Curtosis

173 18 7,00 -,154 -,573 ,357 ,702

El grfico de tallo y hojas queda as:


Altura en cm. Stem-and-Leaf Plot for SEXO= Hombre Frequency 2,00 10,00 7,00 6,00 2,00 Stem width: Each leaf: Stem & 16 16 17 17 18 10 1 case(s) . . . . . Leaf 00 5555778889 0012234 567888 00

Altura en cm. Stem-and-Leaf Plot for SEXO= Mujer Frequency ,00 5,00 12,00 20,00 7,00 Stem width: Each leaf: Stem & 15 15 16 16 17 10 1 case(s) . . . . . Leaf 57789 000001112333 55555556666777788888 0000233

El diagrama de cajas se nos quedara de la siguiente forma:

20

190

180

Altura en cm.

170

160

150
N = 27 44

Hombre

Mujer

Sexo del encuestado?

Despus de observar los diagramas, tanto el de tallo y hojas como el de cajas y bigotes, se observa que hay una diferencia en las medias, puesto que la de los chicos es 170,78 y la de las chicas es 164,66. Dicha diferencia demuestras que los chicos son ms altos que las chicas. Adems la mediana es distinta, habiendo una diferencia de 5 puntos. Respecto a la variabilidad podemos decir que la varianza es mayor para los chicos que para las chicas, lo que significa que el grupo de los chicos es ms variable. La desviacin tpica es tambin mayor para los chicos por lo que se deduce que hay una mayor dispersin en este grupo. Si hablamos de la distribucin decimos que los dos grupos presentan una asimetra negativa, ya que sus valores son 0,05 para los chicos y 0,15 para las chicas. Las dos distribuciones son platicrticas puesto que sus valores son menores que 0; esto nos dice que la agrupacin es ancha y baja, alejndose los valores extremos de la media.

4. Comparar los resultados del diagrama de cajas segn la Opcin elegida en BUP para la variable Nota final en la asignatura. Interpreta y razn los resultados para la

21

tendencia central, variabilidad, forma de la curva y/o valores extremos. En primer lugar debemos segmentar el archivo, puesto que se nos pide los resultados segn la Opcin de BUP, para ello nos vamos al men datos, segmentar archivo, comparar casos , donde introducimos la variable Opcin elegida en BUP. A continuacin en el men analizar, estadsticos descriptivos, explorar seleccionamos la variable Nota final en la asignatura y pasamos a Grficos. Una vez dentro seleccionamos el diagrama de cajas y bigotes. Una vez hecho todo esto, obtenemos los siguientes resultados:
Resumen del procesamiento de los casos Opcin en BUP? N Nota final asignatura? Ciencias Letras Mixto 29 16 26 Vlidos Porcentaje 100,0% 100,0% 100,0% N

Casos Perdidos Porcentaje 0 0 0 ,0% ,0% ,0% N 29 16 26 Total Porcentaje 100,0% 100,0% 100,0%

22

Descriptivos Opcin en BUP? Ciencias Nota final asignatura? Media Intervalo de confianza Lmite inferior para la media al 95% Lmite superior Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Nota final asignatura? Media Intervalo de confianza Lmite inferior para la media al 95% Lmite superior Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Nota final asignatura? Media Intervalo de confianza Lmite inferior para la media al 95% Lmite superior Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Estadstico 2,41 2,20 2,63 2,37 2,00 ,323 ,568 2 4 2 1,00 ,990 ,067 2,00 1,52 2,48 1,89 2,00 ,800 ,894 1 5 4 ,00 2,556 9,368 2,00 1,80 2,20 2,00 2,00 ,240 ,490 1 3 2 ,00 ,000 1,902 Error tp. ,105

Letras

,434 ,845 ,224

Mixto

,564 1,091 ,096

,456 ,887

23

Nota final asignatura?

43 44 35

1 0
N= 29

29 5 47

38 46 45

16

26

Ciencias

Letras

Mixto

Opcin en BUP?

Lo primero que nos llama la atencin es la forma del grfico, en el que se pueden ver que slo hay una caja para la opcin ciencias. Esto es as porque la variable con la que trabajamos es cuasicuantitativa. Podemos observar que hay gran diferencia segn las opciones de BUP. En primer lugar, si analizamos la opcin de ciencias vemos que hay unos resultados algo dispersos, ya que la caja es bastante ancha, pero por otro lado no se ve ningn valor extremo. Los resultados de la caja son los representativos de la media y no coinciden completamente con la mediana, la cual est desplazada hacia la parte inferior de la caja. Podramos decir que esta distribucin presenta un

apuntamiento mesocrtico. An as existe asimetra puesto que la mediana se encuentra situada en la parte inferior de la caja. A continuacin pasamos a analizar las opciones de letras y mixto, en ella los casos estn totalmente agrupados. Media, mediana y moda coinciden, lo que hace que no se vean los resultados de la media, ni la caja de resultados, ni los bigotes.

24

La curtosis refleja claramente unas distribuciones leptocrticas, puesto que los datos estn extremadamente agrupados.

25

PRCTICA 3: RELACIN ENTRE VARIABLES

1.

Explorar grficamente la relacin entre Peso en Kg. y

altura en cm. Interpreta la grfica obtenida. Para observar la relacin que existente entre la relacin entre el peso en kilogramos y la altura en centmetros debemos utilizar el coeficiente de correlacin de Pearson puesto que las variables que se nos dan son cuantitativas. correlacin, bivariadas: en primer Para llegar a ese coeficiente de vamos a analizar, despus seleccionamos lugar

seleccionamos correlaciones y dentro de ella

Tras marcar las correlaciones bivariadas, hemos de aadir las variables peso en Kg. y altura en cm. Y tambin seleccionar a Pearson dentro de los coeficientes de correlacin.

26

Tras aceptar obtenemos los siguientes resultados:


Correlaciones Peso en kg Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Peso en kg Altura en cm. 1 ,622** , ,000 71 71 ,622** 1 ,000 , 71 71

Altura en cm.

**. La correlacin es significativa al nivel 0,01 (bilateral).

Para observar la dispersin de los valores acompaaremos a este cuadro con una grfica de dispersin; para obtenerla nos vamos a grficos y dentro de este apartado seleccionaremos dispersin, en el cual marcamos la opcin simple. El grfico quedar de la siguiente forma:
80

70

60

Peso en kg

50

40 150 160 170 180 190

Altura en cm.

27

Puesto que los puntos de la grfica estn algo dispersos, y a pesar de que se concentran en un espacio, no se puede realizar una lnea recta que pase por todos los puntos, pero si que se puede trazar una lnea recta que pase, ms o menos, por el centro de los puntos. Por ello, podemos afirmar que existe relacin entre las variables. La lnea que se forma va creciendo desde los valores ms pequeos a los ms grandes, lo que nos indica que hay una relacin positiva. Adems podemos observar dicha relacin mediante la observacin de los resultados obtenidos en la tabla, ya que da un valor de 0,62 y hay relacin entre las variables. 2. Indicar grficamente y mediante un ndice la relacin entre Metros cuadrados del aula y N de escalones. En este ejercicio se nos pide que indiquemos que relacin existe entre las variables metros cuadrados del aula y nmero de escalones. Como las dos variables son cuantitativas utilizaremos el coeficiente de correlacin de Pearson para observar la relacin existente, ya que con este coeficiente podemos conocer el grado de relacin exacto de las variables, para llegar hasta ese coeficiente seguiremos los mismos pasos que en el ejercicio anterior. En primer lugar vamos a analizar, despus seleccionamos correlaciones y dentro de ella seleccionamos bivariadas, en el cuadro de variables pondremos las variables metros cuadrados del aula. y nmero de escalones y dentro de los coeficientes de correlacin, marcamos la opcin de Pearson. Una vez hecho esto, nos aparece la siguiente tabla de resultados:

28

Correlaciones Metros cuadrados del aula? 1 , 71 ,169 ,158 71 N. escalones? ,169 ,158 71 1 , 71

Metros cuadrados del aula? N. escalones?

Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N

El grfico que se obtienen es el siguiente:

500

Metros cuadrados del aula?

400

300

200

100

0 20 30 40 50 60 70 80 90 100

N. escalones?

Como se puede observar en la grfica, los valores estn demasiado dispersos, por lo que no se podra dibujar una elipse; esto nos indica que no existe relacin entre las variables. Adems no se puede trazar una lnea que pase por todos los puntos ya que estn demasiado dispersos. 3. Obtener una matriz de correlaciones para todas las

variables cuantitativas presentes en el archivo. Indica entre que variables existe un mayor y un menor grado de relacin. Este ejercicio es similar a los anteriores, pero ahora se van a utilizar todas las variables cuantitativas para observar entre que variables existe mas y menos relacin. Puesto que el ejercicio es

29

similar a los anteriores seguimos los mismos pasos, primero vamos a analizar, despus seleccionamos correlaciones y dentro de ella seleccionamos bivariadas. Dentro del cuadro de variables pondremos todas las variables cuantitativas, seleccionaremos Pearson y obtenemos el siguiente cuadro de correlaciones:
Correlaciones N. personas que conviven contigo ,007 ,953 71 -,128 ,288 71 -,109 ,364 71 1 , 71 ,473** ,000 71 ,153 ,202 71 -,028 ,814 71 ,038 ,752 71 -,212 ,075 71 Posicion entre los hermanos ,065 ,592 71 -,017 ,890 71 ,084 ,488 71 ,473** ,000 71 1 , 71 ,027 ,820 71 -,144 ,229 71 ,008 ,950 71 -,312** ,008 71 Metros cuadrados del aula? -,111 ,358 71 ,008 ,945 71 ,136 ,259 71 ,153 ,202 71 ,027 ,820 71 1 , 71 ,169 ,158 71 -,042 ,730 71 ,150 ,213 71 Segundos transcurrid os? -,207 ,083 71 ,225 ,059 71 ,020 ,865 71 ,038 ,752 71 ,008 ,950 71 -,042 ,730 71 -,041 ,733 71 1 , 71 -,116 ,337 71 Cuantos alumnos asisten a clase? -,024 ,843 71 -,038 ,755 71 ,023 ,850 71 -,212 ,075 71 -,312** ,008 71 ,150 ,213 71 ,261* ,028 71 -,116 ,337 71 1 , 71

Edad (aos) Edad (aos) Correlacin de Pearson Sig. (bilateral) N Peso en kg Correlacin de Pearson Sig. (bilateral) N Altura en cm. Correlacin de Pearson Sig. (bilateral) N N. personas que Correlacin de conviven contigo Pearson Sig. (bilateral) N Posicion entre los Correlacin de hermanos Pearson Sig. (bilateral) N Metros cuadrados Correlacin de del aula? Pearson Sig. (bilateral) N N. escalones? Correlacin de Pearson Sig. (bilateral) N Segundos Correlacin de transcurridos? Pearson Sig. (bilateral) N Cuantos alumnos Correlacin de asisten a clase? Pearson Sig. (bilateral) N 1 , 71 -,047 ,699 71 ,042 ,729 71 ,007 ,953 71 ,065 ,592 71 -,111 ,358 71 ,012 ,921 71 -,207 ,083 71 -,024 ,843 71

Peso en kg -,047 ,699 71 1 , 71 ,622** ,000 71 -,128 ,288 71 -,017 ,890 71 ,008 ,945 71 ,108 ,368 71 ,225 ,059 71 -,038 ,755 71

Altura en cm. ,042 ,729 71 ,622** ,000 71 1 , 71 -,109 ,364 71 ,084 ,488 71 ,136 ,259 71 ,050 ,677 71 ,020 ,865 71 ,023 ,850 71

N. escalones? ,012 ,921 71 ,108 ,368 71 ,050 ,677 71 -,028 ,814 71 -,144 ,229 71 ,169 ,158 71 1 , 71 -,041 ,733 71 ,261* ,028 71

**. La correlacin es significativa al nivel 0,01 (bilateral). *. La correlacin es significante al nivel 0,05 (bilateral).

Al observar la tabla de resultados podemos comprobar que las variables entre s no muestran una estrecha relacin, puesto que los valores de la correlacin se aproximan casi todos a cero, no existe

30

ningn valor que tenga una buena aproximacin a 1 -1. A pesar de ello vamos a ver entre que variables hay mayor y menor relacin: o Las variables que mayor relacin presentan son peso en Kg con altura en cm y nmero de personas que viven contigo con posicin entre los hermanos cuyos valores son 0,622 y 0,473 respectivamente. Estas relaciones no llegan a ser perfectas. o Las variables que presentan menor relacin son edad con nmero de personas que viven contigo , edad con Nmero de escalones y peso con metros cuadrados del aula y sus valores son 0,07; 0,012 y 0,08 respectivamente. 4. Controla el efecto de la variable Peso en Kg. en la relacin entre Edad (aos) y Nmero de Escalones. En este ejercicio se nos pide hallar la relacin que existe entre las variables edad y nmero de escalones. Tambin se nos pide que controlemos el efecto de la variable peso ya que puede influir en la relacin de las otras variables. Por todo esto, utilizamos las correlaciones parciales, ya que con ellas se puede controlar el efecto de una variable sobre otras. Para realizar el ejercicio debemos de realizar lo siguiente: primero debemos analizar la relacin que existe entre las variables edad y nmero de escalones sin controlar la variable peso. Para ello nos iremos al men: analizar, correlaciones bivariadas. Una vez mostrado el cuadro de dilogo correspondiente introducimos las variables. Esto quedara as:

31

Una vez introducidas las variables aceptamos, obteniendo este resultado:


Correlaciones Edad (aos) Correlacin de Pearson 1 Sig. (bilateral) , N 71 Correlacin de Pearson ,012 Sig. (bilateral) ,921 N 71 N. escalones? ,012 ,921 71 1 , 71

Edad (aos)

N. escalones?

Una vez hecho esto realizaremos lo mismo pero controlando la variable peso. El procedimiento es el siguiente: analizar, correlaciones parciales. Una vez seleccionado esto, nos aparece una ventana con un cuadro de variables donde ponemos edad y nmero de escalones y un cuadro de controlando para donde pondremos la variable que va a ser controlada, en este caso es peso, quedando de la siguiente manera:

32

Tras aceptar obtenemos los siguientes resultados:

--- PARTIAL CORRELATION COEFFICIENTS --Controlling for.. EDAD EDAD PESO ESCALO

1,0000 ,0171 ( 0) ( 68) P= , P= ,888 ,0171 1,0000 ( 68) ( 0) P= ,888 P= ,

ESCALO

(Coefficient / (D.F.) / 2-tailed Significance) " , " is printed if a coefficient cannot be computed Observando los resultados de los anlisis podemos ver que existe una escasa relacin entre las variables edad y nmero de escalones, el resultado de la correlacin nos da 0,012; al aproximarse bastante a cero la relacin es mnima.

33

Teniendo en cuenta el efecto de la variable peso

podemos

decir que tampoco existe mucha relacin entre las variables anteriores, ya que el valor que nos da es 0,0171. En conclusin, la variable peso no afecta a la relacin entre las variables edad y nmero de escalones 5. Podemos pensar que la relacin entre Peso en Kg. y

Altura en cm. se ve afectada por la variable Edad (aos)? Razona tu respuesta. El ejercicio propuesto es similar al ejercicio cuatro, en l debemos comprobar la relacin existente entre dos variables controlando el efecto de una tercera; para realizarlo debemos utilizar la correlacin parcial. Para ello vamos a seguir los mismos pasos que en el ejercicio anterior, el primer paso ser ir a analizar, despus seleccionamos correlaciones y dentro de ella seleccionamos parciales. Dentro de las correlaciones parciales pondremos en el cuadro de variables peso y altura y en el cuadro controlando para se pondr edad. Se obtiene lo siguiente: --- PARTIAL CORRELATION COEFFICIENTS --Controlling for.. PESO PESO EDAD ALTURA

1,0000 ,6251 ( 0) ( 68) P= , P= ,000 ,6251 1,0000 ( 68) ( 0) P= ,000 P= ,

ALTURA

(Coefficient / (D.F.) / 2-tailed Significance) " , " is printed if a coefficient cannot be computed

34

Si observamos la relacin existente entre las variables peso y altura podemos comprobar que presentan cierta relacin. Cuando controlamos el efecto de la variable edad en la relacin de las anteriores variables observamos que el valor a penas vara ya que pasa de ser 0,622 a 0,6251. Por tanto, podemos decir que la variable edad no influye en la relacin de las otras variables. 6. Calcula la relacin entre Opcin en BUP y Deporte favorito. Interpreta y razona los resultados obtenidos. En este ejercicio nos piden que calculemos la relacin existente entre dos variables no cuantitativas, por tanto tendremos que utilizar las tablas de contingencia, puesto que es la tcnica ms adecuada para este tipo de variables. Para realizar las tablas de contingencia hemos de ir a analizar, despus seleccionamos estadsticos descriptivos y dentro de estos seleccionamos tablas de contingencia:

35

Una vez dentro de la ventana tenemos que rellenar los cuadros con las variables a relacionar; hay dos cuadros en los que pone fila y columnas; en ellos se pondrn cada una de las variables, quedando de la siguiente forma:

Tras estos pasos, aceptamos y obtenemos los siguientes resultados:


Resumen del procesamiento de los casos Casos Perdidos N Porcentaje 0 ,0%

N Opcin en BUP? * Deporte favorito?

Vlidos Porcentaje 71 100,0%

Total Porcentaje 71 100,0%

36

Tabla de contingencia Opcin en BUP? * Deporte favorito? Deporte favorito? Tenis Ciclismo 5 2 17,2% 6,9% 50,0% 40,0% 7,0% 2,8% 3 2 18,8% 12,5% 30,0% 40,0% 4,2% 2,8% 2 1 7,7% 3,8% 20,0% 20,0% 2,8% 1,4% 10 5 14,1% 7,0% 100,0% 100,0% 14,1% 7,0%

Futbol Opcin en BUP? Ciencias Recuento % de Opcin en BUP? % de Deporte favorito? % del total Recuento % de Opcin en BUP? % de Deporte favorito? % del total Recuento % de Opcin en BUP? % de Deporte favorito? % del total Recuento % de Opcin en BUP? % de Deporte favorito? % del total 6 20,7% 60,0% 8,5% 2 12,5% 20,0% 2,8% 2 7,7% 20,0% 2,8% 10 14,1% 100,0% 14,1%

Baloncesto 2 6,9% 28,6% 2,8%

Letras

Mixto

Total

5 19,2% 71,4% 7,0% 7 9,9% 100,0% 9,9%

Otros 14 48,3% 38,9% 19,7% 7 43,8% 19,4% 9,9% 15 57,7% 41,7% 21,1% 36 50,7% 100,0% 50,7%

Ninguno

2 12,5% 66,7% 2,8% 1 3,8% 33,3% 1,4% 3 4,2% 100,0% 4,2%

Total 29 100,0% 40,8% 40,8% 16 100,0% 22,5% 22,5% 26 100,0% 36,6% 36,6% 71 100,0% 100,0% 100,0%

Tras observar la tabla de contingencia podemos decir que, independientemente de la opcin de bachillerato o el deporte favorito lo que ms han respondido los alumnos es otros (otro tipo de deportes que no reflejados). Esta opcin representa el 50,7%. Despus de este deporte podemos decir que el ftbol y el tenis son los dos deportes favoritos, ya que sus porcentajes son de 14,1% en cada caso. Analizando los resultados por opciones en BUP sealamos que en el caso de ciencias, que representan un 40,8% de los casos, el deporte menos escogido es baloncesto y ciclismo con un 2,8% en cada caso. La opcin de letras representa un 22,5% de los casos y aqu destaca que baloncesto es un deporte que no es practicado por nadie. Por ltimo, de la opcin de mixto podemos resaltar que el baloncesto es un deporte bastante escogido entre los alumnos. Veamos ahora la relacin entre estas dos variables con ms exactitud. Para ello utilizamos las pruebas de chi-cuadrado, puesto que son ms aclaratorias:

37

Pruebas de chi-cuadrado Valor 12,358 a 13,875 ,969 71 gl 10 10 1 Sig. asinttica (bilateral) ,262 ,179 ,325

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

a. 15 casillas (83,3%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es ,68.

En la tabla vemos que la significacin asinttica es de 0,262. Esto pone de manifiesto la inexistencia de relacin entre las dos variables del ejercicio (opcin en BUP y deporte favorito). Sera necesario que la significacin fuera menor al 0,05 para que existiera relacin. 7. Obtener la relacin entre Opcin en BUP y Nota final en la asignatura. Interpreta y razona los resultados. Este ejercicio es muy similar al anterior; nos piden que calculemos la relacin existente entre dos variables no cuantitativas, por tanto seguiremos los mismos pasos: analizar, estadsticos descriptivos, tablas de contingencia. Seguidamente colocamos las variables opcin en BUP y nota final en sus respectivas casillas, aceptamos y obtenemos los siguientes resultados:

Resumen del procesamiento de los casos Casos Perdidos N Porcentaje 0 ,0%

N Opcin en BUP? * Nota final asignatura?

Vlidos Porcentaje 71 100,0%

Total Porcentaje 71 100,0%

38

Tabla de contingencia Opcin en BUP? * Nota final asignatura? Nota final asignatura? Aprobado Notable Sobresaliente 18 10 1 62,1% 34,5% 3,4% 36,0% 3 18,8% 50,0% 4,2% 3 11,5% 50,0% 4,2% 6 8,5% 100,0% 8,5% 25,4% 12 75,0% 24,0% 16,9% 20 76,9% 40,0% 28,2% 50 70,4% 100,0% 70,4% 3 11,5% 23,1% 4,2% 13 18,3% 100,0% 18,3% 1 1,4% 100,0% 1,4% 1 1,4% 100,0% 1,4% 76,9% 14,1% 100,0% 1,4% 1 6,3% 100,0% 1,4%

Suspenso Opcin en BUP? Ciencias Recuento % de Opcin en % de Nota final asignatura? % del total Recuento % de Opcin en % de Nota final asignatura? % del total Recuento % de Opcin en % de Nota final asignatura? % del total Recuento % de Opcin en % de Nota final asignatura? % del total BUP?

Matricula

Total 29 100,0% 40,8% 40,8% 16 100,0% 22,5% 22,5% 26 100,0% 36,6% 36,6% 71 100,0% 100,0% 100,0%

Letras

BUP?

Mixto

BUP?

Total

BUP?

Como se puede observar en la tabla, en general, la gran mayora de alumnos, ha aprobado la asignatura, en total un 70,4%. Slo un 1,4% de los alumnos ha obtenido un sobresaliente o una matricula y un 8,5% ha suspendido. Si observamos los resultados por opciones vemos que: De la opcin de ciencias un 62,1% ha aprobado, un 34,5% ha obtenido un notable y un 3,4% ha sacado un sobresaliente. La opcin de ciencias es la opcin con mayor nmero de alumnos (40,8% del total de alumnos). De la opcin de letras un 75% ha aprobado, un 18,8% ha suspendido y un 6,3% ha obtenido una matricula. Es la opcin que mas bajas tiene las notas. De la opcin mixto un 76,9% ha aprobado, siendo este porcentaje el mayor de todas las calificaciones en cualquier opcin de bachillerato y un 11,5% ha obtenido suspenso y notable.

39

Pasamos ahora a analizar el chi-cuadrado:


Pruebas de chi-cuadrado Valor 17,853 a 21,809 5,622 71 gl 8 8 1 Sig. asinttica (bilateral) ,022 ,005 ,018

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

a. 11 casillas (73,3%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es ,23.

Comprobamos aqu que s existe relacin entre la opcin elegida en BUP y la nota media de la asignatura; la opcin ciencias tiene mejores notas que la opcin mixta o la de letras, que es la que tiene peores notas. 8. Calcula la relacin entre Sexo y el resto de variables no

cuantitativas. Interpreta los resultados e indica con que variables aparece una mayor y una menor relacin. Otra vez se nos presenta un ejercicio similar a los anteriores. Vamos a calcular la relacin entre varias variables no cuantitativas. Los pasos a seguir son los mismos en los otros apartados. Los resultados que obtenemos son:
Resumen del procesamiento de los casos Casos Perdidos N Porcentaje 0 0 0 0 0 ,0% ,0% ,0% ,0% ,0%

N Opcin en BUP? * Sexo del encuestado? Medio de transporte? * Sexo del encuestado? Tienes ordenador en casa? * Sexo del encuestado? Deporte favorito? * Sexo del encuestado? Nota final asignatura? * Sexo del encuestado?

Vlidos Porcentaje 71 71 71 71 71 100,0% 100,0% 100,0% 100,0% 100,0%

Total Porcentaje 71 71 71 71 71 100,0% 100,0% 100,0% 100,0% 100,0%

Sexo del encuestado? * Opcin en BUP?

40

Tabla de contingencia Sexo del encuestado? Hombre Mujer Recuento 12 17 % de Opcin en BUP? 41,4% 58,6% % de Sexo del 44,4% 38,6% encuestado? % del total 16,9% 23,9% Recuento 7 9 % de Opcin en BUP? 43,8% 56,3% % de Sexo del 25,9% 20,5% encuestado? % del total 9,9% 12,7% Recuento 8 18 % de Opcin en BUP? 30,8% 69,2% % de Sexo del 29,6% 40,9% encuestado? % del total 11,3% 25,4% Recuento 27 44 % de Opcin en BUP? 38,0% 62,0% % de Sexo del 100,0% 100,0% encuestado? % del total 38,0% 62,0%

Opcin en BUP?

Ciencias

Total 29 100,0% 40,8% 40,8% 16 100,0% 22,5% 22,5% 26 100,0% 36,6% 36,6% 71 100,0% 100,0% 100,0%

Letras

Mixto

Total

Pruebas de chi-cuadrado Valor ,942a ,954 ,623 71 gl 2 2 1 Sig. asinttica (bilateral) ,624 ,621 ,430

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

a. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 6,08.

Lo primero que podemos observar es que hay mayor porcentaje de mujeres que de hombres, 62% frente a un 38% respectivamente. La opcin mixta es la ms escogida por el sexo femenino (25,4%), mientras que los hombres suelen escoger la opcin de ciencias (16,9%) La prueba del chi-cuadrado nos apunta que no existe correlacin entre el sexo del encuestado y la opcin de BUP (la significacin es de 0,624)

41

Sexo del encuestado? * Medio de transporte?


T abla de co n tingen cia Sexo del encuestado? Hombre Mujer 3 5 37,5% 11,1% 4,2% 5 20,0% 18,5% 7,0% 7 63,6% 25,9% 9,9% 11 42,3% 40,7% 15,5% 1 100,0% 3,7% 1,4% 27 38,0% 100,0% 38,0% 44 62,0% 100,0% 62,0% 62,5% 11,4% 7,0% 20 80,0% 45,5% 28,2% 4 36,4% 9,1% 5,6% 15 57,7% 34,1% 21,1%

Total 8 100,0% 11,3% 11,3% 25 100,0% 35,2% 35,2% 11 100,0% 15,5% 15,5% 26 100,0% 36,6% 36,6% 1 100,0% 1,4% 1,4% 71 100,0% 100,0% 100,0%

Medio de transporte?

Coche

Autobus

Metro

Andando

Otros

T otal

Recuento % de Medio de transporte? % de Sexo del encuestado? % del total Recuento % de Medio de transporte? % de Sexo del encuestado? % del total Recuento % de Medio de transporte? % de Sexo del encuestado? % del total Recuento % de Medio de transporte? % de Sexo del encuestado? % del total Recuento % de Medio de transporte? % de Sexo del encuestado? % del total Recuento % de Medio de transporte? % de Sexo del encuestado? % del total

Pruebas de chi-cuadrado Valor 8,341 a 8,865 2,384 71 gl 4 4 1 Sig. asinttica (bilateral) ,080 ,065 ,123

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

a. 5 casillas (50,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es ,38.

Observando la tabla comprobamos que el medio de transporte ms utilizado en general tanto por hombres como por mujeres es el autobs (35,2%). Hay que destacar tambin que muchas personas

42

prefieren no utilizar ningn medio de transporte e ir caminando 36,6% (el porcentaje ms grande de todos en general). Por sexos el medio de transporte ms utilizado es: para las mujeres el autobs y los hombres prefieren ir andando. En este caso si hay relacin entre el sexo del encuestado y el medio de transporte ya que la significacin es menor al 0,05. Sexo del encuestado? * Tienes ordenador en casa?
Tabla de contingencia Sexo del encuestado? Hombre Mujer 14 20 41,2% 51,9% 19,7% 13 35,1% 48,1% 18,3% 27 38,0% 100,0% 38,0% 58,8% 45,5% 28,2% 24 64,9% 54,5% 33,8% 44 62,0% 100,0% 62,0%

Tienes ordenador en casa?

Si

No

Total

Recuento % de Tienes ordenador en casa? % de Sexo del encuestado? % del total Recuento % de Tienes ordenador en casa? % de Sexo del encuestado? % del total Recuento % de Tienes ordenador en casa? % de Sexo del encuestado? % del total

Total 34 100,0% 47,9% 47,9% 37 100,0% 52,1% 52,1% 71 100,0% 100,0% 100,0%

Pruebas de chi-cuadrado Valor ,274 b ,078 ,274 gl 1 1 1 Sig. asinttica (bilateral) ,600 ,780 ,600 ,632 ,271 71 1 ,603 ,390 Sig. exacta (bilateral) Sig. exacta (unilateral)

Chi-cuadrado de Pearson Correccin a por continuidad Razn de verosimilitud Estadstico exacto de Fisher Asociacin lineal por lineal N de casos vlidos

a. Calculado slo para una tabla de 2x2. b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 12,93.

Apreciamos que hay ms hombres que tienen ordenador en casa (19,7%) que hombres que no tienen (18,3%). Mientras que para las mujeres es al contrario, un 28,2% tienen ordenador frente a un 33,8%

43

que no tienen ordenador. El porcentaje de mujeres que tienen ordenador es mayor que el de hombres; esto es debido a que el porcentaje de mujeres es mayor que el de hombres. En este caso no existe correlacin entre las dos variables analizadas. Sexo del encuestado? * Deporte favorito?
Tabla de contingencia Sexo del encuestado? Hombre Mujer Recuento 4 6 % de Deporte favorito? 40,0% 60,0% % de Sexo del 14,8% 13,6% encuestado? % del total 5,6% 8,5% Recuento 1 6 % de Deporte favorito? 14,3% 85,7% % de Sexo del 3,7% 13,6% encuestado? % del total 1,4% 8,5% Recuento 3 7 % de Deporte favorito? 30,0% 70,0% % de Sexo del 11,1% 15,9% encuestado? % del total 4,2% 9,9% Recuento 3 2 % de Deporte favorito? 60,0% 40,0% % de Sexo del 11,1% 4,5% encuestado? % del total 4,2% 2,8% Recuento 15 21 % de Deporte favorito? 41,7% 58,3% % de Sexo del 55,6% 47,7% encuestado? % del total 21,1% 29,6% Recuento 1 2 % de Deporte favorito? 33,3% 66,7% % de Sexo del 3,7% 4,5% encuestado? % del total 1,4% 2,8% Recuento 27 44 % de Deporte favorito? 38,0% 62,0% % de Sexo del 100,0% 100,0% encuestado? % del total 38,0% 62,0%

Deporte favorito?

Futbol

Total 10 100,0% 14,1% 14,1% 7 100,0% 9,9% 9,9% 10 100,0% 14,1% 14,1% 5 100,0% 7,0% 7,0% 36 100,0% 50,7% 50,7% 3 100,0% 4,2% 4,2% 71 100,0% 100,0% 100,0%

Baloncesto

Tenis

Ciclismo

Otros

Ninguno

Total

44

Pruebas de chi-cuadrado Valor 3,219 a 3,446 ,501 71 gl 5 5 1 Sig. asinttica (bilateral) ,666 ,632 ,479

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

a. 8 casillas (66,7%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 1,14.

En general el porcentaje mayor se concentra en otros deportes no sealados (50,7. A ste le seguira tenis y ftbol con un mismo porcentaje (14,1%). Separado por sexos mujeres y hombres comparten que el deporte favorito es otros, con un porcentaje de 29,6%, y 21,1% respectivamente. Para estas dos variables la prueba de chi-cuadrado nos indica que no existe correlacin entre ambas.

45

Sexo del encuestado? *Nota final asignatura?

Tabla de contingencia Sexo del encuestado? Hombre Mujer 4 2 66,7% 14,8% 5,6% 16 32,0% 59,3% 22,5% 6 46,2% 22,2% 8,5% 1 100,0% 3,7% 1,4% 1 100,0% 2,3% 27 38,0% 100,0% 38,0% 1,4% 44 62,0% 100,0% 62,0% 33,3% 4,5% 2,8% 34 68,0% 77,3% 47,9% 7 53,8% 15,9% 9,9%

T otal 6 100,0% 8,5% 8,5% 50 100,0% 70,4% 70,4% 13 100,0% 18,3% 18,3% 1 100,0% 1,4% 1,4% 1 100,0% 1,4% 1,4% 71 100,0% 100,0% 100,0%

Nota final asignatura?

Suspenso

Aprobado

Notable

Sobresaliente

Matricula

Total

Recuento % de Nota final asignatura? % de Sexo del encuestado? % del total Recuento % de Nota final asignatura? % de Sexo del encuestado? % del total Recuento % de Nota final asignatura? % de Sexo del encuestado? % del total Recuento % de Nota final asignatura? % de Sexo del encuestado? % del total Recuento % de Nota final asignatura? % de Sexo del encuestado? % del total Recuento % de Nota final asignatura? % de Sexo del encuestado? % del total

46

Pruebas de chi-cuadrado Valor 5,467 a 6,047 ,044 71 gl 4 4 1 Sig. asinttica (bilateral) ,243 ,196 ,833

Chi-cuadrado de Pearson Razn de verosimilitud Asociacin lineal por lineal N de casos vlidos

a. 7 casillas (70,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es ,38.

En general el mayor porcentaje de la nota de la asignatura, lo tiene la calificacin de aprobado con un porcentaje de 70,4%. A sta le sigue el notable con un porcentaje de 18,3%, lo que significa que aprobado y notable son las calificaciones ms frecuentes. Para las mujeres la calificacin de aprobado es la que mayor porcentaje presenta y tambin para los hombres. Aqu tampoco existe una correlacin entre la variable sexo del encuestado y la nota final de la asignatura (la significacin asinttica es de 0,243).

47

PRCTICA 4: CONTRASTE DE HIPTESIS


1. Comprobar si la variable Edad del Alumno muestra

diferencias significativas entre hombres y mujeres para el nivel del 1%. Para comenzar, hemos de saber claramente cuales son las variables con las que vamos a trabajar, una vez conocidas esas variables pasamos a realizar las posibles hiptesis que se puedan dar. En este caso las variables son: edad del alumno y sexo. A partir de aqu podemos plantear las siguientes hiptesis: Ho X Hi X
eh eh

=X X

em em

Una vez planteadas las hiptesis, debemos verificar el supuesto de normalidad para poder quedarnos con una u otra hiptesis y para ello hemos de aplicar la prueba de Kolmogorov-Smirnov. Puesto que se nos pide que veamos si hay diferencias segn sexo debemos segmentar el archivo; para ello nos vamos a Datos, elegimos la opcin Segmentar archivo y nos aparecer el siguiente cuadro de dilogo.

48

En el cuadro marcamos la opcin Comparar casos y los Grupos basados en Sexo. Una vez segmentados los archivos, hemos de realizar la prueba de Kolmogorov-Smirnov, para realizarla nos vamos a Analizar, despus seleccionamos Pruebas no paramtricas y dentro de esta seleccionamos K-s de 1 muestra

Tras esto nos aparecer:

49

En este cuadro marcamos edad del alumnos y lo ponemos en Contrastar siguientes: variables. Entonces nos aparecen los resultados

Prueba de Kolmogorov-Smirnov para una muestra

Sexo del alumno Hombre

N Parmetros normales(a,b) Media Desviacin tpica Diferencias ms extremas Absoluta Positiva Negativa Z de Kolmogorov-Smirnov Sig. asintt. (bilateral)

Edad del alumno 36 14,53 ,910 ,281 ,191 -,281 1,689 ,007 23

Mujer

N Parmetros normales(a,b) Media Desviacin tpica Diferencias ms extremas Absoluta Positiva Negativa Z de Kolmogorov-Smirnov

14,26 1,137 ,214 ,214 -,177 1,027 ,242

Sig. asintt. (bilateral) a La distribucin de contraste es la Normal. b Se han calculado a partir de los datos.

Tras observar los resultados nos encontramos con que no se cumple el supuesto de normalidad, y puesto que las dos muestras son independientes hemos de aplicar un contraste no paramtrico . Para llevar a cabo este contraste nos vamos a Analizar, Comparar medias y marcamos la opcin Prueba T para muestras independientes. La pantalla ha de quedar as:

50

Tras eso nos aparecer el siguiente cuadro de dilogo, en l hemos de poner las variables que se muestran ( edad del alumno para contrastar variables y sexo como variable de agrupacin):

Tras ello los resultados que se obtienen son:


Estadsticos de grupo Sexo del alumno Hombre Mujer N 36 23 Media 14,53 14,26 Desviacin tp. ,910 1,137 Error tp. de la media ,152 ,237

Edad del alumno

51

Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas

Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior -,270 -,302 ,803 ,836

F Edad del alumno Se han asumido varianzas iguales No se han asumido varianzas iguales 2,838

Sig. ,098

t ,996 ,948

gl 57 39,527

Sig. (bilateral) ,323 ,349

Diferencia de medias ,27 ,27

Error tp. de la diferencia ,268 ,281

Como el valor de la significacin es mayor al 1% nos quedaremos con la Hiptesis nula (Ho) , y el optar por la Ho significa que las varianzas son iguales. Podemos decir que existe homogeneidad en las variables y que las medias son muy similares por lo tanto no existen diferencias significativas lo cual demuestra que la relacin entre ambas variables no existe. 2. Existen diferencias, con un nivel de significacin del 5%,

para las faltas de los alumnos entre el 1er y el 3er trimestre. En este ejercicio vamos a trabajar con las variables faltas de los alumnos en el 1 trimestre y faltas de los alumnos en el 3 trimestre. A partir de estas variables formulamos las posibles hiptesis: Ho X1 = X3 Hi X1 X3

Se trata de muestras relacionadas, por ello podramos aplicar la prueba T de medias comparadas pero siempre verificando el supuesto de normalidad para poder quedarnos con una u otra hiptesis; para ello aplicaremos la prueba de Kolmogorov-Smirnov. Introduciremos las dos variables y obtendremos el siguiente cuadro:

52

Prueba de Kolmogorov-Smirnov para una muestra N de faltas en el 1er trimestre 60 19,92 9,645 ,137 ,129 -,137 1,058 ,212 N de faltas en el 3er trimestre 59 17,32 10,002 ,126 ,126 -,101 ,971 ,303

N a,b Parmetros normales

Media Desviacin tpica Absoluta Positiva Negativa

Diferencias ms extremas Z de Kolmogorov-Smirnov Sig. asintt. (bilateral)

a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos.

Como la significacin asinttica es 0,212 y 0,303 se cumple el supuesto de normalidad, y ya que la significacin es mayor al 5% podemos aceptar la Hiptesis nula. Ya que las muestras son relacionadas, puesto que la variable se ha medido en momentos temporales distintos pero sobre los mismos sujetos, y el supuesto de normalidad se cumple hemos de aplicar la prueba T, para ello pasamos al men analizar, comparar medias y accedemos a la prueba t para muestras relacionadas

Una vez dentro de ese apartado nos aparece una ventana en la que debemos seleccionar las variables que correspondan:

53

Una vez seguidos estos pasos obtenemos lo siguiente:

Estadsticos de muestras relacionadas Media Par 1 N de faltas en el 1er trimestre N de faltas en el 3er trimestre 19,95 17,32 N 59 59 Desviacin tp. 9,725 10,002 Error tp. de la media 1,266 1,302

Correlaciones de muestras relacionadas N Par 1 N de faltas en el 1er trimestre y N de faltas en el 3er trimestre 59 Correlacin ,627 Sig. ,000

Prueba de muestras relacionadas Diferencias relacionadas 95% Intervalo de confianza para la diferencia Inferior Superior ,41 4,85

Media Par 1 N de faltas en el 1er trimestre - N de faltas en el 3er trimestre 2,63

Desviacin tp. 8,526

Error tp. de la media 1,110

t 2,367

gl 58

Sig. (bilateral) ,021

Tras analizar la media de faltas de ambos trimestres podemos decir que el nmero de faltas cometidas es mayor en el primer trimestre ya que su media es algo mayor.

54

Como la significacin asinttica es menor al 5% hemos de rechazar la Hiptesis nula y aceptar la alterna que nos dice que existen diferencias entre las faltas de ambos trimestres. 3. Demuestra si los hombres tienen una nota en matemticas inferior a la de las mujeres con un nivel de significacin del 5%. Comprobarlo tambin con la nota en lengua. Este ejercicio es muy similar a los anteriores, especialmente al primero, ya que aqu entra en juego la variable sexo y por tanto se deber segmentar el archivo. En primer lugar, formulamos las hiptesis que se puedan dar para la nota en matemticas: Ho X Hi X =X X

mh mh

mm mm

A partir de aqu, como en el ejercicio 1, debemos de verificar el supuesto de normalidad para poder quedarnos con una u otra hiptesis y para ello aplicaremos la prueba de KolmogorovSmirnov. Como nos piden que veamos si hay diferencias segn sexo deberemos segmentar el archivo y seguidamente realizar la prueba de Kolmogorov-Smirnov para la variable nota en matemticas y obtenemos los siguientes resultados:

55

Prueba de Kolmogorov-Smirnov para una muestra Nota media en Matemticas 36 4,997 1,8358 ,251 ,251 -,138 1,508 ,021 24 5,717 2,2272 ,234 ,234 -,210 1,147 ,144

Sexo del alumno Hombre

N a,b Parmetros normales

Media Desviacin tpica Absoluta Positiva Negativa

Diferencias ms extremas

Mujer

Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) N a,b Parmetros normales Media Desviacin tpica Diferencias ms extremas Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) Absoluta Positiva Negativa

a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos.

La significacin asinttica de los hombres es menor al 5% (0,021) y la de las mujeres es mayor (0,144), por lo tanto no se cumple la hiptesis nula ya que existen diferencias entre hombres y mujeres; al quedarnos con la hiptesis alterna damos por hecho que no se cumple el supuesto de normalidad. Debido a esto hemos de aplicar la Prueba U de Mann Whitney por ser dos muestras independientes. Para calcular esta prueba seguimos los siguientes pasos: analizar, pruebas no paramtricas y 2 muestras independientes:

56

Una vez dentro aparece un cuadro de dialogo donde debemos seleccionar las variables implicadas, en el apartado de contrastar variables ponemos la variable nota en matemticas y en variable de agrupacin ponemos la variable sexo, quedando de la siguiente forma:

Y los resultados que obtenemos son los que a continuacin se muestran:


Rangos Sexo del alumno Hombre Mujer Total N 36 24 60 Rango promedio 27,86 34,46 Suma de rangos 1003,00 827,00

Nota media en Matemticas

57

a Estadsticos de contraste

U de Mann-Whitney W de Wilcoxon Z Sig. asintt. (bilateral)

Nota media en Matemticas 337,000 1003,000 -1,436 ,151

a. Variable de agrupacin: Sexo del alumno

La significacin en este caso es mayor al 5% as que rechazamos la Hi y nos quedamos con la Ho. Con esto se puede decir que las diferencias entre la nota de hombres y mujeres no son significativas. Ahora nos piden que hagamos lo mismo pero esta vez para la nota de lengua. Las hiptesis que se puedan dar son: Al vez Ho X Hi X igual =X X

lh lh

lm lm

que

antes

deberemos

segmentar

el

archivo

seguidamente realizar la prueba de Kolmogorov-Smirnov pero esta para la variable nota en lengua y obtenemos los siguientes resultados:

58

Prueba de Kolmogorov-Smirnov para una muestra Sexo del alumno Hombre Nota media en Lengua 36 61,486 21,4316 ,261 ,261 -,136 1,566 ,015 24 74,896 20,4460 ,256 ,256 -,168 1,253 ,087

N a,b Parmetros normales

Media Desviacin tpica Absoluta Positiva Negativa

Diferencias ms extremas

Mujer

Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) N a,b Parmetros normales Media Desviacin tpica Diferencias ms extremas Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) Absoluta Positiva Negativa

a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos.

Observando los resultados vemos que la significacin asinttica es diferente puesto que la de las mujeres es superior al 5% y la de los hombres es menor. Por lo tanto, hemos de aceptar la Hiptesis alterna y aplicar la prueba de U de Mann-Whitney, obteniendo los resultados siguientes:
Rangos Sexo del alumno Nota media en Lengua Hombre Mujer Total N 36 24 60 Rango promedio 25,03 38,71 Suma de rangos 901,00 929,00

a Estadsticos de contraste

Nota media en Lengua U de Mann-Whitney 235,000 W de Wilcoxon 901,000 Z -2,978 Sig. asintt. (bilateral) ,003 a. Variable de agrupacin: Sexo del alumno

Tras

ver los

resultados observamos

que la

significacin

asinttica es menor al 5%, lo que significa que debemos quedarnos

59

con la hiptesis alterna que dice que la nota media de lengua para los hombres es inferior a la nota media en lengua de las mujeres. 4. Existen diferencias entre los hombres y las mujeres para la variable Nmero de faltas (faltot) con un nivel del 1%? El primer paso que debemos realizar es identificar las variables que se van a analizar para as poder formular las hiptesis que puedan darse. En este caso las variables implicadas son nmero de faltas y sexo, y las posibles hiptesis: Ho X Hi X = X X (la media en el nmero de faltas de los (la media en el nmero de faltas de los

fh

fm

hombres es igual a la media de las mujeres).


fh fm

hombres es distinta a la media de las mujeres). Como en ejercicios anteriores tenemos que verificar el supuesto de normalidad; al pedirnos que veamos si hay diferencias segn el sexo debemos segmentar el archivo y seguidamente realizar la prueba de Kolmogorov-Smirnov para la variable nmero de faltas. Para llevar a cabo la prueba seguimos los mismos pasos que en los ejercicios anteriores: analizar, pruebas no paramtricas y dentro de esta seleccionamos K-S de una muestra. Una vez realizados estos pasos seleccionamos la variable nmero de faltas, aceptamos y obtenemos los siguientes resultados:

60

Prueba de Kolmogorov-Smirnov para una muestra Sexo del alumno Hombre N Parmetros normales N de faltas 36 57,2500 25,65193 ,149 ,131 -,149 ,893 ,403 24 52,9167 22,99133 ,144 ,144 -,118 ,706 ,702

a,b

Media Desviacin tpica Absoluta Positiva Negativa

Diferencias ms extremas Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) N Parmetros normales

Mujer

a,b

Media Desviacin tpica Absoluta Positiva Negativa

Diferencias ms extremas Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos.

En ambos casos comprobamos que la significacin es mayor al 1%, tanto para los hombres como para las mujeres, por lo que se cumple el supuesto de normalidad. Esto a su vez nos hace aceptar en principio la hiptesis nula. Verificado el supuesto de normalidad pasamos al men analizar, comparar medias, prueba T para muestras independientes:

61

Estadsticos de grupo Sexo del alumno Hombre Mujer N 36 24 Media 57,2500 52,9167 Desviacin tp. 25,65193 22,99133 Error tp. de la media 4,27532 4,69309

N de faltas

Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas

Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior -8,65964 -8,40003 17,32630 17,06670

F N de faltas Se han asumido varianzas iguales No se han asumido varianzas iguales ,749

Sig. ,390

t ,668 ,683

gl 58 53,020

Sig. (bilateral) ,507 ,498

Diferencia de medias 4,3333 4,3333

Error tp. de la diferencia 6,49091 6,34850

Lo que hacemos a continuacin es comprobar si la significacin es mayor o menor a 1% para poder quedarnos con una de las dos hiptesis. En este caso es mayor, por eso nos quedamos con la hiptesis nula, que apunta que no existen diferencias entre la nota final de hombres y mujeres. 5. Comprueba si obtienen una nota final mejor los

absentistas bajos que los absentistas crnicos para un nivel de significacin del 5%. Las variables implicadas en este ejercicio son nota final y tipo de absentismo; las posibles hiptesis son: Ho X Hi X
nab nab

=X X

nac nac

Primero verificamos el supuesto de normalidad aplicando la prueba de Kolmogorov-Smirnov. Antes de realizar la prueba debemos segmentar el archivo porque es necesario hacerlo para poder ver si hay diferencias de nota final segn el tipo de absentismo. Una vez segmentado nos vamos al men analizar, pruebas no

62

paramtricas, K-1 de una muestra, contrastar variable nota final. Los resultados que obtenemos son:
Prueba de Kolmogorov-Smirnov para una muestra Tipo de Absentismo Bajo Nota media del alumno 13 6,9828 1,18192 ,228 ,217 -,228 ,822 ,510 22 6,1608 1,20747 ,175 ,170 -,175 ,819 ,513 25 5,6352 2,22195 ,250 ,250 -,133 1,249 ,088

N a,b Parmetros normales

Media Desviacin tpica Absoluta Positiva Negativa

Diferencias ms extremas

Regular

Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) N a,b Parmetros normales Media Desviacin tpica Diferencias ms extremas Absoluta Positiva Negativa

Crnico

Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) N a,b Parmetros normales Media Desviacin tpica Diferencias ms extremas Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) Absoluta Positiva Negativa

a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos.

En los tres casos la significacin es mayor al 5% por lo que podemos decir que se cumple el supuesto de normalidad y que en principio aceptamos la hiptesis nula que dice que obtienen una nota mejor los absentistas bajos que crnicos. Para verificar esta eleccin pasamos a comparar las medias: analizar, comparar medias, prueba T para muestras independientes; estos son los resultados:
Estadsticos de grupo Tipo de Absentismo Bajo Crnico N 13 25 Media 6,9828 5,6352 Desviacin tp. 1,18192 2,22195 Error tp. de la media ,32780 ,44439

Nota media del alumno

63

Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas

Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior ,00336 ,22755 2,69174 2,46755

F Nota media del alumno Se han asumido varianzas iguales No se han asumido varianzas iguales 6,143

Sig. ,018

t 2,033 2,440

gl 36 35,941

Sig. (bilateral) ,049 ,020

Diferencia de medias 1,3476 1,3476

Error tp. de la diferencia ,66278 ,55221

En primer lugar nos fijamos en las medias; vemos que hay bastante diferencia entre absentistas bajos (13) y absentistas crnicos (25). Pasamos pues a ver la significacin y comprobamos que en ambos casos no es igual ni supera el 5%. Con estos resultados podemos sealar que debemos quedarnos con la hiptesis alterna (H1) y rechazar la hiptesis nula (H0); traducido a otras palabras diramos que no obtienen mejor nota los absentistas bajos que los crnicos. 6. Los alumnos con nivel econmico bajo obtienen una media menor que los alumnos de nivel econmico alto en alguna de las tres asignaturas (Matemticas, Medio Ambiente y Lengua), utiliza un nivel de 5%. Otra vez, como en apartados anteriores, debemos identificar las variables y formular las hiptesis posibles. Las variables implicadas son nivel econmico y nota media en las tres asignaturas , y las posibles hiptesis son: Ho X
nb

=X

na

(no existen diferencias entre los alumnos con

nivel econmico alto y los alumnos con nivel econmico bajo en las asignaturas de matemticas, lengua y medio ambiente) H1 X
nb

na

(no existen diferencias entre los alumnos con

nivel econmico alto y los alumnos con nivel econmico bajo en las asignaturas de matemticas, lengua y medio ambiente)

64

Para verificar el supuesto de normalidad aplicamos la prueba de Kolmogorov-Smirnov, segmentado antes el archivo para comparar los grupos segn el nivel econmico. Seguidamente realizamos la prueba de Kolmogorov-Smirnov de la siguiente forma: analizar, pruebas no paramtricas, K-1 de una muestra; esta vez en lugar de seleccionar solo una variable seleccionamos las tres variables de nota en la asignatura (nota media en matemticas, nota media en lengua y nota media en Medio Ambiente) ya que debemos de observar la nota en las tres asignaturas y si existen diferencias en alguna de ellas segn el nivel econmico de los alumnos. Los resultados obtenidos son:
Prueba de Kolmogorov-Smirnov para una muestra Nota media en Matemticas 13 5,115 1,4070 ,335 ,335 -,228 1,209 ,108 15 3,960 1,2557 ,261 ,261 -,222 1,010 ,259 19 6,321 2,2491 ,232 ,152 -,232 1,009 ,260 13 5,469 2,1422 ,354 ,354 -,222 1,276 ,077 Nota media en Medio Ambiente 13 52,08 13,294 ,364 ,240 -,364 1,314 ,063 15 32,20 17,193 ,396 ,396 -,257 1,536 ,018 19 54,16 13,150 ,257 ,181 -,257 1,119 ,164 13 55,08 6,487 ,298 ,298 -,223 1,074 ,199 Nota media en Lengua 13 59,338 18,2465 ,316 ,316 -,229 1,139 ,149 15 53,720 18,1044 ,347 ,347 -,191 1,342 ,054 19 82,221 19,1572 ,243 ,243 -,194 1,058 ,213 13 67,046 20,9784 ,261 ,261 -,221 ,942 ,338

Nivel Econmico ,

N a,b Parmetros normales

Media Desviacin tpica Absoluta Positiva Negativa

Diferencias ms extremas

Bajo

Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) N a,b Parmetros normales Media Desviacin tpica Diferencias ms extremas Absoluta Positiva Negativa

Medio

Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) N a,b Parmetros normales Media Desviacin tpica Diferencias ms extremas Absoluta Positiva Negativa

Alto

Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) N a,b Parmetros normales Media Desviacin tpica Diferencias ms extremas Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) Absoluta Positiva Negativa

a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos.

65

Si observamos la significacin por materias vemos que en matemticas y en lengua es mayor al 5% en los dos grupos pero en medio ambiente no lo es en los dos grupos. Para el grupo de nivel econmico bajo la significacin es menor a 5% mientras que para el grupo de nivel econmico alto es mayor a 5%. De este modo el supuesto de normalidad slo se cumple para matemticas y lengua, para medio ambiente no. Una vez comprobada la normalidad, debemos utilizar diferentes procedimientos: como en las materias de matemticas y lengua la significacin es mayor debemos realizar la prueba T, mientras que para la asignatura medio ambiente aplicamos la prueba de U de Mann-Whitney -Prueba T para matemticas
Estadsticos de grupo Nivel Econmico Bajo Alto N 15 13 Media 3,960 5,469 Desviacin tp. 1,2557 2,1422 Error tp. de la media ,3242 ,5941

Nota media en Matemticas

Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas

Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior -2,8509 -2,9270 -,1676 -,0915

F Nota media en Matemticas Se han asumido varianzas iguales No se han asumido varianzas iguales 11,616

Sig. ,002

t -2,312 -2,230

gl 26 18,784

Sig. (bilateral) ,029 ,038

Diferencia de medias -1,509 -1,509

Error tp. de la diferencia ,6527 ,6768

-Prueba T para lengua


Estadsticos de grupo Nivel Econmico Nota media en Lengua Bajo Alto N 15 13 Media 53,720 67,046 Desviacin tp. 18,1044 20,9784 Error tp. de la media 4,6745 5,8184

66

Prueba de muestras independientes Prueba de Levene para la igualdad de varianzas

Prueba T para la igualdad de medias 95% Intervalo de confianza para la diferencia Inferior Superior -28,5021 -28,7322 1,8498 2,0799

F Nota media en Lengua Se han asumido varianzas iguales No se han asumido varianzas iguales 1,537

Sig. ,226

t -1,805 -1,785

gl 26 23,941

Sig. (bilateral) ,083 ,087

Diferencia de medias -13,326 -13,326

Error tp. de la diferencia 7,3830 7,4636

Con esto resultados podemos ver que la significacin asinttica para matemticas es menor al 5%, por ello debemos rechazar la hiptesis nula y aceptar la alterna, que dice que existen diferencias entre alumnos con nivel econmico bajo y entre alumnos con nivel econmico alto. Sin embargo para el caso de lengua es diferente; al ser la significacin mayor al 5% aceptamos la hiptesis nula, que apunta que no existen diferencias entre los niveles econmicos altobajo. -Prueba U de Mann-Whitney
Rangos Nivel Econmico Bajo Alto Total N 15 13 28 Rango promedio 10,60 19,00 Suma de rangos 159,00 247,00

Nota media en Medio Ambiente

b Estadsticos de contraste

Nota media en Medio Ambiente U de Mann-Whitney 39,000 W de Wilcoxon 159,000 Z -2,719 Sig. asintt. (bilateral) ,007 a Sig. exacta [2*(Sig. ,006 unilateral)] a. No corregidos para los empates. b. Variable de agrupacin: Nivel Econmico

Para medio ambiente la significacin asinttica es menor al 5% (0,006), por lo que rechazamos la hiptesis nula y aceptamos la

67

alterna, que nos dice que existen diferencias entre los alumnos de nivel econmico alto y nivel econmico bajo. 7. Demostrar si existen diferencias entre las medias de

faltas del primer trimestre y el segundo trimestre para un nivel del 5%. En este ejercicio las variables son nmero de faltas del primer trimestre y nmero de faltas del segundo trimestre . Las hiptesis que pueden formularse son:

Ho X Hi X

f1 f1

=X X

f2 f2

Ahora verificamos el supuesto de normalidad aplicando la prueba de Kolmogorov-Smirnov. Seguimos los pasos ya descritos en ejercicios anteriores, introducimos las dos variables y obtenemos el siguiente cuadro:
Prueba de Kolmogorov-Smirnov para una muestra N de faltas en el 1er trimestre 60 19,92 9,645 ,137 ,129 -,137 1,058 ,212 N de faltas en el 2 trimestre 60 18,57 8,420 ,128 ,096 -,128 ,988 ,283

N a,b Parmetros normales

Media Desviacin tpica Absoluta Positiva Negativa

Diferencias ms extremas Z de Kolmogorov-Smirnov Sig. asintt. (bilateral)

a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos.

La tabla obtenida nos muestra que la significacin es mayor al 5% (0,212 y 0,283 respectivamente), por lo que podemos decir que

68

se cumple el supuesto de normalidad y que nos quedamos con la hiptesis nula. Una vez realizado este paso pasamos a calcular la prueba T. Los pasos a seguir son (igual que en el segundo apartado): analizar, comparar medias, prueba T para muestras relacionadas. Hecho esto obtenemos los siguientes resultados:
Estadsticos de muestras relacionadas Media Par 1 N de faltas en el 1er trimestre N de faltas en el 2 trimestre 19,92 18,57 N 60 60 Desviacin tp. 9,645 8,420 Error tp. de la media 1,245 1,087

Correlaciones de muestras relacionadas N Par 1 N de faltas en el 1er trimestre y N de faltas en el 2 trimestre 60 Correlacin ,645 Sig. ,000

Prueba de muestras relacionadas Diferencias relacionadas 95% Intervalo de confianza para la diferencia Inferior Superior -,64 3,34

Media Par 1 N de faltas en el 1er trimestre - N de faltas en el 2 trimestre 1,35

Desviacin tp. 7,691

Error tp. de la media ,993

t 1,360

gl 59

Sig. (bilateral) ,179

Observando los valores de las medias de faltas comprobamos que no existe una gran diferencia entre las faltas del 1 trimestre y las faltas del 2 trimestre. Referente a la significacin, vemos que es mayor a 5% por ende nos quedamos con la hiptesis nula, que dice que no existen diferencias significativas entre el nmero de faltas cometidas en el primer trimestre y el nmero de faltas cometidas en el segundo trimestre.

69

8.

Comprueba si los alumnos con una nota final superior o

igual a 5 tienen un nmero de faltas mayor en el segundo trimestre que en el tercero, con un nivel de significacin del 5%. El primer que debemos realizar es la identificacin de las variables con las que se vamos a trabajar para poder formular las hiptesis convenientes. Las variables implicadas son nota media del alumno y nmero de faltas tanto del segundo como del tercer trimestre. Las hiptesis que se pueden plantear son:

Ho X

f2a

=X

f3a

(la media de faltas en el segundo trimestre

para los alumnos aprobados es igual a la media de las faltas cometidas en el tercer trimestre para los mismos alumnos). Hi X
f2a

f2a

(la media de faltas en el segundo trimestre

para los alumnos aprobados es distinta a la media de las faltas cometidas en el tercer trimestre para los mismos alumnos). A continuacin verificamos el supuesto de normalidad aplicando la prueba de Kolmogorov-Smirnov. Antes de realizar otro paso debemos seleccionar los casos, ya que nos piden que comprobemos las diferencias de nmero de faltas solo para los alumnos que tienen una nota final superior o igual a cinco. Para realizar la seleccin de los casos nos vamos a men, datos, seleccionar casos, seleccionar si se satisface la condicin. Una vez aqu debemos poner la condicin, que sera escoger solamente a los alumnos con nota igual o superior a cinco; esto queda de la siguiente forma:

70

De este modo tenemos seleccionados nicamente los casos que nos interesan. Seleccionados los casos debemos segmentar el archivo, seleccionando la opcin comparar grupos. Acto seguido introducimos la nueva variable creada (nota final pero solo con los que tienen cinco o una nota superior).

71

Ahora aplicamos la prueba de Kolmogorov-Smirnov, contrastando las variables de nmero de faltas en el primer trimestre y nmero de faltas en el tercer trimestre. Los resultados que obtenemos son los siguientes:
Prueba de Kolmogorov-Smirnov para una muestra N de faltas en el 2 trimestre 44 16,41 8,587 ,133 ,133 -,099 ,880 ,421 N de faltas en el 3er trimestre 43 14,37 9,355 ,181 ,181 -,139 1,190 ,118

notfinal >= 5 (FILTER) Seleccionado N a,b Parmetros normales

Media Desviacin tpica Absoluta Positiva Negativa

Diferencias ms extremas Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos.

En la tabla podemos apreciar que la significacin es mayor a 5%, por consiguiente se cumple el criterio de normalidad; por eso nos quedamos con la hiptesis nula. A continuacin calculamos la prueba T, para poder comparar las variables: analizar, comparar medias, prueba T para muestras relacionadas. Al introducir las variables obtenemos estos resultados:
Estadsticos de muestras relacionadas notfinal >= 5 (FILTER) Seleccionado Par 1 Media N de faltas en el 2 trimestre N de faltas en el 3er trimestre 16,47 14,37 N 43 43 Desviacin tp. 8,680 9,355 Error tp. de la media 1,324 1,427

Correlaciones de muestras relacionadas notfinal >= 5 (FILTER) Seleccionado Par 1 N N de faltas en el 2 trimestre y N de faltas en el 3er trimestre 43 Correlacin ,597 Sig. ,000

72

Prueba de muestras relacionadas Diferencias relacionadas 95% Intervalo de confianza para la diferencia Inferior Superior -,41 4,59

notfinal >= 5 (FILTER) Seleccionado Par 1 N de faltas en el 2 trimestre - N de faltas en el 3er trimestre

Media 2,09

Desviacin tp. 8,118

Error tp. de la media 1,238

t 1,691

gl 42

Sig. (bilateral) ,098

Podemos observar que las medias del nmero de faltas en el trimestre 2 y el nmero de faltas en el trimestre 3 son ligeramente diferentes en un caso y en otrora, ya que la media de faltas el segundo trimestre es mayor que la del tercer trimestre. Esto significa que se ha cometido mayor nmero de faltas en el segundo trimestre aunque la diferencia no es muy abultada. La significacin es mayor al 5% por lo que debemos quedarnos con la hiptesis nula que dice que la media de faltas en el segundo trimestre para los alumnos con una nota superior o igual a cinco es igual o similar a la media de las faltas cometidas en el tercer trimestre para los mismos alumnos.

73