Professional Documents
Culture Documents
CARRERA:
CURSO:
PLAN:
CATEDRTICO:
FECHA:
ESTADSTICA I
FIN DE SEMANA
ING. OSCAR ROLANDO SALAZAR
15 agosto 2015
UNIDAD 4
MEDIDAS DE TENDENCIA CENTRAL o
DE CENTRALIZACIN
I.
Introduccin
Son mediciones alrededor de las cuales tienden a agruparse los datos. Nos proporcionan informacin de los
datos que estamos analizando y a la vez, nos permiten conocer las caractersticas de series de datos.
En el anlisis exploratorio de los datos, generalmente se reconocen los siguientes tipos de medidas:
II.
Medidas de tendencia central, son aquellas que informan sobre el centro o promedio de las
observaciones, entre ellas destacan, la media aritmtica, la mediana y la moda.
Medidas de posicin, una vez ordenados los datos informan sobre la localizacin de estos;
generalmente se les denomina cuantiles, entre ellas tenemos a los, deciles, quintiles, cuartiles y
percentiles.
Medidas de dispersin, son aquellas que determinan la separacin de los datos, de ellas destacan,
el rango intercuartlico, la desviacin tpica, la varianza, el coeficiente de variacin.
Medidas de forma, son las que proporcionan una idea de la simetra y apuntamiento de las
distribuciones; tal es el caso del coeficiente de asimetra o sesgo y el coeficiente de apuntamiento o
curtosis.
Los fenmenos biolgicos se caracterizan por la diversidad de informacin que proporciona, por lo que es
necesario que junto a una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una
medida que haga referencia a la variabilidad que refleje dicha fluctuacin.
1
Conocer las principales medidas de posicin central utilizadas comnmente en al anlisis de datos
estadsticos.
2.
Aplicar los conocimientos adquiridos de tales medidas para la bsqueda de la solucin a estudios de
casos.
3.
Crear la metodologa que facilite la comparacin de datos entre grupos distintos con la misma
variable o entre variables distintas.
4.
Tendencia a centrarse.
b.
c.
Variacin de la posicin.
d.
e.
Resulta valioso conocer los valores que marcan posiciones caractersticas de una distribucin de frecuencias, as
como, su simetra y forma.
Las principales medidas o estadsticos de posicin central son:
II.2
La Media Aritmtica
Es la suma de los valores de todas las observaciones dividida por el nmero de observaciones:
2
Recibe tambin el nombre de media aritmtica o promedio. Valores muy alejados del resto pueden modificar
sustancialmente la media (en una situacin as debe considerarse la utilizacin de la mediana, que no es sensible
a los valores extremos).
Identificacin:
Si se trata de la media de una muestra, el smbolo es:
Si se trata de la media de una poblacin, su smbolo es: (mu)
Es el estadstico que nos permite conocer el valor central de un conjunto de datos. Existen varios
procedimientos para obtenerla, la tecnologa actual, nos facilita las operaciones mediante el uso de un
computador o calculadoras programables o sencillamente utilizando las calculadoras cientficas. Sin embargo,
cuando se desea analizar gran cantidad de observaciones, estas pequeas mquinas dejan de ser importantes.
Por otro lado, resulta valioso conocer aspectos bsicos del origen de la informacin.
Para el efecto pueden utilizarse datos brutos (los que provienes del campo) o los datos contenidos en una tabla
de distribucin de frecuencias tipo A o tipo B.
Obviamente, resulta engorroso y delicado analizar datos de campo si se cuenta con muchas observaciones,
siendo necesario antes ordenarlos en una tabla de distribucin de frecuencias.
III.1. Caractersticas de la media aritmtica:
1.
2.
3.
4.
Fcil de calcular
Toma en cuenta todos los valores
Con valores extremos no es representativa
No se puede calcular para caracteres cualitativos o intervalos no acotados.
III.2. Metodologa
III.2.1 Primer caso: Utilizando los datos de campo.
EDAD
25
19
21
22
28
17
22
25
19
20
22
21
23
21
16
20
18
21
22
22
24
20
21
18
20
21
25
22
23
25
25
19
19
22
22
19
20
20
27
20
20
20
22
19
21
21
23
24
22
20
24
21
21
30
22
24
20
20
22
19
19
20
20
25
21
20
28
35
20
21
32
24
19
19
21
19
25
21
20
21
21
20
26
20
22
21
28
23
23
18
21
22
20
21
23
24
21
23
25
23
20
21
25
18
21
18
19
21
22
21
23
20
17
23
21
21
19
20
23
27
18
18
21
20
21
23
19
22
19
19
31
22
19
20
21
23
19
21
23
25
22
26
25
20
20
20
20
27
21
19
21
21
19
19
20
31
23
23
35
22
18
19
36
23
Click en fx:
En la casilla: seleccionar una categora, hacer click en su icono V;
buscar todas
Click en todas
En la casilla: seleccionar una funcin buscar la funcin: promedio utilizando su icono V
Una vez localizada la funcin promedio, hacer click en la casilla aceptar lo cual activar el cursor
No ha sido necesario ordenar los datos en una tabla de distribucin de frecuencias y mediante un procedimiento
sencillo hemos obtenido la media aritmtica de 164 observaciones y podemos responder con certeza que el
promedio de altura de las treinta plantas de maz es de 21.8292 aos.
III.2.2 Segundo caso: Clculo de la media utilizando una tabla de distribucin de frecuencias.
Esta metodologa se utiliza si deseamos obtener el promedio a partir de una tabla de distribucin de frecuencias;
se puede proceder de la siguiente manera:
Edad
Valor de la
variable
Valid
Frequency
16
17
18
19
20
21
22
23
24
25
26
27
28
30
31
32
35
36
Total
1
2
8
22
30
33
19
17
6
11
2
3
3
1
2
1
2
1
164
Percent
.6
1.2
4.9
13.4
18.3
20.1
11.6
10.4
3.7
6.7
1.2
1.8
1.8
.6
1.2
.6
1.2
.6
100.0
Valid Percent
.6
1.2
4.9
13.4
18.3
20.1
11.6
10.4
3.7
6.7
1.2
1.8
1.8
.6
1.2
.6
1.2
.6
100.0
Cumulative Percent
.6
1.8
6.7
20.1
38.4
58.5
70.1
80.5
84.1
90.9
92.1
93.9
95.7
96.3
97.6
98.2
99.4
100.0
Utilizar la columna que contiene los valores encontrados de la variable y la columna que contiene las
frecuencias absolutas simples (recordemos que este cuadro se obtuvo utilizando SPSS).
Se procede a multiplicar cada valor de variable por la correspondiente frecuencia absoluta simple, la que se
suma a la siguiente clase operada de igual forma, en nuestro caso, llegaremos a obtener 18 multiplicaciones,
segn el nmero de clases; la sumatoria de estos valores se divide entre el numero de observaciones (N), como
en el primer caso y utilizaremos la siguiente notacin matemtica:
7
De donde,
= (16*1)+(17*2)+(18*8)+ + (36*1)
164
= 21.8292
Podemos observar que el resultado es el mismo que al utilizar los datos de campo.
III.2.3 Tercer caso. Encontrar la media aritmtica utilizando una tabla de distribucin de frecuencias con
datos agrupados en intervalos de clase.
Posiblemente los resultados no sean idnticos a los obtenidos anteriormente, porque en este caso utilizaremos la
marca de clase de cada intervalo.
li
ls
Fas
16.0000
18.3930
11
17.1965
18.3930
20.7860
52
19.5895
20.7860
23.1790
69
21.9825
23.1790
25.5720
17
24.3755
25.5720
27.9650
26.7685
27.9650
30.3580
29.1615
30.3580
32.7510
31.5545
32.7510
35.1440
33.9475
35.1440
37.5370
36.3405
164
La marca de clase (identificada como c) se ha obtenido sumando los lmites de cada intervalo y dividindolos
entre 2, por ejemplo, (16 + 18.3930)/2 = 17.1965 aos
Se procede de igual forma al caso anterior, multiplicando cada marca de clase (c), por la correspondiente
frecuencia absoluta simple y dividiendo el resultado total entre el nmero de observaciones, N.
De donde,
= (17.1965*11)+(19.5895*52)++(36.3405*1)
164
8
Media
5.0
5.0
5.0
5.0
5.0
5.0
Operacin
6-5 = 1
4-5 = -1
8-5 = 3
5-5 = 0
4-5 = -1
3-5 = -2
Desviacin
1
-1
3
0
-1
-2
Total 0
III.3.2 La suma de los cuadrados de las desviaciones de un conjunto de nmeros X de cualquier nmero a es
mnima, solamente si a es =.
Cuadrado de las
Datos
Media
Operacin
Desviacin
desviaciones
6
5.0
6-5 = 1
1
1
4
5.0
4-5 = -1
-1
1
8
5.0
8-5 = 3
3
9
5
5.0
5-5 = 0
0
0
4
5.0
4-5 = -1
-1
1
3
5.0
3-5 = -2
-2
4
Total 30
Total 0
Total 16
Promedio = 5.0
III.3.3 Si f1 nmeros tienen de media m1, f2 nmeros tienen de media m2, fk nmeros tienen de media mk,
entonces la media de todos los nmeros es
Grupos de plantas
(f)
15
20
10
18
63
Peso promedio
por grupo (m)
112
118
106
98
(f) * (m)
1680
2360
1060
1764
6864
= 6864
63
= 108.95 libras
Esta media tambin se denomina media aritmtica ponderada.
Una persona se somete a un examen de oposicin para ocupar una plaza vacante en una empresa, el
examen consta de tres pruebas:
Oral,
Escrita,
Curricular
Dicha persona obtiene las siguientes notas: 85,70 y 75, en cada una de las pruebas respectivamente.
a.1
Si para el departamento de seleccin de personal, las tres pruebas tienen el mismo valor, determina la
media aritmtica ponderada.
a.2
Si para el departamento de seleccin de personal, la prueba escrita vale el doble de la oral y la prueba
curricular vale el cudruplo de la oral, determine la media aritmtica ponderada.
2.
Obtener la media ponderada de tres calificaciones de una prueba (85, 90, 75), donde la primera
prueba cuenta el 20%, la segunda el 30% y la tercera el 50% de la calificacin final.
= 81.5
10
IV.
La Media Geomtrica
Metodologa
11
Ejemplo de media geomtrica: la media geomtrica suele utilizarse en negocios y economa para calcular las
tasas de cambio promedio, las tasas de crecimiento promedio o tasas promedio. Dados n valor (todos positivos),
la media geomtrica es la n-sima raz de su producto.
Ejemplo: El factor de crecimiento promedio de dinero compuesto con tasas de inters anual del 10%, el 8%, el
9%, el 12% y el 7% se obtiene determinando la media geomtrica de 1.10, 1.08, 1.09, 1.12, y 1.07. Calcule el
factor de crecimiento promedio.
= 1.091
La media geomtrica (MG) de un conjunto de n nmeros positivos se define como la raz n-sima del producto de los n valores. Su frmula
es:
La media geomtrica se usa para encontrar el promedio de porcentajes, razones, ndices o tasas de crecimiento.
Ejemplo
Las tasas de inters de tres bonos son 5%, 7% y 4%.
La media geomtrica es
= 5.192.
12
Ejemplo
El nmero total de mujeres inscritas en colegios americanos aument de 755 000 en 1986 a 835 000 en 1995.
Aqu n = 10, as (n - 1) = 9.
Es decir, la media geomtrica de la tasa de crecimiento es 1.27%.
V.
La Media Armnica
Es una importante medida de centralizacin utilizada para conocer el comportamiento de grupos de individuos
bajo estudio.
Se define como el recproco de la media aritmtica de los recprocos, es decir,
Por tanto,
V.1
Metodologa
N
.
1/x1 + 1/x2 + 1/Xn
En nuestro caso, utilizaremos EXCEL, buscando la funcin MEDIA.ARMO, mediante los procedimientos ya
conocidos y el resultado se expresa en la siguiente grfica:
13
Ejemplo: cuatro estudiantes viajan desde Xela hasta la capital de Guatemala (220 kilmetros) a una velocidad
de 60 km/h. Como necesitan llegar a tiempo a su clase de estadstica, viajan de regreso a una velocidad de 100
km/h. cul es la velocidad promedio del viaje completo?
= 75 km/h
VI.
La media cuadrtica
Es la raz cuadrada del cuadrado de la media (root main squart o RMS). Tiene utilidad cuando se analizan datos
de carcter fsico, tales como gases, lquidos, fuerzas, etc.
Se obtiene extrayendo la raz cuadrada de la sumatoria de cuadrados de los datos obtenidos y divididos entre su
correspondiente totalidad de observaciones. Se le identifica como RMS.
VI.1
Metodologa
La media cuadrtica suele utilizarse en aplicaciones fsicas. Por ejemplo, en los sistemas de distribucin de
energa, los montajes y las corrientes suelen referirse en trminos de sus valores de CMR. La media cuadrtica
de un conjunto de valores se obtiene elevando al cuadrado cada valor, sumando los resultados, dividiendo el
nmero de valor n y despus sacando la raz cuadrada del resultado, el cual se expresa como
Ejemplo: calcular el CMR de estas fuentes de poder (en volts): 110, 0, -60, 12
= 125.87 volts
VII. La mediana
La representaremos con el smbolo:
Es una medida de localizacin o tendencia central de los datos. Es el valor que divide al conjunto de datos en
dos conjuntos de igual tamao. Unos que son menores o iguales que la mediana y otros que son mayores o
15
iguales que la mediana. Es el valor de la serie de datos que se sita justamente en el centro (un 50% de valores
son inferiores y otro 50% son superiores).
Para calcularla se procede primeramente a ordenar los datos, generalmente del menor al mayor valor; la
mediana slo depende de la posicin que ocupa, no del valor particular observado.
En la mediana, los datos no presentan el problema de estar influidos por los valores extremos, pero en cambio
no se utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de
veces que se ha repetido).
VII.1 Caractersticas de la mediana:
Si ahora observamos los valores 1, 6, 5, 4, 3, 4, 5, 5, podemos darnos cuenta que son datos pares. El primer
paso consiste en ordenar los datos: 1, 3, 4, 4, 5, 5, 5, 6. Como hay 8 datos, un valor que se encuentre entre la
cuarta y la quinta posicin dividir el conjunto de datos en dos subconjuntos de 4 datos cada uno: 1, 3, 4, 4, x,
5, 5, 5, 6. En este caso, se procede tomando los dos nmeros centrales y dividindolos entre 2, esto nos permite
obtener el valor de la mediana, de este conjunto de datos que es (4 + 5)/2 = 4.5
La mediana puede obtenerse directamente utilizando EXCEL (funcin MEDIANA) o SPSS. Para ello hacemos
uso de los procedimientos que antes se han explicado. La grafica siguiente muestra el valor de la mediana
utilizando los datos de campo.
VII.2.2
Segundo caso, utilizando datos agrupados en una tabla de distribucin de frecuencias con
intervalos de clase
Para datos agrupados, la mediana se obtiene mediante interpolacin lineal y viene dada por
Donde
L1 =
N=
(f)1 =
f mediana =
c=
lmite real inferior de la clase mediana (es decir, la clase que contiene la mediana)
Nmero total de datos, es decir, frecuencia total.
Suma de las frecuencias de todas las clases por debajo de la clase mediana
frecuencia de la clase mediana
Tamao del intervalo de la clase mediana
Utilizando la tabla de distribucin de frecuencias por intervalos que nos ha ocupado, procederemos a calcular la
mediana mediante la frmula antes mencionada.
17
Primeramente conviene ubicar la clase mediana, y es aquella donde se encuentra el 50% de los datos, en la
frecuencia porcentual acumulada.
li
ls
Fa
frs
Frac
fps
fpac
16.0000
18.3930
11
11
0.0671
0.0671
6.7073
6.7073
17.1965
18.3930
20.7860
52
63
0.3171
0.3841
31.7073
38.4146
19.5895
20.7860
23.1790
69
132
0.4207
0.8049
42.0732
80.4878
21.9825
23.1790
25.5720
17
149
0.1037
0.9085
10.3659
90.8537
24.3755
25.5720
27.9650
154
0.0305
0.9390
3.0488
93.9024
26.7685
27.9650
30.3580
158
0.0244
0.9634
2.4390
96.3415
29.1615
30.3580
32.7510
161
0.0183
0.9817
1.8293
98.1707
31.5545
32.7510
35.1440
163
0.0122
0.9939
1.2195
99.3902
33.9475
35.1440
37.5370
164
0.0061
1.0000
0.6098
100.0000
36.3405
164
1.0000
100.0000
En el presente caso, la clase mediana se ubica en el tercer intervalo, porque en este se encontr el 80.49% de los
datos acumulados.
Donde
L1 =
lmite real inferior de la clase mediana (es decir, la clase que contiene la mediana) = 20.7860
N=
VII.3.1
Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas,
ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado
su uso en distribuciones asimtricas.
VII.3.2
VII.3.3
A diferencia de la media, la mediana de una variable discreta es siempre un valor de la variable
que estudiamos (ej. La mediana de la variable nmero de hijos toma siempre valores enteros).
VII.3.4
Si una poblacin est formada por dos subpoblaciones de medianas Med1 y Med2, slo se puede
afirmar que la mediana, Med, de la poblacin est comprendida entre Med1 y Med2
VII.3.5
El mayor defecto de la mediana es que tiene unas propiedades matemticas complicadas, lo que
hace que sea muy difcil de utilizar en inferencia estadstica.
VII.3.6
VII.3.7
VII.3.8
La suma de las diferencias de los valores absolutos de n puntuaciones respecto a su mediana es
menor o igual que cualquier otro valor.
Ejemplo
Sea X, una variable discreta que ha presentado sobre una muestra las modalidades, 2, 5, 7, 9, 12, la mediana es
7.
Si cambiamos la ltima observacin por otra anormalmente grande, esto no afecta a la mediana, pero si a la
media: 2, 5, 7, 9, 125, la mediana seguir siendo 7, pero la media ahora ser 29.6.
En este caso la media no es un posible valor de la variable (discreta), y se ha visto muy afectada por la
observacin extrema. Este no ha sido el caso para la mediana.
VIII. La moda
Se representa por el smbolo:
Tambin suele ser llamada modo. Es el valor que ocurre con mayor frecuencia, es decir, el valor ms frecuente.
La moda puede no existir, e incluso no ser nica en caso de existir (ej. Multimodal).
En ciertas ocasiones la media aritmtica, la mediana y la moda suelen coincidir, aunque generalmente no es as.
Cada uno de ellos presenta ventajas e inconvenientes.
Una distribucin que tiene una sola moda se llama unimodal.
19
Llamaremos moda a cualquier mximo relativo de la distribucin de frecuencias, es decir, cualquier valor de la
variable que posea una frecuencia mayor que su anterior y su posterior.
En el caso de datos agrupados donde se ha construido una curva de frecuencia para ajustar los datos, la moda
ser el valor (o los valores) de X correspondientes al mximo (o mximos) de la curva.
Primer caso: Utilizando los datos de campo.
La moda puede obtenerse directamente utilizando EXCEL (funcin MODA) o SPSS. Para ello hacemos uso de
los procedimientos que antes se han explicado. La grafica siguiente muestra el valor de la moda utilizando los
datos de campo:
Segundo caso: Calcular la moda de una distribucin de frecuencias o un histograma con datos agrupados, la
moda suele obtenerse utilizando la frmula:
Donde
L1
1
2
c
=
=
=
=
Lmite real inferior de clase de la clase modal (es decir, la clase que contiene la moda)
Exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferior
Exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior
tamao del intervalo de clase modal
Si tomamos la tabla que hemos venido analizando, podemos encontrar la moda aplicando la frmula anterior,
Li
20
ls
fas
Faac
frs
frac
fps
fpac
16.0000
18.3930
11
11
0.0671
0.0671
6.7073
6.7073
17.1965
18.3930
20.7860
52
63
0.3171
0.3841
31.7073
38.4146
19.5895
20.7860
23.1790
69
132
0.4207
0.8049
42.0732
80.4878
21.9825
23.1790
25.5720
17
149
0.1037
0.9085
10.3659
90.8537
24.3755
25.5720
27.9650
154
0.0305
0.9390
3.0488
93.9024
26.7685
27.9650
30.3580
158
0.0244
0.9634
2.4390
96.3415
29.1615
30.3580
32.7510
161
0.0183
0.9817
1.8293
98.1707
31.5545
32.7510
35.1440
163
0.0122
0.9939
1.2195
99.3902
33.9475
35.1440
37.5370
164
0.0061
1.0000
0.6098
100.0000
36.3405
164
1.0000
100.0000
Observando la frecuencia absoluta simple (fas), encontramos que la clase modal est constituida por el tercer
intervalo.
L1
1
2
c
=
=
=
=
20.7860
69 52 = 17
69 17 = 52
2.3930
VIII.2.2
VIII.2.3
Es funcin de los intervalos elegidos a travs de su amplitud, nmero y lmites de los mismos.
VIII.2.4 Aunque el primero o el ltimo de los intervalos no posean extremos inferior o superior
respectivamente, la moda puede ser calculada.
21
X.
En el caso de distribuciones unimodales, la mediana est con frecuencia comprendida entre la media y la moda
(incluso ms cerca de la media). En distribuciones que presentan cierta inclinacin, es ms aconsejable el uso de
la mediana. Sin embargo en estudios relacionados con propsitos estadsticos y de inferencia suele ser ms apta
la media.
Para curvas de frecuencias unimodales que sean moderadamente sesgadas (asimtricas), se tiene la relacin
emprica
Media moda = 3 (media mediana)
En la siguiente figura se muestran las posiciones relativas de la media, mediana y moda para una curva de
frecuencias que est sesgadas a la izquierda.
22
ACTIVIDADES COMPLEMENTARIAS
A. Calcular las medidas de tendencia central utilizando el programa Stadis 1.05
2. Hacer click en nueva (cuando se desean ingresar nuevos datos) o abrir cuando se desea abrir una base de
datos guardada. Supongamos que nuestro inters es ingresar nuevos datos, hacer click en nueva.
3. Seleccionar el tipo de variable a analizar: unidimensional o bidimensional. Si nuestro inters es analizar
la variable EDAD, la consideraremos unidimensional discreta (hacer doble click en
UNIDIMENSIONAL); luego seleccionar si se trata de una variable categrica, discreta o continua.
Las variables unidimensionales pueden clasificarse en categricas, discretas o continuas (Variables unidimensionales: slo
recogen informacin sobre una caracterstica (por ejemplo: edad de los alumnos de una clase. Variable
23
individuo en solo una de varias celdas o clases; estas celdas o clases son totalmente incluyentes y mutuamente excluyentes. Variable
discreta: Es una variable que puede asumir un nmero contable de distintos valores. Es decir, la cantidad de valores que puede asumir una variable
discreta puede contarse fcilmente (potencialmente, ya que puede que nunca se llegue al final); Ejemplos: nmeros que se asignan a cada nio.
Variable continua: Es una variable que puede adquirir valores en un conjunto no contable de objetos, tal como un intervalo o la recta numrica.
Ejemplos: estatura, largo, peso, distancia, tiempo, volumen, etc., podra incluirse la edad.
Variables BIDIMENSIONALES: Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: edad y
altura de los alumnos de una clase); pueden clasificarse en variables discretas-discretas, discretas-continuas y, continuas-continuas.
4.
5. Tomar en consideracin que aparecern dos columnas: la primera con Xi y la segunda ni; esto implica
que el programa analizar datos agrupados en una tabla de distribucin de frecuencias tipo A; en
nuestro caso, contamos con la siguiente tabla:
Edad
Valor de la
variable
Valid
Frequency
16
17
18
19
20
21
22
23
24
25
26
27
28
30
31
32
35
36
Total
1
2
8
22
30
33
19
17
6
11
2
3
3
1
2
1
2
1
164
Percent
.6
1.2
4.9
13.4
18.3
20.1
11.6
10.4
3.7
6.7
1.2
1.8
1.8
.6
1.2
.6
1.2
.6
100.0
Valid Percent
.6
1.2
4.9
13.4
18.3
20.1
11.6
10.4
3.7
6.7
1.2
1.8
1.8
.6
1.2
.6
1.2
.6
100.0
Cumulative Percent
.6
1.8
6.7
20.1
38.4
58.5
70.1
80.5
84.1
90.9
92.1
93.9
95.7
96.3
97.6
98.2
99.4
100.0
6. Ingresar en la columna Xi los valores de la variable edad y en ni el valor de la frecuencia simple, como
puede observarse en la siguiente grfica:
24
7. Pulsar NOT; hacer click en de la casilla en blanco. Hacer click en medidas de tendencia central,
los resultados son los siguientes:
25
Conclusiones:
a. Se le recomienda al alumno conocer informacin valiosa pulsando el icono: CAL, informacin que
posteriormente ser de importancia para el curso Estadstica I.
b. Ingresar la tabla de distribucin de frecuencias tipo B utilizando UNIDIMENSIONAL CONTINUA,
ingresando en LiX los valores de los lmites inferiores de cada intervalo y la columna LsX, los valores
de los lmites superiores de cada intervalo y, en la columna ni, ingresar las observaciones:
26
Al igual que el caso anterior, pulsar NOT y obtener los resultados de medidas de tendencia central
Resultados (utilizando una tabla de distribucin de frecuencias tipo B)
=== MEDIDAS DE TENDENCIA CENTRAL (var. X) ===
- Tamao Muestral ............... 164
- Media Aritmtica .............. 21.88
- Media Armnica ................ 21.478
- Media Geomtrica .............. 21.668
- Media Cuadrtica .............. 22.121
- Mediana ....................... 21.445
- Moda .......................... 21.376
- Cuartil Q(1) ................. 19.774
- Cuartil Q(3) ................. 22.867
27
28
4. Reconocer las funciones principales del programa (en espaol o ingls): File, Edit, View, Data,
Transform, Analyze, Graphs, Utilities, Adds-ons, Window, Help.
5. Debajo de la hoja encontramos las ventanas Data View y Variable View, que son de utilidad para
cambiar las caractersticas de las variables.
6. En las columnas anotar los valores de las variables de forma descendente (no es posible trasladar la base
de datos EXCEL que antes hemos utilizado, al menos que la base de datos se encuentre en forma
descendente pueden transportarse los datos desde EXCEL: copiar, luego ubicarnos en la primera celda
de SPSS, click derecho: paste); observar la siguiente grfica luego que han sido transportados desde
EXCEL los valores de las variables EDAD, ESTATURA Y PESO de los 164 estudiantes.
7. Identificar las variables segn cada columna. Para ello, pulsar Variable view en la parte baja de la
ventana, lo cual nos traslada a la grafica de abajo y en Name proceder a identificar las variables: Edad,
Estatura y Peso (la informacin de cada variable la encontraremos en forma horizontal)
Y el resultado es el siguiente:
29
Existen otras caractersticas de las variables que pueden modificarse desde aqu y que ser necesario hacerlo
conforme avancemos con el curso.
8. Analizar los datos mediante el siguiente procedimiento: click Analyze + Estadstica Descriptiva + 123
frequencies:
9. Trasladar las variables a la casilla Variables (s), utilizando la flecha azul: click sobre el nombre la
variable + click sobre la flecha.
30
10. Click sobre Statistic y luego marcar las medidas de tendencia central que nos interesan: la media, la
mediana, la moda, la sumatoria, los valores mnimos y mximos.
11. Click en continue, click en Ok y los resultados los observaremos en la ventana output debajo de
esta pantalla.
12. Copiar y pegar a WORD los resultados que se encontraran en varios cuadros:
Descriptive Statistics
N
Minimum
Maximum
Mean
Std. Deviation
Edad
164
16.00
36.00
21.8293
3.30014
Estatura
164
1.45
1.90
1.6929
.08023
Peso
164
95.00
286.00
151.2195
28.03833
Valid N (listwise)
164
31
Statistics
Edad
N
Valid
Estatura
Peso
164
164
164
Mean
21.8293
1.6929
151.2195
Median
21.0000
1.7000
147.5000
Mode
21.00
1.70
160.00
Minimum
16.00
1.45
95.00
Maximum
36.00
1.90
286.00
3580.00
277.63
24800.00
Missing
Sum
Edad
Cumulative
Frequency
Valid
Valid Percent
Percent
16.00
.6
.6
.6
17.00
1.2
1.2
1.8
18.00
4.9
4.9
6.7
19.00
22
13.4
13.4
20.1
20.00
30
18.3
18.3
38.4
21.00
33
20.1
20.1
58.5
22.00
19
11.6
11.6
70.1
23.00
17
10.4
10.4
80.5
24.00
3.7
3.7
84.1
25.00
11
6.7
6.7
90.9
26.00
1.2
1.2
92.1
27.00
1.8
1.8
93.9
28.00
1.8
1.8
95.7
30.00
.6
.6
96.3
31.00
1.2
1.2
97.6
32.00
.6
.6
98.2
35.00
1.2
1.2
99.4
36.00
.6
.6
100.0
164
100.0
100.0
Total
32
Percent
33