You are on page 1of 33

UNIVERSIDAD RAFAEL LANDVAR

CARRERA:
CURSO:
PLAN:
CATEDRTICO:
FECHA:

LICENCIATURA EN CIENCIAS AGRCOLAS CON NFASIS EN CULTIVOS TROPICALES

ESTADSTICA I
FIN DE SEMANA
ING. OSCAR ROLANDO SALAZAR
15 agosto 2015

UNIDAD 4
MEDIDAS DE TENDENCIA CENTRAL o
DE CENTRALIZACIN

I.

Introduccin

Son mediciones alrededor de las cuales tienden a agruparse los datos. Nos proporcionan informacin de los
datos que estamos analizando y a la vez, nos permiten conocer las caractersticas de series de datos.
En el anlisis exploratorio de los datos, generalmente se reconocen los siguientes tipos de medidas:

II.

Medidas de tendencia central, son aquellas que informan sobre el centro o promedio de las
observaciones, entre ellas destacan, la media aritmtica, la mediana y la moda.

Medidas de posicin, una vez ordenados los datos informan sobre la localizacin de estos;
generalmente se les denomina cuantiles, entre ellas tenemos a los, deciles, quintiles, cuartiles y
percentiles.

Medidas de dispersin, son aquellas que determinan la separacin de los datos, de ellas destacan,
el rango intercuartlico, la desviacin tpica, la varianza, el coeficiente de variacin.

Medidas de forma, son las que proporcionan una idea de la simetra y apuntamiento de las
distribuciones; tal es el caso del coeficiente de asimetra o sesgo y el coeficiente de apuntamiento o
curtosis.

Medidas de tendencia central

Los fenmenos biolgicos se caracterizan por la diversidad de informacin que proporciona, por lo que es
necesario que junto a una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una
medida que haga referencia a la variabilidad que refleje dicha fluctuacin.
1

II.1 OBJETIVOS ESPECFICOS


1.

Conocer las principales medidas de posicin central utilizadas comnmente en al anlisis de datos
estadsticos.

2.

Aplicar los conocimientos adquiridos de tales medidas para la bsqueda de la solucin a estudios de
casos.

3.

Crear la metodologa que facilite la comparacin de datos entre grupos distintos con la misma
variable o entre variables distintas.

4.

Describir las medidas de tendencia central.

Caractersticas de los datos con respecto a estas medidas:


a.

Tendencia a centrarse.

b.

Dispersin o variacin con respecto al centro

c.

Variacin de la posicin.

d.

La simetra de los datos.

e.

La forma en que los datos se agrupan

Resulta valioso conocer los valores que marcan posiciones caractersticas de una distribucin de frecuencias, as
como, su simetra y forma.
Las principales medidas o estadsticos de posicin central son:

II.2

La Media Aritmtica

Es la suma de los valores de todas las observaciones dividida por el nmero de observaciones:
2

Recibe tambin el nombre de media aritmtica o promedio. Valores muy alejados del resto pueden modificar
sustancialmente la media (en una situacin as debe considerarse la utilizacin de la mediana, que no es sensible
a los valores extremos).
Identificacin:
Si se trata de la media de una muestra, el smbolo es:
Si se trata de la media de una poblacin, su smbolo es: (mu)

Es el estadstico que nos permite conocer el valor central de un conjunto de datos. Existen varios
procedimientos para obtenerla, la tecnologa actual, nos facilita las operaciones mediante el uso de un
computador o calculadoras programables o sencillamente utilizando las calculadoras cientficas. Sin embargo,
cuando se desea analizar gran cantidad de observaciones, estas pequeas mquinas dejan de ser importantes.
Por otro lado, resulta valioso conocer aspectos bsicos del origen de la informacin.
Para el efecto pueden utilizarse datos brutos (los que provienes del campo) o los datos contenidos en una tabla
de distribucin de frecuencias tipo A o tipo B.
Obviamente, resulta engorroso y delicado analizar datos de campo si se cuenta con muchas observaciones,
siendo necesario antes ordenarlos en una tabla de distribucin de frecuencias.
III.1. Caractersticas de la media aritmtica:
1.
2.
3.
4.

Fcil de calcular
Toma en cuenta todos los valores
Con valores extremos no es representativa
No se puede calcular para caracteres cualitativos o intervalos no acotados.

III.2. Metodologa
III.2.1 Primer caso: Utilizando los datos de campo.

Utilizaremos los datos de campo que corresponden a la edad de un grupo de 164


estudiantes de la sede de Escuintla de la Universidad Rafael Landivar:
3

Para el efecto utilizaremos el programa EXCEL:

EDAD
25

19

21

22

28

17

22

25

19

20

22

21

23

21

16

20

18

21

22

22

24

20

21

18

20

21

25

22

23

25

25

19

19

22

22

19

20

20

27

20

20

20

22

19

21

21

23

24

22

20

24

21

21

30

22

24

20

20

22

19

19

20

20

25

21

20

28

35

20

21

32

24

19

19

21

19

25

21

20

21

21

20

26

20

22

21

28

23

23

18

21

22

20

21

23

24

21

23

25

23

20

21

25

18

21

18

19

21

22

21

23

20

17

23

21

21

19

20

23

27

18

18

21

20

21

23

19

22

19

19

31

22

19

20

21

23

19

21

23

25

22

26

25

20

20

20

20

27

21

19

21

21

19

19

20

31

23

23

35

22

18

19

36

23

Trasladamos esta base de datos a una hoja de EXCEL:

Seguidamente, ubicarse en cualquier celda vaca (por ejemplo A23):


Buscar la funcin (f):
4

Click en fx:
En la casilla: seleccionar una categora, hacer click en su icono V;
buscar todas
Click en todas
En la casilla: seleccionar una funcin buscar la funcin: promedio utilizando su icono V
Una vez localizada la funcin promedio, hacer click en la casilla aceptar lo cual activar el cursor

Hacer click en la flecha roja de la casilla que dice: numero1


Colocar el cursor en la primera casilla que contiene los datos, en nuestro caso es la A2, luego marcar todas las
columnas que contienen la informacin, es decir, hasta J21:

Hacer click en la flecha roja de argumentos de funcin


Hacer click en aceptar y como resultado tenemos: 21.8292 (recordemos que de preferencia deben utilizarse
cuatro decimales)
En la siguiente casilla escribimos el nombre del valor obtenido para no perdernos. El resultado lo observamos
en la siguiente imagen:

Responder: el promedio de edad encontrado en los 164 estudiantes es de 21.8292 aos.


Utilizando el mismo procedimiento podemos encontrar el promedio o media aritmtica de cualquier cantidad de
observaciones.
6

No ha sido necesario ordenar los datos en una tabla de distribucin de frecuencias y mediante un procedimiento
sencillo hemos obtenido la media aritmtica de 164 observaciones y podemos responder con certeza que el
promedio de altura de las treinta plantas de maz es de 21.8292 aos.

III.2.2 Segundo caso: Clculo de la media utilizando una tabla de distribucin de frecuencias.
Esta metodologa se utiliza si deseamos obtener el promedio a partir de una tabla de distribucin de frecuencias;
se puede proceder de la siguiente manera:

Edad
Valor de la
variable
Valid

Frequency
16
17
18
19
20
21
22
23
24
25
26
27
28
30
31
32
35
36
Total

1
2
8
22
30
33
19
17
6
11
2
3
3
1
2
1
2
1
164

Percent
.6
1.2
4.9
13.4
18.3
20.1
11.6
10.4
3.7
6.7
1.2
1.8
1.8
.6
1.2
.6
1.2
.6
100.0

Valid Percent
.6
1.2
4.9
13.4
18.3
20.1
11.6
10.4
3.7
6.7
1.2
1.8
1.8
.6
1.2
.6
1.2
.6
100.0

Cumulative Percent
.6
1.8
6.7
20.1
38.4
58.5
70.1
80.5
84.1
90.9
92.1
93.9
95.7
96.3
97.6
98.2
99.4
100.0

Utilizar la columna que contiene los valores encontrados de la variable y la columna que contiene las
frecuencias absolutas simples (recordemos que este cuadro se obtuvo utilizando SPSS).
Se procede a multiplicar cada valor de variable por la correspondiente frecuencia absoluta simple, la que se
suma a la siguiente clase operada de igual forma, en nuestro caso, llegaremos a obtener 18 multiplicaciones,
segn el nmero de clases; la sumatoria de estos valores se divide entre el numero de observaciones (N), como
en el primer caso y utilizaremos la siguiente notacin matemtica:
7

De donde,
= (16*1)+(17*2)+(18*8)+ + (36*1)
164

= 21.8292
Podemos observar que el resultado es el mismo que al utilizar los datos de campo.
III.2.3 Tercer caso. Encontrar la media aritmtica utilizando una tabla de distribucin de frecuencias con
datos agrupados en intervalos de clase.
Posiblemente los resultados no sean idnticos a los obtenidos anteriormente, porque en este caso utilizaremos la
marca de clase de cada intervalo.

li

ls

Fas

16.0000

18.3930

11

17.1965

18.3930

20.7860

52

19.5895

20.7860

23.1790

69

21.9825

23.1790

25.5720

17

24.3755

25.5720

27.9650

26.7685

27.9650

30.3580

29.1615

30.3580

32.7510

31.5545

32.7510

35.1440

33.9475

35.1440

37.5370

36.3405

164

La marca de clase (identificada como c) se ha obtenido sumando los lmites de cada intervalo y dividindolos
entre 2, por ejemplo, (16 + 18.3930)/2 = 17.1965 aos
Se procede de igual forma al caso anterior, multiplicando cada marca de clase (c), por la correspondiente
frecuencia absoluta simple y dividiendo el resultado total entre el nmero de observaciones, N.

De donde,
= (17.1965*11)+(19.5895*52)++(36.3405*1)
164
8

= 3588.3788/164 = 21.8803 aos.


El resultado obtenido es satisfactorio, si se toma en cuenta lo expresado al iniciar el tercer caso.
III.3. Propiedades de la media aritmtica
III.3.1 La suma algebraica de las desviaciones de un conjunto de nmeros de su media aritmtica es cero.
Con la siguiente serie de nmeros demostrar la primera propiedad de la media aritmtica: 6, 4, 8, 5, 2, 7.
Datos
6
4
8
5
4
3
Total 30
Promedio = 5.0

Media
5.0
5.0
5.0
5.0
5.0
5.0

Operacin
6-5 = 1
4-5 = -1
8-5 = 3
5-5 = 0
4-5 = -1
3-5 = -2

Desviacin
1
-1
3
0
-1
-2
Total 0

III.3.2 La suma de los cuadrados de las desviaciones de un conjunto de nmeros X de cualquier nmero a es
mnima, solamente si a es =.
Cuadrado de las
Datos
Media
Operacin
Desviacin
desviaciones
6
5.0
6-5 = 1
1
1
4
5.0
4-5 = -1
-1
1
8
5.0
8-5 = 3
3
9
5
5.0
5-5 = 0
0
0
4
5.0
4-5 = -1
-1
1
3
5.0
3-5 = -2
-2
4
Total 30
Total 0
Total 16
Promedio = 5.0
III.3.3 Si f1 nmeros tienen de media m1, f2 nmeros tienen de media m2, fk nmeros tienen de media mk,
entonces la media de todos los nmeros es

Es decir, una media aritmtica ponderada de todas las medias


Por ejemplo, cuatro grupos de plantas, formados por 15, 20, 10 y 18 plantas registran una media de altura de
112, 118, 106 y 98 centmetros, respectivamente. Hallar el peso medio de todas las plantas.
Un procedimiento que puede facilitar las operaciones y comprensin es la preparacin de la siguiente tabla:
9

Grupos de plantas
(f)
15
20
10
18
63

Peso promedio
por grupo (m)
112
118
106
98

= (15 * 112) + (20 * 118) + (10 * 106) + (18 * 98)


15 + 20 + 10 + 18

(f) * (m)
1680
2360
1060
1764
6864

= 6864
63

= 108.95 libras
Esta media tambin se denomina media aritmtica ponderada.

Ejemplo de media aritmtica ponderada:


1.
a.
b.
c.

Una persona se somete a un examen de oposicin para ocupar una plaza vacante en una empresa, el
examen consta de tres pruebas:
Oral,
Escrita,
Curricular

Dicha persona obtiene las siguientes notas: 85,70 y 75, en cada una de las pruebas respectivamente.
a.1
Si para el departamento de seleccin de personal, las tres pruebas tienen el mismo valor, determina la
media aritmtica ponderada.
a.2
Si para el departamento de seleccin de personal, la prueba escrita vale el doble de la oral y la prueba
curricular vale el cudruplo de la oral, determine la media aritmtica ponderada.

2.

Obtener la media ponderada de tres calificaciones de una prueba (85, 90, 75), donde la primera
prueba cuenta el 20%, la segunda el 30% y la tercera el 50% de la calificacin final.

= 81.5

10

IV.

La Media Geomtrica

Constituye otro importante estadstico en el anlisis de la informacin bajo investigacin. Es de importancia en


los campos econmicos, sociales, educativos, de salud y otros, para conocer tipos de inters anual, inflacin,
crecimiento poblacional, etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos
anteriores.
Segn los datos que obtengamos y el estudio que se realice es conveniente analizar la posibilidad de utilizar, la
media aritmtica o la media geomtrica.
La metodologa a utilizar para encontrar la media geomtrica depender de la informacin disponible, al igual
que los casos para encontrar la media aritmtica.
IV.1

Metodologa

IV.1.1 Primer caso: Utilizando datos de campo.


Se extrae la raz N de la multiplicacin consecutiva de cada observacin multiplicada por el nmero de
observaciones. El procedimiento se facilita si no se dispone de muchos datos.

Tambin se denota por

, es la media de los logaritmos de los valores de la variable.


Fcilmente podemos obtener la media geomtrica utilizando EXCEL. El procedimiento es similar al caso de la
obtencin del promedio. En este caso, buscamos la funcin MEDIA.GEOM

11

Y el resultado lo ubicamos en la celda siguiente despus del promedio.


Media geomtrica: 21.6128aos

Ejemplo de media geomtrica: la media geomtrica suele utilizarse en negocios y economa para calcular las
tasas de cambio promedio, las tasas de crecimiento promedio o tasas promedio. Dados n valor (todos positivos),
la media geomtrica es la n-sima raz de su producto.
Ejemplo: El factor de crecimiento promedio de dinero compuesto con tasas de inters anual del 10%, el 8%, el
9%, el 12% y el 7% se obtiene determinando la media geomtrica de 1.10, 1.08, 1.09, 1.12, y 1.07. Calcule el
factor de crecimiento promedio.
= 1.091
La media geomtrica (MG) de un conjunto de n nmeros positivos se define como la raz n-sima del producto de los n valores. Su frmula
es:

La media geomtrica se usa para encontrar el promedio de porcentajes, razones, ndices o tasas de crecimiento.
Ejemplo
Las tasas de inters de tres bonos son 5%, 7% y 4%.

La media geomtrica es

= 5.192.

La media aritmtica es (6 + 3 + 2)/3 = 5.333.


La MG da una cifra de ganancia ms conservadora porque no tiene una ponderacin alta para la tasa de 7%.
Otra aplicacin de la media geomtrica es determinar el porcentaje promedio del incremento en ventas, produccin u otros negocios o series
econmicas de un periodo a otro.
La frmula para este tipo de problema es:

12

Ejemplo
El nmero total de mujeres inscritas en colegios americanos aument de 755 000 en 1986 a 835 000 en 1995.
Aqu n = 10, as (n - 1) = 9.
Es decir, la media geomtrica de la tasa de crecimiento es 1.27%.

V.

La Media Armnica

Es una importante medida de centralizacin utilizada para conocer el comportamiento de grupos de individuos
bajo estudio.
Se define como el recproco de la media aritmtica de los recprocos, es decir,

Por tanto,

V.1

Metodologa

V.1.1 Primer caso: Utilizando los datos de campo.


Es decir, se obtiene dividiendo la totalidad de observaciones N entre la sumatoria de recprocos de cada dato
(1/x). Se le identifica con la letra H.
H=

N
.
1/x1 + 1/x2 + 1/Xn

En nuestro caso, utilizaremos EXCEL, buscando la funcin MEDIA.ARMO, mediante los procedimientos ya
conocidos y el resultado se expresa en la siguiente grfica:

13

Respuesta: la media armnica encontrada en 164 estudiantes es de 21.4214 aos.


La media armnica, se utiliza a menudo como una medida de tendencia central para conjuntos de datos que
consisten en tasas de cambios, como la velocidad. Para calcularla, se divide el nmero de valores n entre l suma
de los reciprocos de todos los valores, de la siguiente forma:

Ejemplo: cuatro estudiantes viajan desde Xela hasta la capital de Guatemala (220 kilmetros) a una velocidad
de 60 km/h. Como necesitan llegar a tiempo a su clase de estadstica, viajan de regreso a una velocidad de 100
km/h. cul es la velocidad promedio del viaje completo?

= 75 km/h

VI.

La media cuadrtica

Es la raz cuadrada del cuadrado de la media (root main squart o RMS). Tiene utilidad cuando se analizan datos
de carcter fsico, tales como gases, lquidos, fuerzas, etc.
Se obtiene extrayendo la raz cuadrada de la sumatoria de cuadrados de los datos obtenidos y divididos entre su
correspondiente totalidad de observaciones. Se le identifica como RMS.

VI.1

Metodologa

VI.1.1 Primer caso. Utilizando datos de campo.


14

Elevar al cuadrado cada observacin,


Sumar todos los cuadrados: resultado 79924
Dividir la sumatoria entre las observaciones: 487.3415
Obtener la raz de la divisin anterior: 22.0758 aos
Respuesta: la raz cuadrtica de los 164 estudiantes es de 22.0758 aos

La media cuadrtica suele utilizarse en aplicaciones fsicas. Por ejemplo, en los sistemas de distribucin de
energa, los montajes y las corrientes suelen referirse en trminos de sus valores de CMR. La media cuadrtica
de un conjunto de valores se obtiene elevando al cuadrado cada valor, sumando los resultados, dividiendo el
nmero de valor n y despus sacando la raz cuadrada del resultado, el cual se expresa como

Ejemplo: calcular el CMR de estas fuentes de poder (en volts): 110, 0, -60, 12

= 125.87 volts

VII. La mediana
La representaremos con el smbolo:
Es una medida de localizacin o tendencia central de los datos. Es el valor que divide al conjunto de datos en
dos conjuntos de igual tamao. Unos que son menores o iguales que la mediana y otros que son mayores o
15

iguales que la mediana. Es el valor de la serie de datos que se sita justamente en el centro (un 50% de valores
son inferiores y otro 50% son superiores).
Para calcularla se procede primeramente a ordenar los datos, generalmente del menor al mayor valor; la
mediana slo depende de la posicin que ocupa, no del valor particular observado.
En la mediana, los datos no presentan el problema de estar influidos por los valores extremos, pero en cambio
no se utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de
veces que se ha repetido).
VII.1 Caractersticas de la mediana:

Es til si la media no se puede calcular o no es representativa

No toma en cuenta todas las observaciones

Depende de la posicin relativa de los datos, no de sus valores.


VII.2 Metodologa
VII.2.1

Primer caso, utilizando datos de campo

Si tenemos los valores 2, 8, 3, 6, 4, 8, 3, 5, 6, primeramente procedemos a ordenarlos: 2, 3, 3, 4, 5, 6, 6, 8, 8.


Observamos que contamos con nueve datos, es decir, son datos impares y el valor que se encuentra en la quinta
posicin dividir el conjunto de datos en dos subconjuntos de 4 datos cada uno: 2, 3, 3, 4 5 6, 6, 8, 8, la
mediana es, por lo tanto, el nmero 5.
16

Si ahora observamos los valores 1, 6, 5, 4, 3, 4, 5, 5, podemos darnos cuenta que son datos pares. El primer
paso consiste en ordenar los datos: 1, 3, 4, 4, 5, 5, 5, 6. Como hay 8 datos, un valor que se encuentre entre la
cuarta y la quinta posicin dividir el conjunto de datos en dos subconjuntos de 4 datos cada uno: 1, 3, 4, 4, x,
5, 5, 5, 6. En este caso, se procede tomando los dos nmeros centrales y dividindolos entre 2, esto nos permite
obtener el valor de la mediana, de este conjunto de datos que es (4 + 5)/2 = 4.5
La mediana puede obtenerse directamente utilizando EXCEL (funcin MEDIANA) o SPSS. Para ello hacemos
uso de los procedimientos que antes se han explicado. La grafica siguiente muestra el valor de la mediana
utilizando los datos de campo.

Respuesta: la mediana que corresponde a los 164 estudiantes es de 21 aos

VII.2.2
Segundo caso, utilizando datos agrupados en una tabla de distribucin de frecuencias con
intervalos de clase
Para datos agrupados, la mediana se obtiene mediante interpolacin lineal y viene dada por

Donde
L1 =
N=
(f)1 =
f mediana =
c=

lmite real inferior de la clase mediana (es decir, la clase que contiene la mediana)
Nmero total de datos, es decir, frecuencia total.
Suma de las frecuencias de todas las clases por debajo de la clase mediana
frecuencia de la clase mediana
Tamao del intervalo de la clase mediana

Utilizando la tabla de distribucin de frecuencias por intervalos que nos ha ocupado, procederemos a calcular la
mediana mediante la frmula antes mencionada.
17

Primeramente conviene ubicar la clase mediana, y es aquella donde se encuentra el 50% de los datos, en la
frecuencia porcentual acumulada.

li

ls

Fa

frs

Frac

fps

fpac

16.0000

18.3930

11

11

0.0671

0.0671

6.7073

6.7073

17.1965

18.3930

20.7860

52

63

0.3171

0.3841

31.7073

38.4146

19.5895

20.7860

23.1790

69

132

0.4207

0.8049

42.0732

80.4878

21.9825

23.1790

25.5720

17

149

0.1037

0.9085

10.3659

90.8537

24.3755

25.5720

27.9650

154

0.0305

0.9390

3.0488

93.9024

26.7685

27.9650

30.3580

158

0.0244

0.9634

2.4390

96.3415

29.1615

30.3580

32.7510

161

0.0183

0.9817

1.8293

98.1707

31.5545

32.7510

35.1440

163

0.0122

0.9939

1.2195

99.3902

33.9475

35.1440

37.5370

164

0.0061

1.0000

0.6098

100.0000

36.3405

164

1.0000

100.0000

En el presente caso, la clase mediana se ubica en el tercer intervalo, porque en este se encontr el 80.49% de los
datos acumulados.

Donde
L1 =

lmite real inferior de la clase mediana (es decir, la clase que contiene la mediana) = 20.7860

N=

Nmero total de datos, es decir, frecuencia total = 164

(f)1 = Suma de las frecuencias acumuladas por debajo de la clase mediana = 63

f mediana = frecuencia de la clase mediana = 69


c=
Tamao del intervalo de la clase mediana = 2.3930

Med = 21.8611 aos


VII.3
Propiedades de la mediana
Entre las propiedades de la mediana, vamos a destacar las siguientes:
18

VII.3.1
Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas,
ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado
su uso en distribuciones asimtricas.
VII.3.2

Es de clculo rpido y de interpretacin sencilla.

VII.3.3
A diferencia de la media, la mediana de una variable discreta es siempre un valor de la variable
que estudiamos (ej. La mediana de la variable nmero de hijos toma siempre valores enteros).
VII.3.4
Si una poblacin est formada por dos subpoblaciones de medianas Med1 y Med2, slo se puede
afirmar que la mediana, Med, de la poblacin est comprendida entre Med1 y Med2
VII.3.5
El mayor defecto de la mediana es que tiene unas propiedades matemticas complicadas, lo que
hace que sea muy difcil de utilizar en inferencia estadstica.
VII.3.6

Es funcin de los intervalos escogidos.

VII.3.7

Puede ser calculada aunque el intervalo inferior o el superior no tengan lmites.

VII.3.8
La suma de las diferencias de los valores absolutos de n puntuaciones respecto a su mediana es
menor o igual que cualquier otro valor.
Ejemplo
Sea X, una variable discreta que ha presentado sobre una muestra las modalidades, 2, 5, 7, 9, 12, la mediana es
7.
Si cambiamos la ltima observacin por otra anormalmente grande, esto no afecta a la mediana, pero si a la
media: 2, 5, 7, 9, 125, la mediana seguir siendo 7, pero la media ahora ser 29.6.
En este caso la media no es un posible valor de la variable (discreta), y se ha visto muy afectada por la
observacin extrema. Este no ha sido el caso para la mediana.

VIII. La moda
Se representa por el smbolo:
Tambin suele ser llamada modo. Es el valor que ocurre con mayor frecuencia, es decir, el valor ms frecuente.
La moda puede no existir, e incluso no ser nica en caso de existir (ej. Multimodal).
En ciertas ocasiones la media aritmtica, la mediana y la moda suelen coincidir, aunque generalmente no es as.
Cada uno de ellos presenta ventajas e inconvenientes.
Una distribucin que tiene una sola moda se llama unimodal.
19

Llamaremos moda a cualquier mximo relativo de la distribucin de frecuencias, es decir, cualquier valor de la
variable que posea una frecuencia mayor que su anterior y su posterior.
En el caso de datos agrupados donde se ha construido una curva de frecuencia para ajustar los datos, la moda
ser el valor (o los valores) de X correspondientes al mximo (o mximos) de la curva.
Primer caso: Utilizando los datos de campo.
La moda puede obtenerse directamente utilizando EXCEL (funcin MODA) o SPSS. Para ello hacemos uso de
los procedimientos que antes se han explicado. La grafica siguiente muestra el valor de la moda utilizando los
datos de campo:

Segundo caso: Calcular la moda de una distribucin de frecuencias o un histograma con datos agrupados, la
moda suele obtenerse utilizando la frmula:

Donde
L1
1
2
c

=
=
=
=

Lmite real inferior de clase de la clase modal (es decir, la clase que contiene la moda)
Exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferior
Exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior
tamao del intervalo de clase modal

Si tomamos la tabla que hemos venido analizando, podemos encontrar la moda aplicando la frmula anterior,
Li

20

ls

fas

Faac

frs

frac

fps

fpac

16.0000

18.3930

11

11

0.0671

0.0671

6.7073

6.7073

17.1965

18.3930

20.7860

52

63

0.3171

0.3841

31.7073

38.4146

19.5895

20.7860

23.1790

69

132

0.4207

0.8049

42.0732

80.4878

21.9825

23.1790

25.5720

17

149

0.1037

0.9085

10.3659

90.8537

24.3755

25.5720

27.9650

154

0.0305

0.9390

3.0488

93.9024

26.7685

27.9650

30.3580

158

0.0244

0.9634

2.4390

96.3415

29.1615

30.3580

32.7510

161

0.0183

0.9817

1.8293

98.1707

31.5545

32.7510

35.1440

163

0.0122

0.9939

1.2195

99.3902

33.9475

35.1440

37.5370

164

0.0061

1.0000

0.6098

100.0000

36.3405

164

1.0000

100.0000

Observando la frecuencia absoluta simple (fas), encontramos que la clase modal est constituida por el tercer
intervalo.
L1
1
2
c

=
=
=
=

20.7860
69 52 = 17
69 17 = 52
2.3930

Moda = 21.3756 aos


VIII.3 Caractersticas de la moda:
1.
2.
3.
4.
5.
6.
7.

Pueden existir varias modas, lo que da origen a distribuciones bimodales, trimodales, o


multimodales.
No toma en cuenta todas las observaciones
Es menos representativa que la media
Se puede calcular para caractersticas cualitativas.
Indica el valor ms tpico en la distribucin.
Puede localizarse con facilidad y tener una idea cruda del promedio.
Es la medida de tendencia central ms fcil de calcular.

VIII.4 Propiedades de la Moda:


De la moda destacamos las siguientes propiedades:
VIII.2.1

Es muy fcil de calcular.

VIII.2.2

Puede no ser nica.

VIII.2.3

Es funcin de los intervalos elegidos a travs de su amplitud, nmero y lmites de los mismos.

VIII.2.4 Aunque el primero o el ltimo de los intervalos no posean extremos inferior o superior
respectivamente, la moda puede ser calculada.
21

X.

Relacin entre media, mediana y moda

En el caso de distribuciones unimodales, la mediana est con frecuencia comprendida entre la media y la moda
(incluso ms cerca de la media). En distribuciones que presentan cierta inclinacin, es ms aconsejable el uso de
la mediana. Sin embargo en estudios relacionados con propsitos estadsticos y de inferencia suele ser ms apta
la media.
Para curvas de frecuencias unimodales que sean moderadamente sesgadas (asimtricas), se tiene la relacin
emprica
Media moda = 3 (media mediana)
En la siguiente figura se muestran las posiciones relativas de la media, mediana y moda para una curva de
frecuencias que est sesgadas a la izquierda.

Para curvas simtricas, la media, moda y mediana coinciden.

22

ACTIVIDADES COMPLEMENTARIAS
A. Calcular las medidas de tendencia central utilizando el programa Stadis 1.05

Recomendacin: instalar el programa, bajndolo de internet.

1. Activar el programa utilizando el icono StadiS.exe. La respuesta la encontramos en la siguiente grafica:

2. Hacer click en nueva (cuando se desean ingresar nuevos datos) o abrir cuando se desea abrir una base de
datos guardada. Supongamos que nuestro inters es ingresar nuevos datos, hacer click en nueva.
3. Seleccionar el tipo de variable a analizar: unidimensional o bidimensional. Si nuestro inters es analizar
la variable EDAD, la consideraremos unidimensional discreta (hacer doble click en
UNIDIMENSIONAL); luego seleccionar si se trata de una variable categrica, discreta o continua.
Las variables unidimensionales pueden clasificarse en categricas, discretas o continuas (Variables unidimensionales: slo
recogen informacin sobre una caracterstica (por ejemplo: edad de los alumnos de una clase. Variable

23

categrica: Es la que clasifica o categoriza cada

individuo en solo una de varias celdas o clases; estas celdas o clases son totalmente incluyentes y mutuamente excluyentes. Variable
discreta: Es una variable que puede asumir un nmero contable de distintos valores. Es decir, la cantidad de valores que puede asumir una variable
discreta puede contarse fcilmente (potencialmente, ya que puede que nunca se llegue al final); Ejemplos: nmeros que se asignan a cada nio.
Variable continua: Es una variable que puede adquirir valores en un conjunto no contable de objetos, tal como un intervalo o la recta numrica.
Ejemplos: estatura, largo, peso, distancia, tiempo, volumen, etc., podra incluirse la edad.
Variables BIDIMENSIONALES: Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: edad y
altura de los alumnos de una clase); pueden clasificarse en variables discretas-discretas, discretas-continuas y, continuas-continuas.

4.

Hacer click en discreta y click en aceptar y se activar la casilla DAT

5. Tomar en consideracin que aparecern dos columnas: la primera con Xi y la segunda ni; esto implica
que el programa analizar datos agrupados en una tabla de distribucin de frecuencias tipo A; en
nuestro caso, contamos con la siguiente tabla:
Edad
Valor de la
variable
Valid

Frequency
16
17
18
19
20
21
22
23
24
25
26
27
28
30
31
32
35
36
Total

1
2
8
22
30
33
19
17
6
11
2
3
3
1
2
1
2
1
164

Percent
.6
1.2
4.9
13.4
18.3
20.1
11.6
10.4
3.7
6.7
1.2
1.8
1.8
.6
1.2
.6
1.2
.6
100.0

Valid Percent
.6
1.2
4.9
13.4
18.3
20.1
11.6
10.4
3.7
6.7
1.2
1.8
1.8
.6
1.2
.6
1.2
.6
100.0

Cumulative Percent
.6
1.8
6.7
20.1
38.4
58.5
70.1
80.5
84.1
90.9
92.1
93.9
95.7
96.3
97.6
98.2
99.4
100.0

6. Ingresar en la columna Xi los valores de la variable edad y en ni el valor de la frecuencia simple, como
puede observarse en la siguiente grfica:

24

7. Pulsar NOT; hacer click en de la casilla en blanco. Hacer click en medidas de tendencia central,
los resultados son los siguientes:

8. Grabar la informacin: en el icono grabar, el programa permite almacenar la informacin con el


nombre que nos parezca con al extensin .mdb
9. Hacer click en el icono seleccionar todo; hacer click derecho sobre los datos marcados para
transportar los resultados y pegarlos en WORD

25

10. Pegar la informacin en WORD


Los resultados son los siguientes.
=== MEDIDAS DE TENDENCIA CENTRAL (var. X) ===
- Tamao Muestral ............... 164
- Media Aritmtica .............. 21.829
- Media Armnica ................ 21.421
- Media Geomtrica .............. 21.613
- Media Cuadrtica .............. 22.076
- Mediana ....................... 21.0
- Moda .......................... 21.0
- Cuartil Q(1) ................. 20.0
- Cuartil Q(3) ................. 23.0

Conclusiones:
a. Se le recomienda al alumno conocer informacin valiosa pulsando el icono: CAL, informacin que
posteriormente ser de importancia para el curso Estadstica I.
b. Ingresar la tabla de distribucin de frecuencias tipo B utilizando UNIDIMENSIONAL CONTINUA,
ingresando en LiX los valores de los lmites inferiores de cada intervalo y la columna LsX, los valores
de los lmites superiores de cada intervalo y, en la columna ni, ingresar las observaciones:

26

Al igual que el caso anterior, pulsar NOT y obtener los resultados de medidas de tendencia central
Resultados (utilizando una tabla de distribucin de frecuencias tipo B)
=== MEDIDAS DE TENDENCIA CENTRAL (var. X) ===
- Tamao Muestral ............... 164
- Media Aritmtica .............. 21.88
- Media Armnica ................ 21.478
- Media Geomtrica .............. 21.668
- Media Cuadrtica .............. 22.121
- Mediana ....................... 21.445
- Moda .......................... 21.376
- Cuartil Q(1) ................. 19.774
- Cuartil Q(3) ................. 22.867

27

B. CALCULAR LAS MEDIDAS DE TENDENCIA CENTRAL UTILIZANDO


EL PROGRAMA SPSS
1. Instalar el programa SPSS

2. Reconocer el icono caracterstico de SPSS.


3. Pulsar el icono de SPSS
Primera informacin del programa:

28

4. Reconocer las funciones principales del programa (en espaol o ingls): File, Edit, View, Data,
Transform, Analyze, Graphs, Utilities, Adds-ons, Window, Help.
5. Debajo de la hoja encontramos las ventanas Data View y Variable View, que son de utilidad para
cambiar las caractersticas de las variables.
6. En las columnas anotar los valores de las variables de forma descendente (no es posible trasladar la base
de datos EXCEL que antes hemos utilizado, al menos que la base de datos se encuentre en forma
descendente pueden transportarse los datos desde EXCEL: copiar, luego ubicarnos en la primera celda
de SPSS, click derecho: paste); observar la siguiente grfica luego que han sido transportados desde
EXCEL los valores de las variables EDAD, ESTATURA Y PESO de los 164 estudiantes.

7. Identificar las variables segn cada columna. Para ello, pulsar Variable view en la parte baja de la
ventana, lo cual nos traslada a la grafica de abajo y en Name proceder a identificar las variables: Edad,
Estatura y Peso (la informacin de cada variable la encontraremos en forma horizontal)

Y el resultado es el siguiente:

29

Existen otras caractersticas de las variables que pueden modificarse desde aqu y que ser necesario hacerlo
conforme avancemos con el curso.
8. Analizar los datos mediante el siguiente procedimiento: click Analyze + Estadstica Descriptiva + 123
frequencies:

9. Trasladar las variables a la casilla Variables (s), utilizando la flecha azul: click sobre el nombre la
variable + click sobre la flecha.

30

10. Click sobre Statistic y luego marcar las medidas de tendencia central que nos interesan: la media, la
mediana, la moda, la sumatoria, los valores mnimos y mximos.

11. Click en continue, click en Ok y los resultados los observaremos en la ventana output debajo de
esta pantalla.
12. Copiar y pegar a WORD los resultados que se encontraran en varios cuadros:
Descriptive Statistics
N

Minimum

Maximum

Mean

Std. Deviation

Edad

164

16.00

36.00

21.8293

3.30014

Estatura

164

1.45

1.90

1.6929

.08023

Peso

164

95.00

286.00

151.2195

28.03833

Valid N (listwise)

164

31

Statistics
Edad
N

Valid

Estatura

Peso

164

164

164

Mean

21.8293

1.6929

151.2195

Median

21.0000

1.7000

147.5000

Mode

21.00

1.70

160.00

Minimum

16.00

1.45

95.00

Maximum

36.00

1.90

286.00

3580.00

277.63

24800.00

Missing

Sum

Edad
Cumulative
Frequency
Valid

Valid Percent

Percent

16.00

.6

.6

.6

17.00

1.2

1.2

1.8

18.00

4.9

4.9

6.7

19.00

22

13.4

13.4

20.1

20.00

30

18.3

18.3

38.4

21.00

33

20.1

20.1

58.5

22.00

19

11.6

11.6

70.1

23.00

17

10.4

10.4

80.5

24.00

3.7

3.7

84.1

25.00

11

6.7

6.7

90.9

26.00

1.2

1.2

92.1

27.00

1.8

1.8

93.9

28.00

1.8

1.8

95.7

30.00

.6

.6

96.3

31.00

1.2

1.2

97.6

32.00

.6

.6

98.2

35.00

1.2

1.2

99.4

36.00

.6

.6

100.0

164

100.0

100.0

Total

32

Percent

Por razones de espacio no encontrar los cuadros de estatura y peso.


13. Anlisis de la informacin:
Utilizando los cuadros anteriores describir los resultados.

33

You might also like