You are on page 1of 12

Desde pocas remotas los humanos nos hemos interesado en poder identificar

patrones de comportamiento que permitan describir la evolucin de los


sistemas sociales, ecolgicos y fsicos.
Uno de los nuestros mayores anhelos es, y seria, poder predecir los resultados
de la lotera, la ruleta o los dados con el fin de garantizar que ganramos en el
momento de jugar; este tipo de predicciones no difieren de aquellas que nos
acercan al conocimiento en las ciencias sociales o las naturales, por el
contrario, muy buena parte del soporte terico de la estadstica descriptiva y la
inferencia proviene del anlisis del comportamiento de los juegos de azar.
La presente seccin procura elementos de juicio y estrategias que nos
permitirn adentrarnos un poco en la organizacin, presentacin y comparacin
de los datos asociados a la cuantificacin de las caractersticas de cualquier
poblacin para iniciar nuestro estudio relativo al manejo y presentacin de
datos tomemos una tabla con cien valores desprovistos de significado y
veamos cmo tratarlos. Posteriormente, con cifras que midan algn atributo de
una muestra podremos ver la importancia de la estadstica descriptiva y las
medidas asociadas a ella.
TABLA DE DATOS:
343 369 991 826 679 244 407 621 174 958
911 498 808 15 625 613 362 291 20 49
967 455 600 367 393 119 347 710 460 142
249 483 815 452 61 741 987 350 492 279
734 120 750 409 405 58 701 68 637 437
889 763 250 417 331 351 132 564 653 58
457 554 762 594 627 74 53 994 38 353
516 763 537 676 439 709 221 863 883 136
870 565 373 566 117 327 101 849 325 130
16 999 601 29 706 539 331 529 476 999

Primero, es conveniente ordenar los datos en forma ascendente, as:
15 68 174 331 393 460 565 637 750 883
16 74 221 343 405 476 566 653 762 889
20 101 244 347 407 483 592 676 763 911
29 117 249 350 409 498 594 679 763 958
38 119 250 351 417 516 600 701 808 967
49 120 279 353 437 529 601 706 815 987
53 130 291 362 439 537 613 709 826 991
58 132 325 367 452 539 621 710 849 994
58 136 327 369 455 554 625 734 863 999
61 142 331 373 457 564 627 741 870 999

Lo siguiente que podramos hacer, pues esta tabla no es mucho ms
reveladora que la primera, seria disponer los nmeros ordenados en una
columna indicando al frente cuantas veces aparece, as:
xi

ni


15 1
16 1
20 1
29 1
38 1
49 1
53 1
58 2
61 1
68 1
. .
. .
. .

Pero debido a la poca repeticin de los valores tendramos una tabla
excesivamente larga, cosa que no facilita su visualizacin. Debemos aclarar
que, en la tabla,
xi
indica cada valor y
ni
es la cantidad de veces que aparecen
cada dato;
ni
recibe el nombre de frecuencia absoluta.
Ejercicio: en una maquina balotera estn los nmeros de
0
al
9
. Una vez que
se ha accionado la maquina se registran los primeros
39
datos obtenidos
haciendo reposicin despus de cada extraccin.

1 4 3 5 2 6 3 7 6 4 2 1 5
4 6 5 6 4 3 5 8 1 8 5 7 4
2 5 4 7 5 3 6 7 5 3 4 6 2

1)
Ordenar los nmeros.
2)
Construir una tabla de distribucin de frecuencias, es decir, con las
columnas
xi
y
ni
.
Tabla de distribucin de frecuencias. Una forma bastante ms eficiente de
acomodar y presentar los datos es estableciendo intervalos y diciendo cuantos
datos hay en cada uno de ellos. Al margen de mltiples estrategias que existen
para tratar de establecer dichos intervalos, vale la considerar que el objetivo es
mostrar una distribucin que posibilite formarse, de un vistazo, una idea
general de lo que ocurre; de tal suerte que es aconsejable dividir en un numero
tal de intervalos que se puedan ver todos, por ejemplo, entre
5
y
15
, evitando
siempre que la tabla se divida en dos pginas o algo semejante.
Para facilitar nuestro trabajo tomaremos
10
intervalos de cien en cien e
indicaremos cuantos nmeros hay en cada uno, as:

i

xi

ni

Ni

hi

Hi


Intervalo

1 0 - 99 49.5 12 12 12/100 12/100
2 100 - 199 149.5 9 21 9/100 21/100
3 200 - 299 249.5 6 27 6/100 27/100
4 300 - 399 349.5 14 41 14/100 41/100
5 400 - 499 449.5 13 54 13/100 54/100
6 500 - 599 549.5 10 64 10/100 64/100
7 600 - 699 649.5 10 74 10/100 74/100
8 700 - 799 749.5 10 8 10/100 84/100
9 800 - 899 849.5 8 92 8/100 92/100
10 900 - 999 949.5 8 100 8/100 100/100

N=100


Aclaremos la notacin y algunas definiciones:
i
: Indica el intervalo que estamos observando, parte desde
1
y cuenta
consecutivamente todos los intervalos.
xi
: Es el centro del intervalo y se toma como si fuera el nico dato en el
presente.
ni
: Se llama frecuencia absoluta y dice la cantidad de datos en cada uno de
los intervalos.
: Ni
Llamada frecuencia absoluta acumulada, indica la cantidad de datos que
hay desde el menos de todos (o en este caso) hasta el extremo superior del
intervalo correspondiente.
: hi
Frecuencia relativa, indica cuntos datos hay en el intervalo, con
respecto del total presente en la muestra
: Hi
Frecuencia relativa acumulada, cuantifica la frecuencia de datos que hay
desde el menor de todos hasta el extremo superior del intervalo
correspondiente, con respecto al total de la muestra.
: N
Nmero total de datos.

Interpretacin de las frecuencias:
Tomemos como ilustracin uno de los intervalos, por ejemplo
i =4


i =4


x
4

n
4

N
4

h
4

H
4

Intervalo
300 399 349.5 14 41 14/100 41/100


i =4
Cuarto intervalo consta de los datos entre
300399

x
4
=
Tomaremos como representante de cuarto intervalo el valor medio de los
extremos, en este caso
. x
4
= 349 5

n
4
=
Hay
n
4
=14
datos comprendidos en el intervalo
4

N
4
=
Hay
N
4
= 41
datos comprendidos entre cero
( ) 0
y
399
. Tambin
podemos decir, hay
41
datos menores o iguales que
399

h
4
=
En el cuarto intervalo hay
14
de
100
datos
H
4
=
Hasta el extremo superior del cuarto intervalo
( ) 399
hay exactamente
H
4
41
=
100

41
de
100
datos

Ejercicio: supongamos que los datos el ejercicio
1
reflejan las edades de los
nios que residen en una urbanizacin.
Elaborar la tabla de distribucin de frecuencias con cinco intervalos de edades
e interpretar cada una de las frecuencias para todos los intervalos.


MEDIDAS DE TENDENCIA CENTRAL:

Algunos de los rasgos ms notables de un conjunto de datos se reflejan en las
medidas conocidas como de tendencia central, aunque en ocasiones su
nombre no tenga nada que ver con nuestra nocin intuitiva de tendencia
central.

Moda:
Retomemos nuestra tabla de cien datos, propuesta desde el comienzo de la
seccin, presentndola con sus correspondientes frecuencias.

xi

ni

xi

ni

xi

ni

xi

ni

15 1 291 1 483 1 710 1
16 1 325 1 498 1 734 1
20 1 327 1 516 1 741 1
29 1 331 2 529 1 750 1
38 1 343 1 537 1 762 1
49 1 347 1 539 1 763 2
53 1 350 1 554 1 808 1
58 2 351 1 564 1 815 1
61 1 353 1 565 1 826 1
68 1 362 1 566 1 849 1
74 1 367 1 592 1 863 1
101 1 369 1 594 1 870 1
117 1 373 1 600 1 883 1
119 1 393 1 601 1 889 1
120 1 405 1 613 1 911 1
130 1 407 1 621 1 958 1
132 1 409 1 625 1 967 1
136 1 417 1 627 1 987 1
142 1 437 1 637 1 991 1
174 1 439 1 653 1 994 1
221 1 452 1 676 1 999 2
244 1 455 1 679 1

249 1 457 1 701 1
250 1 460 1 706 1
279 1 476 1 709 1


En la tabla de distribucin de frecuencias podemos observar cuatro datos que
sobresalen por tener frecuencias,
ni
, mayores a las de los dems datos:

xi


ni


58 2
. .
. .
. .
331 2
. .
. .
. .
763 2
. .
. .
. .
999 2

Aquellos datos de mayor frecuencia reciben el nombre de modas, una muestra
puede tener una sola moda que ser el dato de mayor frecuencia o varias,
cuando hay igualdad en las mayores frecuencias.

As pues, nuestra muestra de cien datos es polimodal y las modas son
, 58

, 331

, 763

999
todas de frecuencia
n=2


La moda, como en la cotidianidad, nos dice cul dato es el ms frecuente.

Ejercicios
Identificar la moda en el conjunto de nios del ejercicio anterior y redactar su
interpretacin.

Ahora retomemos nuestros cien datos en la tabla de distribucin con los diez
intervalos e identifiquemos entre las marcas de clase,
, xi
la de mayor
frecuencia:

i

xi

ni

Ni

hi

Hi


Intervalo

1 0 - 99 49.5 12 12 12/100 12/100
2 100 - 199 149.5 9 21 9/100 21/100
3 200 - 299 249.5 6 27 6/100 27/100
4 300 - 399 349.5 14 41 14/100 41/100
5 400 - 499 449.5 13 54 13/100 54/100
6 500 - 599 549.5 10 64 10/100 64/100
7 600 - 699 649.5 10 74 10/100 74/100
8 700 - 799 749.5 10 8 10/100 84/100
9 800 - 899 849.5 8 92 8/100 92/100
10 900 - 999 949.5 8 100 8/100 100/100

N=100


n
4
=14

, x
4
= 349 5

Como
n
4
=14
es la mayor de las frecuencias la moda de los datos agrupados la
tomamos, inicialmente, como la marca de clase correspondiente, es decir: la
moda es
, x
4
= 349 5
, si comparamos este valor con lo obtenido antes de agrupar
los datos es claro que hay una gran diferencia.
SIN AGRUPAR
Modas:
, 331, 763, 999 58

Multimodal
AGRUPADOS
Moda:
. 349 5

Unimodal

Este cambio radical en las caractersticas obedece a un proceso de
agrupamiento que genera errores conocidos como errores de agrupamiento
vemos que el facilitar la observacin de los datos tiene un costo que se reduce
en la variacin de algunas de sus medidas.

Ejercicio:
Identificar moda en los nios agrupados interpretarla y comparar con el
ejercicio anterior.

Media aritmtica:
Tal vez es la medida de tendencia central ms conocida y caracterstica de un
grupo de datos.

Para su interpretacin y clculo podemos pensar en que debemos buscar un
nmero tal que al ponerlo en lugar de todos los datos obtengamos la misma
suma que con los datos inciales.

Veamos unos ejemplos muy sencillos:
Se hace una colecta de canicas entre tres amigos con el fin de repartirlas entre
tres nios para que puedan jugar. Si la intencin es que todos los nios tengan
igual nmero de canicas y los aportes de los donantes son de
, 5

7
y
9
canicas,
Cuntas debe recibir cada nio?
Solucin:
Debemos sumar el nmero de canicas aportadas
5+7+9=21

Ahora debemos repartirlas entre los tres nios, as:
21
=7
3

Es decir, cada nio recibe
7
canicas.

Observemos que
7
tambin es el nmero de canicas que debera haber
aportado cada una de los donantes si todos hubieran decidido poner
cantidades iguales.

Podemos cambiar el problema anterior, as: si tres amigos van a aportar un
total de
21
canicas, Cuntas pondr cada uno, si deben aportar la misma
cantidad?
Tenemos entonces que para calcular la media aritmtica ser suficiente
Con sumar todos los datos y dividir entre la cantidad de estos. Escribiremos,
entonces:
xi
x
N
=



Donde xi

indica que debemos sumar todos los xi y N es el nmero total de


datos.

Ejemplo: calculemos la media aritmtica de los cien datos de que disponemos.
xi
x
N
=


xi = 47797


x
47797
=
100

. = 477 97



Ejercicio:
Calcular la media aritmtica de los nios de los anteriores ejemplos.

Media ponderada: se conoce con este nombre a la media aritmtica de datos
que tienen diferente importancia dentro de la muestra.
Generalmente esta importancia recibe el nombre de peso y corresponde al
valor de su frecuencia.
Para facilitar su clculo los datos se acomodan en una tabla, as:

xi ni Ni hi Hi xini xihi
5 3 3 3/15 3/15 15 15/15
7 2 5 2/15 5/15 14 14/15
8 5 10 5/15 10/15 40 40/15
10 1 11 1/15 11/15 10 10/15
15 4 15 4/15 15/15 60 60/15

15

139 139/15

;
xini
x
N
=

; x
139
=
15
. x =9 266
Que tambin podemos escribir como:
; x xini =

; x
139
=
15
. x =9 266

Las dos ltimas columnas de la tabla han sido introducidas con el propsito de
facilitar los clculos.

Ejercicio:
Calcular la media ponderada de las edades de los nios, usando para ella la
tabla ampliada.

Media aritmtica para datos agrupados:
Se calcula la media ponderada de las marcas de clase. Desarrollemos el
clculo para nuestros cien datos una vez que estn agrupados.

i xi ni Ni hi Hi xini xihi

Intervalo

0 - 9 49.5 12 12 12/100 12/100 594 5.94
100 - 199 149.5 9 21 9/100 21/100 1345.5 13.455
200 - 299 249.5 6 27 6/100 27/100 1497 14.97
300 - 399 349.5 14 41 14/100 41/100 4893 48.93
400 - 499 449.5 13 54 13/100 54/100 5843.5 58.435
500 - 599 549.5 10 64 10/100 64/100 5495 54.95
600 - 699 649.5 10 74 10/100 74/100 6495 64.95
700 - 799 749.5 10 84 10/100 84/100 7495 74.95
800 - 899 849.5 8 92 8/100 92/100 6796 67.96
900 - 999 949.5 8 100 8/100 100/100 7596 75.96
48050 480.5

;
xini
x
N
=

; x
48050
=
100
. x = 480 5
; x xihi =

. x = 480 5

Ejercicio: calcular x de nios agrupados.

You might also like