You are on page 1of 34

CAPTULO I. NOCIONES DE ESTADSTICA DESCRIPTIVA. 1.1. ESTADISTICA COMO CIENCIA Y COMO UNA METODOLOGIA.

Se han planteado muchas definiciones de la Estadstica, algunas caracterizndola como ciencia y otras como una metodologa. Para nosotros la Estadstica es Ciencia ( Teora Estadstica ) porque su fundamentacin terica la encontramos en una de las ramas de la matemtica: La Teora de las Probabilidades . 1.2. POBLACION Y MUESTRA. POBLACION.- Es el conjunto mayor de objetos ( universo ) que poseen al menos una caracterstica comn, cuyo estudio nos interesa o acerca de los cuales se desea informacin. Los elementos de este conjunto se denomina Unidades Estadsticas. La Poblacin puede ser finita o infinita. Si la poblacin es infinita ser imposible tener una informacin completa sobre ella o si la poblacin es finita pero numerosa y no sea posible estudiar todos y cada uno de los elementos. Se acude a la informacin proporcionada por una parte representativa y finita de dicha poblacin llamada Muestra. Llamaremos Datos u observaciones a las unidades estadsticas obtenidas o recopilaciones en forma total ( datos poblacionales ) o en forma parcial ( datos muestrales ). 1.3.. OBSERVACIONES CUANTITATIVAS Y CUALITATIVAS Las observaciones contables o medibles se denominan observaciones Cuantitativas; por ejemplo, la estatura de los estudiantes, la edad de las personas, duracin de una bombilla de luz, nmero de hijos de una familia, e.t.c. En cambio; el sexo, estado civil, la marca de cigarrillo, no son medibles, slo pueden describirse como sexo masculino o sexo femenino, estado civil: soltero, casado, viudo o divorciado, Estas observaciones se denomina Observaciones Cualitativas o Nominales. 1.4. PARAMETRO Y ESTADIGRAFO. Parmetro.- Es un nmero que describe alguna caracterstica de la poblacin y para determinar su valor es necesario utilizar la informacin poblacional completa, y por lo tanto, las decisiones se toman con certidumbre total. Estadgrafo.- Es un nmero que se obtiene a partir de los datos muestrales y describe alguna caracterstica de la muestra y la toma de decisiones contiene un grado de incertidumbre. 1.5. UNA DEFINICION DE ESTADISTICA.. DEFINICION : Estadstica es una disciplina que nos proporciona un conjunto de mtodos y procedimientos que permiten recopilar, clasificar, presentar y describir datos en forma adecuada para tomar decisiones frente a

la incertidumbre o predecir o afirmar algo acerca de la poblacin o sus parmetros a partir de los datos extrados de la misma. CAPTULO II -ESTADISTICA DESCRIPTIVA: Se ocupa de la recopilacin, clasificacin, presentacin y descripcin de los datos. Los datos pueden recopilarse de dos maneras fundamentales: Censo y la informacin obtenida por este procedimiento se llama Censal. Si se selecciona algunos elementos de la poblacin pero no todos, se denomina Muestra y la Si se consideran todos los elementos de la poblacin y se registran sus caractersticas se denomina

informacin obtenida por este procedimiento se llama por Muestreo. Debe decidirse si se va a observar todos y cada una de las unidades estadsticas o se ha de seleccionar una muestra. En contraste a los censos esta la gran mayora de las recopilaciones que dependen de la obtencin de Muestras Representativas de la poblacin. Existen muchas razones por las que se han generalizado el uso de muestras, entre ellas, el ahorro de tiempo, posibilidades econmicas, facilidad y precisin en la obtencin de datos, y sobre todo. El impresionante desarrollo de la Estadstica que proporciona algoritmos o tcnicas eficientes por lo que no se requiere una informacin completa para llegar a conocer alguna caracterstica de la poblacin o tomar decisiones generales. Son recopilaciones muestrales, por ejemplo, las encuestas de opinin o intencin de voto de unos cientos o miles de electores ( para proyectarlas y determinar el candidato ganador en una poblacin de millones de habitantes ); o la recopilacin de precios de unos cuantos artculos y servicios obtenidos de un nmero relativamente pequeo de vendedores o dependencias estatales ( para determinar el Indice de Costo de Vida de una Nacin ); o la seleccin de 10 artculos de una lnea de produccin ( para efecto de Control de Calidad de un artculo producido por una empresa ). Son recopilaciones censales, por ejemplo, el Censo Poblacional de Per de 1981; o el acopio de los promedios ponderados de todos los estudiantes de ingeniera del presente ciclo; o el rcord acadmico del alumno Ivan Alex. Si la recopilacin de los datos muestrales se efecta al azar se dice que el muestreo es aleatorio y la muestra obtenida de este modo se denomina Muestra Aleatoria (m.a). Existen otros tipos de muestreo que permiten encontrar muestras representativas y confiables como el sistemtico, Estatificado, Secuencial, etc. Que se estudian en detalle en cualquier tratado de Tcnicas de Muestreo. La informacin total o parcial puede recopilarse mediante encuestas, registros, informacin bibliogrfica, etc. Las encuestas Escritas ( o verbales ) son las ms usuales y prcticas; pero es preciso disear adecuadamente el cuestionario correspondiente, redactando las preguntas en forma clara , evitando preguntas innecesarias; la brevedad del cuestionario es importante, se debe tener presente que necesitamos la cooperacin del encuestado, generalmente a cambio de nada. Diseado el cuestionario es recomendable someterlo a prueba, con pocas personas,( Estudio Piloto) para identificar las fallas y corregirlas a tiempo. Las entrevistas personales son las ms deseables aunque tienen la desventaja de un costo alto.

La recopilacin por Registro se obtienen en las oficinas de Estadstica, Dependencias Institucionales o Centros de Computo. 2.1. CLASIFICACION. Los datos obtenidos obtenidos en la primera etapa suelen suelen ser registradas en el orden en que se recopilan, para facilitar su interpretacin y el anlisis correspondiente debemos organizarlos o clasificarlos de manera sistemtica, y una manera sencilla de hacerlo es ordenar los datos segn su magnitud y/o agruparlos segn sus caractersticas en grupos ms condensados; este ltimo equivale a sub-dividir los datos en sub-grupos o clases; a este proceso se le conoce como Clasificacin. Ordenando los datos en forma creciente o decreciente de sus magnitudes se distinguirn claramente los datos de mayor valor (mximo) y de menor valor (mnimo); pero clasificndolos convenientemente podremos distinguir otras caractersticas que nos permitirn una mayor comprensin y descripcin de los datos bajo estudio. Haremos algunas definiciones en base al siguiente ejemplo: Clasificar los siguientes datos recopilados del nmero de cabezas de ganado vacuno que poseen cada una de las 40 familias de las comunidades campesinas de la Sierra Central del Per, elegidas al azar:

1 4 0 0 5

2 3 0 0 4

0 3 4 4 5

3 5 9 9 8

5 12 0 0 2

1 0 1 1 0

0 4 3 3 1

8 3 2 2 3

1 0 1 1 2

2 10 3 3 0

Observamos que los datos tal como fueron registrados en el proceso de recopilacin estn en completo desorden y no sugieren ninguna interpretacin. Procedamos a organizarlos en orden creciente de sus magnitudes: 0 1 3 4 0 1 3 5 0 1 3 5 0 1 3 5 0 1 3 6 0 2 3 8 0 2 3 8 0 2 4 9 0 2 4 10 1 2 4 12

Observamos que el mnimo 0 y el mximo es 12; y adems, el dato que ms se repite es el 0. Pero, clasificndolos podremos distinguir otras caractersticas, a la par de conseguir una mayor simplificacin o condensacin de los datos bajo estudio. Comencemos con algunas definiciones: ALCANCE (A): Es el intervalo cerrado definido por los datos de menor y mayor valor (mnimo y mximo) En el ejemplo, A = [ 0, 12 ]

12

RANGO (R): Llamado tambin Amplitud, es la longitud del Alcance. R = l(A) = | 12 - 0 | = 12. INTERVALOS DE CLASE (Ii). Clasificar los datos en k sub-grupos equivale a particionar el Alcance en k partes, llamados Intervalos de Clase o simplemente Clases que se denotan por Ii : i = 1,2,...,k. Por tratarse de una particin del Alcance, se debe cumplir: i) Ii Ij = ; i j ii)

i =1

Ii = A

Ii

I2 A

IK

Lo que se interpreta diciendo: que las clases deben ser mutuamente excluyentes (sin traslapos) y colectivamente exhaustivas (sin vacos, tal que la unin de las clases sea igual al Alcance). LIMITES DE CLASE ( Li) Los extremos de los intervalos de Clase se denominan Lmites de Clase y se denotan por Li : i = 1,2,...k + 1. Cuando algunos de los datos coincide con un lmite se presenta la dificultad de asignarle su pertenencia; para despejar esta duda los Intervalos de Clase los consideramos semi-abiertos por la derecha (o por la izquierda ); esto es: Ii = [ Li , Li+1
r

; I = 1,2,...,k

Eventualmente, Ii puede ser abierto y/o Ik puede ser cerrado. As los Lmites de Clase en trminos ms matemticos los definimos como el Supremo y el Infimo de cada Intervalo de clase. El criterio a seguir para determinar el nmero de clases es el mismo sea suficientemente pequeo para lograr la simplificacin deseada, pero lo suficientemente grande para minimizar los posibles errores de clasificacin; se recomienda: 5 k 15

REGLA DE STURGES. Se recomienda usar la Regla de Sturges para determinar un primer valor aproximado de k, el que puede sufrir modificaciones de acuerdo al criterio del estadstico y problemas de redondeo. Regla de Sturges: k = 1+ 3.3 log n ; donde n es el nmero total de datos disponibles y el

logaritmo se toma en base 10. En el ejemplo, k = 1+ 3.3 log 40 = 6.2868. Luego k podr tomar valores enteros: 5,6 7. El valor entero de k finalmente depender del estadstico, de la naturaleza del trabajo de investigacin, problemas de redondeo y Tcnicas de Clasificacin adoptadas. Tngase en cuenta que al clasificar los datos se logre posiblemente la simplificacin deseada a costa de una prdida de informacin. Cuando un dato se asigna a determinada clase pierde su propia caracterstica de toda la clase); esta prdida de informacin conlleva una reduccin en la precisin que se conoce como error de clasificacin. Si se desean medidas ms precisas es preferible usar los datos sin clasificar o minimizar en lo posible los errores de clasificacin. ANCHO DE CLASE(Wi). Llamado tambin Amplitud de Clase, es la longitud de un Intervalo de Clase. Wi = l (Ii) = | Li+1 - Li |

Para conseguir anchos de clase iguales a w, como es deseable, se usa la siguiente relacin: W = R/K En el ejemplo anterior, tomando k = 6 se tiene w = 2

FRECUENCIAS ABSOLUTAS ( ni fi) Una vez decidido el valor de k y calculado el ancho de clase (anchos de clase iguales o no)., mediante la Tabulacin o Chequeo se determina el nmero de datos contenidos en cada clase y este nmero de datos contenidos en cada clase y este nmero entero se denomina Frecuencia Absoluta, que se denota por: ni f i y tiene las siguientes propiedades: i) 0 ni n ii)

ni
i =1

=n

ni se lee: frecuencia absoluta de la i-sima clase. 2.2 PRESENTACION DE DATOS.

En esta etapa se elaboran cuadros numricos llamados Tablas o Cuadros Estadsticos o Distribucin de Frecuencias y se representa mediante Grficas. Tomando el ejemplo construiremos una Distribucin de Frecuencias de la siguiente manera: A partir del dato de menor valor 0 = l1 agregando sucesivamente el ancho de clase (comn) obtendremos los lmites de los seis intervalos de clase. L1 = 0 L2 = L1 + w = 0 + 2 = 2 L3 L 2 + w = 2 + 2 =4 . . . Li+1 = Li + w w = Li+1 - Li Los intervalos de clase resultantes son: I1 = [ 0,2 > , I2 = [2,4 > ,. . . , I5 = [8,10>, I6= [10, 12] Despus de disponer los intervalos de clase en columna (ver la tabla 1) se procede a asignar cada observacin a la clase que le corresponde, registrando cada asignacin (para efectos de control) mediante una traza (raya oblicua pequea) en la casilla correspondiente de la columna Tabulacin. As, (considerando los datos ya ordenados ) el primer nmero 0 estar en el intervalo de clase [0,2 , entonces anotaremos una traza en la casilla correspondiente a I1; el segundo nmero o tambin pertenece a I1, entonces marcamos otra traza en el mismo casillero; se observa que los primeros 9 nmeros son ceros y los siguientes 6 son unos, todos ellos pertenecen al intervalo [0,2> luego aparecern 15 trazas en el primer intervalo; continuando el procedimiento se registraran 12 trazas en la segunda casilla, 7 en la tercera, etc. El nmero de trazas en cada intervalo de clase (casilla) representa el nmero de datos pertenecientes a cada clase y el nmero entero resultante constituye la ya referida Frecuencia Absoluta. TABLA 1: DISTRIBUCION DE FRECUENCIAS ABSOLUTAS Cabezas de ganado Intervalo de clase Ii [ 0,2 > [ 2,4> [4,6> [6,8> [8,10> [10,12> TOTAL ///// ///// ///// ///// ///// // ///// // / /// // 40 ni 15 12 7 1 3 2 TABULACION No. de Fam./ clase Frecuencia. Absol i En general:
;

ni = 15 , n2 = 12 , n3 = 7 , n4 = 1 , n5 = 3 , n6 = 2

Se verifica que: i) 0 ni 40 ; . ii)

ni = n
i =1

1,

n2, n3 , n4 , n5 , n6

= 15 + 12 + 7 + 1 + 3 + 2 = 40 n3 = 7 se lee: La Frecuencia Absoluta de la tercera Clase es 7.

MARCA DE CLASE ( Xi) Son los puntos medios de los intervalos de clase. Xi = ( Li + Li+1) / 2 X1 = 1 , X2 = 3 , X3 = 5 , . . . ( ver tabla 4 ). i = 1,2,. . . , k

X1 = 1 , Se lee: La Marca de Clase del primer intervalo es 1 Todos los datos agrupados en una clase, si bien pierden su individualidad, estn representados por un mismo valor que a su vez caracteriza la clase, ese valor tpico es la Marca de Clase. TABLA 2. CUADRO ESTADISTICO Ii [ 0, 2 > [ 2, 4 > [ 4, 6 > [ 6, 8 > [ 8 , 10> [ 10, 12 ]
TOTALES

ni 15 12 7 1 3 2 40

xi 1 3 5 7 9 11

hi 0,375 0,300 0,175 0,025 0,075 0,050 1,000

Hi

Ni 0,375 0,675 0,850 0,875 0,950 1,000

100hi% 15 27 34 35 38 40

100Hi% 37,5 30,0 17,5 2,5 7,5 5,0 100% 37,5 67,5 85,0 87,5 95,0 100

FRECUENCIAS RELATIVAS. ( hi ) Se define: hi = ni / n ; i = 1,2 , . . . , k.

Tienen las siguientes propiedades: i) 0 ii) hi 1 ; i = 1 , 2 , . . . , k hi = 1 ( ver tabla 4 ).

i =1

hi = 0,375 , h2 = 0,300 , . . .

FRECUENCIAS RELATIVA PORCENTUAL ( 100 hi % ). Representa la proporcin o el porcentaje de datos en cada clase. Nos permite contestar preguntas del siguiente tipo: Qu porcentaje de familias, de las 40 bajo estudio, tienen 2 3 cabezas de ganado. FRECUENCIA ABSOLUTA ACUMULADA ( Ni Fi) Representa el nmero de observaciones menores que el lmite superior de determinada clase. Se obtiene sumndole a la frecuencia acumulada de la clase anterior la frecuencia absoluta de la clase interesada; es decir: Ni = Ni-1 + ni , i = 2 , 3 , . . . , k tambin: Tienen las siguientes propiedades: i) ni Ni n ii) n1 = N1 ii) Nk =
k

Ni = ni

Ni =

j =1

nj

i = 1 , 2 , . . . ,k

nj
j= 1

=n

iv) ni = Ni = Ni-1 ; i > 1

Observando la columna de las frecuencias absolutas acumuladas de la TABLA 4 podemos interpretar: 15 familias poseen menos de 2 cabezas de ganado 27 familias poseen menos de 4 cabezas de ganado FRECUENCIA RELATIVA ACUMULADA ( Hi ). Representa la frecuencia relativa acumulada con valores menores que el lmite superior de una clase y se obtiene sumndole a la frecuencia relativa acumulada de la clase anterior la frecuencia relativa de la clase interesada: Hi = Hi-1 + hi , i = 2 , 3 , . . . , k tambin:
i

Hi = hi

Hi =

hj
j= 1

Hi = Ni / n

i = 1 , 2 , . . . , k.

Tiene las siguientes propiedades: i) hi Hi 1 ; i ii) h1 = H1 ii) Hk = iv) hi = Hi-1 ; i > 1

hj
j= 1

= 1

En el ejemplo: H1 = h1 = 0,375 H2 = H1 + h2=0,375 + 0,300 = 0,675 H3 =

hj
j= 1

= h1 + h2 + h3 = 0,375 + 0,300 + 0,175 = 0, 850

H4 = N4/n = 35/40 = 0,875 h2 = H2 - H1 = 0,675 - 0,375 = 0,300 h3 = H3 - H2 = 0,850 - 0,675 = 0,175

Adems:

FRECUENCIA RELATIVA ACUMULADA PORCENTUAL ( 100 Hi % ). Representa la proporcin o el porcentaje de observaciones menores que el lmite superior de determinada clase. Nos permite contestar preguntas del siguiente tipo: Qu porcentaje de familias de las 40 bajo estudio, tienen menores de 2 cabezas de ganado? Observando 100Hi% , diremos que el 37,55 de las familias poseen menos de 2 cabezas de ganado. 2.2.1. Distribucin de frecuencias. De la tabla 2 ( Cuadro Estadstico ) podemos extraer las llamadas Distribuciones de Frecuencias ( o tablas de Frecuencias ). Veamos algunas. TABLA 3. Distribucin de Frecuencias Absolutas Ii [0,2> [2,4> [4,6> [6,8> [ 8 , 10> [ 10 , 12> Ii vs. TABLA 5: Distribucin de Frecuencias Absolutas Acumuladas Ii [0,2> [2,4> [4,6> [6,8> [ 8 , 10 > [ 10 , 12 ] Ni 15 27 34 35 38 40 Ii n1 TABLA 6: Distribucin de Frecuencias Relativas Acumuladas Hi [0,2> [2,4> [4,6> [6,8> [ 8 , 10 > [ 10 , 12 > 0,375 0,675 0,850 0,875 0,950 1,000 ni 15 12 7 1 3 2 40 Ii vs h1 Ii [0,2> [2,4> [4,6> [6,8> [ 8 , 10 > [ 10, 12] TABLA 4. Distribucin de Frecuencias Relativas hi 0,375 0,300 0,175 0,025 0,075 0,050 1.000

Ii vs Ni 2.2.2. Grficas. Las grficas se levantan o disean sobre un plano cartesiano.

I i vs Hi

Previa eleccin de una escala adecuada: el Alcance, los Intervalos de Clase y los Lmites de Clase se disponen en el eje horizontal ( eje x ) y en el eje vertical ( eje y ) las frecuencias correspondientes. Las Distribuciones de Frecuencias pueden representarse grficamente mediante: Histogramas, Polgonos de Frecuencias, Diagramas Escalonados, Ojivas, etc. 2.2.2.1. Histogramas. Son grfica de rectngulos cuyas bases representan los Intervalos de Clase y las alturas de Frecuencias Absolutas o Relativas. Nos permiten comparar frecuencias. Los rectngulos deben tocarse unos a otros, sin brechas, excepto para clases vacas. Ii vs ni 2.2.2.2. Polgonos de frecuencias. Es una poligonal construida uniendo los puntos ( xi , ni ) o ( xi , hi ) mediante segmentos de recta: o tambin se define como una poligonal construida uniendo, mediante segmentos de recta, los puntos medios de los techos de los rectngulos del Histograma. En algunos casos puede ser recomendable extender la poligonal en los puntos: ( xi - w , 0 ) y ( xk + w , 0 ). Los polgonos de frecuencias pueden permitirnos comparar varias distribuciones superpuestas cuando todas ellas estn expresadas en la misma escala y en lo posible tienen los mismos lmites de clase. Adems, un polgono de Frecuencias nos sugiere el uso de una curva suave como su representacin idealizada, lo que puede lograr mediante las Tcnicas de Ajuste. La curva suavizada adquiere importancia por que se considera que representa la poblacin ( o modelo matemtico ) de la que se obtiene la muestra. Ver fig. 2 FUNCION ESCALONADA. Son grficas correspondientes a: ( Ii vs Ni ) o ( Ii vs Hi ) Ver fig. 3 2.2.2.3. Ojiva: Es una poligonal construida uniendo los puntos cuyas abscisas son los lmites superiores de las clases y las ordenadas son las frecuencias absolutas acumuladas, o relativas acumuladas o las porcentuales. Se aade una clase con frecuencia cero antes de la primera clase. La ojiva nos permitir hacer interpolaciones y puede ser suavizada ( igual que el polgono de frecuencias ) hasta conseguir una curva que representa la poblacin llamada Funcin de Distribucin. Ver fig 3 o Ii vs Hi ver fig. 2

HISTOGRAMA 15 15 12 10 7 3 5 1 0 12 FUNCION ESCALONADA Y OJIVA.


38 35 34 27

POLIGONO DE FRECUENCIAS CURVA SUAVE

6 40

10

15

fig. 3

2 0

10

12

2.2.2.4. Grfica de sectores angulares o diagramas circulares. Las cantidades porcentuales se transforman a grados sexagesimales mediante la relacin: donde r es la cantidad porcentual ; x esta expresado en grados sexagesimales. As en nuestro ejemplo: r = 37,5 % ; x = (3,6)(37,5) = 135 s r = 30.0 % ; x = (3,6)(30,0) = 108s 17,5 % ; 2,5 % 7,5 % 5,0% 63s 9s 27s 18s

Se dibuja un crculo. Los sectores angulares ( medidos en grados sexagesimales ) representan los porcentajes correspondientes. Se recomienda colorear o distinguir de alguna manera cada sector y asociarle una Leyenda que explique claramente su significado o la caracterstica que representan.

LEYENDA

1 37,5 %
6 2

[0,2} [ 2 , 4 }

30,0 %
3 6} 17,5 % 2 6,8} 2,5 % 5 4 [ [4,

5 7,5 % 4 5,0 % 3 6

[ 8 , 10 }

[ 10, 12 ]

PICTOGRAMAS. En el interior de los rectngulos del Histograma se dibuja el objeto de estudio, variando el tamao proporcional a las alturas de los rectngulos. En el ejemplo, un pictograma presentara cabezas de ganado dibujados en el interior de los rectngulos, proporcional a la magnitud de sus alturas CAPTULO III.- MEDIDAS DE TENDENCIA CENTRAL. 3.1. MEDIA ARITMTICA. Llamada simplemente Media o promedio. Es una medida de tendencia central que localiza el centro fsico ( semejante al centro de gravedad ) de la distribucin de datos. Se denota por: x si la medida es muestral ( estadgrafo ) , si la media es Proporcional ( parmetro ).

Tambin: M(x) que se lee : Media de la variable X

3.1.1.Media de datos no clasificados. Sea { x1,x2, ... , xn } una muestra de tamao n; entonces.
n

X =

i= 1

xi

/ n = ( x1 +x2+x3+. . . + xn)/ n

3.1.2.Media de datos Clasificados. Sean x1 , x2 , . . . , xk las marcas de clase y f1, f2, ... ,f4 las frecuencias absolutas correspondientes, k =No de clases y n tamaos de muestra; la Media muestral se define:
k

x =

i= 1

x ih i

3.1.3. Caractersticas ms relevantes de la media aritmtica. a. b. c. La Media Aritmtica es la Medida Descriptiva ms conocida y usada en Estadstica Es una medida nica: es decir, un conjunto de datos tienen solamente una Media Es calculada tomando en cuenta la magnitud de todos y cada uno de los datos bajo consideracin. d. Como la Media localiza el "centro" fsico (centro de gravedad) de una distribucin de datos, es una Medida de Tendencia Central muy sensible a los valores extremos y estos valores con magnitudes desproporcionadas desplazan el valor de la media hacia esos extremos.

3.2. MEDIANA. Es una medida de tendencia central en donde se define como el centro de una distribucin. Es decir el 50% para cada lado. 3.2.1.Mediana de datos no clasificados Sean x1,x2, ....... xn los datos muestrales o poblacionales tales que x1,_ x2,_ ...... _ xn; entonces

X (n+1)/2 ; si n es impar Me = Xm = 1 [x n/2 + (n+2)/2 ] ; si n es par 2

Una vez ordenados los datos en orden creciente (o decreciente) Si n es impar, la Mediana es el valor central que equidista de los extremos. Si n es par, la Mediana es el promedio aritmtico de los dos valores centrales que equidistan de los extremos. En ambos casos, la Mediana es aquel valor para el cual el nmero de observaciones mayores que l es igual al nmero de observaciones menores que l. Ejemplos: Hallar la Mediana de los siguientes conjuntos de datos: 1) Solo 1) {3,6,8,2,1} 1 , 2, 3, 6, 8, ----> Datos ordenados X1 X2 X3 X4 X5 Como n es impar (n = 6) Xm = X (5+1)/2 = X3 = 3 El nmero de observaciones mayores que la Mediana es igual al nmero de observaciones menores que la Mediana Sol 2) 1 , 2, 4, 5, 8, 9 X1 X2 X3 X4 X5 X6 ----> Datos ordenados 2) {2,1,5,4,9,8}

Como n es par (n = 6)

Me = 1 x 6/2 + x(6+2)/2 = 1 x3 + x6 2 2

x3 y x4 equidistan de los extremos y el promedio aritmtico de estos nmeros es la Mediana. Lo que podemos interpretar de las siguientes maneras: Hay 3 observaciones mayores que 4.5 y 3 observaciones menores que 4.5 (el nmero de observaciones mayores que 4.5. es igual al nmero de observaciones menores que 4.5.). O bien, la Mediana 4.5 clasifica los datos colocando al lado izquierdo el 50% de los datos y el lado derecho los otros 50%

3.2.2.Mediana de datos clasificados

x = Li + ( N/2 - Fi-1 ) c/Fi donde: Li es el valor inferior del intervalo de clase. Fi-1 es la frecuencia acumulada anterior. N es el nmero total de datos. Fi es la frecuencia absoluta de la clase mediana. C es el ancho de la clase mediana.

3.3. MODA. Es el dato que ms tiene repeticiones o de ms frecuencias. Existen: a) Una moda b) Dos modas c) Varias modas unimodal. bimodal Multimodal

a)

b)

x1

x2

x1 c)

x2

x3

3.3.1.Moda de Datos no clasificados Moda es el valor de dato que se presenta con mayor frecuencia o se repite el mayor nmero de veces. Ejemplos: Determinar la Moda en los siguientes conjuntos de datos no agrupados: 1) 2) 3) SOLUCIN Sol 1. Ordenando los datos o "tabulndolos" se tiene 4,6,6,6,7,7,8,9,10,15 Medidas Descriptivas 4,7,6,6,9,8,10,15,6,7 8,4,7,8,4,6,9,8,6,10,15,4,8,6,4,8,9,3 4,7,6,4,6,7,7,6,4

Xi 4 6 7 8 9 10 15 /

TABULACIN

Ni 1 3 1 1 1 1 1 10

/// / / / / /

Se observa que el dato que se repite con mayor frecuencia es el 6, entonces Mo = 6 Sol 2. Ordenndolos o tabulndolos: 3,4,4,4,4,6,6,6,7,8,8,8,8,8,9,10,15 TABULACIN xi 3 4 6 7 8 9 10 15 / //// /// / ///// // / / 1 4 3 1 5 2 1 1 11 ni

El dato que se repite el mayor nmero de veces es el 6 Luego Mo=8 Sol 3. Como no existe un dato que se repita con mayor frecuencia no existe Moda. Xi 4 Ni 3

6 7 3.3.2. Moda de datos clasificados.

3 3 9

Cuando se tiene datos agrupados en una tabla de distribucin de Frecuencias la moda ser: X = Li + ( 1 / 1+ 2) w Donde: Li es el Lmite inferior de cada intervalo de clase. 1 y 2 son las diferenciales del valor ms alto de la frecuencia. W es el recorrido. Determinar la Moda o Modas de las siguientes Distribuciones de Frecuencia Ii [24.5 , 29.5> [29.5 , 34.5> [34.5 , 39.5> [39.5 , 44.5> [44.5 , 49.5> [49.5 , 54.5> [54.5 , 59.5> [59.5 , 64.5> fi 1 8 22 26 20 16 6 5 Ii 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99 fi 2 10 6 12 9 7 4

Observando la Tabla notamos un mximo absoluto sobre el cuarto Intervalo de clase, entonces,

Clase Modal:

[39.5 , 44.5>

_1

f4 - f3 = 26 - 22 = 4

_2

f4 - f5 = 26 - 20 = 6

L4

39.5 ; w4 = [44.5 - 39.5] = 5

_1 Mo = L4 + W4 ------- = 39.5 + 5 ----- = 41.5 _1 + _2 4+6

O podamos haber obtenido, un valor aproximado de la Moda, tomando la Marca de Clase de la Clase Modal.

L4+L5 = 39.5 + 44.5 = 42 ==> Mo _ 42 X4 = ------ ---------2 2

3.3.3. Caractersticas mas relevantes de la moda 1. Le sigue en importancia a la Media y a la Mediana; su uso se hace imperativo cuando los datos son de tipo cualitativo. Su fcil interpretacin y su clculo sencillo hacen de la Moda una medida de Localizacin ms usual y prctico. As, un gerente de una fbrica de calzados puede estar interesado en las medidas (nmero de calzadura) que se venden mas, esta medida est mejor representada por la Moda que por otras medidas descriptivas.

2.

No es una medida nica como la Media y la Median. Un conjunto de datos puede tener ms de una Moda. Mediante una clasificacin adecuada una multimodal se puede transformar en una unimodal. La moda es nica en datos cualitativos.

3.

El clculo de la Moda es independiente de la magnitud de las observaciones, como tal, puede permanecer igual variando los valores o incrementando el nmero de ellas.

3.4. CUARTILAS O FRACTILAS.

3.4.1. Los Cuartiles: ( Q ) Los cuartiles o cuartilas son medidas de tendencia central que a su distribucin de frecuencias divide en 4 partes. Es decir: Q1 0% Sus frmulas son: Q1 = Li + ( N/4 - Fi-1 )/W/fi Q2 = X Q3 = Li + (3N/4 - Fi-1)W/fi dQ = (Q3 - Q1)/2 Desviacin Cuartlica. 25% Q2 = X 50% Q3 75% 100%

3.4.2. Los Deciles ( D ). Son medidas de tendencia central que a su distribucin de frecuencias divide en 10 partes. Se enuncia: Dr = Li + (rN/10 - Fi-1)/ W/fi dD = (D9 - D1)/2 Desviacin Declica

3.4.3. Los Percentiles ( P ) Son medidas de tendencia central que a la distribucin de frecuencias divide en 100 partes iguales.

P1 P100 Se enuncia:

P50 P51

P99

Pt = Li + /( tN/100 - Fi-1)/(W/fi)

CAPTULO IV.- MEDIDAS DE DISPERSIN.

Para describir y analizar ms ampliamente el comportamiento de una distribucin de frecuencias, no es suficiente obtener los valores centrales, sino adems, algunos otros valores que nos permitan tener idea sobre la dispersin o diseminacin de los datos. Se llama dispersin al grado en que los datos numricos tienen a extenderse alrededor de un valor medio.

4.1. VARIANZA Una manera de suprimir los signos que corresponden a cada una de las diferencias, sin establecer discriminacin, consiste en elevarlos al cuadrado. El cociente que resulta de dividir la suma de los cuadrados de las diferencias entre los valores individuales y la Media Aritmtica por el nmero de observaciones se denomina VARIANZA y se le designa por la letra "S 2" cuando se trata de la poblacin y con "S2" cuando se trata de una muestra. La varianza minimiza la suma de las desviaciones al cuadrado, esta medida no se utiliza para describir una distribucin, sino ms bien, tiene una gran aplicacin en el campo del muestreo en el diseo de muestras y tambin sirve para comparar 2 ms distribuciones, por tal razn el concepto de Varianza posee un mayor valor terico que la Desviacin Standard que viene a ser la raz cuadrada de la Varianza. En el clculos de la Varianza se presentan dos situaciones: Varianza a partir de datos no agrupado y Varianza de datos agrupado 4.1.1. Varianza de datos no clasificados. 1) Mtodo Directo (X1 - X2)2 + (X2 - X)2 + ....... (Xn - X)2 S2 = -----------------------------------------N n

i=1

(X1 - X)2

S2 = ---------------N 1 n S2 = -- (X1 - X)2 N i=1 Pasos: 1 2 3

Se determina la desviacin de cada trmino (X1) con respecto a la Media (X) Se elevan al cuadrado las desviaciones y luego se suman Se divide la suma de cuadrados resultante entre el nmero de observaciones

Las frmulas 26 y 27 que se dan a continuacin, reciben el nombre de frmulas modificadas y son transformaciones algebraicas de la frmula 25 llamada frmula de la definicin. n n X2 i=1 S2 = --------------------N 1 n n
2 2

X1 i=1

------N

S2 = -- N X2 - X1 N2
1=1 i=1

2) Mtodo Abreviado, con cambio de origen en la serie simple de datos

S2 = -- N C2 - C1

N2

1=1

i=1

donde: C1 = X1 - X0

Para usar estas dos frmulas 26 y 27 el nico paso previo que se da, es el de elevar al cuadrado cada uno de los valores (X2) y luego sumarlos y para la frmula 28 se selecciona un valor arbitrario (X0) Ejemplo: Utilizaremos los mismos datos de los ejemplos anteriores, donde el peso promedio de los 5 recin nacidos fue 3.4 y seleccionando 3.5. como X 0 tenemos los siguientes resultados.

X1 3.5 3.7 4.0 3.1 2.7 17.0

X1- X 0.1 0.3 0.6 0.3 0.7 -

(X1-X)2 0.01 0.09 0.36 0.09 0.49 1.04

X2 12.25 13.69 16.00 9.61 7.29 58.84

C1=X1-X0 0. 0.2 0.5 -0.4 -0.8 -0.5

C2=(X1-XO)2 0. 0.04 0.25 0.16 0.64 1.09

Efectuando operaciones con cada una de las cuatro frmulas tenemos:

1.04 (1) S2 = ----- = 0.21 5

1 S2 = --- (1.04) = 0.2 (1.4) = 0.21 5

(17)2 58.84 - 5 (2) S2 = -------------- = -------------- = ----- = 5 5 5 = 0.21 1 5(58.84) - (17)2 (3) S2 = --52 = 1 294.20 - 289.00 25 = 1 5.20 = 5.20 = 0.21 58.84 - 57-80 1.04

25 (4)
2

25

S = 1 5(1.09) - (-0.5)2 52 = 1 5.45 - 0.25 25

1 5.20 = 5.20 = 0.21 25 25

4.1.2. Varianza de datos clasificados. En este caso se cuentan con los siguientes mtodos: 1. Mtodo Directo k h=1 S2 =-------------------N Donde: S2 fh Xh X N (Xh-X)2 = = = = = = Varianza Frecuencia de clase Punto medio de clase Media Nmero total de observaciones fh (Xh - X)2

Cuadrado de las diferencias de cada punto medio y ma media

Esta frmula se usa tanto para intervalos regulares como irregulares y recibe el nombre de Mtodo Directo. Tambin se le puede expresar de la siguiente manera: 1 k k
2

S2 = -- N fhX2 - fh Xh

N2

h=1

h=1

PASOS: 1 2 3 4 Se determinan los puntos medios (X) Se obtiene las diferencias de cada punto medio y la media respetando los signos Se elevan las diferencias al cuadrado El cuadrado de las diferencias se multiplica por la frecuencia respectiva, luego se suman los valores resultantes. 5 La suma resultante en el punto 4 se divide entre el nmero de observaciones

Ejemplo de Aplicacin: Con X = 5.19

Xh1 Xh2

nh

Xh

Xh-X

(Xh-X)

nh(Xh-X)2

nh Xh

nh X2

3.5-3.9 4.0-4.4 4.5-4.9 5.0-5.4 5.5-5.9 6.0-6.4 6.5-6.9 TOTAL

1 7 14 37 12 2 2 75

3.75 4.25 4.75 5.25 5.75 6.25 6.75 ----

1.44 0.94 0.44 0.06 0.56 1.06 1.56 ----

2.074 0.884 0.194 0.004 0.314 1.124 2.434 ----

2.074 6.188 2.716 0.148 3.768 2.248 4.868 22.010

3.75 29.75 66.50 194.25 69.00 12.50 13.50 389.25

14.063 126.438 315.882 1,019,831 396.756 78.126 91.125 2,042.202

reemplazando en las frmulas 29 y 30 tenemos: (1) S2 = 22.0 = 0.29 75 (2) S2 = 1 [75 (2042.22) - (389.25)2 (75)2 S2 = 1 [1,650.94] 5625 S2 = 1,650.94 = 0.29 5,625

2.

Mtodos Abreviados Se usa slo para distribuciones de frecuencias con intervalos regulares, cambio de origen de los intervalos.

k S2 = 1 N nhC2 - nh Ch N2 donde: Ch = Xh - Xo k S2 = 12 N nhC2 - nh Ch N2


h=1 h=1

h=1

donde: dh = Xh - X0 1

4.2. DESVIACIN STANDARD O DESVIACIN TPICA Es la medida de dispersin ms utilizada en el campo de la estadstica y se define como la raz cuadrada de la media aritmtica de las desviaciones cuadradas con respecto a la Media. Se le designa por la letra "S" (mayscula) cuando se trata de la poblacin y por "s" (minscula) cuando se trata de una muestra. Caractersticas Cunto mayor es la dispersin alrededor de la media tanto mayor es el valor de la desviacin standard. Las desviaciones extremas con respecto a la media pesan mucho ms en cuanto a determinar el valor de la desviacin standard. Propiedades La Desviacin Standard puede definirse por: n S = _ (X1-a)2
N

donde "a" es un valor que puede ser distinto de la media aritmtica. De todas las desviaciones tpicas, la mnima es aquella para la que a = x 1. Para distribuciones normales resulta que: El 68.27% de los casos estn comprendido entre la: X - S y X + S

2.

El 95.45% de los casos estn comprendidos entre la X - 2S y X + 2S

INTRODUCCON

Desde los ms remotos tiempos encontramos vestigios sobre la recopilacin de datos, a veces aspectos analticos de ellos. Los esfuerzos del hombre por evaluar en forma cuantitativa las caractersticas que le rodean los como resultado la Estadstica. La Estadstica como mtodo cientfico para el estudio de fenmenos colectivos y por su utilidad en la toma de decisiones como de previsin, se ha convertido en una de las caractersticas de nuestro tiempo y su desarrollo trasciende, como ciencia y como metodologa de investigacin cientfica, a casi todas las ramas del saber humano. Se ha estructurado la presente monografa en cuatro captulos, en los que se exponen aspectos bsicos sin descuidar su rigurosidad conceptual. En el primer captulo se exponen nociones de Estadstica. En el segundo, se trata sobre la Estadstica

Descriptiva propiamente dicha. En el tercero se trata referente a las medidas de tendencia central y en el cuarto captulo se consideran las medidas de dispersin las que nos indican el grado de variacin de los valores de la variable en estudio. Dado su gravitante utilidad, se valora de por s la estadstica. Actualmente se impone el auge del conocimiento en pos de arrancar los secretos a la naturaleza a fin de ponerlos al servicios del bienestar humano. Seguramente que en el desarrollo de los temas se apreciarn algunas limitaciones; son los primeros intentos por sumergirse en estas reas . Esperamos su comprensin y hacemos presente que va en las siguientes pginas nuestro mejor propsito. El Autor.

UNIVERSIDAD NACIONAL DE EDUCACIN ENRIQUE GUZMN Y VALLE LA CANTUTA

FACULTAD DE CIENCIAS ESCUELA ACADMICA PROFESIONAL DE MATEMTICA E INFORMTICA

ASIGNATURA

SEMINARIO DE MATEMTICA

TEMA

ESTADSTICA DESCRIPTIVA
(MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN) PROFESOR DEL CURSO Aurelio GMEZ TORRES

REALIZADO POR Ciro Miguel, ANAYA COTRINA CDIGO: 862164 ESPECIALIDAD: MATEMTICA CICLO 99-B

CONTENIDO INTRODUCCIN CAPTULO I NOCIONES DE ESTADSTICA DESCRIPTIVA 1. 1. Estadstica como ciencia y como una metodologa. 1. 2. Poblacin y muestra. 1. 3. Observaciones cuantitativas y cualitativas. 1. 4. Parmetro y estadgrafo. 1. 5. Una definicin de Estadstica. CAPTULO I I ESTADSTICA DESCRIPTIVA 2.1. Clasificacin. 2.2.Presentacin de datos. 2.2.1. Distribucin de frecuencias. 2.2.2.Grficas. 2.2.2.1. Histogramas 2.2.2.2. Polgonos de frecuencia 2.2.2.3. Ojiva 2.2.2.4. Grfica de sectores angulares o diagramas circulares. CAPTULO I I I MEDIDAS DE TENDENCIA CENTRAL 3.1. Media aritmtica 3.1.1. Media de datos no clasificados 3.1.2. Media de datos clasificados 3.1.3. Caractersticas ms relevantes de la media aritmtica 3.2.Mediana 3.2.1. Mediana de datos no clasificados 3.2.2. Mediana de datos clasificados 3.3. Moda 3.3.1. Moda de datos no clasificados 3.3.2. Moda de datos clasificadoa 3.3.3. Caractersticas ms relevantes de la moda 3.4. Cuartilas o fractilas 3.4.1. Los cuartiles 3.4.2. Los deciles 3.4.3. Los percentiles CAPTULO I V MEDIDAS DE DISPERSIN 4.1. Varianza 4.1.1. Varianza de datos no clasificados 4.1.2. Varianza de datos clasificados BIBLIOGRAFA

BIBLIOGRAFA 1. BARBANCHO, Alonso 2. GARCA OR, Celestino Estadstica Descriptiva Estadstica y Probabilidades Edita Ursula 1990 Estadstica Descriptiva

3. MOYA CALDERN, Rufino

4. MURRAY R., Spiegel

Estadstica Edita Mac Graw Hill, Mxico 1970.