You are on page 1of 3

Teorema de Chebyshev.

La desigualdad de Chebyshev es un resultado estadstico que ofrece una cota


inferior a la probabilidad de que el valor de una variable aleatoria con varianza
finita est a una cierta distancia de su esperanza matemtica o de su media;
equivalentemente, el teorema proporciona una cota superior a la probabilidad de
que los valores caigan fuera de esa distancia respecto de la media. El teorema es
aplicable incluso en distribuciones que no tienen forma de "curva de campana" y
acota la cantidad de datos que estn o no "en medio".
Teorema: Sea X una variable aleatoria de media y varianza finita s. Entonces,
para todo nmero real k > 0,

Slo
los
casos
con
k
>
1
proporcionan
informacin
til.
Para ilustrar este resultado, supongamos que los artculos de Wikipedia tienen una
extensin media de 1000 caracteres y una desviacin tpica de 200 caracteres. De
la desigualdad de Chebyshev se deduce que al menos el 75% de los artculos
tendrn una extensin comprendida entre 600 y 1400 caracteres (k = 2).
Otra consecuencia del teorema es que para cada distribucin de media y
desviacin tpica finita s, al menos la mitad de los valores caern en el
intervalo
Las cotas proporcionadas por la desigualdad de Chebyshev, en general, no se
pueden mejorar; es posible construir una variable aleatoria cuyas cotas de
Chebyshev sean exactamente iguales a las probabilidades reales. Sin embargo,
en general el teorema proporcionar cotas poco precisas.
El teorema puede ser til a pesar de las cotas imprecisas porque se aplica a una
amplia gama de variables que incluye las que estn muy alejadas de la
distribucin normal, y porque las cotas son fciles de calcular. El teorema se
emplea para demostrar la ley dbil de los nmeros grandes.
El teorema recibe su nombre del matemtico Pafnuty Chebyshev.
Si una distribucin es simtrica con forma de campana, prcticamente todas las
observaciones se encuentran entre la media ms o menos tres desviaciones
estndares.
Dispersin Relativa:

Karl Pearson (1857-1936) desarroll una medida relativa denominada coeficiente


de variacin(CV). Es una medida til cuando:
Los datos estn en unidades diferentes (como U$S y das de asistencia).
Los datos estn en las mismas unidades, pero las medias muy distantes
(ingresos de superiores e ingresos de empleados).o Coeficiente de variacin: es la
razn (cociente) de la desviacin estndar a la media aritmtica, expresada como
un porcentaje:
s
CV = (100)
X
Karl Pearson desarroll tambien una medida para evaluar el grado de orientacin
al sesgo, denominada coeficiente de asimetra (CA):
3 (media - mediana)
CA =
Desviacin Estndar
Otras medidas de dispersin:
Un mtodo es determinar la ubicacin de los valores que dividen un conjunto de
observaciones en partes iguales. Estas medidas son:
o Los cuartiles, que dividen un conjunto de observaciones en 4 partes
iguales(conjuntos ordenados de menor a mayor). El primer cuartil (Q1) es el valor
abajo del cual se encuentra el 25% de las observaciones, y, el tercer cuartil (Q3)
es el valor por abajo del cual se encuentra el 75% de las observaciones. Q2 es la
mediana.
o Los deciles dividen un conjunto de observaciones en 10 partes iguales.
o Los centiles se utilizan para reportar resultados acerca de ciertas pruebas
nacionales estandarizadas, empleado para calificar la admisin a programas.

Cuartiles, Deciles y Centiles ( o Porcentiles):


Para formalizar el procedimiento, sea Lp la ubicacindel centil deseado.

Ej: porcentil 33 L33. El nmero de observaciones es n. Entonces se aplica: (n +1) /


2
Ubicacin de un centil Lp = (n +1) P/100
o Diagramas de caja: representacin grfica basada en cuartiles, que ayuda a
ilustrar un conjunto de dato. Se necesitan 5 valores estadsticos: el valor mnimo;
Q1 ; la mediana; Q3 ; y el valor mximo.

Mediana
Q1 Q3

Valor mnimo Valor Mximo


La distancia entre los extremos de la caja se denomina amplitud cuartlica ( o
intercuartlica). Dicho intervalo es la distancia entre el primero y el tercer cuartiles.
Se indican dos asteriscos (**) . Uno indica n dato impropio. Un dato incongruente
es un valor inconsciente con el resto de los datos. Es como aquel valor que ms
de 1,5 veces el valor de la amplitud intercuartlica, mayor que Q3 o bien, menor
que Q1.

Dato incongruente = Q1 - 1,5 (Q3 - Q1)


La desigualdad de Chbyshev es muy importante, ya que permite determinar los
lmites de las probabilidades de variables aleatorias discretas o continuas sin tener
que especificar sus funciones de probabilidad. Este teorema asegura que la
probabilidad de que una variable aleatoria se aleje de la media no ms de k
desviaciones estndar, es menor o igual a 1/k2 para algn valor de k >1. Aunque
la garanta no siempre es muy precisa, la ventaja sobre este teorema es su gran
generalidad por cuanto es aplicable a cualquier variable aleatoria con cualquier
distribucin de probabilidad, ya sea discreta o continua.

You might also like