You are on page 1of 5

II.

- ESTADISTICA DESCRIPTIVA Y MEDIDAS ESTADSTICAS


IIA.- DISTRIBUCIONES DE FRECUENCIAS: Muestra el nmero (frecuencia) de elementos correspondientes a cada una de varias clases que no se traslapan.
Datos cualitativos grfica: barras pastel
clase o frecuencia frecuencia relativa frecuencia
categora absoluta fi porcentual
fi fr f % fr 100
n

total n= 1.00 100%


datos cuantitativos Grficas:
Construccin distribucin de frecuencias histograma: grafico de barras de
1.- Obtener R=dato mayor - dato menor ancho proporcional al tamao de
clase y altura proporcional a la
2.- Determinar # clases 1 3.322 logn frecuencia.
3.- Determinar R polgono de frecuencias: grfico
W
# clases de lneas.
4.- formar las clases usando como li de la primera clase un nmero
menor o igual que el dato menor.
clase
li ls
fi fr mi mi f i

f i mi x
2 fa
ojiva menor que: grfico de
lneas de la distribucin de
frecuencias acumuladas

total n= 1.00

Algunas formas de distribucin:

uniforme sesgada a la derecha normal, forma de campana

IIB.- MEDIDAS ESTADSTICAS: Medidas descriptivas para presentar de la tendencia central o la dispersin de una serie de datos.
MEDIDAS DE TENDENCIA CENTRAL Igual que los promedios, la medida de tendencia central es un valor nico que nos indica el punto medio o tpico de los
datos que cabe esperar.
MEDIDA DATOS SIMPLES DATOS AGRUPADOS.
NO AGRUPADOS (Distribuciones de frecuencias)
datosanlisis de
datosestadsticadescriptivarango de Excel no tiene funciones para calcular medidas
entrada[rango],,seleccionar: resumen de estadsticas en datos agrupados
estadsticasaceptar
MEDIA ARITMTICA
Es el ms comnmente usado. Tambin llamado Media de la muestra x
xi mi = punto medio de la clase
promedio o simplemente media. n f i = frecuencia de clase
n = # elementos en el conjunto
x = media muestral xi =valor de cada observacin
media poblacional n =# elementos en el conjunto x
mi f i
f
Media de la poblacin
x i
n
N
=promedio ( [rango] )
MEDIANA Md Ordene los datos en orden ascendente (de menor Lri = lmite. Inferior. Real clase mediana
Es el valor intermedio cuando los valores de los a mayor) Fa = frecuencia acumulada hasta la clase anterior
datos se ordenan en forma ascendente. a) para un nmero impar de observaciones, la a la clase mediana
mediana es el valor intermedio f = frecuencia de la clase mediana
se prefiere sobre la media cuando hay valores Md x n 1 , si n es impar. W = tamao de la clase mediana.
extremos (muy altos o muy bajos) en el conjunto 2

de datos. localizacin central: i n


b) para un nmero par de observaciones, la 2
mediana es el promedio de los dos valores
i Fa
intermedios. Md Lri W
x n x n 1 f
Md 2 2
, si n es par.
2
=mediana([rango])
MODA Mo Se determina por inspeccin (buscamos el valor
Es el valor de los datos que se presenta con ms que ms se presenta en el conjunto) Cuando los datos estn agrupados, debemos
frecuencia. Cuando hay dos o ms modas en un suponer que la moda se halla en la clase que tenga
conjunto, los datos son llamados bimodales o =moda([rango]) mas elementos, llamada Clase Modal.
multi-modales. Tambin puede ser que no haya
moda.

MEDIDAS DE DISPERSION. Se usa el trmino dispersin para describir el grado en que una serie de valores vara respecto a su media. Los valores incluidos
en un conjunto de datos usualmente varan en magnitud; algunos valores son pequeos y algunos son grandes. La variacin de los valores es llamada
Dispersin, y hay varios criterios para medirla:
Una medida de dispersin es importante en dos modos:
1. Puede ser usada para mostrar el grado de variacin entre los valores en los datos
2. Puede ser usada para suplementar un promedio: si la dispersin es alta, el promedio no es significativo; si la dispersin es baja, el promedio se
vuelve altamente significativo.
RANGO R valor mxi mo-valor m nimo R=(l.r.s. ltima clase)- (l.r. i. primera clase)
VARIANZA varianza muestral varianza muestral

x x fi m x
medida de la dispersin que emplea todos los 2 2
datos. Promedio de las desviaciones respecto al
s 2
i
s 2
i
promedio elevadas al cuadrado. Se mide en el n 1 n 1
cuadrado de las unidades originales. varianza poblacional varianza poblacional
s2= variancia muestral.
2= variancia poblacional.
2

x
i
2

2

fi m
i
2

N N
=var([rango)]
DESVIACIN ESTANDAR desviacin estndar muestral desviacin estndar muestral

x x fi m x
Dispersin promedio de los datos alrededor de la 2 2
media aritmtica, se mide con las mismas unidades s s2 i
s s 2 i
que las de los datos originales. n 1 n 1
Es la raz cuadrada positiva de la varianza. desviacin estndar poblacional
n 1 = grados de libertad.
fi m
desviacin estndar poblacional 2

2 i

x
2
N
2 i

N
=desvest([rango])
MEDIDAS DE POSICIN DE LOCALIZACIN.
Cuartiles: limitan cuartas partes de los datos: Q1, Q2, Q3
Percentiles: limitan centsimas partes de los datos: P1 a P99.
Nota: la mediana corresponde a Q2, a P50.
CUARTILES Q1= primer cuartil o percentil 25 Q1= primer cuartil o percentil 25
Valores que dividen los datos en cuatro partes: Q2= segundo cuartil, o percentil 50 (tambin la Q2= segundo cuartil, o percentil 50 (tambin la
Q1= primer cuartil o percentil 25 mediana) mediana)
Q2= segundo cuartil, o percentil 50 (tambin la Q3= tercer cuartil, o percentil 75. Q3= tercer cuartil, o percentil 75.
mediana)
Q3= tercer cuartil, o percentil 75. =cuartil(matriz,cuartil)
localizacin: i p n
PERCENTILES. El p-simo percentil es un valor tal Clculo del p-simo percentil
que por lo menos p porciento de las 1. Ordene los datos de manera ascendente
100
observaciones son menores o iguales que p y (100 2. Calcule un ndice i p
p) porciento de las observaciones son mayores o i n i Fa
iguales que p. 100 Pi Lri W
en donde p es el percentil de inters. f
3. a) si i no es entero, se redondea. El valor entero
inmediato mayor que i indica la posicin del
p-simo percentil
b) Si i s es entero, el p-simo percentil es el
promedio de los valores de los datos ubicados
en los lugares i e i 1
=percentil(matriz,k)
COEFICIENTE DE VARIACIN desviacin estandar desviacin estandar
Es una medida de dispersin relativa. C.V . 100 C.V . 100
para comparar la dispersin de variables que media aritmtica media aritmtica
tienen distintas desviaciones estndar y distintos Indica lo grande que es la desviacin
promedios. estndar en comparacin con la media.

APLICACIONES DE LA DESVIACIN ESTNDAR


La desviacin estndar nos permite determinar, con cierto grado de precisin, donde se sitan los valores de una distribucin en relacin con la media. Cuando
los valores de una serie de datos estn concentrados cerca de su media, la desviacin estndar es pequea.
TEOREMA DE CHEBYSHEV:
Permite inferir la proporcin de valores que deben quedar dentro de una cantidad especfica de desviaciones estndar respecto a la media.

Cuando menos 11 z 2 de los datos debe estar a menos de z desviaciones estndar de separacin respecto a la media, siendo z
cualquier valor mayor que 1
Ventaja: se aplica a cualquier conjunto de datos, independientemente de la forma de la distribucin de los mismos.

EMPRICA:
REGLA
Para datos con distribucin en forma de campana, se puede aplicar la regla emprica para determinar el porcentaje de elementos que debe estar dentro
de determinada cantidad de desviaciones estndar respecto al promedio.
Aproximadamente 68.27% de los elementos estn a menos de una desviacin estndar de la media.
Aproximadamente 95.45% de los elementos estn a menos de dos desviaciones estndar de la media.
Casi todos los elementos (99.73%) estn a menos de tres desviaciones estndar de la media.
Podemos medir con mayor precisin la proporcin de elementos que caen dentro de intervalos especficos si estos estn distribuidos normalmente, es
decir, si la grfica de la distribucin es simtrica con forma de campana, Md Mo
Distribucin normal estndar

xi x
donde z
s
se considera que cualquier elemento con valor z fuera del intervalo de 3 es un valor atpico.

III.- REGRESIN LINEAL SIMPLE Y CORRELACIN.



Nos interesa saber si dos variables cuantitativas x e y estn asociadas, qu tan fuertemente lo estn y como se asocian.
Datos: n pares ordenados x, y , donde
x valor observado de la variable predictora o independiente
y valor observado de la variable a predecir o dependiente
adems
y valor de la variable dependiente, estimado mediante la lnea de regresin,
e y y residuo o error
MTODO DE MNIMOS CUADRADOS PARA ESTIMAR LA LNEA DEL MEJOR Mediante excel:
AJUSTE

Ecuacin de la lnea de regresin: y a bx



Insertar el grfico de dispersin de los datos,
Clic derecho en uno de los puntos de datos observados
Modelo lineal,
(pestaa opciones o misma pestaa)
presentar lnea de tendencia en el grfico,
2
presentar r en el grfico (r2 = coeficiente de determinacin)
a = interseccin de la recta con el eje vertical a y bx fx =intercepcin.eje(conocido_y,conocido_x)

b = pendiente o inclinacin de la recta b xy n x y fx =pendiente(conocido_y,conocido_x)

x n x
2 2

valor de
Interpretacin: cambio promedio del y por cada unidad que
aumenta x
Estimacin de Y para una X dada fx =pronostico(x,conocido_y,conocido_x)

sustituimos el valor de x en la ecuacin de regresin
Error estndar de la estimacin Se fx =error.tipico.xy(conocido_y,conocido_x)
Mide la variabilidad o dispersin de los valores observados respecto a la
lnea de regresin:

Se
y y 2

Se
y 2
a y b xy
n 2 n 2
COEFICIENTE DE CORRELACIN DE PEARSON : Es una herramienta fx =pearson(matriz1,matriz2)
estadstica que nos sirve para describir el grado de asociacin entre dos
variables. Su valor vara desde -1 hasta 1, el signo es el de la pendiente, su
valor numrico informa la fuerza de la relacin entre las variables, hasta
una correlacin perfecta en r=-1 r=1.

r

xy n x y
xy 2 2

2
x n x y 2 n y

2
COEFICIENTE DE DETERMINACIN: r : corresponde al cuadrado del fx coeficiente.r2(conocido_y,conocido_x)
coeficiente de correlacin; multiplicado por 100, Interpretacin: informa
en qu porcentaje la ecuacin de regresin explica el valor de la variable
dependiente.

IV. PROBABILIDAD
0 certeza no ocurrencia
Probabilidad de ocurrencia del evento A: # resultados favorables
p A
# resultados posibles 1
certeza de ocurrencia
Al conjunto de todos los resultados de un experimento se llama espacio muestral S. Cada uno de los posibles resultados del experimento se
llama punto muestral. Un subconjunto de uno o ms resultados del espacio muestral se llama evento.

TECNICAS DE CONTEO: Para determinar el nmero de formas en que ocurre un experimento o un evento, usando frmulas o procedimientos
sistemticos.
1. Diagrama de rbol: Dispositivo grfico til para visualizar un experimento de varias etapas y enumerar los resultados posibles..
2. Regla de multiplicacin: n1 n2 nk
3. Permutaciones: Una permutacin es cualquier arreglo u ordenacin de todos o una parte de n elementos. El nmero de Permutaciones
de r elementos en lnea, tomados de n elementos elegibles: P n! , r n En Excel:= permutaciones(n,r)
n r
n r!
4. Combinaciones: Una combinacin es un subconjunto de r objetos, tomado de un conjunto de n objetos elegibles. El orden de los

elementos carece de importancia. El nmero de combinaciones de r elementos es: nCr n n! En Excel: =combinat(n,r)
r
r! r!
n
Mtodos ms comunes para asignar probabilidades:
Probabilidad clsica o a priori Es la de los juegos de azar cuando todos N Nmero de resultados asociados con E i
pE i E i
los resultados del experimento son N Nmero de resultados posibles
igualmente probables
Probabilidad emprica o de Se analiza como ha ocurrido el n nmero de veces que ocurre el evento E i
pE i E i

frecuencia relativa experimento en el pasado para calcular n Nmero de ensayos u observaciones



probabilidades
Probabilidad subjetiva o de Es una evaluacin personal de la probabilidad de que ocurra un evento
juicio

Axiomas de probabilidad:
1. 0 pEi 1 2.- pEi 1 3.- pE1 E2 pE1 pE2
Probabilidad marginal o simple.: Es una probabilidad sencilla; quiere decir que solo un evento puede llevarse a cabo, al margen de otros
eventos o clasificaciones.
# resultados favorables f
p A
# resultados posibles n
Ley Aditiva: Sean A y B dos eventos de S, la probabilidad de que ocurra A B:
pA B pA pB, cuando A y B son mutuamente excluyentes.
pA B pA pB pA B, cuando A y B no son mutuamente excluyentes.
Ley Multiplicativa: A y B se presenten al mismo tiempo o en sucesin. Sean A y B dos eventos de S,
pA B pA pB, si A y B son independientes.
pA B pA pB A, si A y B no son independientes.
Probabilidad Condicional: Si A y B no son independientes, la probabilidad de que ocurrencia del evento B, si se sabe que ha ocurrido el
evento A, se determina con relacin al evento A que se sabe que ha ocurrido, y no en referencia al espacio muestral S:

pA B; Muy importante: Si A y B son independientes, pB A pB pA B pA pB
pB A

pA
* Teorema de Bayes: En un experimento en dos etapas, si se sabe que en la segunda etapa se obtuvo el resultado B, cul es la probabilidad
posterior de que provenga del resultado Ai de la primera etapa
Mtodo tabular:
Evento Probabilidad previa Probabilidad condicional Probabilidad conjunta Probabilidad posterior
Ai p Ai pB Ai p Ai B
pAi B
p Ai B
p B
A1
A2

Total p Ai 1 p A B p B
i
V. DISTRIBUCIONES DE PROBABILIDAD
Distribucin de probabilidad: describen como se espera que varen los resultados de un experimento, si este se llevara a cabo. La
distribucin de probabilidad de una variable aleatoria describe cmo se distribuyen las probabilidades de los diferentes valores de la variable
aleatoria.
E x x f x Var x 2 x f x
2
Valor esperado, varianza:

DISTRIBUCIONES DISCRETAS DE PROBABILIDAD


DISTRIBUCION BINOMIAL: Para describir situaciones en las que tenemos n ensayos, cada uno de los cuales tiene dos resultados posibles,
xito
o fracaso, y los resultados de los ensayos son independientes.
Probabilidad de x xitos: Parmetros: n p
px xitos n Cx p qx n x

p= probabilidad de xito en cada ensayo Media aritmtica: Desviacin estndar:


x= nmero de xitos en los n ensayos n p n p 1 p
n-x = nmero de fracasos en los n ensayos
=distr.binom(x,#ensayos,prob_exito,acum)

DISTRIBUCION DE POISSON: para describir situaciones donde nos interesa el nmero de veces que ocurre un fenmeno durante un intervalo
dado o en una regin especfica se llaman experimentos de Poisson.
Probabilidad de x ocurrencias: Parmetro:
x e Media aritmtica: Desviacin estndar
f x
x!
=poisson(x,media,acumulado)
Aproximacin de Poisson a la binomial: es adecuada cuando n20 , p0.05, consiste en
poisson binomial np enp
x

f x
n p x!
DISTRIBUCIN HIPERGEOMTRICA:
Probabilidad de x xitos:

f x

r Cx
Cnx f(x)=probabilidad de x xitos en n ensayos.
xitos N r N=tamao poblacin
N Cn r=# xitos en la poblacin
n=tamao de muestra
=distr.hipergeom(x,n,r,N) x= #xitos en la muestra.

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD


DISTRIBUCION NORMAL:
Muy importante distribucin continua de probabilidad. Proporciona una base sobre la cual se fundamenta gran parte de la teora de
Estadstica Inferencial.
Para definir una poblacin distribuida normalmente, se necesitan solo 2 parmetros: y .
Distribucin normal estndar:

El rea total bajo la curva es 1.00, por lo cual las reas bajo la curva y dentro de dos lmites corresponden a la
probabilidad de que la variable tome valor dentro de sos lmites. La tabla muestra las reas bajo la curva normal a la
izquierda de un valor Z, donde (Z es la forma estandarizada o tipificada de la variable aleatoria x).
x x Z
z
area tabulada (area a la izquierda de Z)
=distr.norm.estand.inv(probabilidad)

=distr.norm.estand(Z)

APROXIMACIN DE LA DISTRIBUCIN NORMAL A LA BINOMIAL.


Es aceptable cuando n30 y p0.05, y tanto np5 como nq 5. Se realiza una correccin por continuidad, sumando o restando
0.5 al valor de la variable a estandarizar.
Media aritmtica: n p Desviacin estndar: n p 1 p