You are on page 1of 5

II.

- ESTADISTICA DESCRIPTIVA Y MEDIDAS ESTADSTICAS


IIA.- DISTRIBUCIONES DE FRECUENCIAS: Muestra el nmero (frecuencia) de elementos correspondientes a cada una de varias clases que no se traslapan.
Datos cualitativos grfica:
clase o frecuencia frecuencia relativa frecuencia
categora absoluta fi porcentual
fi fr f % fr 100
n

total n= 1.00 100% barras pastel



datos cuantitativos Grficas:
Construccin distribucin de frecuencias histograma: grafico de barras de
1. Obtener el rango de los datos rango dato mayor - dato menor ancho proporcional al tamao de
clase y altura proporcional a la
1.- Determinar #clases 1 3.322 logn redondear a entero frecuencia.
2.- Determinar W rango redondear segn la precisin de los datos polgono de frecuencias: grfico
# clases de lneas.
4.- formar las clases usando como li de la primera clase un nmero menor o
que el dato menor.
igual
fi fr mi fi

clase mi 2 fa Lim
fi mi x reales ojiva menor que: grfico de
li ls lir lsr lneas de la distribucin de
frecuencias acumuladas



total n= 1.00 Algunas formas de distribucin:
Auxiliares para determinar media aritmtica y varianza, datos agrupados

uniforme sesgada a la derecha normal, forma de campana

IIB.- MEDIDAS ESTADSTICAS: Medidas descriptivas para presentar de la tendencia central o la dispersin de una serie de datos.
MEDIDAS DE TENDENCIA CENTRAL Igual que los promedios, la medida de tendencia central es un valor nico que nos indica el punto medio o tpico de los
datos que cabe esperar.
MEDIDA DATOS SIMPLES DATOS AGRUPADOS.
NO AGRUPADOS (Distribuciones de frecuencias)
No hay una funcin para obtenerlas con
excel
MEDIA ARITMTICA
Es el ms comnmente usado. Tambin llamado
Media de la muestra x
x i
mi = punto medio de la clase
fi = frecuencia de clase
promedio o simplemente media.
n n = # elementos en el conjunto
x = media muestral x i =valor de cada observacin m f i i
media poblacional n =# elementos en el conjunto
x
n

x
i

Media de la poblacin
N
En Excel: =promedio()
MEDIANA Md 1. Ordene los datos de manera ascendente

Aproxime su valor mediante el grfico de ojiva
Es el valor intermedio cuando los valores de los 2. Calcule un ndice i n
i
datos se ordenan en forma ascendente. 2
en donde n es el nmero de datos.
se prefiere sobre la media cuando hay valores 3. a) si i no es entero: El valor entero inmediato
extremos (muy altos o muy bajos) en el conjunto mayor que i indica la posicin de la mediana
de datos. b) Si i s
es entero, la mediana es el promedio de
los valores de los datos ubicados en los lugares
i e i 1
En Excel: =mediana()
MODA Mo Se determina por inspeccin (buscamos el valor
Es el valor de los datos que se presenta con ms que ms se presenta en el conjunto) Cuando los datos estn agrupados, debemos
frecuencia. Cuando hay dos o ms modas en un suponer que la moda se halla en la clase que tenga
conjunto, los datos son llamados bimodales o ms elementos, llamada Clase Modal.
multi-modales. Tambin puede ser que no haya En Excel: =moda()
moda.
MEDIDAS DE DISPERSION. Se usa el trmino dispersin para describir el grado en que una serie de valores vara respecto a su media. Los valores incluidos
en un conjunto de datos usualmente varan en magnitud; algunos valores son pequeos y algunos son grandes. La variacin de los valores es llamada
Dispersin, y hay varios criterios para medirla:
Una medida de dispersin es importante en dos modos:
1. Puede ser usada para mostrar el grado de variacin entre los valores en los datos
2. Puede ser usada para suplementar un promedio: si la dispersin es alta, el promedio no es significativo; si la dispersin es baja, el promedio se
vuelve altamente significativo.
RANGO R valor mximo-valor mnimo R=(l.r.s. ltima cla se)- (l.r.i. primera clase)
VARIANZA varianza muestral varianza muestral

x fi m
medida de la dispersin que emplea todos los 2 2
datos. Promedio de las desviaciones respecto al i x i x
s2 s 2

promedio elevadas al cuadrado. Se mide en el n 1 n 1
cuadrado de las unidades originales.
s2= variancia muestral.
En Excel: =var()
2= variancia poblacional. varianza poblacional
varianza poblacional
x i
2

2

fi m i
2

2

N
N
En Excel: =varp()
DESVIACIN ESTANDAR desviacin estndar muestral desviacin estndar muestral

x fi m
Dispersin promedio de los datos alrededor de la 2 2
x x
media aritmtica, se mide con las mismas unidades s s 2 i
s s2
i

que las de los datos originales. n 1 n 1


Es la raz cuadrada positiva de la varianza. desviacin estndar poblacional
En Excel: =desvest()
fi m
2
n 1 = grados de libertad. i
desviacin estndar poblacional 2
N

x
2
i
2
N
En Excel: =desvestp()
MEDIDAS DE POSICIN DE LOCALIZACIN.
Percentiles: limitan centsimas partes de los datos: P1 a P99.

Cuartiles: limitan cuartas partes de los datos: Q1, Q2, Q3
Nota: la mediana corresponde a Q2, a P50.
PERCENTILES. El p-simo percentil es un valor tal Clculo del p-simo percentil Aproxime su valor mediante el grfico de ojiva
que por lo menos p porciento de las 1. Ordene los datos de manera ascendente
observaciones son menores o iguales que p y (100 2. Calcule un ndice i p
p) porciento de las observaciones son mayores o i n
100
iguales que p.
en donde p es el percentil de inters.
3. a) si i no es entero, se redondea. El valor entero
inmediato mayor que i indica la posicin del
p-simo percentil
b) Si i s es entero, el p-simo percentil es el
promedio de los valores de los datos ubicados
i e i 1
en los lugares
En Excel: =percentil()
CUARTILES Localizacin Q1 : i = 14 n Aproxime su valor mediante el grfico de ojiva
Valores que dividen los datos en cuatro partes:
Q1= primer cuartil, Localizacin Q2 : i = n 2
4
Q2= segundo cuartil,
Q3 : i = n
Localizacin 3
4
Q3= tercer cuartil.
En Excel: =cuartil()
COEFICIENTE DE VARIACIN
desviacin estandar desviacin estandar
Es una medida de dispersin relativa. C.V . 100 C.V . 100
Para comparar la dispersin de variables que media aritmtica media aritmtica
Indica lo grande que es la desviacin
tienen distintas desviaciones estndar y distintos
estndar en comparacin con la media.
promedios.
En Excel no hay funcin para obtenerla

APLICACIONES DE LA DESVIACIN ESTNDAR
La desviacin estndar nos permite determinar, con cierto grado de precisin, donde se sitan los valores de una distribucin en relacin con la media. Cuando
los valores de una serie de datos estn concentrados cerca de su media, la desviacin estndar es pequea.

REGLA EMPRICA:
Para datos con distribucin en forma de campana, se puede aplicar la regla emprica para determinar el porcentaje de elementos que debe estar dentro
de determinada cantidad de desviaciones estndar respecto al promedio.
Aproximadamente 68.27% de los elementos estn a menos de una desviacin estndar de la media.
Aproximadamente 95.45% de los elementos estn a menos de dos desviaciones estndar de la media.
Casi todos los elementos (99.73%) estn a menos de tres desviaciones estndar de la media.
Podemos medir con mayor precisin la proporcin de elementos que caen dentro de intervalos especficos si estos estn distribuidos normalmente, es
decir, si la grfica de la distribucin es simtrica con forma de campana, Md Mo
Distribucin normal estndar

xi x
donde z ;
s
En Excel: =normalizacion()

se considera que cualquier elemento con valor z fuera del intervalo de


3 es un valor atpico.

III.- REGRESIN LINEAL SIMPLE Y CORRELACIN.


Nos interesa saber si dos variables cuantitativas x e y estn asociadas, qu tan fuertemente lo estn y como se asocian.
Datos: n pares ordenados x, y , donde
x valor observado de la variable predictora o independiente
y valor observado de la variable a predecir o dependiente
adems
y valor de la variable dependiente, estimado mediante la lnea de regresin,
e y y residuo o error
MTODO DE MNIMOS CUADRADOS PARA ESTIMAR LA LNEA DEL MEJOR Mediante excel:
AJUSTE

Ecuacin de la lnea de regresin: y a bx



Insertar el grfico de dispersin de los datos,
Clic derecho en uno de los puntos de datos observados
Modelo lineal,
(pestaa opciones o misma pestaa)
presentar lnea de tendencia en el grfico,
2
presentar r en el grfico (r2 = coeficiente de determinacin)
a = interseccin de la recta con el eje vertical a y bx fx =intercepcin.eje(conocido_y,conocido_x)

b = pendiente o inclinacin de la recta b xy n x y fx =pendiente(conocido_y,conocido_x)

x n x
2 2

valor de
Interpretacin: cambio promedio del y por cada unidad que
aumenta x
Estimacin de Y para una X dada fx =pronostico(x,conocido_y,conocido_x)

sustituimos el valor de x en la ecuacin de regresin

COEFICIENTE DE CORRELACIN DE PEARSON : Es una herramienta fx =pearson(matriz1,matriz2)


estadstica que nos sirve para describir el grado de asociacin entre dos
variables. Su valor vara desde -1 hasta 1, el signo es el de la pendiente, su
valor numrico informa la fuerza de la relacin entre las variables, hasta
una correlacin perfecta en r=-1 r=1.

r
xy n x y
xy 2 2

2
x n x y 2 n y

2 fx coeficiente.r2(conocido_y,conocido_x)
COEFICIENTE DE DETERMINACIN: r : corresponde al cuadrado del
coeficiente de correlacin; multiplicado por 100, Interpretacin: informa
en qu porcentaje la ecuacin de regresin explica el valor de la variable
dependiente.

IV. PROBABILIDAD
0 certeza no ocurrencia
Probabilidad de ocurrencia del evento A: # resultados favorables
p A
# resultados posibles 1
certeza de ocurrencia
Al conjunto de todos los resultados de un experimento se llama espacio muestral S. Cada uno de los posibles resultados del experimento se
llama punto muestral. Un subconjunto de uno o ms resultados del espacio muestral se llama evento.

TECNICAS DE CONTEO: Para determinar el nmero de formas en que ocurre un experimento o un evento, usando frmulas o procedimientos
sistemticos.
1. Diagrama de rbol: Dispositivo grfico til para visualizar un experimento de varias etapas y enumerar los resultados posibles..
2. Regla de multiplicacin: n1 n2 nk
3. Permutaciones: Una permutacin es cualquier arreglo u ordenacin de todos o una parte de n elementos
Permutaciones de r elementos tomados de n elementos elegibles: P n! , r n Excel: permutaciones(n,r)
n r
n r!
4. Combinaciones: Una combinacin es un subconjunto de r objetos, tomado de un conjunto de n objetos elegibles. El orden de los

elementos carece de importancia. El nmero de combinaciones es: nCr n n! Excel: =combinat(n,r)
r
r! r!
n
Mtodos ms comunes para asignar probabilidades:
Probabilidad clsica o a priori Es la de los juegos de azar cuando todos N Ei Nmero de resultados asociados con E i
pE i
los resultados del experimento son N Nmero de resultados posibles
igualmente probables
Probabilidad emprica o de Se analiza como ha ocurrido el nE nmero de veces que ocurre el evento E i
pE i i

frecuencia relativa experimento en el pasado para calcular n Nmero de ensayos u observaciones



probabilidades
Probabilidad subjetiva o de Es una evaluacin personal de la probabilidad de que ocurra un evento
juicio

Axiomas de probabilidad:
1. 0 pEi 1 2.- pEi 1 3.- pE1 E2 pE1 pE2
Probabilidad marginal o simple.: Es una probabilidad sencilla; quiere decir que solo un evento puede llevarse a cabo, al margen de otros
eventos o clasificaciones.
# resultados favorables x
p A
# resultados posibles n
Ley Aditiva: Sean A y B dos eventos de S, la probabilidad de que ocurra A B:
cuando A y B son mutuamente excluyentes cuando A y B no son mutuamente excluyentes.
pA B pA pB pA B pA pB pA B

Ley Multiplicativa: A y B se presenten al mismo tiempo o en sucesin. Sean A y B dos eventos de S,


si A y B son independientes. si A y B no son independientes.
pA B pA pB pA B pA pB A

Probabilidad Condicional:, la probabilidad de que ocurrencia del evento B, si se sabe que ha ocurrido el evento A, se determina con relacin
al evento A que se sabe que ha ocurrido, y no en referencia al espacio muestral S:

Si A y B no son independientes pB A
p
A B Si A y B son independientes pB A pB
pA

Muy importante:, Si A y B son independientes, pA B pA pB



V. DISTRIBUCIONES DE PROBABILIDAD
Distribucin de probabilidad: describen como se espera que varen los resultados de un experimento, si este se llevara a cabo. La
distribucin de probabilidad de una variable aleatoria describe cmo se distribuyen las probabilidades de los diferentes valores de la variable
aleatoria.
Valor esperado, E x x f x
Var x 2 x f x
2
varianza:
DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
DISTRIBUCION BINOMIAL: Para describir situaciones en las que tenemos
n ensayos, cada uno de los cuales tiene dos resultados posibles,
xito o fracaso, y los resultados de los ensayos son independientes.

Probabilidad de x xitos: Parmetros: n p

px xitos n Cx p x q n x
Media aritmtica: Desviacin estndar:
p= probabilidad de xito en cada ensayo
x= nmero de xitos en los n ensayos n p n p 1 p
n-x = nmero de fracasos en los n ensayos
Excel: =distr.binom(x,#ensayos,prob_exito,acum)

DISTRIBUCION DE POISSON: para describir situaciones donde nos interesa el nmero de veces que ocurre un fenmeno durante un intervalo
dado o en una regin especfica se llaman experimentos de Poisson.
Probabilidad de x ocurrencias: Parmetro:

e
x Media aritmtica: Desviacin estndar

f x
x!
Excel: =poisson(x,media,acumulado)

APROXIMACIN DE POISSON A LA BINOMIAL: es adecuada cuando n20 , p0.05


Consiste en obtener la media a partir de los valor de n y p:

Probabilidad de X xitos en los n ensayos
poisson binomial np
x
enp
f x
n p x!
DISTRIBUCIN HIPERGEOMTRICA:
Probabilidad de x xitos:
f(x)=probabilidad de x xitos en n ensayos.
r Cx
N r Cnx poblacin
N=tamao
f x xitos r=# xitos en la poblacin

N Cn n=tamao de muestra
x= #xitos en la muestra.

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

DISTRIBUCION NORMAL:
Muy importante distribucin continua de probabilidad. Proporciona una base sobre la cual se fundamenta gran parte de la teora de
Estadstica Inferencial.
Para definir una poblacin distribuida normalmente, se necesitan solo 2 parmetros: y .
Distribucin normal estndar:

El rea total bajo la curva es 1.00, por lo cual las reas bajo la curva y dentro de dos lmites corresponden a
la probabilidad de que la variable tome valor dentro de sos lmites. La tabla muestra las reas bajo la
curva normal a la izquierda de un valor Z, donde (Z es la forma estandarizada o tipificada de la variable
aleatoria x).
Para obtener probabilidad dado el intervalo de valores de X Para obtener X dada la probabilidad.
x x Z
z
Calculamos Z para la X dada:
Donde Z est determinada por el rea o la
Mediante la tabla: obtener rea tabulada (area a la izquierda de Z) probabilidad conocida.
usamos el rea tabulada para detemrinar la probabilidad =distr.norm.estand.inv(probabilidad)
Excel =distr.norm.estand(Z)

APROXIMACIN DE LA DISTRIBUCIN NORMAL A LA BINOMIAL.


Es aceptable cuando n30 y p0.05, y tanto np5 como nq 5. Se realiza una correccin por continuidad, sumando o restando
0.5 al valor de la variable a estandarizar.
Media aritmtica: n p Desviacin estndar: n p 1 p
Con la media y la desviacin, obtenemos la probabilidad como en la distribucin normal.