You are on page 1of 9

Elaborado por CIRO MARTINEZ BENCARDINO

FORMULAS
APLICADAS EN LA
ESTADISTICA
DESCRIPTIVA
MEDIDAS DE POSICION O
DE TENDENCIA CENTRAL
Promedios
Media Aritmética:
n
x
x
i
Σ
·
n
n y
y
i i
Σ
·
i i
h y y Σ ·

(Datos sin agrupar) (Datos agrupados)
Propiedades de la Media
1) 0 ) ( · − Σ x x
i
y 0 ) ( · − Σ
i i
n y y 2)
[ ]
K M
K
·
3)
[ ]
x K M
KX
·
4) [ ]
K x M
K X
+ ·
+ y [ ]
K x M
K X
− ·
− 5)
.....
......
2 1
2 2 1 1
+ +
+ +
·
n n
n x n x
x
Mediana
Datos sin agrupar
a) Número impar, se toma el valor una vez ordenada de menor a mayor j e
x M ·
b) Número par, se toma el valor promedio de los valores centrales
2
1 j j
e
x x
M
+
·


Datos agrupados: variable discreta
a)
2
1 j j
e
y y
M
+
·

* Cuando
2
1
n
N
j
·

b) j e
y M ·
Cuando
2
1
n
N
j
<


Datos agrupados: Variable continua
a)
,
1 −
·
j e
y M
Cuando
2
1
n
N
j
·

b)
1
1
]
1

¸


+ ·


j
j
j e
n
N
n
c y M
1
,
1
2

2
1
n
N
j
<

Modo
Se debe tomar el valor de la variable que tenga la mayor frecuencia
j d
x M ·
(Datos sin agrupar) j d
y M ·
(Datos agrupados)
*NOTA Para las 4 fórmulas que aparece en el libro, cuando la amplitud (C) es
constante además, variable continua, la frecuencia absoluta de mayor valor se
simboliza por j
n
; el valor anterior en posición se simboliza por 1 − j
n
y el
inmediatamente superior en posición a j
n
, corresponderá a 1 + j
n
a)
1
1
]
1

¸

+
+ ·
+ −
+

1 1
1 ,
1
j j
j
j d
n n
n
c y M
b)
1
1
]
1

¸

− + −

+ ·
+ −


) ( ) (
1 1
1
,
1
j j j j
j j
j d
n n n n
n n
c y M
c)
1
1
]
1

¸

− −

+ ·
+ −
− +

) 2 ( 2
1 1
1 1 ,
1
j j j
j j
j d
n n n
n n
c y M
d)
1
1
]
1

¸

+ +

+ ·
− +
+ −

1 1
1 1
,
1
j j j
j j
j d
n n n
n n
c y M
Elaborado por CIRO MARTINEZ BENCARDINO
⇒Relaciones entre los anteriores promedios:

d e
M M M · ·
1

d e
M M M < <
1

d e
M M M > >
1

Centro Recorrido Cr
Datos sin agrupar:
2
mín máx
r
x x
C
+
· Datos agrupados, V Discreta:
2
1
y y
C
m
r
+
·
Datos agrupados, V. Continua:
2
,
0
,
y y
C
m
r
+
·
Media geométrica

n
i
x M Π ·
0
ó
n
x
M
i
log
log
0
Σ
· (En datos sin agrupar)

n
n
i
i
y M Π ·
0
ó
n
y n
M
i i
log
log
0
Σ
· (Datos agrupados)

log
0
anti M ·
del
0
log M
Media armónica
1
]
1

¸

Σ
·

i
x
n
M
1
1
(Sin agrupar)
1
]
1

¸

Σ
·

i
i
y
n
n
M
1
(Agrupados)
En problemas de velocidad, la fórmula a utilizar es:

i
i
T
m
V
S
S
V
Σ
·

·
T
S
Espacio total;
·
i
S
Espacio parcial;
·
i
V
V. parcial
Media Cuadrática
2
M
n
x
M
i
2
2
Σ
·
Datos sin agrupar
n
n y
M
i i
2
2
Σ
·
Datos agrupados
Media Cúbica
3
M
3
3
3
n
x
M
i
Σ
·
Datos sin agrupar
3
3
3
n
n y
M
i i
Σ
·
Datos agrupados
⇒Relaciones entre los anteriores promedios:

3 2 1 0
M M M M M
H
< < < <
Elaborado por CIRO MARTINEZ BENCARDINO
Cuartiles, Deciles y Percentiles
En datos sin agrupar, lo primero que se debe hacer, es determinar su posición dentro de
la variable.
Cuartiles Posición:
4
) 1 ( + n K
Deciles Posición:
10
) 1 ( + n K
Percentiles Posición:
100
) 1 ( + n K
K ⇔ Su valor depende de lo que se va a calcular
En datos agrupados, tanto para variable discreta o continua, también se requiere
determinar la posición donde se encuentra, luego se aplica las fórmulas dada para la
Mediana. Hay que tener en cuenta, una pequeña modificación en la siguiente fórmula

1
1
1
1
]
1

¸


+ ·


j
j
j K
n
N
kn
c y Q
1
,
1
4
CUARTILES *
1
1
1
1
]
1

¸


+ ·


j
j
j K
n
N
kn
c y D
1
,
1
10
DECILES
1
1
1
1
]
1

¸


+ ·


j
j
j K
n
N
kn
c y P
1
,
1
100
PERCENTILES
En cuanto a la determinación de la posición en donde de se localiza, se tendrá:
Cuartiles Posición:
4
) (n K
Deciles Posición:
10
) (n K
Percentiles Posición:
100
) (n K
K ⇔ Su valor depende de lo que se va a calcular
K ⇔ Toma los valores del 1 al 3 para Cuartiles; del 1 al 9 para Deciles y del 1 al 99
para Percentiles
MEDIDAS DE
DISPERSIÓN
Varianza
n
x x
s
i
2
2
) ( − Σ
· (Sin agrupar)
( )
n
n y y
s
i i
2
2
− Σ
· (Agrupados)

n
x n x
s
i
2 2
2
− Σ
· (Sin agrupar)
n
y n n y
s
i i
2 2
2
− Σ
· (Agrupados)

2
2
2
x
n
x
s
i

Σ
· (Sin agrupar)
2
2
2
y
n
n y
s
i i

Σ
· (Agrupados)
PROPIEDADES DE LA VARIANZA
1) [ ]
0 ·
K
V
2)
[ ]
2
x K x
S V ·
+
y
[ ]
2
x K x
S V ·

3)
[ ]
2 2
x Kx
S K V ·
4)
( ) ( )
.. .......... ..........
..........
........
......
2 1
2
2
2 1
2
1
2 1
2
2
2 1
2
1 2
+ +
+ − + −
+
+ +
+ +
·
n n
n x x n x x
n n
n s n s
s
Desviación típica o estándar


n
x x
s S
i
2
2
) ( − Σ
· ·
y
n
y y
s S
i
2
2
) ( − Σ
· ·
Coeficiente de variación
:
100
x
s
CV ·
(Sin agrupar)
100
y
s
CV ·
(Agrupados)
Puntaje Típico

s
x X
Z

·
(Sin agrupar)
s
y y
Z

·
(Agrupados)
Medidas de Asimetría
(1)
S
M M
A
d
s

·
1
(2)
S
M M
A
e
s
) ( 3
1

· * (3)
3
3
S
m
A
s
· Siendo
n
n y y
m
i i
3
4
) ( − Σ
·

d e
M M M < <
1
(Negativa)
d e
M M M > >
1
(Positiva)

d e
M M M · ·
1
(Simétrica)
Medidas de Apuntamiento

( )
2
2
4
S
m
A
p
·
Siendo *
n
n y y
m
i i
4
4
) ( − Σ
·

3 >
p
A
(Apuntada)
3 ·
p
A
(Normal)
3 <
p
A
(Achatada)
____________________________________
INFERENCIA ESTADISTICA
Distribución Binomial
Combinaciones:
( ) ! !
!
x x n
n
x
n

·

,
_

¸
¸
Ejemplo

,
_

¸
¸

·

,
_

¸
¸
4 10
10
4
10
Permutaciones:
! n P
n
·

( )!
!
x n
n
P
x n

·
Esperanza:
np E ·

np · µ
(Media) npq ·
2
σ (Varianza)
npq · σ

Probabilidad:
( )
x n x
x
q p
x
n
P

,
_

¸
¸
·
Distribución de Poisson:
( )
!
) (
x
e
P
x
x

·
λ

np · λ

71828 , 2 · e
Distribución Normal:
σ
µ −
·
x
Z
Tamaño Muestral

2 2 2
2 2
) 1 ( S Z E N
S NZ
n
+ −
·
o
1
2
2
2

+
,
_

¸
¸
·
N
S
Z
E
S
n

PQ Z E N
PQ NZ
n
2 2
2
) 1 ( + −
·
(Muestreo Aleatorio Simple (Variables) (Proporciones)

2 2 2
2 2
h h st
h h
S W Z NE
S W NZ
n
Σ +
Σ
·

h h h st
h h h
Q P W Z NE
Q P W NZ
n
Σ +
Σ
·
2 2
2
Muestreo Aleatorio Estratificado
Distribuciones Muestrales
Medias
n
x
Z
σ
µ −
·

n
s
x
Z
µ −
·
Sí 30 > n

1
ˆ


·
n
s
x
t
µ
o
n
s
x
t
µ −
·
Sí 30 ≤ n
( )
1
1
ˆ
2

− Σ
·

·
n
x x
n
n
s s
Proporciones
n
pq
P p
Z

·
Sí 30 > n
1 −

·
n
pq
P p
t
Sí 30 ≤ n
Diferencias entre dos medias

( ) ( )
2
2
1
2
n n
y x
Z
y
x
y x
σ
σ
µ µ
+
− − −
·

( ) ( )
2
2
1
2
n
S
n
S
y x
Z
y
x
y x
+
− − −
·
µ µ
Cuando
1
n
y
30
2
> n
( ) ( )
( ) ( )
2 1 2 1
2
2
2
1
1 1
2
ˆ
1
ˆ
1
n n n n
S n S n
y x
t
y x
y x
+
− +
− + −
− − −
·
µ µ

( ) ( )
2
2
1
2
n
S
n
S
y x
t
y x
+
− − −
·
µ µ
2
ˆ
x
S y
2
ˆ
y
S
Sin corregir
( ) ( )
2
2 1
2 2
2
− +
− Σ + − Σ
·
n n
y y x x
S
i i
Corregida
Diferencias entre dos proporciones

( ) ( )
2
2 2
1
1 1
2 1 2 1
n
q p
n
q p
P P p p
Z
+
− − −
·

( ) ( )
1 1
2
2 2
1
1 1
2 1 2 1

+

− − −
·
n
q p
n
q p
P P p p
t

(Muestras grandes) (Muestras pequeñas)
Limites de Confianza
n
s
Z x
i
s
t · µ
ˆ
1
ˆ


t ·
N
n N
n
s
Z x
i
s
µ

n
pq
Z p P
i
s
t ·
ˆ
1
ˆ

t ·
n
pq
t p P
i
s
Sí 30 ≤ n ( )
2
2
1
2
ˆ
n
S
n
S
Z y x
y
x
y x
+ t − ·

µ Sí
1
n
y
30
2
> n
( )
( ) ( )
2 1 2 1
2
2
2
1
1 1
2
ˆ
2
ˆ
1
ˆ
n n n n
S n S n
t y x
y x
y x
+
− +
− + −
t − ·

µ
2
2
1
2
ˆ
) ( ˆ
n
s
n
s
t y x
y x
+ t − ·

µ
2
2 2
1
1 1
2 1 2 1
) ( ˆ
n
q p
n
q p
Z p p
p p
+ t − ·

µ

1 1
) ( ˆ
2
2 2
1
1 1
2 1 2 1

+

t − ·

n
q p
n
q p
t p p
p p
µ
Prueba de hipótesis
)
valor H · µ :
0
1)
valor H · µ :
0
1)
valor H · µ :
0


valor H ≠ µ :
1

valor H < µ :
1

valor H > µ :
1
(Bilateral) (Unilateral izquierda) (Unilateral a la derecha)

Este planteamiento es parecido para proporciones y diferencias
2)
05 , 0 · α
por ejemplo 3) Z o t para medias, proporciones y diferencias.
Series de tiempo o cronológicas
Ajuste Rectilíneo c bx Y + ·
ˆ

0 1
ˆ
β β + · X Y
A BX Y + ·
ˆ
Cálculo de b y c
Sistema de ecuaciones
nc x b y
i i
+ Σ · Σ


i i i i
x c x b x y Σ + Σ · Σ
2
Cálculo abreviado
( )
( )
2
2
i i
i i i i
x x n
y x y x n
b
Σ − Σ
Σ Σ − Σ
·

n
x b y
c
i i
Σ − Σ
·
Varianza Residual
( )
n
Y y
s
i i
yx
2
2
ˆ
− Σ
·

n
x y b y c y
s
i i i i
yx
Σ + Σ − Σ
·
2
2
Error estándar
2
yx
s s ·
Límites
n
s
t y Y
yx
i
s
t ·
ˆ
ˆ
Coeficiente de correlación
( )
( ) [ ] ( ) [ ]
2 2 2 2
i i i i
i i i i
y y n x x n
y x y x n
r
Σ − Σ Σ − Σ
Σ Σ − Σ
·
1 1 ≤ ≤ − r

2
R r ·

2
2
2
1
x
yx
s
s
R − · 1 0
2
≤ ≤ R
Ajuste Parabólico c bx ax Y + + ·
2
ˆ

2 2 1 1 0
ˆ
x x Y β β β + + ·
Sistema de Ecuaciones
nc x b x a y
i i i
+ Σ + Σ · Σ
2

i i i i i
x c x b x a x y Σ + Σ + Σ · Σ
2 3

2 3 4 2
i i i i i
x c x b x a x y Σ + Σ + Σ · Σ
Cálculo de los coeficientes abreviado, con cambio de origen:
Coeficientes
2
i
i i
x
y x
b
Σ
Σ
·

( )
( )
2
2 4
2 2
i i
i i i i
x x n
y x y x n
a
Σ − Σ
Σ Σ − Σ
·

n
x a y
c
i i
2
Σ − Σ
·
Varianza residual:
n
x y a x y b y c y
s
i i i i i i
yx
2 2
2
Σ − Σ − Σ − Σ
·
2
yx yx
s s ·
Coeficiente de correlación al cuadrado
2
2
2
1
x
yx
s
s
R − ·
Limites de confianza
n
s
t y Y
yx
i
s
t ·
ˆ
ˆ

Ajuste exponencial
x
cb Y ·
ˆ
o también
b x c y log log log + ·
Sistema de ecuaciones: 1)
i i
x b c n y Σ + · Σ log log log
2)
2
log log log
i i i i
x b x c y x Σ + Σ · Σ
Cálculos abreviados
· b log
2
log
i
i i
x
y x
Σ
Σ

n
x b y
c
i i
Σ − Σ
·
log
log
Varianza residual
n
y x b y c y
s
i i i i
y x
log log log log log
2
2
log
Σ + Σ − Σ
·
2
log
2
log
y x yx
S anti s ·

2
yx yx
s s ·

2
2
2
1
x
yx
s
s
R − ·
2
yx yx
s s ·
Límites de confianza
n
s
t y Y
yx
i
s
t ·
ˆ
ˆ
Coeficiente de correlación
( )
( ) [ ] ( ) [ ]
2 2 2 2
log log
log log
i i i i
i i i i
y y n x x n
y x y x n
r
Σ − Σ Σ − Σ
Σ Σ − Σ
·

Regresión y correlación
Los procedimientos para estimar el valor de Y
ˆ
mediante un ajuste Rectilíneo,
Parabólico o exponecial, son exactamente igual a los presentados en las Series
cronológicas, pero al estimar a X
ˆ
se cambia de posición las variables, pero el
procedimiento más empleado, consiste en intercambiar los valores de las columnas,
manteniendo el encabezamiento de X y Y
Cálculos abreviados en la Recta
2
x
xy
yx
s
m
b ·

2
y
xy
xy
s
m
b ·

( ) ( )
( )
2
x x
y y x x
b
i
i i
yx
− Σ
− − Σ
·


( ) ( )
( )
2
y y
y y x x
b
i
i i
xy
− Σ
− − Σ
·

Covarianza y x
n
y x
m
i i
xy

Σ
· o
( ) ( )
n
y y x x
Cov m
i i
xy
− − Σ
· ·
( )
( )
2
2
i i
i i i i
yx
x x n
y x y x n
b
Σ − Σ
Σ Σ − Σ
·

( )
( )
2
2
i i
i i i i
xy
y y n
y x y x n
b
Σ − Σ
Σ Σ − Σ
·

n
x b y
c
i yx i
yx
Σ − Σ
·
n
y b x
c
i xy i
xy
Σ − Σ
· yx yx
c x b Y + ·
ˆ
xy xy
c y b X + ·
ˆ

y x x b Y
i yx
+ − · ) (
ˆ
x y y b X
xy
+ − · ) (
ˆ

( )
n
Y y
s
i i
yx
2
2
ˆ
− Σ
·

( )
n
X x
s
i i
xy
2
2
ˆ
− Σ
·

n
x y b y c y
s
i i yx i yx i
yx
Σ + Σ − Σ
·
2
2

n
x y b x c x
s
i i xy i xy i
xy
Σ + Σ − Σ
·
2
2

2
2
2 2
x
xy
y yx
s
m
s s − ·
2
2
2 2
y
xy
x xy
s
m
s s − ·

2
2
2
1
y
yx
s
s
R − ·

2
2
2
1
x
xy
s
s
R − ·
2 2
2
2
y x
xy
s s
m
R ·

y x
xy
s s
m
r ·
n
s
t y Y
yx
i
s
t ·
ˆ
ˆ

n
s
t x X
xy
i
s
t ·
ˆ
ˆ

xy yx
b b R ·
2

) 1 (
2 2 2
r s s
y yx
− ·
Pruebas del coeficiente de correlación
1)
0
0 :
1
0
≠ ·
·
ρ
ρ
H
H
2)
05 , 0 · α
3)
2
1
2


·
n
r
r
t
Pruebas del Coeficiente de regresión

1)
0
0 :
1 1
1 0
≠ ·
·
β
β
H
H
2)
05 , 0 · α
3)
1
1 1
b
S
b
t
β −
·
Siendo
2
1
) (
1
x x
s S
i
yx b
− Σ
·

2
1
) (
1
y y
s S
i
xyx b
− Σ
·
Las demás fórmulas que se pueden aplicar en la regresión se encuentra en los textos
estadísticos o el profesor los anexa en su clase.