You are on page 1of 51

ESTADÍSTICA

DESCRIPTIVA
Cr. Jorge de Souza Martinez
crjdesouzamartinez@gmail.com
097351538
DISTRIBUCIONES
BIDIMENSIONALES
Relación funcional
Dos variables x e y están relacionadas
funcionalmente cuando conocida la
primera se puede saber con exactitud el
valor de la segunda.
Por ejemplo
Si se deja caer una piedra, existe una
fórmula que nos permite calcular
exactamente, la altura a la que se
encuentra en función del tiempo
transcurrido.
h = ½ g t².
Relación estadística

Dos variables x e y están relacionadas


estadísticamente cuando conocida la
primera se puede estimar aproximadamente
el valor de la segunda.
Por ejemplo

Ingresos y gastos de una familia.

Producción y ventas de una fábrica.

Gastos en publicidad y beneficios de una


empresa.
Variable estadística bidimensional
Una variable bidimensional es una variable en la
que cada individuo está definido por un par de
caracteres, (X, Y).

Estos dos caracteres son a su vez variables


estadísticas en las que sí existe relación entre ellas,
una de las dos variables es la variable independiente y
la otra variable dependiente.
Distribuciones bidimensionales
Son aquellas en las que a cada individuo le
corresponden los valores de dos variables, las
representamos por el par (xi, yi).
diagrama de dispersión

Si representamos cada par de valores como las


coordenadas de un punto, el conjunto de todos ellos se
llama nube de puntos o diagrama de dispersión.
recta de regresión.

Sobre la nube de puntos puede trazarse una recta que


se ajuste a ellos lo mejor posible, llamada RECTA DE
REGRESIÓN 
Covarianza
La covarianza de una variable bidimensional es la
media aritmética de los productos de las desviaciones
de cada una de las variables respecto a sus medias
respectivas.

La covarianza se representa por σxy.


La covarianza indica el sentido de la
correlación entre las variables

Si σxy > 0 la correlación es directa.

Si σxy < 0 la correlación es inversa.


Correlación
La correlación trata de establecer la relación o
dependencia que existe entre las dos variables que
intervienen en una distribución bidimensional.

Es decir, determinar si los cambios en una de las


variables influyen en los cambios de la otra. En caso de
que suceda, diremos que las variables están
correlacionadas o que hay correlación entre ellas.
Tipos de correlación
1º Correlación directa
La correlación directa se da cuando al aumentar una
de las variables la otra aumenta.
La recta correspondiente a la nube de puntos de la
distribución es una recta creciente.
2º Correlación inversa
La correlación inversa se da cuando al aumentar una
de las variables la otra disminuye.

La recta correspondiente a la nube de puntos de la


distribución es una recta decreciente.
3º Correlación nula
La correlación nula se da cuando no hay dependencia
de ningún tipo entre las variables

En este caso se dice que las variables son incorreladas y


la nube de puntos tiene una forma redondeada.
Grado de correlación
El grado de correlación indica la proximidad que hay
entre los puntos de la nube de puntos. Se pueden dar
tres tipos:
Grado de Correlación
1. Correlación fuerte
La correlación será fuerte cuanto más cerca estén los
puntos de la recta.

2. Correlación débil
La correlación será débil cuanto más separados estén
los puntos de la recta.

3. Correlación nula
Coeficiente de correlación lineal
El coeficiente de correlación lineal es el cociente
entre la covarianza y el producto de las desviaciones
típicas de ambas variables.

El coeficiente de correlación lineal se expresa


mediante la letra r.

r= σxy/ σx. σy.


Propiedades
1. El coeficiente de
correlación no varía al hacerlo
la escala de medición.

Es decir, si expresamos la altura en metros o en


centímetros el coeficiente de correlación no varía.
2. El signo del coeficiente de
correlación es el mismo que el
de la covarianza.

Si la covarianza es positiva, la correlación es directa.


Si la covarianza es negativa, la correlación es inversa.
Si la covarianza es nula, no existe correlación.
3. El coeficiente de correlación
lineal es un número real
comprendido entre −1 y 1.

−1 ≤ r ≤ 1
4. Si el coeficiente de correlación
lineal toma valores cercanos a −1
la correlación es fuerte e inversa, y será tanto más
fuerte cuanto más se aproxime r a −1.
5. Si el coeficiente de correlación
lineal toma valores cercanos a 1
 la correlación es fuerte y directa, y será tanto más
fuerte cuanto más se aproxime r a 1
6. Si el coeficiente de
correlación lineal toma valores
cercanos a 0,
la correlación es débil.
7. Si r = 1 ó −1,
Los puntos de la nube están sobre la recta creciente o
decreciente.

Entre ambas variables hay dependencia funcional.


Recta de regresión
La recta de regresión es la que mejor se ajusta a
la nube de puntos.

La recta de regresión pasa por el


punto  llamado centro de gravedad.
DISTRIBUCIONES DE FRECUENCIAS
Se disponen las frecuencias en una tabla de doble
entrada donde las xi y la yj están ordenadas en forma
creciente. Recibe el nombre de tabla de frecuencias o
tabla de correlación.

Si hay pares que se repiten se agrupan siendo nij la


frecuencia absoluta del par (xi, yj).
TABLA DE FRECUENCIAS
X x1 x2 ....... xk Frec. absolutas
Y marginales de Y
y1 n11 n21 ..... nk1 n’1

y2 n12 n22 ...... nk2 n’2

...... ..... .... .... ... ....


.
yr n1r n2r ... nkr n’r

Frec. absolutas n1 n2 .. nk nij = N


marginales de X ij
FRECUENCIAS
Las sumas
 
nij = ni , frecuencia absoluta de xi.
j
nij = n’j , frecuencia absoluta de yj
 i
se llaman frecuencias absolutas marginales de las
variables X e Y respectivamente
TOTAL DE PARES

nij = N=número total de pares.


distribuciones unidimensionales
según se consideren las filas o las columnas de la tabla
en estudio.

Las distribuciones unidimensionales del total de los


individuos de la población, respecto a cada una de las
características reciben el nombre de distribuciones
marginales.
Distribución marginal de la Y
Y Frec. absolutas marginal de Y
 

y1 n’1
y2 n’2
. .
.
.
yr n’r
 
Distribución marginal de la Y
  Frec. absolutas condicionadas por
Y x2

2 0
3 2
4 1
5 2
distribución marginal de la variable X

X Frec. absolutas marginal


deX

1 3
2 5
3 2
distribución marginal de la variable X

  Frec. absolutas condicionadas


X por yj
 

x1 n1j
x2 n2j
. .
. .
xk nkj
 
Los pares de valores observados (xi , yj)
se pueden repesentar en unos ejes
coordenados,.
y
 
 
( xi , yj )
 
 

Ejemplo
X 1 2 1 2 3 2 2 2 3 1

Y 3 5 2 3 5 4 3 5 5 3

Dada la distribución bidimensional:


la tabla correspondiente es
X 1 2 3 Frec. absolutas
Y     marginales de y

2 1     1
3 2 2   4
4   1   1
5   2 2 4
Frec. absolutas 3 5 2 N=10
marginales de X
MEDIA Y VARIANZA
MEDIA MARGINAL DE X

MEDIA MARGINAL DE X 1,9

SUMATORIA
X1=1 n1=3 1X3 3
X2=2 n2=5 2X5 10
X3=3 n3=2 3X2 6
19
MEDIA MARGINAL DE Y
MEDIA MARGINAL DE Y 3,8

SUMATORIA
Y1=2 n1=1 2x1 2
Y2=3 n2=4 3x4 12
Y3=4 n3=1 4
Y4=5 n4=4 20
38
CENTRO DE GRAVEDAD
Es el punto formado por las coordenadas
correspondientes a las medias marginales de X e Y
respectivamente
Centro de gravedad del ejemplo

MEDIA MARGINAL DE X 1,9 CENTRO DE GRAVEDAD


(1,9 ; 3,8)
MEDIA MARGINAL DE Y 3,8
FORMULA COVARIANZA
Cálculo de la Covarianza
Xi Yi nij
X1.Y1.n11 1 2 1 2
X1.Y2.n12 1 3 2 6
X2.Y2.n22 2 3 2 12
X2.Y3.n23 2 4 1 8
X2.Y4.n24 2 5 2 20
X3.Y4.n34 3 5 2 30

78

MEDIA MARG X 1,9


MEDIA MARG Y 3,8 COVARIANZA 0,58
RECTA DE REGRESIÓN
Es la recta que mejor se ajusta a la nube de puntos
Fórmula
Cálculo

recta de regresión de Y sobre X y – 3,8 = 1,18 (x- 1,9)

recta de regresión de X sobre Y x – 1,9 = 0,5 ( y – 3,8 )

You might also like