You are on page 1of 16

CONCEPTOS BÁSICOS DE MUESTREO

Población, Muestra y Muestreo.

Al conjunto de elementos sobre los que se toma información en una investigación se le llama
población.
Cuando el investigador toma información de todos y cada uno de los elementos de la población
se realiza un censo. Sin embargo, esto no siempre es posible, ya sea por el costo, o bien porque la toma
de información requiere la destrucción de los elementos de la población, o que la población tenga
infinitos elementos, o por otras razones.

Este problema lleva al investigador a tomar información sólo de una parte de la población,
proceso que recibe el nombre de muestreo.
Al conjunto de los elementos de los que se toma la información se llama muestra y al número
de elementos que componen la muestra tamaña de la muestra.

Se entiende por muestra a un subconjunto lo más representativo posible de una población.

El estudio de la población requiere un cuidadoso proceso de muestreo, a efectos de elaborar la


muestra en las condiciones más adecuadas de representatividad, puesto que la inferencia se caracteriza
por aplicar a la población las conclusiones obtenidas de la muestra.
Así, el método de la selección de la muestra es importante, dado que dependiendo de cómo se
constituya la muestra se obtendrá unos u otros resultados.

Para medir el grado de representatividad de la muestra es necesario utilizar el muestreo


probabilístico. Un muestreo es probabilístico cuando se puede establecer la probabilidad de obtener cada
una de las muestras.

Se denomina inferencia estadística a la metodología consistente en inferir resultados,


predicciones y generalizaciones sobre la población estadística, basándose en la información contenida
en las muestras representativas previamente elegidas por métodos formales de muestreo.

Se pueden definir los métodos de muestreo como el conjunto de técnicas estadísticas que
estudian la forma de seleccionar una muestra suficientemente representativa de una población cuya
información permita inferir las propiedades o características de toda la población cometiendo un error
medible.

Con la muestra seleccionada mediante un determinado método de muestreo, se estiman las


características poblacionales con un error cuantificable y controlable. Las estimaciones se realizan a
través de funciones matemáticas de la muestra (estadísticas) denominados estimadores. Los errores se
cuantifican mediante varianzas, desviaciones típicas o errores cuadráticos medios de los estimadores.

POBLACIÓN, MARCO Y MUESTRA

Es importante para el investigador definir cuidadosa y completamente la población antes de


recolectar la muestra. Inicialmente una población es una colección de elementos acerca de los cuales
deseamos hacer alguna inferencia. Esta población inicial que se desea investigar se denomina población
objetivo.
El muestreo de toda la población objetivo no siempre posible. Existen problemas que van a
impedir obtener información de algunos de sus elementos. Entre estos problemas se pueden destacar las
negativas a colaborar, las ausencias, la inaccesibilidad de algunos elementos o los errores en los
instrumentos de medida de la característica que se estudia en los elementos de la población. Por lo tanto
la población objetivo se ve restringida a la hora de obtener información de sus elementos, dando lugar
al concepto de población investigada, que es la población que realmente es objeto de estudio.

Una unidad de muestreo puede ser un simple elemento de la población, en este caso estamos ante
una unidad elemental de muestreo. Pero también pueden considerarse unidades de muestreo que sean
grupos no solapados de elementos de la población que cubren la población completa, en este caso
estamos ante una unidad de muestreo compuesta de varias unidades elementales, también denominada
unidad primaria.

Para seleccionar el conjunto de unidades de muestreo que componen la muestra, será necesario
disponer de un listado de unidades de muestreo. Esta relación de unidades de muestreo, de la que se
selecciona la muestra, se denomina marco.

CONVENIENCIAS Y LIMITACIONES DEL MUESTREO

Conveniencias del muestreo.

El Objetivo óptimo del muestreo, es el de conseguir la máxima información con recursos


prefijados o bien obtener determinada información con mínimos recursos, existen criterios generales
para el uso de las técnicas de muestreo:
• Se emplea el muestreo cuando la población sea tan grande que el censo excede las
posibilidades del investigador.
• Se toma muestra cuando la población es lo suficientemente uniforme como para que
cualquier muestra sea representativa de la misma.
• Se utiliza muestra cuando el proceso de medida o investigación de los caracteres de cada
elemento sea destructivo.
• Se utiliza el muestreo cuando se observa el desagrado de las personas de las que se
requiere información.
• Se utiliza técnicas de muestreo cuando ello supone reducción de costes. Criterio de
economía.
• El muestreo es conveniente cuando se requiere exactitud. Criterio de calidad.
• El muestreo es conveniente cuando la formación del personal y la intensidad de los
controles supervisión son altos.

Limitaciones del muestreo


• Cuando se requiere información de cada uno de los elementos de la población.
• Cuando sea difícil superar la dificultad que supone el empleo de un instrumento delicado
y complejo como la teoría de muestreo.
• El muestreo exige menos trabajo material que una investigación exhaustiva, pero más
refinamiento y preparación, lo que puede suponer en muchos casos una limitación a su
utilización..
• Cuando el costo por unidad, que es mayor en las encuestas que en los censos, aconseje
desestimar los métodos de muestreo.

DISTRIBUCIONES EN EL MUESTREO Y PROPIEDADES


Número de muestras aleatorias de tamaño n que se pueden extraer de una población de tamaño N.

i) Sin repetición y cuando no interesa el orden de sus elementos(Número de


combinaciones simples)
N!
C nN =
n!( N − n)!
ii) Sin repetición e interesa el orden de sus elementos(Número de variaciones simples)
N!
𝑽𝑵𝒏=
( N − n )!
iii) Con repetición e interesa el orden de sus elementos(Número de variaciones con
repetición)
𝑵
𝑽𝑹𝒏 = N n
iv) Con repetición y cuando no interesa el orden de sus elementos(Número de
combinaciones con repetición)
( N + n − 1)!
𝑪𝑹𝑵𝒏 = Cn
N + n −1
=
n!( N − 1)!

ESPACIO MUESTRAL, PARÁMETRO Y ESTIMADOR

o Al espacio muestral se le denota con S (y).


o Espacio muestral, es el conjunto de muestras posibles de tamaño n que se pueden seleccionar
de una población de tamaño N.
o Representamos al conjunto de las N unidades que constituyen la población finita objeto de
estudio mediante U = {U1, U2, . . . , UN}
o Sea Y una variable cuantitativa
o A cada unidad de la población hacemos corresponder el valor de la variable Y(cuantitativa o
cualitativa), teniendo los siguientes valores { Y1, Y2, …, YN},
o A una función  de los N valores de Y, tal como  =  ( Y1, Y2, …, YN}, se le denomina
parámetro poblacional.
o Los parámetros son denotados con letras griegas
o Los parámetros poblacionales son denotados con letras griegas.
o N unidades que constituyen la población finita objeto de estudio
n unidades que constituyen la muestra
o Los principales parámetros asociados a variables cuantitativas son:
N
 =  Yi Total poblacional
i =1
N

 Y i
= = i =1
Media poblacional
N N

 (Y i − )2
2 = i =1
Varianza poblacional
N

σ = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 Desviación estándar poblacional

o Parámetros asociados a variables cualitativas


Una variable cualitativa Y toma el valor
1 cuando la unidad pertenece a la clase de interés
0 cuando no pertenece a la clase de interés

o Los principales parámetros asociados a variables cualitativas son:

N
A= Y
i =!
i Total poblacional para variable cualitativa

(Número de unidades que pertenecen a la clase de interés en la población)


N

Y
A i =1 i
p= = Proporción poblacional
N N
(Proporción de unidades que pertenecen a la clase de interés en la
población).

o Representamos al conjunto de las n unidades que constituyen la muestra, mediante


U = {U1, U2, . . . , Un}

o Los valores de la variable Y asociados a las unidades de la muestra son {Y 1, Y2, …,Yn},
 
o A la función  =  (Y1 , Y2 ,..., Yn ) , que es una estadística, se le denomina estimador del
parámetro 

o Se utiliza  para estimar  .
o Las Estadísticas muy utilizadas a variables cuantitativas son:

Y
i =1
i Total de la muestra;
n

Y i
Y= i =1
Media de la muestra. Estimador de 
n

 (Y i − Y )2
S2 = i =1
Varianza de la muestra. Estimador de  2
n −1

S = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 Desviación estándar muestral Estimador de σ

o Las Estadísticas muy utilizadas a variables cualitativas son:

n
a= Yi =1
i Total de la muestra.
n

Y
i =1
i
𝑎
𝑝̂ = = proporción de la muestra. Estimador de p
𝑛 𝑛

Los estimadores son variables aleatorias, tienen tantos valores como muestras tenga su espacio
muestral.

Ejemplo. Sea Y: El tiempo de servicio de los funcionarios de una empresa


Si los valores de Y asociados a las unidades de la población U = {U 1, U2, . . . , UN} son {5, 2, 8, 3}
1. Los parámetros son:
 = 5 + 2 + 8 + 3 = 18

 18
= = = 4.5
N 4

(5 − 4.5) 2 + (2 − 4.5) 2 + (8 − 4.5) 2 + (3 − 4.5) 2


2 = = 5.25
4
Supongamos una clase de interés en la población:
Clase de interés: Ingreso menor de 6 miles de soles

Ingreso mensual 5, 2, 8, 3
Y : Ingreso menor de 6 1 1 0 1

A = ∑4𝑖=! 𝑌𝑖 = 1+1+0+1 = 3 (Número poblacional de funcionarios con ingreso mensual


menor de 6 mil soles)

𝐴 ∑4𝑖=1 𝑌𝑖
p=𝑁= Proporción poblacional
𝑁
(Proporción de unidades que pertenecen a la clase de interés en la
población).
𝐴 3
p = 𝑁 = 4 = 0.75 (Proporción poblacional de funcionarios con ingreso mensual menor de 6
mil soles).

2. El espacio muestral S (y) en Muestreo sin reposición y sin que interese el orden

✓ El espacio muestral, para muestras de tamaño 2


✓ Al escoger sin reposición y sin que interese el orden de los elementos se tiene C 24 = 6 muestras
posibles:
✓ Muestras posibles:

{5 , 2}, {5 , 8}, {5 , 3}, {2 , 8}, {2 , 3}, {8 , 3}.

✓ La estadística Y es la media de la muestra, los valores en las muestras posibles son,


respectivamente:

3.5, 6.5, 4, 5, 2.5 5.5

✓ La estadística S2 es la varianza de la muestra, los valores en las muestras posibles son,


respectivamente:

4.5, 4.5, 2, 18, 0.5, 12.5.

✓ ¿Cuál es la diferencia ente μ y Y ?

μ Es valor fijo Y Es variable aleatoria

Y es estimador de μ

¿Cuál es la diferencia ente  2 y S2 ?

2 Es valor fijo S2 Es variable aleatoria

S2 es estimador de  2

✓ Clase de interés: Ingreso menor de 6


𝑎
𝑝̂ = 𝑛 Proporción muestral

(Proporción de unidades que pertenecen a la clase de interés en la muestra).

{5 , 2}, {5 , 8}, {5 , 3}, {2 , 8}, {2 , 3}, {8 , 3}.

La estadística 𝑝̂ es la proporción de la muestra, los valores en las muestras posibles son,


respectivamente:

1, 0.5 , 1 , 0.5, 1 0.5

¿Cuál es la diferencia ente p y 𝑝̂ ?

p Es valor fijo 𝑝̂ Es variable aleatoria

p es estimador de 𝑝̂

3. Cuál es el espacio muestral cuando se forman muestras de tamaño 2 con repetición e interesa el
orden de sus elementos?

Espacio muestral S (y) en Muestreo con repetición e interesa el orden

✓ El espacio muestral, para muestras de tamaño 2


✓ Al escoger con reposición e interesa el orden de los elementos se tiene 𝑉𝑅24 = 𝟒𝟐 =16 muestras
posibles
✓ Muestras posibles:
5, 5 5, 2 5, 8 5, 3
2, 5 2, 2 2, 8 2, 3
8, 5 8, 2 8, 8 8, 3
3, 5 3, 2 3, 8 3, 3

✓ La estadística Y es la media de la muestra, los valores en las muestras posibles son,


respectivamente:
Medias muestrales
5 3.5 6.5 4
3.5 2 5 2.5
6.5 5 8 5.5
4 2.5 5.5 3

∑𝑛
𝑖=1(𝑌𝑖 −𝑌)
2
✓ La estadística S2 es la varianza de la muestra S2 = 𝑛−1

∑𝑛 (𝑌 −𝑌)2
Si consideramos a las estadísticas Y y S2 = 𝑖=1𝑛−1𝑖
como estimadores de  y  2
respectivamente , los valores de los estimadores son, respectivamente:

Medias muestrales Y varianzas muestrales S2


5 2 3.5 5 0 0 4.5 18
3.5 5 6.5 2.5 4.5 18 4.5 0.5
6.5 2.5 4 5.5 4.5 0.5 2 12.5
4 5.5 8 3 2 12.5 0 0
∧ ∑𝑛
𝑖=1(𝑌𝑖 −𝑌)
2
Si consideramos 𝜎 2 = como estimador  2 , los valores del estimador son, respectivamente:
𝑛

0 0 2.25 9
2.25 9 2.25 0.25
2.25 0.25 1 6.25
1 6.25 0 0


𝜎 2 Estimador de  2

Y , S2 y 𝜎 2 son variables aleatorias, como tales tienen su función de probabilidad. Si cada muestra
tiene igual probabilidad de ser elegida, la función de probabilidad de cada estimador se obtiene así:

o Obtención de la Distribución de probabilidad de la media muestral


Dadas la medias muestrales posibles

Medias muestrales
5 3.5 6.5 4
3.5 2 5 2.5
6.5 5 8 5.5
4 2.5 5.5 3

Se tiene :
Distribución de probabilidad de la media muestral

y 2 2.5 3 3.5 4 5 5.5 6.5 8


P( y ) 1/16 2/16 1/16 2/16 2/16 3/16 2/16 2/16 1/16

o Obtención de la Distribución de probabilidad de la varianza muestral S 2


Dadas las varianzas muestrales posibles

varianzas muestrales S2
0 0 4.5 18
4.5 18 4.5 0.5
4.5 0.5 2 12.5
2 12.5 0 0
Se tiene :
Distribución de probabilidad de la varianza muestral S2
S2 0 0.5 2 4.5 12.5 18
2
P(S ) 4/16 2/16 2/16 4/16 2/16 2/16

o Obtención de la Distribución de probabilidad de la varianza muestral 𝜎 2

Dados los siguientes valores de varianzas muestrales 𝝈𝟐
0 2.25 2.25 1
2.25 0 9 0.25
2.25 9 0 6.25
1 0.25 6.25 0
Se tiene :
Distribución de probabilidad de la varianza muestral

𝝈𝟐 0 0.25 1 2.25 6.25 9

P(𝝈𝟐 ) 4/16 2/16 2/16 4/16 2/16 2/16

• Graficar la función de probabilidad de la media muestral


• Graficar la función de probabilidad de la varianza muestral
• Calcule:
E( Y ) valor esperado de la media muestral (media de las medias muestrales)

V( Y ) varianza de la media muestral

E(𝑆 2 ) valor esperado de la varianza muestral (media de las varianzas muestrales)

V(𝑆 2 ) varianza de la varianza muestral



E(𝜎 2 ) valor esperado de la varianza muestral (media de las varianzas muestrales)

V(𝜎 2 ) varianza de la varianza muestral

✓ Clase de interés: Ingreso menor de 6


𝑎
𝑝̂ = 𝑛 Proporción muestral

(Proporción de unidades que pertenecen a la clase de interés en la muestra).

5, 5 5, 2 5, 8 5, 3
2, 5 2, 2 2, 8 2, 3
8, 5 8, 2 8, 8 8, 3
3, 5 3, 2 3, 8 3, 3

La estadística 𝑝̂ es la proporción de la muestra, los valores en las muestras posibles son,


respectivamente:
proporciones muestrales
1 1 0.5 1
1 1 0.5 1
0.5 0.5 0 0.5
1 1 0.5 1

Distribución de probabilidad de la proporción muestral


𝑝̂ 0 0. 5 1
P(𝑝̂ 1/16 6/16 9/16

• Graficar la función de probabilidad de la proporción muestral


• Calcule:
E( 𝑝̂ ) valor esperado de la media muestral (media de las medias muestrales)

V(𝑝̂ ) varianza de la media muestral


Cuadro de muestras posible y cálculo de algunos estimadores importantes
𝑌̅ Estimador de 𝜎 2
𝜎̂ 2
muestras posibles Media muestral Varianza muestral S2
5 5 5 0 0
5 2 3.5 4.5 2.25
5 8 6.5 4.5 2.25
5 3 4 2 1
2 2 2 0 0
2 8 5 18 9
2 3 2.5 0.5 0.25
8 3 5.5 12.5 6.25
2 5 3.5 4.5 2.25
8 5 6.5 4.5 2.25
3 5 4 2 1
8 8 8 0 0
8 2 5 18 9
3 2 2.5 0.5 0.25
3 8 5.5 12.5 6.25
3 3 3 0 0

Pre requisito: VALOR ESPERADO y VARIANZA DE UNA VARIABLE ALEATORIA Y

• El Valor esperado de Y se denota E(Y) y se define como

E(Y) = ∑∀𝑦 𝑌 𝑝(𝑌)

• La varianza de Y se denota V( Y) y se define como

2
V(Y) = E [𝑌 − 𝐸(𝑌)] = ∑∀𝑦(𝑌 − 𝐸(𝑌))2 𝑝(𝑌)

• A la desviación estándar de Y, denotado por 𝜎(𝑌), se le denomina error estándar de la variable


Y se expresa:
𝜎(𝑌) = + √𝑉(𝑌)

• Coeficiente de variación, es el error relativo de muestreo del estimador Y, y es la razón de su


error estándar y su valor esperado.

𝜎(𝑌)
CV(𝒀)) =
𝐸(𝑌)

✓ Valor Esperado, Varianza y Error Cuadrático Medio de un estimador


Como un estimador es una variable aleatoria posee características de tendencia central, de
dispersión y de forma.


Valor esperado de 
  
Si  es un estimador de  , el valor esperado de  se denota E(  ) y se define como
  
E(  ) =   P( )



Varianza de 
 
La varianza de  se denota V(  ) y se define como
     
V(  ) = E[  − E ( ) ] 2 =  ( − E ( ))

2
P( )



Desviación estándar de 
 
A la desviación estándar de  , denotado por  ( ) , se le denomina error estándar del estimador

 y se expresa:
 
 ( ) = + V ( )


Coeficiente de variación de 
 
El Coeficiente de variación de  , es el error relativo de muestreo del estimador  , y es la
razón de su error estándar y su valor esperado.


 ( )
CV(  ) = 
E ( )

Error cuadrático medio de 

El error cuadrático medio se denota ECM (𝜃 ) y se define como
 ∧
ECM (  ) = E(𝜃 − 𝜃)2

La varianza expresa la concentración de los valores del estimador alrededor de su valor esperado
y el error cuadrático medio expresa la concentración de los valores del estimador alrededor del
parámetro.

PROPIEDADES DESEABLES DE LOS ESTIMADORES

Todo estimador θ̂ tiene valor esperado E( θ̂) y varianza V( θ̂)


Un buen estimador cumple con las siguientes propiedades:

Estimador insesgado.

Un estimador puntual θ̂ , es un estimador insesgado del parámetro θ si y solo si E(θ̂) = θ, para todo
valor posible de θ̂.
En otras palabras: “ un estimador insesgado, es aquel para el cual la media de la distribución muestral
del estimador del parámetro, es el parámetro estimado “.
Se demuestra que la media muestral es un estimador insesgado de la media poblacional.
𝑋̅ es un estimador insesgado de µ puesto que E( 𝑋̅ ) = µ
Sesgo de un estimador
 
Sesgo de  , se denota B(  ) y se define como
 
B(  ) = E(  ) - 

¿Cuánto es el sesgo de un estimador insesgado? B(𝜃 ) = 0

Si B(  ) > 0 se dice que el estimador es sesgado positivamente y

Si B(  ) < 0 se dice que el estimador es sesgado negativamente.

Error cuadrático medio


∧ ∧ ∧ ∧
ECM(𝜃 ) = E(𝜃 - 𝜃)2 = V(𝜃 ) + (𝐵(𝜃 ))2

Cuando el estimador es insesgado el error cuadrático medio es la varianza porque el sesgo



B(𝜃 ) = 0
  
Se demuestra que ECM(  ) = V(  ) + ( B( )) 2

Estimador consistente o coherente.

• Una estadística es un estimador consistente o coherente de un parámetro de población, si al


aumentar el tamaño de la muestra se tiene casi la certeza de que el valor de la estadística se
aproxima bastante al valor del parámetro de la población.
• Si un estimador es coherente, se vuelve más confiable si tenemos tamaños de muestras más
grandes.

•  es un estimador consistente de  cuando su sesgo tiende a cero al aumentar el tamaño de la
muestra. Es decir:
 
 es un estimador consistente de θ  B(  ) → 0
n →N
Estimador eficiente o con varianza mínima.

• Suponga que θ̂1 𝑦 θ̂2 son dos estimadores insesgados del parámetro θ.
• Entonces, aun cuando la distribución de cada estimador esté centrada en el valor verdadero de
θ, las dispersiones de las distribuciones alrededor del valor verdadero pueden ser diferentes.
• Entre todos los estimadores de θ que son insesgados, se selecciona al que tenga varianza mínima.
• El estimador resultante recibe el nombre de estimador insesgado con varianza mínima (MVUE,
mínimum variance unbiased estimator) de θ.
• En otras palabras, la eficiencia se refiere al tamaño de error estándar de la estadística.
• Si comparamos dos estadísticas de una muestra del mismo tamaño y tratamos de decidir cuál de
ellas es un estimador más eficiente, escogeríamos la estadística que tuviera el menor error
estándar, o la menor desviación estándar de la distribución de muestreo.
• Tiene sentido pensar que un estimador con un error estándar menor tendrá una mayor
oportunidad de producir una estimación más cercana al parámetro de población que se está
considerando.

Como se puede observar las dos distribuciones tienen un mismo valor en el parámetro sólo que la
distribución muestral de medias tiene una menor varianza, por lo que la media se convierte en un
estimador eficiente e insesgado.

Estimador suficiente

Un estimador es suficiente si utiliza una cantidad de la información contenida de la muestra que ningún
otro estimador podría extraer información adicional de la muestra sobre el parámetro de la población
que se está estimando.
Es decir, se pretende que al extraer la muestra el estadístico calculado contenga toda la información de
esa muestra.
Por ejemplo, cuando se calcula la media de la muestra, se necesitan todos los datos. Cuando se calcula
la mediana de una muestra sólo se utiliza a un dato o a dos. Esto es, solo el dato o los datos del centro
son los que van a representar la muestra.
Con esto se deduce que si utilizamos a todos los datos de la muestra como es en el caso de la media, la
varianza, desviación estándar, etc; se tendrá un estimador suficiente.
La precisión de un estimador se analiza en función de conceptos como:
error estándar, error cuadrático medio y sesgo.

Ejemplo.
Si consideramos a Y como estimador de μ en el ejemplo de las muestras con reposición e interesa el
orden, tenemos:
Distribución de probabilidad de la media muestral

y 2 2.5 3 3.5 4 5 5.5 6.5 8


P( y ) 1/16 2/16 1/16 2/16 2/16 3/16 2/16 2/16 1/16

Calcule E( Y ) , V( Y ) y ̂𝟐 )
E( 𝝈

E( Y ) valor esperado de la media muestral (media de las medias muestrales)

V( Y ) varianza de las media muestral

E( 𝜎̂ 2 ) = valor esperado de la varianza muestral


  
E(  ) =   P( )



E( Y ) = ∑ 𝑌̅ 𝑃(𝑌̅ )

E( Y ) = 2(1/16) + 2.5(2/16) + 3(1/16) + 3.5(2/16) + 4(2/16) + 5(3/16) + 5.5(2/16) + 6.5( 2/16) +


8(1/16) = 72/ 16 = 4.5

     
V(  ) = E[  − E ( ) ] =  ( − E ( )) 2 P( )
2



y 2 2.5 3 3.5 4 5 5.5 6.5 8


P( y ) 1/16 2/16 1/16 2/16 2/16 3/16 2/16 2/16 1/16

V( Y ) = (2 - 4.5)2 (1/16) + (2.5 - 4.5)2 (2/16) + (3 - 4.5)2 (1/16) +(3.5 - 4.5)2 (2/16) +
(4 - 4.5)2 (2/16) + (5 - 4.5)2 (3/16) + (5.5 - 4.5)2 (2/16) + (6.5 - 4.5)2(2/16) +
(8 - 4.5)2 (1/16)
V( Y ) = 2.625


 ( )
CV(  ) = 
E ( )
 
 ( ) = + V ( ) desviación estándar ó error estándar


 ( ) = 1.62
1.62
CV( Y ) = = 0.36 coeficiente de variación
4.5

ECM( Y ) =? Error cuadrático medio

µ= E( Y )= 4.5
ECM( Y ) = V( Y ) = (2 - 4.5)2 (1/16) + (2.5 - 4.5)2 (2/16) + (3 - 4.5)2 (1/16) +(3.5 - 4.5)2 (2/16) +
(4 - 4.5)2 (2/16) + (5 - 4.5)2 (3/16) + (5.5 - 4.5)2 (2/16) + (6.5 - 4.5)2(2/16) +
(8 - 4.5)2 (1/16)

 18
= = = 4.5
N 4
∧ ∧
Calcule E( 𝜎 2 ) valor esperado de la varianza muestral 𝜎 2

Distribución de probabilidad de la varianza muestral 𝜎 2

𝜎2 0 0.25 1 2.25 6.25 9
∧2
P(𝜎 ) 4/16 2/16 2/16 4/16 2/16 2/16

E( 𝜎 2 ) = 0(4/16) + 0.25(2/16)+ 1(2/16)+2.25(4/16)+6.25(2/16)+9(2/16)

E( 𝜎 2 ) = 2.625 valor esperado de la varianza muestral

V( 𝜎 2 ) = varianza de la varianza muestral

(5 − 4.5) 2 + (2 − 4.5) 2 + (8 − 4.5) 2 + (3 − 4.5) 2


2 = = 5.25
4
σ2 = 5.25

∧ ∧ ∑𝑛
𝑖=1(𝑌𝑖 −𝑌)
2
E( 𝜎 2 ) =2.62 𝜎 2= 𝑛

Los resultados no son iguales



E( 𝜎 2 ) ≠ σ2 no se cumple la igualdad por tanto el estimador de la varianza poblacional
∧ ∑𝑛
𝑖=1(𝑌𝑖 −𝑌)
2
calculada con la formula 𝜎 2= da como resultado un estimador sesgado
𝑛

¿Cuál sería el estimador insesgado de la varianza poblacional?


Consideramos el siguiente estimador:

∑𝑛
𝑖=1(𝑌𝑖 −𝑌)
2
S2= 𝑛−1
Demostramos que este estimador es insesgado

5, 5 5, 2 5, 8 5, 3
2, 5 2, 2 2, 8 2, 3
8, 5 8, 2 8, 8 8, 3
3, 5 3, 2 3, 8 3, 3

Distribución de probabilidad de la varianza muestral S2

S2 0 0.5 2 4.5 12.5 18


P(S2) 4/16 2/16 2/16 4/16 2/16 2/16

E( S2 ) = 5.25 valor esperado de la varianza muestral ,donde la varianza muestral es


calculada con la fórmula
∑𝑛
𝑖=1(𝑌𝑖 −𝑌)
2
S2= 𝑛−1
σ2 = 5.25 varianza poblacional

Los resultados son iguales

E( S2 ) = σ2 por tanto S2es un estimador insesgado de σ2

COVARIANZA Y VARIABLES ALEATORIAS INDEPENDIENTES.


Se ha estudiado:
• el valor esperado de una variable como características de centralidad
• la varianza y la desviación estándar de una variable como características de dispersión.
La covarianza es una medida que sirve para medir la naturaleza de la asociación entre dos variables
aleatorias.
La covarianza entre dos variables discretas X y Y se denota 𝜎𝑋𝑌 y se define como:

𝜎𝑋𝑌 = E[(X-μX)(Y-μY)] = ∑𝑋 ∑𝑌(𝑋 − 𝜇𝑋 )(𝑌 − 𝜇𝑌 )𝑝(𝑥, 𝑦)

donde 𝜇𝑋 = 𝐸(𝑋) , 𝜇𝑌 = E(Y) y p(x ,y) es la probabilidad conjunta de X y Y.

Al desarrollar el valor esperado se encuentra otra expresión de la covarianza que permite su cálculo con
facilidad:
𝜎𝑋𝑌 = 𝐸(𝑋𝑌) − 𝜇𝑋 𝜇𝑌 donde E(XY) = ∑𝑥 ∑𝑦 𝑥𝑦𝑝(𝑥, 𝑦)

Dos variables aleatorias X y Y son independientes si p( x, y) = p(x)p(y) para todos los valores de X y Y.

Si dos variables aleatorias X y Y son independientes su covarianza es cero.

Ejemplos.

Sea X el número de veces que falla cierta máquina. Sea Y el número de veces que se llama al técnico
para una emergencia. La distribución de probabilidad conjunta de X y Y está dada por:
y
p(x, y) 1 2 3 .
1 0.05 0.05 0.1
X 2 0.05 0.1 0.35
3 0 0.2 O.1
La distribución de probabilidad marginal para X es:

x 1 2 3 .
p(x) 0.2 0.5 0.3

𝜇𝑋 = 1(0.2) + 2(0.5) + 3(0.3) = 2.1

La distribución de probabilidad marginal de Y es


y 1 2 3 .
p(y) 0.1 0.35 0.55
𝜇𝑌 = 1(0.1) + 2(0.35) + 3(0.55) = 2.45

E(XY) = 1(1)(0.05) + 1(2)(0.05) + 1(3)(0.1) + 2(1)(0.05) + 2(2)(0.1) + 2(3)(0.35) + 3(1)(0) + 3(2)(0.2) + 3(3)(0.1)
E(XY) = 0.05 + 0.1 + 0.3 + 0.1 + 0.4 + 2.1 + 0 + 1.2 + 0.9
E(XY) = 5.15.

𝜎𝑋𝑌 =C(X,Y) = E(XY) - 𝜇𝑋 𝜇𝑌 = 5.15 – (2.1)(2.45) = 0.005

¿Son las variables X y Y independientes?

Valor esperado y varianza de una combinación lineal.

Sea Y = 𝑎1 𝑋1 + 𝑎2 𝑋2 +. . . +𝑎𝑘 𝑋𝑘 una combinación lineal de las variables aleatorias X 1, X2, …, Xk ,


donde 𝑎1 , 𝑎2 , . . . , 𝑎𝑘 son constantes, entonces:

E( Y) = E(𝑎1 𝑋1 + 𝑎2 𝑋2 +. . . +𝑎𝑘 𝑋𝑘 )
E( Y) = 𝑎1 𝐸(𝑋1 ) + 𝑎2 𝐸(𝑋2 )+. . . +𝑎𝑘 𝐸(𝑋𝑘 )
V( Y ) = V(𝑎1 𝑋1 + 𝑎2 𝑋2 +. . . +𝑎𝑘 𝑋𝑘 )

V( Y ) = 𝑎12 𝑉(𝑋1 ) + 𝑎22 𝑉(𝑋2 )+. . . +𝑎𝑘2 𝑉(𝑋𝑘 ) +2𝜎𝑋1 𝑋2 + 2𝜎𝑋1 𝑋3 + 2𝜎𝑋1 𝑋4 +. . . +2𝜎𝑋𝑘−1 𝑋𝑘

Si las variables 𝑋1 , 𝑋2 , . . . , 𝑋𝑘 , son independientes

V( Y ) = V(𝑎1 𝑋1 + 𝑎2 𝑋2 +. . . +𝑎𝑘 𝑋𝑘 ) = 𝑎12 𝑉(𝑋1 ) + 𝑎22 𝑉(𝑋2 )+. . . +𝑎𝑘2 𝑉(𝑋𝑘 )

Así, para las variables aleatorias del ejemplo:

E( 3X + 5Y) = 3E(X) + 5E(Y) = 3(2.1) + 5(2.45) = 18.55

V(3X + 5Y) = 9V(X) + 25V(Y) + 2(3)(5)𝜎𝑋𝑌

V(3X + 5Y) = 9 ( 2.04 ) + 25 ( 0.4475 ) + 30(0.005) = 29.6975

Calcule E(X +Y)


V(X +Y)

You might also like