You are on page 1of 22

ESTADÍSTICA INFERENCIAL

Estimación de parámetros
Distribución normal
Distribución t-student
Estadística inferencial

Población

1.- Tamaño de muestra

Muestra 2. Tipos de muestreo

4.- Estimación
de parámetros

5.- Contraste de
hipótesis
Estimación de parámetros

El objetivo de este tema es describir cómo se puede realizar la estimación de las características de
una población a partir del estudio de una muestra aleatoria extraída de la misma.

Al estadístico que sirve para realizar una estimación de un parámetro poblacional se le llama
estimador.

Por ejemplo

Para estimar la media μ de una población normal se define el estimador ẍ, y para estimar la
varianza σ^2, se define el estimador S^2
Estimación de parámetros
Insesgado
Diremos que un estimador A de un parámetro poblacional B es insesgado, si su media,
coincide con el parámetro poblacional. Es decir
=u
Por ejemplo, La media aritmética ( ẍ) es un estimador insesgado de la media de una
población (u);
Sesgado
Diremos que un estimador A de un parámetro poblacional B es sesgado, si su valor no ,
coincide con el parámetro poblacional.
Por ejemplo:
La desviación estándar S es un estimador sesgado de la desviación estándar de la,
población σ
Propiedades de y la varianza S^2 es un estimador sesgado de la varianza de la población σ^2.
un estimador
Sesgo = diferencia Eficiente
Si se tienen dos estimadores A1, A2 de un parámetro poblacional, se dice que A1 es más
A≠B eficiente que A2 si su varianza es menor. Es decir
Insesgado σ2A 1 < σ2A2 .
A=B Por ejemplo: Para la estimación de la media poblacional, los estimadores media
aritmética ẍ y mediana (Me) son insesgados, pero la media es más eficiente que la
mediana (su varianza es menor).

Consistente
Se dice que un estimador es consistente cuando, al crecer el tamaño muestral, se
aproxima asintóticamente al valor del parámetro poblacional y su varianza se hace nula.
Es decir
Lim A = B ( parámetro)
n--- ∞
Lim σA2 = 0
Estimación de parámetros

Estimación puntual
Cuando se determina un único valor de un estimador que se
aproxime al parámetro poblacional desconocido se dice que se
hace una estimación puntual.

Métodos de Xmedia = u
estimación S=σ
S^2 = σ^2
Existen dos procedimientos
para realizar la estimación de n > 20
un parámetro poblacional.

Estimación por intervalo


Cuando, alternativamente, se calculan dos valores entre los
cuales se considera que, con cierta probabilidad, se encuentra
el parámetro poblacional, el procedimiento se conoce como
estimación por intervalos de confianza.

u = Xmedia ± Intervalo
S = σ1 -------s-------σ2
n ≤ 20
Estimación de parámetros

Métodos de
estimación
Estimación puntual
Cuando se determina un único valor de un estimador que se
Existen dos procedimientos
aproxime al parámetro poblacional desconocido se dice que se
para realizar la estimación
de un parámetro hace una estimación puntual.
poblacional.

Una estimación puntual es el valor concreto que toma el


estimador puntual en una muestra en particular. En general, a
cada parámetro poblacional se le pueden asociar diferentes
estimadores puntuales aunque normalmente se elegirán
aquellos que sean insesgados y más eficientes.

Evidentemente, no se espera que un estimador puntual


proporcione sin error el parámetro poblacional, sino que se
pretende que las estimaciones puntuales no se alejen mucho
del valor desconocido a calcular..
Estimación de parámetros

Estimadores de la distribución Normal


Si tenemos una distribución normal N(μ, σ). Como estimadores
puntuales de los parámetros poblaciones μ y σ2 normalmente se
utilizan la media aritmética Ẍ y la varianza muestra S2
respectivamente.

Estimadores Estimador de la distribución Binomial


puntuales Si tenemos una distribución binomial de parámetro p (probabilidad
de éxito). Como estimador puntual de p se usa la proporción de
según
éxitos P, definida como el número de éxitos dividido por el número
distribución de ensayos (o frecuencia relativa de éxitos).Este estimador es
insesgado. Es decir E(P) = p.

Estimador de la distribución de Poisson


Una distribución de Poisson, donde λ, o número medio de sucesos
por intervalo e el parámetro poblacional a determinar. Sean
X1,X2, . . . ,Xn los números de resultados obtenidos en n
experimentos (muestra de tamaño n). Entonces, un estimador
puntual para λ es la media muestral. Este estimador es insesgado,
es decir E(λ) = λ,
Estimación de parámetros

Estimación puntual
Cuando se determina un único valor de un estimador que se
aproxime al parámetro poblacional desconocido se dice que se
hace una estimación puntual.

Métodos de
estimación

Existen dos procedimientos


para realizar la estimación de
un parámetro poblacional.

Estimación por intervalo


Cuando, alternativamente, se calculan dos valores entre los
cuales se considera que, con cierta probabilidad, se encuentra
el parámetro poblacional, el procedimiento se conoce como
estimación por intervalos de confianza.
Estimación de parámetros
Métodos de
estimación Estimación por intervalo
Cuando, alternativamente, se calculan dos valores entre los
Existen dos procedimientos cuales se considera que, con cierta probabilidad, se encuentra
para realizar la estimación de
un parámetro poblacional.
el parámetro poblacional, el procedimiento se conoce como
estimación por intervalos de confianza.

Generalmente, una estimación puntual no proporciona un valor exacto del parámetro poblacional a
determinar. Es más, en la mayoría de los casos, no tendremos información sobre la precisión de tal
estimación,
de forma que su valor único no nos informa sobre la probabilidad de que se encuentre cerca o lejos del
valor verdadero. En la practica, interesa no solamente dar una estimación, sino precisar la incertidumbre de
dicha estimación. Esto se consigue mediante la estimación por intervalos de confianza en la cual se calcula
un intervalo sobre el que podamos establecer que, con cierta probabilidad, esta contenido el parámetro
poblacional desconocido De esta manera, en vez de calcular un único estimador, se determinan dos
estimadores que serán los limites inferior (L1) y superior (L2) (o limites de confianza) de un intervalo de
confianza I = [L1,L2]. A

Al ser el estimador por intervalo una variable aleatoria, podrá decirse que existe una cierta probabilidad de
que el intervalo aleatorio cubra el verdadero valor del parámetro poblacional β.
Es decir P(L1 < β < L2) = 1 − α,
X media = X media media = u
Estimación por intervalos de confianza
Por definición, a 1−α se le llama nivel de confianza y al intervalo [L1,L2] se le denomina intervalo de
confianza del (1 − α)100%
En otras palabras, el 100(1 − α)% de los intervalos correspondientes a todas las muestras posibles del mismo
tamaño contienen a (u) y el 100α% no lo contienen.

L1 L2 Si consideramos un nivel de
confianza (NC) con sus valores de Z
u
y el error estándar de la media (eem)

NC
(1-α)% (α/2)%
(α/2)%
u

El intervalo contiene a la media poblacional con un


determinado nivel de confianza
Estimación por intervalos de confianza
Distribución normal

Población desconocida Población conocida

Muestras
Grandes
n > 20
Cuando la muestra ( n > 20)
Cuando la muestra (n > 20)
Se hace una estimación puntual, Se
Se remplaza σ por s de la muestra
remplaza σ por s de la muestra

Muestras
pequeñas
n ≤ 20
muestra (n ≤ 20) N: población
t : es la t -student Muestra (n ≤ 20)
t : es la t -student
Generalmente en química se suele trabajar con poblaciones
desconocidas
Estimación de parámetros
Distribución t-student

La distribución t-student, es una distribución aleatoria (variable cuantitativas continuas)


continua, cuando se tiene un tamaño de muestra ( n) pequeño ( n ≤ 20)

El campo de variabilidad de la variable t de Student es desde de −∞ a + ∞ y su


función de densidad depende de los grado de libertad, expresados con gl = n-1

La función de densidad es simétrica alrededor de t = 0. Su forma es campaniforme,


siendo más achatada para valores bajos de n, cuando n aumenta se tiende a la curva
normal tipificada(N(0, 1)). En general, la curva normal es una buena aproximación de la
distribución t cuando n ≥ 20.
Estimación de parámetros
Distribución t-studente

gl = n-1

Los valores de t studente Depende:


Tamaño de datos, expresados grados de libertad gl =n-1
NC expresado como α
Distribución t-studente
t-student, dos colas NC = 95
n=9
Gl = n-1 = 9-1 = 8

NC %
α/2 =95
α/2

- t (α/2; gl(n-1) t=0 +t (α/2; gl(n-1)


- t(0,025, 8) =-2,30 = +2,30

t-student, una cola

Cola Cola derecha


Izquierda

NC % NC %
α α

- t (α; gl(n-1) +t (α; gl(n-1)


α

gl=n-1

t - student
Estimación de parámetros
Estimación por intervalos
Para muestras independientes
Las muestras independientes son mediciones
realizadas en dos conjuntos de elementos distintos
Individuo Tratameinto Dato Individuo Tratamientos Dato
A tratamiento 1 X1 D tratamiento 2 X1
B tratamiento 1 X2 F tratamiento 2 X2
C tratamiento 1 X3 G tratamiento 2 X3
Estimación por intervalos Xmedias, Xmedias,
S, S,
S^2 S^2

Para muestras apareada


Cuando se somete a un mismo individuo a dos
tratamientos diferentes
Individuo Tratamiento Dato Individuo Tratamiento Dato Individuo Tratamiento Dato
A tratamiento 1 x1 ( antes) B tratamiento 1 x1 ( antes) C tratamiento 1 x1 ( antes)
tratamiento 2 x2 ( después) tratamiento 2 x2 ( después) tratamiento 2 x2 ( después)
dA = x2-x1 = Diferencia en el tratamiento 1 y 2 dB = x2-x1 = Diferencia en el tratamiento 1 y 2 dC = x2-x1 = Diferencia en el tratamiento 1 y 2

A T1 T2 d=x2-x1

B T1 T2 d=x2-x1
Esto para contraste de hipótesis
C T1 T2 d=x2-x1
Xmedia-diferencias
S-diferencias
Estimación de parámetros
Estimación por intervalos
MUESTRAS INDEPENDIENTES
Muestras grande (n >20)

Ejemplo
Las mediciones de la cantidad de cloroformo (microgramos por litro) de 40 muestras de agua potable
de una ciudad produjeron los siguientes resultados: media (Ẍ ) = 30,48 ug/L y varianza (s^2) =24,0
(ug/L)^2. Calcule e interprete un intervalo de confianza de 95%, para la cantidad promedio de
cloroformo del agua potable de esta ciudad.(estime el valor de la u de la población)
Cuando se tiene muestras grandes:n >20 podemos hacer un a estimación puntual S = σ
Datos
n = 40
Media X= 30,48 ug/L
Varianza (s^2) = 24,0 (ug/L)^2 Como n > 20, remplazamos (σ) por (S) de la muestra
Des. Estándar (S) = √(24,01) = 4,9
Estimación puntual: S = σ
NC = 95%
α = 5%
IC = ?
Z(α/2) = │±1,96│

u
Estimación de parámetros
Estimación por intervalos
MUESTRAS INDEPENDIENTES
Muestras pequeñas (n ≤ 20)
Se sabe que el contenido alcohólico del vino es de u= 11°, para comprobar esto se toma una muestra
de 6 botellas y se analiza el contenido alcohólico obteniéndose los siguientes resultados 10,9 …11,1
…11,5 …11,7 … 11,8 … 13,9; se trabajo al 95% de confianza.
Estime cual será el valor de la u de la población

Antes de realizar los cálculos vamos a analizar los datos para ver si se tiene datos dudosos.

Ojo-siempre
10,9 …11,1 …11,5 …11,7 … 11,8 ………………………………………13,9

Vemos que el dato 13,9 esta bastante alejado de los demás; para saber si se acepta o se
elimina este dato, vamos a aplicar el estadístico Q de Dixon.
La Q de Dixon depende del tamaño de muestra (n) y del nivel de confianza que se
trabaje.

Análisis
Si Q (expe) ≤ Q (tabulada) Se acepta el dato
Q (expe) > Q (tabulada) Se elimina el dato
Estimación de parámetros
Estimación por intervalos
Estimación por intervalos

Buscamos el valor de la Q (tabulada) para n = 6, NC 95% ( α = 5% = 0,05)


Se obtiene una Q (tabulada) de 0,56

Q (expe) > Q (tabulada)


0,7 > 0,567 Se elimina el dato 13,9

n ° Alcohol
1 10,9 Buscamos el valor de la t en la tabla de t-student,
para t(α/2; gl)
2 11,1
T-student depende de u= 11
3 11,5 (α/2); 0,05/2 = 0,025
4 11,7 gl =(n-1) = 5-1 = 4
T(α/2, gl)
5 11,8
Media 11,4 t (0,025;4) = │±2,776│
Desv.
Estan 0,39
Estimación por intervalos
Si quisiéramos reducir el intervalo a la mitad (I) = 0,48/2 = 0,24; que tamaño de muestra
(n) se deberá toma
El intervalo esta dado por ecuación

De aquí despejamos n, y tenemos


Usamos el mismo valor de t original

Como queremos disminuir el ancho del intervalo a la mitad; es decir: I = 0,48/2 = 0,24
Remplazamos en la ecuación despejada; el valor de t es el mismo original que calculamos

Xmedia 0,48
n=5
 
0,24
n = 20 11,16 11,64
 

You might also like