You are on page 1of 4

Bioestadística – Tema 3

1. Mostra, població, estadístic i estimador

En els intervals de confiança i la inferència estadística estudiem una població per mitjà
d’una o més variables aleatòries. A més a més, també estudiarem els paràmetres asso-
ciats a aquestes variables com l’esperança o la variància, és a dir, els paràmetres
poblacionals.

D’aquesta manera, realitzarem estimacions per a partir d’un conjunt de mostres trobar
els paràmetres poblacionals. En aquest context, un estadístic és una variable aleatòria
definida sobre el conjunt de mostres de grandària fixada.

També caldrà considerar que són els estimadors, és a dir, estadístics dissenyats per a
obtenir estimacions puntuals d’un paràmetre poblacional. Dit d’una altra manera, són
variables aleatòries que aproximen la mitjana i la variància poblacional. Finalment, cen-
trem-nos en les propietats d’un bon estimador.

Doncs bé, aquest ha d’estimar el seu paràmetre, és a dir, vol apropar-se molt al paràme-
tre; per tant, 𝐄(𝐗) = 𝛍. Addicionalment, ha de presentar una distribució coneguda i una
variància el més petit possible, ja que a menor dispersió, presentarà valors més propers
a la seva esperança, és a dir, a μx .

1.1. Els estimadors més freqüents

En aquest apartat estudiarem els estimadors més freqüents i, per a fer-ho, ens basarem
en una variable aleatòria X definida sobre una certa població. A més a més, considera-
rem els paràmetres μ = E(X) i σ2 = var(X). Llavors, si tenim una mostra aleatòria, es
pot definir la seva mitjana i variància corresponent:
n n
1 1
̅
X= ∑ xi 2
S = ∑(xi − x̅)2
n n−1
i=1 i=1

Per una banda, la mitjana mostral constitueix un estimador, que vol apropar-se a la mit-
jana poblacional o l’esperança de la població. En aquest cas, veiem a continuació com, si
xi té la mateixa distribució que la variable X, la mitjana d’aquesta constitueix un bon
estimador, ja que l’esperança d’aquesta és la mitjana poblacional.

1 1 1
̅) =
E(X · E(x1 + ⋯ + xn ) = (E(x1 ) + ⋯ + E(xn )) = · nμ = μ
n n n

D’altra banda, també podem determinar la dispersió d’aquest paràmetre mostral. En


aquest cas, es pot observar com la seva variància es veu reduïda a mesura que augmenta
la mida de la mostra. Finalment, abans de veure-ho numèricament, cal tenir present que
estem estudiant variables aleatòries independents.

1 1 σ2x
̅) =
var(X · var(x1 + ⋯ + x n ) = (var(x1 ) + ⋯ + var(x n )) =
n2 n2 n

Per acabar, aquest apartat és important considerar que la variància mostral és també un
estimador comú i un bon estimador. D’aquesta manera, 𝐄(𝐒 𝟐 ) = 𝛔𝟐 .
Bioestadística – Tema 3

2. Intervals de confiança

Els intervals de confiança donen un rang estimat de valors que probablement inclou un
paràmetre desconegut. A més a més, el rang estimat es calcula a partir d’una mostra de-
terminada. Així doncs, un interval de confiança amb un coeficient de confiança 𝟏 − 𝛂
pel paràmetre μ és un interval [𝐚, 𝐛] 𝐚, 𝐛 𝛜 𝐑 tal que P(a < μ < b) = 1 − α.

En resum, s’entén que “a” i “b” són estadístics calculats a partir d’una mostra i, per tant,
el coeficient de confiança s’interpreta com la probabilitat que l’interval calculat contin-
gui realment el paràmetre d’interès. Finalment, centrem-nos en els diferents intervals de
confiança que estudiarem en aquest document.

2.1. Els intervals de confiança per a l’esperança amb variància coneguda

En aquest apartat ens centrarem en l’estudi d’una mostra aleatòria de la variable X, que
presenta una distribució normal i una esperança 𝛍, així com una variància 𝛔𝟐 . En
aquest cas, la mitjana mostral serà també normal i presentarà una esperança 𝛍, així com
una variància de 𝛔𝟐 /𝐧. Per tant:

̅−μ
X En què “ z ” serà l’estadístic, que pre-
z= senta una distribució 𝐍(𝟎, 𝟏).
σ/√n

Llavors, només caldrà cercar un valor del nostre estadístic que compleixi el valor fixat
del coeficient de confiança. Així doncs, obtindrem finalment l’interval de confiança de-
sitjat i amb un coeficient de confiança determinat; vegem-ho:

P (−zα < Z < zα ) = 1 − α Definim el coeficient de confiança que


2 2 hem fixat prèviament.

σ σ Modifiquem l’expressió anterior amb la


P (x̅ − zα · < μ < x̅ + zα · )
2 √n 2 √n descripció de l’estadístic d’abans.
=1−α
σ σ Definim l’interval de confiança per al
(x̅ − zα · , x̅ + zα · ) paràmetre μ i amb un coeficient de con-
2 √n 2 √n fiança determinat.
σ Escrivim d’una altra forma l’interval de
μ = x̅ ± zα ·
2 √n confiança.

Per acabar aquest apartat és important considerar que els


valors del nostre estadístic els obtindrem gràcies al
programa R. En aquest cas, voldrem obtenir una regió
l’àrea de la qual equivalgui al coeficient de confiança i,
per tant, agafarem dos valors que ens permetin que l’àrea
dels extrems equivalgui a 𝛂/𝟐 cadascun. D’aquesta
manera, l’àrea total sota la corba equivaldrà a 1.

Així, per a resoldre aquests exercicis serà necessari recordar la comanda de R necessà-
ria. Doncs bé, com que ens interessa un punt darrere del qual hi hagi una àrea determinada
i estem estudiant una distribució normal, usarem: qnorm(g) on “g” és l’àrea.
Bioestadística – Tema 3

Finalment, és important considerar que podem usar el mateix procediment sense saber o
sense comprovar que la variable X sigui normal si tenim mostres prou grans. Doncs bé,
en aquest cas, mostres prou grans equivaldran a 𝐧 ≥ 𝟑𝟎 i ens permetran considerar que
̅ és aproximadament normal, com diu el teorema del límit central.
la variable 𝐗

2.2. Els intervals de confiança per a l’esperança amb variància desconeguda

En aquest apartat ens centrarem en una mostra aleatòria de la variable X, que presenta
una distribució normal amb esperança 𝛍 i variància 𝛔𝟐 . A més a més, en aquest cas,
com que desconeixem el valor de la variància poblacional, l’aproximarem amb la
variància mostral (S2).

̅−μ
X En aquest cas, el nostre estadístic pre-
Tn−1 = senta una distribució t de Student amb
S/√n “n − 1” graus de llibertat.

Així doncs, en aquest cas l’interval de confiança presentarà una forma diferent, mostra-
da a continuació. Addicionalment, per a calcular el valor de l’estadístic haurem d’usar
també el R; ara bé, en aquest cas la distribució és diferent i caldrà indicar els graus de
llibertat. Per tant, haurem d’escriure qt(g, df = 𝐧 − 𝟏) on “g” de nou és l’àrea i “df” els
graus de llibertat o “degree of freedom”.

s Definim el interval de confiança amb


μ = x̅ ± t α · un coeficient de confiança i un grau de
2 √n llibertat determinat.

2.3. Els intervals de confiança per a la variància

En aquest apartat ens centrarem en una variable aleatòria X, normal i amb variància
𝛔𝟐 . A més a més, com que en aquest cas estem estudiant la variància, l’estadístic emprat
serà diferent; vegem-lo:

2
(n − 1)S 2 Definim l’estadístic, que té una distri-
χ = bució χ2 amb “n − 1” graus de llibertat.
σ2

Doncs bé, centrem-nos ara breument en la distribució 𝛘𝟐 .


Aquesta és una distribució que depèn dels graus de llibertat
i pren sempre valors positius. A més a més, no presenta les
propietats de simetria de la distribució normal o de la t de
Student, motiu pel qual serà necessari determinar per sepa-
rat les cues inferior i superior.

En aquest cas, haurem de dur a terme una estimació puntual (S2) i després haurem de
cercar un interval (𝛘𝟐𝐢𝐧𝐟 , 𝛘𝟐𝐬𝐮𝐩 ) tal que 𝐏(𝛘𝟐𝐢𝐧𝐟 ≤ 𝛘𝟐 ≤ 𝛘𝟐𝐬𝐮𝐩 ) = 𝟏 − 𝛂. Addicionalment,
en aquest cas també caldrà cercar dues cues que presentin la mateixa àrea, és a dir, una
àrea equivalent a 𝛂/𝟐. Doncs bé, vegem-ho:

(n − 1)S 2 Canviem l’estadístic en l’expressió ante-


P (χ2inf ≤ 2
≤ χ2sup ) = 1 − α rior per a definir l’interval de confiança.
σ
Bioestadística – Tema 3

(n − 1)S2 2
(n − 1)S 2 Modifiquem l’expressió anterior per a
P( 2
≤ σ ≤ 2 ) = 1 − α obtenir l’interval de confiança.
χsup χinf

Reescrivim l’interval de confiança per


(n − 1)S 2 (n − 1)S 2
( , ) a la variància i amb un coeficient de con-
χ2sup χ2inf fiança i grau de llibertat determinat.

Finalment, és important considerar que, de nou, els valors de l’estadístic s’han de trobar
amb el programa R. En aquest cas, caldrà usar la comanda qchisq(g, df = 𝐧 − 𝟏) en què
“g” segueix sent l’àrea i “df” els graus de llibertat.

2.4. Els intervals de confiança per a proporcions

En aquest apartat estudiarem una variable d’una població que presenta dues modalitats
que poden ser qualificades com a èxit = 1 o fracàs = 0. Així, el paràmetre d’interès en
aquest cas serà la proporció d’èxit a la població (p).

A més, la variable o característica estudiada és una variable aleatòria de Bernouilli i,


per tant, la seva esperança coincideix amb la probabilitat d’èxit; és a dir: E(X) = p.
D’altra banda, en aquest cas, usarem l’estimador 𝐩 ̂, que serà la proporció d’èxits de la
mostra, és a dir, la mitjana de la mostra, i estimarà el valor de “p”.

D’altra banda, és important recordar que si “n” és prou gran podem considerar que el
nostre estimador presenta una distribució normal. Ara bé, en aquest cas, una “n” prou
gran implicarà que es compleixin les següents característiques: 𝐧 ≥ 𝟑𝟎, (𝟏 − 𝐩
̂)𝐧 ≥ 𝟓 i
̂𝐧 ≥ 𝟓.
𝐩

p(1 − p) L’estimador presenta una distribució nor-


N (p, √ ) mal, tal com es mostra a l’esquerra, sem-
n pre que la “n” sigui prou gran.

p̂ − p Estandarditzem l’estimador perquè pre-


Z= senti una distribució normal estàndard, és
√p(1 − p) a dir, N(0, 1).
n

Aproximem la desviació típica per a


p̂(1 − p̂)
σ≈√ poder calcular-la en els següents passos i
n així poder determinar l’interval.

p̂(1 − p̂) Determinem l’interval de confiança amb


p = p̂ ± zα · √ un coeficient de confiança determinat.
2 n

p(1 − p) 1 També es pot emprar aquesta aproximació


√ ≤√ quan “p” està a prop de 0,5.
n 4n

You might also like