Professional Documents
Culture Documents
En els intervals de confiança i la inferència estadística estudiem una població per mitjà
d’una o més variables aleatòries. A més a més, també estudiarem els paràmetres asso-
ciats a aquestes variables com l’esperança o la variància, és a dir, els paràmetres
poblacionals.
D’aquesta manera, realitzarem estimacions per a partir d’un conjunt de mostres trobar
els paràmetres poblacionals. En aquest context, un estadístic és una variable aleatòria
definida sobre el conjunt de mostres de grandària fixada.
També caldrà considerar que són els estimadors, és a dir, estadístics dissenyats per a
obtenir estimacions puntuals d’un paràmetre poblacional. Dit d’una altra manera, són
variables aleatòries que aproximen la mitjana i la variància poblacional. Finalment, cen-
trem-nos en les propietats d’un bon estimador.
Doncs bé, aquest ha d’estimar el seu paràmetre, és a dir, vol apropar-se molt al paràme-
tre; per tant, 𝐄(𝐗) = 𝛍. Addicionalment, ha de presentar una distribució coneguda i una
variància el més petit possible, ja que a menor dispersió, presentarà valors més propers
a la seva esperança, és a dir, a μx .
En aquest apartat estudiarem els estimadors més freqüents i, per a fer-ho, ens basarem
en una variable aleatòria X definida sobre una certa població. A més a més, considera-
rem els paràmetres μ = E(X) i σ2 = var(X). Llavors, si tenim una mostra aleatòria, es
pot definir la seva mitjana i variància corresponent:
n n
1 1
̅
X= ∑ xi 2
S = ∑(xi − x̅)2
n n−1
i=1 i=1
Per una banda, la mitjana mostral constitueix un estimador, que vol apropar-se a la mit-
jana poblacional o l’esperança de la població. En aquest cas, veiem a continuació com, si
xi té la mateixa distribució que la variable X, la mitjana d’aquesta constitueix un bon
estimador, ja que l’esperança d’aquesta és la mitjana poblacional.
1 1 1
̅) =
E(X · E(x1 + ⋯ + xn ) = (E(x1 ) + ⋯ + E(xn )) = · nμ = μ
n n n
1 1 σ2x
̅) =
var(X · var(x1 + ⋯ + x n ) = (var(x1 ) + ⋯ + var(x n )) =
n2 n2 n
Per acabar, aquest apartat és important considerar que la variància mostral és també un
estimador comú i un bon estimador. D’aquesta manera, 𝐄(𝐒 𝟐 ) = 𝛔𝟐 .
Bioestadística – Tema 3
2. Intervals de confiança
Els intervals de confiança donen un rang estimat de valors que probablement inclou un
paràmetre desconegut. A més a més, el rang estimat es calcula a partir d’una mostra de-
terminada. Així doncs, un interval de confiança amb un coeficient de confiança 𝟏 − 𝛂
pel paràmetre μ és un interval [𝐚, 𝐛] 𝐚, 𝐛 𝛜 𝐑 tal que P(a < μ < b) = 1 − α.
En resum, s’entén que “a” i “b” són estadístics calculats a partir d’una mostra i, per tant,
el coeficient de confiança s’interpreta com la probabilitat que l’interval calculat contin-
gui realment el paràmetre d’interès. Finalment, centrem-nos en els diferents intervals de
confiança que estudiarem en aquest document.
En aquest apartat ens centrarem en l’estudi d’una mostra aleatòria de la variable X, que
presenta una distribució normal i una esperança 𝛍, així com una variància 𝛔𝟐 . En
aquest cas, la mitjana mostral serà també normal i presentarà una esperança 𝛍, així com
una variància de 𝛔𝟐 /𝐧. Per tant:
̅−μ
X En què “ z ” serà l’estadístic, que pre-
z= senta una distribució 𝐍(𝟎, 𝟏).
σ/√n
Llavors, només caldrà cercar un valor del nostre estadístic que compleixi el valor fixat
del coeficient de confiança. Així doncs, obtindrem finalment l’interval de confiança de-
sitjat i amb un coeficient de confiança determinat; vegem-ho:
Així, per a resoldre aquests exercicis serà necessari recordar la comanda de R necessà-
ria. Doncs bé, com que ens interessa un punt darrere del qual hi hagi una àrea determinada
i estem estudiant una distribució normal, usarem: qnorm(g) on “g” és l’àrea.
Bioestadística – Tema 3
Finalment, és important considerar que podem usar el mateix procediment sense saber o
sense comprovar que la variable X sigui normal si tenim mostres prou grans. Doncs bé,
en aquest cas, mostres prou grans equivaldran a 𝐧 ≥ 𝟑𝟎 i ens permetran considerar que
̅ és aproximadament normal, com diu el teorema del límit central.
la variable 𝐗
En aquest apartat ens centrarem en una mostra aleatòria de la variable X, que presenta
una distribució normal amb esperança 𝛍 i variància 𝛔𝟐 . A més a més, en aquest cas,
com que desconeixem el valor de la variància poblacional, l’aproximarem amb la
variància mostral (S2).
̅−μ
X En aquest cas, el nostre estadístic pre-
Tn−1 = senta una distribució t de Student amb
S/√n “n − 1” graus de llibertat.
Així doncs, en aquest cas l’interval de confiança presentarà una forma diferent, mostra-
da a continuació. Addicionalment, per a calcular el valor de l’estadístic haurem d’usar
també el R; ara bé, en aquest cas la distribució és diferent i caldrà indicar els graus de
llibertat. Per tant, haurem d’escriure qt(g, df = 𝐧 − 𝟏) on “g” de nou és l’àrea i “df” els
graus de llibertat o “degree of freedom”.
En aquest apartat ens centrarem en una variable aleatòria X, normal i amb variància
𝛔𝟐 . A més a més, com que en aquest cas estem estudiant la variància, l’estadístic emprat
serà diferent; vegem-lo:
2
(n − 1)S 2 Definim l’estadístic, que té una distri-
χ = bució χ2 amb “n − 1” graus de llibertat.
σ2
En aquest cas, haurem de dur a terme una estimació puntual (S2) i després haurem de
cercar un interval (𝛘𝟐𝐢𝐧𝐟 , 𝛘𝟐𝐬𝐮𝐩 ) tal que 𝐏(𝛘𝟐𝐢𝐧𝐟 ≤ 𝛘𝟐 ≤ 𝛘𝟐𝐬𝐮𝐩 ) = 𝟏 − 𝛂. Addicionalment,
en aquest cas també caldrà cercar dues cues que presentin la mateixa àrea, és a dir, una
àrea equivalent a 𝛂/𝟐. Doncs bé, vegem-ho:
(n − 1)S2 2
(n − 1)S 2 Modifiquem l’expressió anterior per a
P( 2
≤ σ ≤ 2 ) = 1 − α obtenir l’interval de confiança.
χsup χinf
Finalment, és important considerar que, de nou, els valors de l’estadístic s’han de trobar
amb el programa R. En aquest cas, caldrà usar la comanda qchisq(g, df = 𝐧 − 𝟏) en què
“g” segueix sent l’àrea i “df” els graus de llibertat.
En aquest apartat estudiarem una variable d’una població que presenta dues modalitats
que poden ser qualificades com a èxit = 1 o fracàs = 0. Així, el paràmetre d’interès en
aquest cas serà la proporció d’èxit a la població (p).
D’altra banda, és important recordar que si “n” és prou gran podem considerar que el
nostre estimador presenta una distribució normal. Ara bé, en aquest cas, una “n” prou
gran implicarà que es compleixin les següents característiques: 𝐧 ≥ 𝟑𝟎, (𝟏 − 𝐩
̂)𝐧 ≥ 𝟓 i
̂𝐧 ≥ 𝟓.
𝐩