Professional Documents
Culture Documents
L'obtenció de les dades necessàries per realitzar una estudi es pot fer
per observació o per experimentació.
Obtenció de les dades
• Estudi transversal
• Estudi de cohorts
• Estudi de casos i controls
Preguntes habituals
– Quina ha de ser la mida n de la mostra?
– Quina informació s’ha de recollir sobre la mostra que
proporcioni informació sobre els paràmetres poblacionals que
interessen?
– De quina manera podem traslladar al conjunt de la població la
informació recollida sobre una mostra representativa?
Inferència Estadística
Mostra
estadístics
(� �)
𝒙𝒙, 𝑺𝑺, 𝒑𝒑
Població Paràmetres (μ, σ, p)
Suposem que una infecció està afectant un 20% de les persones d’una
gran població. És a dir, la proporció p de persones afectades és igual a
0.20. Per tant, en aquest cas el paràmetre poblacional és p=0.20.
�
𝒙𝒙 �
𝒙𝒙 �
𝒙𝒙 � 𝒙𝒙
𝒙𝒙 �
� 𝒙𝒙 �
𝒙𝒙
µ
Estimadors mostrals
95%
µ
ε
�
𝒙𝒙
ε ε 95%
Com que el paràmetre usualment és desconegut, intercanviem els
papers de l’estimador i el paràmetre
�
𝒙𝒙
ε ε
Construir un interval (𝑥𝑥̅ -ε, 𝑥𝑥̅ +ε) al voltant del valor de l’estimador 𝒙𝒙
�
de manera que puguem “assegurar” que “el vertader valor del
paràmetre µ està dins d’aquest interval (𝑥𝑥̅ -ε, 𝑥𝑥̅ +ε) amb una
probabilitat 1-α”.
estimador ± ε
100.9 100.0 98.1 97.8 96.4 99.4 102.8 103.3 100.2 98.7
101.9 102.7 102.1 99.5 99.5 101.0 102.4 98.8 98.4 99.2
99.6 102.7 99.6 99.2 102.2
2 2
100.256 − 1.96 , 100.256 + 1.96 =(99.472, 101.040)
25 25
Podem dir, amb una confiança del 95%, que el valor desconegut de µ està
comprés entre 99.472 i 101.040.
Mai podrem estar segurs que el vertader valor de µ estigui dins d’aquest
interval ja que quan afirmem que “µ està comprés entre 99.472 i 101.040” ho
estem dient amb un nivell de confiança del 95% i per tant estem corrent un
risc d’equivocar-nos del 5%.
Correcció poblacions finites
Quan la mida de la població (N) és finita o petita en comparació amb la mida de
la mostra (n), és necessari fer alguns ajustaments en la forma de calcular l’error
estàndard de la mitjana mostral.
𝑛𝑛 𝑁𝑁−𝑛𝑛
• Quan ≥ 0.05 s’utilitza el factor de correcció
𝑁𝑁 𝑁𝑁−1
𝜎𝜎 𝑁𝑁 − 𝑛𝑛 𝜎𝜎 𝑁𝑁 − 𝑛𝑛
𝑥𝑥̅ − 𝑧𝑧𝛼𝛼/2 , 𝑥𝑥̅ + 𝑧𝑧𝛼𝛼/2
𝑛𝑛 𝑁𝑁 − 1 𝑛𝑛 𝑁𝑁 − 1
𝑛𝑛
• Quan n<5% de la població o bé < 0.05, ignorem la correcció
𝑁𝑁
Interval de confiança per una µ, amb σ desconeguda
Dificultats pràctiques: sovint tampoc es coneix el valor del
paràmetre σ. En aquest casos, cal estimar el seu valor a partir de la
pròpia mostra calculant la desviació estàndard mostral S
100.9 100.0 98.1 97.8 96.4 99.4 102.8 103.3 100.2 98.7
101.9 102.7 102.1 99.5 99.5 101.0 102.4 98.8 98.4 99.2
99.6 102.7 99.6 99.2 102.2
̅ 100.256 i S=1.845 també sabem que n-1=24 i α/2 = 0.025 per tant 𝑡𝑡𝑛𝑛−1,𝛼𝛼/2 =2.064
𝑥𝑥=
L’interval calculat a partir de la mitjana d’aquesta mostra és igual a:
1.845 1.845
100.256 − 2.064 , 100.256 + 2.064 =(99.494, 101.018)
25 25
Podem dir, amb una confiança del 95%, que el valor desconegut de µ està
comprés entre 99.494 i 101.018.
Mai podrem estar segurs que el vertader valor de µ estigui dins d’aquest
interval ja que quan afirmem que “µ està comprés entre 99.494 i 101.018” ho
estem dient amb un nivell de confiança del 95% i per tant estem corrent un risc
d’equivocar-nos del 5%.
Exemple d’interval de confiança per una µ
Interval de confiança per una p
Es desconeix el valor p de la proporció d’unitats d’una població que
presenten una determinada característica d’interès.
Es pot demostrar que 𝑝𝑝̂ entesa com a v.a. es pot aproximar bastant bé
𝑝𝑝(1−𝑝𝑝)
(quan 𝑛𝑛𝑛𝑛 ≥ 10 i 𝑛𝑛(1 − 𝑝𝑝) ≥ 10) per una 𝑁𝑁 𝑝𝑝, , per tant, una
𝑛𝑛
estimació per interval de confiança per μ serà
Aproximació “grollera”:
𝟎𝟎.𝟎𝟎𝟎𝟎 𝟏𝟏−𝟎𝟎.𝟎𝟎𝟎𝟎 𝟎𝟎.𝟎𝟎𝟎𝟎 (𝟏𝟏−𝟎𝟎.𝟎𝟎𝟎𝟎)
(𝟎𝟎. 𝟎𝟎𝟎𝟎 − 𝟏𝟏. 𝟗𝟗𝟗𝟗 , 𝟎𝟎. 𝟎𝟎𝟎𝟎 + 𝟏𝟏. 𝟗𝟗𝟗𝟗 ) = (0.063,0.097)
𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏 𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏
𝑝𝑝(1−𝑝𝑝)
La precisió de l’interval és 𝜀𝜀 = 𝑧𝑧𝛼𝛼/2 així
𝑛𝑛
𝑛𝑛 𝑁𝑁−𝑛𝑛
• Quan ≥ 0.05 s’utilitza el factor de correcció
𝑁𝑁 𝑁𝑁−1
𝑛𝑛
• Quan n<5% de la població o bé < 0.05, ignorem la correcció
𝑁𝑁