You are on page 1of 12

Inici ► Els meus cursos ► 222_01_518 : Estadística aplicada ► Unitat 1.

Estimació puntual i intèrvals de confiança ►


QP1b. Intèrvals de confiança (I)

Començat el Thursday, 9 March 2023, 11:12


Estat Acabat
Completat el Thursday, 9 March 2023, 11:13
Temps emprat 1 minut 12 segons
Qualificació 2,50 sobre 10,00 (25%)
Pregunta 1
En una jornada electoral decisiva es presenten dos candidats: el verd i el blau. Durant la jornada es fan
Parcialment enquestes a peu d’urna, en què es pregunta pel vot a n votants. Amb una confiança del 90 % s’ha
correcte trobat que l’interval de confiança estimat per al percentatge de vots del candidat verd és
Puntuació 0,50 [0, 6174,  0, 6813] .

sobre 2,00 Amb aquesta informació, respon les preguntes següents:


a) Quina és l’anàlisi estadística que cal fer en aquest cas?
b) Quina és la distribució de probabilitat que cal utilitzar?
c) Quin és el marge d’error en l’estimació?
d) Quina és la mida de la mostra (n)?

Nota 1: per calcular els valors crítics en les distribucions de probabilitat, es recomana la pàgina web
següent:
https://www.geogebra.org/m/U5rw94DP
Important: per obrir l’enllaç, feu clic sobre el botó dret del ratolí i seleccioneu l’opció d’obrir
enllaç en una pestanya nova.
Nota 2: per a fer els càlculs intermitjos, utilitza sempre un mínim de quatre decimals.
Nota 3: a la tercera pregunta, introdueix la resposta amb dos decimals, usant la coma (,) com a
separador decimal, no el punt.
Nota 4: a l’última pregunta arrodoniu el valor de n trobat al múltiple de 100 més proper.

a. Inferència sobre la mitjana amb variància coneguda

b. Distribució normal

c. Marge d’error: 12

d. Mida de la mostra: 1

Ja que l’interès de l’estudi és fer inferència sobre el paràmetre de la proporció poblacional (p), l’estudi
s’ha de basar en la inferència sobre la proporció. Per a aquesta mena d’inferència es considera el
valor crític de la distribució normal.
L’objectiu de l’estudi és fer inferència sobre el paràmetre poblacional p, el qual desconeixem i que es
defineix com a proporció de vots afirmatius sobre el total:

Vots afirmatius
p =
Vots totals

Aquesta inferència es realitza a partir de la proporció mostral (a la qual denotem com a p


^ ), a partir de

les dades de l’enquesta:

Vots afirmatius comptabilitzats


^ =
p
Mida de la mostra

Amb l’estimació es construeix l’interval de confiança per al paràmetre p a partir de la següent


expressió:
−−−−−−−−−
^ ⋅ (1 − p
p ^)
p^ ± zα/2 ⋅ √
 n
Proporci ó mostral 
Marge d'error (ME)

Com veiem, l’interval de confiança es construeix a partir de la proporció mostral p ^ , sumant i restant

l’error mitjà que depèn de la proporció mostral p


^ , la mida mostral n i el nivell de significació α .

En el nostre cas disposem de l’interval de confiança [0, 6174,  0, 6813] , així com el grau de confiança
(90 %). Amb aquesta informació podem conèixer l’estimació de la proporció mostral p ^ , que és el punt

mitjà d’aquest interval:

0, 6174 + 0, 6813
^ =
p = 0, 65
2
Així, el marge d’error (ME) és la distància de la proporció mostral p
^ respecte a ambdós extrems de

l’interval:

M E = 0, 65 − 0, 6174 = 0, 032

És a dir, el marge d’error és M E = 0, 032.


Quant a la mida de la mostra n, la trobem a partir de la fórmula del marge d’error (ME):
−−−−−−−−−
^ ⋅ (1 − p
p ^)
M E = zα/2 ⋅ √
n

El pas següent és aïllar la variable n per expressar-la en funció de la resta de variables:


−−−−−−−−−
ME ^ ⋅ (1 − p
p ^)
= √
zα/2 n

2
ME ^ ⋅ (1 − p
p ^)
( ) =
zα/2 n

^ ⋅ (1 − p
p ^)
n =
2
ME
( )
z α/2

En aquesta equació coneixem els valors p ^ = 0, 65 i M E = 0, 032, i només ens falta saber el valor

zα/2 . Sabem que, si la confiança és un 90 %, la significació (en tant per un) és α = 1 − 0, 9 = 0, 1 .

Amb aquest paràmetre, podem trobar el valor zα/2 = z0,05 a la distribució normal estàndard (és a dir,
amb μ = 0 iσ = 1 ):

Així, sabent que z0,05 = 1, 6449 , ja podem calcular la mida de la mostra n:

^ ⋅ (1 − p
p ^)
n =
2
ME
( )
z 0,05

0, 65 ⋅ (1 − 0, 65)
=
2
0,03
( )
1,6449

0, 2275
=
2
0, 0195

≈ 600
És a dir, la mida de la mostra és igual a n = 600.
Sumari de les respostes:

Pregunta a) è
Infer ncia sobre la proporci ó
Pregunta b) Distribuci ó normal

Pregunta c) 0, 032

Pregunta d) 600
Pregunta 2
Una empresa vol analitzar la dispersió de la durada mitjana d’un dels seus productes en dies.
Incorrecte Específicament, es vol crear un interval de confiança per al paràmetre de la dispersió (variància). Per
Puntuació 0,00 fer-ho, l’empresa selecciona una mostra amb n = 80 productes, i s’obté una variància mostral igual a
s = 50. A més, per a fer la inferència estadística es considera una confiança del 99 %.
2
sobre 2,00
Amb aquesta informació, respon les preguntes següents:
a) Quina és l’anàlisi estadística que cal fer en aquest cas?
b) Quina és la distribució de probabilitat que cal utilitzar?
c) Quin és el límit inferior de l’interval de confiança per al paràmetre d’interès?
d) Quin és el límit superior de l’interval de confiança per al paràmetre d’interès?

Nota 1: per calcular els valors crítics en les distribucions de probabilitat, es recomana la pàgina web
següent:
https://www.geogebra.org/m/U5rw94DP
Important: per obrir l’enllaç, feu clic sobre el botó dret del ratolí i seleccioneu l’opció d’obrir
enllaç en una pestanya nova.
Nota 2: per a fer els càlculs intermitjos, utilitza sempre un mínim de quatre decimals.
Nota 3: introdueix les respostes arrodonint a dos decimals i usant la coma (,) com a separador decimal
(no el punt).

a. Inferència sobre la mitjana amb variància coneguda

b. Distribució t de Student

c. Límit inferior de l’interval: 12

d. Límit superior de l’interval: 12

Ja que l’interès de l’estudi és fer inferència sobre la dispersió de la variable d’interès (la durada del
producte en dies), el paràmetre poblacional que cal estudiar és la variància (σ 2 ), per això l’estudi s’ha
de basar en la inferència sobre la variància. En aquest tipus d’inferència, l’estadístic es distribueix
segons la distribució txi quadrat.
En relació amb la inferència sobre el paràmetre de la variància poblacional, sabem que l’estadístic pren
la següent expressió, distribuint-se segons una distribució txi quadrat amb n − 1 graus de llibertat:

2
(n − 1) ⋅ s
∼ χ n−1
2
σ

A partir d’aquest estadístic, l’interval al voltant del veritable paràmetre poblacional σ 2 amb una
confiança de 1 − 0, 01 = 0, 99 és el següent:

2 2
(n − 1) ⋅ s (n − 1) ⋅ s
2
P ( ≤ σ ≤ ) = 1 − α
χ 1−α/2;n−1 χ α/2;n−1

En el nostre cas, aquesta expressió pren els valors següents:

79 ⋅ 50 2
79 ⋅ 50
P ( ≤ σ ≤ ) = 0, 99
χ 0,995;79 χ 0,005;79

Com veiem, l’interval de confiança depèn de la mida de la mostra (n), el nivell de significació (α ) i la
variància mostral (s2 ).
Un tema important a tenir en compte és que la distribució txi quadrat no és simètrica, de manera que
hem de calcular dos valors crítics. D’una banda, el valor crític χ 0,005;79 és aquell valor que deixa a la
cua inferior de la distribució chi quadrat la part α/2 de la massa probabilística, mentre que χ 0,995;79
deixa a la cua superior la part α/2 de la massa probabilística (sobre un total d’1). Acudint a la
distribució txi quadrat amb 79 graus de llibertat trobem aquests valors crítics:
Així, els valors crítics són χ 0,005;79 = 50, 376 i χ 0,995;79 = 115, 117 . Amb aquesta informació ja
podem calcular l’interval de confiança:

79 ⋅ 50 3950
í
L mit inferior: = = 34, 31
χ 0,995;79 115, 117

79 ⋅ 50 3950
í
L mit superior: = = 78, 41
χ 0,005;79 50, 376

Hi ha algunes possibilitats per expressar aquest resultat. Aquesta és la primera:

I Cσ 2 = [34, 31;  78, 41]

Hi ha diverses maneres d’expressar aquest resultat. Una d’aquestes és establir que, si prenguéssim un
nombre suficientment gran de mostres aleatòries i representatives, el 99 per cent d’aquestes (ja que
1 − 0, 01 = 0, 99 ) donarà lloc a un interval que contingui el valor real del paràmetre variància

poblacional (σ 2 ).
2
σ ∈ (34, 31,  78, 41)

També es pot expressar aquest resultat de forma probabilística, de la manera següent:

2
P (34, 31 ≤ σ ≤ 78, 41) = 0, 99

Sumari de les respostes:

Pregunta a) è
Infer ncia sobre la vari ncia à
Pregunta b) Distribuci ó txi quadrat

Pregunta c) 34, 31

Pregunta d) 78, 41
Pregunta 3
El Departament d’Educació vol saber quina és l’alçada mitjana dels estudiants d’un curs determinat.
Parcialment Per fer-ho, selecciona una mostra aleatòria de \(n=130\) estudiants, i els mesura l’alçada (en
correcte centímetres). De la mostra se n’obté una mitjana mostral \(\bar{x}=160\) i una desviació estàndard
Puntuació 0,50 mostral \(s = 17\). A més, es constata que es desconeix la variància poblacional, i per a l’anàlisi es
sobre 2,00 considera una confiança del \(95 \ \%\).
Amb aquesta informació, respon les preguntes següents:
a) Quina és l’anàlisi estadística que cal fer en aquest cas?
b) Quina és la distribució de probabilitat que cal utilitzar?
c) Quin és el límit inferior de l’interval de confiança per al paràmetre d’interès?
d) Quin és el límit superior de l’interval de confiança per al paràmetre d’interès?

Nota 1: per calcular els valors crítics en les distribucions de probabilitat, es recomana la pàgina web
següent:
https://www.geogebra.org/m/U5rw94DP
Important: per obrir l’enllaç, feu clic sobre el botó dret del ratolí i seleccioneu l’opció d’obrir
enllaç en una pestanya nova.
Nota 2: per a fer els càlculs intermitjos, utilitza sempre un mínim de quatre decimals.
Nota 3: introdueix les respostes arrodonint a dos decimals i usant la coma (,) com a separador decimal
(no el punt).

a. Inferència sobre la mitjana amb variància desconeguda

b. Distribució txi quadrat

c. Límit inferior de l’interval: 1,23

d. Límit superior de l’interval: 1,45

Ja que l’interès de l’estudi és fer inferència sobre el paràmetre de la mitjana poblacional (\(\mu\)), i que
no se sap la variància poblacional (\(\sigma^2\)), l’estudi s’ha de basar en la inferència sobre la
mitjana amb variància desconeguda. A més, el fet que es desconegui la variància poblacional fa que
l’estadístic de la mitjana es distribueixi segons la distribució t de Student.
Obtindrem l’interval de confiança per al paràmetre de la mitjana poblacional (\(\mu\)) a partir de la
fórmula següent:
\[\underbrace{\bar{x}}_{\text{Mitjana mostral}} \pm \underbrace{t_{\alpha/2 , n-1} \cdot \frac{s}{\sqrt{n}}}_
{\text{Marge d'error (ME)}}\]
Com veiem, l’interval de confiança es construeix a partir de la mitjana mostral \(\bar{x}\), sumant i
restant un marge d’error que depèn de la mida de la mostra (\(n\)), el nivell de significació (\(\alpha\)) i
la desviació estàndard mostral (\(s\)).
El valor crític \(t_{\alpha / 2 , n-1}\) és aquell valor que deixa a cadascuna de les cues de la distribució t
de Student la part \(\alpha / 2\) de la massa probabilística (sobre un total d’1). En el nostre cas, i tenint \
(\alpha / 2 = 0,05/2 = 0,025\) i \(n-1=129\), només cal acudir a la distribució t de Student amb \(n-
1=129\) graus de llibertat per trobar aquest valor:
Com veiem, el valor crític que estem buscant és \(t_{0,025;129} = 1,979\), ja que deixa a la dreta una
cua igual a \(0,025\). Amb aquesta informació ja podem calcular el marge d’error (ME):
\[ME = t_{0,025;129} \cdot \frac{17}{\sqrt{130}} = 1,979 \cdot 1,491 \approx 2,95\]
Així, doncs, l’interval de confiança per a la mitjana és el següent:
\[IC_{\mu} = \bar{x} \pm ME = 160 \pm 2,95 \qquad \Longrightarrow \qquad IC_{\mu} = [157,05 ,\
162,95]\]
Hi ha diverses maneres d’expressar aquest resultat. Una d’aquestes és establir que, si prenguéssim un
nombre suficientment gran de mostres aleatòries i representatives, el \(95\) per cent d’aquestes (ja que
\(1-0,05 = 0,95\)) donarà lloc a un interval que contingui el valor real del paràmetre mitjana poblacional
(\(\mu\)).
\[\mu \in [160 - 2,95,\ 160 + 2,95] \qquad \Longrightarrow \qquad \mu \in [157,05,\ 162,95]\]
També es pot expressar aquest resultat de forma probabilística, de la manera següent:
\[P(157,05 \leq \mu \leq 162,95) = 0,95\]
Sumari de les respostes:
\[\begin{array}{|l|r|} \hline \text{Pregunta a)} & \text{Inferència sobre la mitjana amb variància
desconeguda} \\ \hline \text{Pregunta b)} & \text{Distribució t de Student} \\ \hline \text{Pregunta c)} &
157,05 \\ \hline \text{Pregunta d)} & 162,95 \\ \hline \end{array}\]
Pregunta 4
Un institut de biologia vol estudiar quina és la longitud mitjana d’un tipus de peix que viu en un llac
Parcialment determinat. Per fer-ho, selecciona una mostra aleatòria de \(n=600\) peixos, i els mesura la longitud (en
correcte mil·límetres). De la mostra se n’obté una mitjana mostral \(\bar{x}=271\), i per estudis previs se sap que
Puntuació 1,00 la variància poblacional és \(\sigma^2 = 10^2\). Per a l’anàlisi es considera una confiança del \(90 \ \%\).
sobre 2,00 Amb aquesta informació, respon les preguntes següents:
a) Quina és l’anàlisi estadística que cal fer en aquest cas?
b) Quina és la distribució de probabilitat que cal utilitzar?
c) Quin és el límit inferior de l’interval de confiança per al paràmetre d’interès?
d) Quin és el límit superior de l’interval de confiança per al paràmetre d’interès?

Nota 1: per calcular els valors crítics en les distribucions de probabilitat, es recomana la pàgina web
següent:
https://www.geogebra.org/m/U5rw94DP
Important: per obrir l’enllaç, feu clic sobre el botó dret del ratolí i seleccioneu l’opció d’obrir
enllaç en una pestanya nova.
Nota 2: per a fer els càlculs intermitjos, utilitza sempre un mínim de quatre decimals.
Nota 3: introdueix les respostes arrodonint a dos decimals i usant la coma (,) com a separador decimal
(no el punt).

a. Inferència sobre la mitjana amb variància coneguda

b. Distribució normal

c. Límit inferior de l’interval: 12

d. Límit superior de l’interval: 12

Ja que l’interès de l’estudi és fer inferència sobre el paràmetre de la mitjana poblacional (\(\mu\)), i que
es coneix la variància poblacional (\(\sigma^2 = 10^2\)), l’estudi s’ha de basar en la inferència sobre la
mitjana amb variància coneguda. A més, el fet que es conegui la variància poblacional fa que
l’estadístic de la mitjana es distribueixi segons la distribució normal.
Obtindrem l’interval de confiança per al paràmetre de la mitjana poblacional (\(\mu\)) a partir de la
fórmula següent:
\[\underbrace{\bar{x}}_{\text{Mitjana mostral}} \pm \underbrace{z_{\alpha/2} \cdot \frac{\sigma}
{\sqrt{n}}}_{\text {Marge d'error (ME)}}\]
Com veiem, l’interval de confiança es construeix a partir de la mitjana mostral \(\bar{x}\), sumant i
restant un marge d’error que depèn de la mida de la mostra (\(n\)), el nivell de significació (\(\alpha\)) i
la desviació estàndard poblacional (\(\sigma\)).
El valor crític \(z_{\alpha / 2}\) és aquell valor que deixa a cadascuna de les cues de la distribució
normal la part \(\alpha / 2\) de la massa probabilística (sobre un total d’1). En el nostre cas, i tenint \
(\alpha / 2 = 0,1/2 = 0,05\), només cal acudir a la distribució normal estàndard (és a dir, amb \(\mu = 0\)
i \(\sigma = 1\)) per trobar aquest valor:
Com veiem, el valor crític que estem buscant és \(z_{0,05} = 1,645\), ja que deixa a la dreta una cua
igual a \(0,05\). Amb aquesta informació ja podem calcular el marge d’error (ME):
\[ME = z_{0,05} \cdot \frac{10}{\sqrt{600}} = 1,645 \cdot 0,408 \approx 0,67\]
Així, doncs, l’interval de confiança per a la mitjana és el següent:
\[IC_{\mu} = \bar{x} \pm ME = 271 \pm 0,67 \qquad \Longrightarrow \qquad IC_{\mu} = [270,33 ,\
271,67]\]
Hi ha diverses maneres d’expressar aquest resultat. Una d’aquestes és establir que, si prenguéssim un
nombre suficientment gran de mostres aleatòries i representatives, el \(90\) per cent d’aquestes (ja que
\(1-0,1 = 0,9\)) donarà lloc a un interval que contingui el valor real del paràmetre mitjana poblacional (\
(\mu\)).
\[\mu \in [271 - 0,67,\ 271 + 0,67] \qquad \Longrightarrow \qquad \mu \in [270,33,\ 271,67]\]
També es pot expressar aquest resultat de forma probabilística, de la manera següent:
\[P(270,33 \leq \mu \leq 271,67) = 0,9\]
Sumari de les respostes:
\[\begin{array}{|l|r|} \hline \text{Pregunta a)} & \text{Inferència sobre la mitjana amb variància coneguda}
\\ \hline \text{Pregunta b)} & \text{Distribució normal} \\ \hline \text{Pregunta c)} & 270,33 \\ \hline
\text{Pregunta d)} & 271,67 \\ \hline \end{array}\]
Pregunta 5
En un país se celebra una jornada electoral, on es vota en un referèndum amb dues opcions: sí i no.
Parcialment Durant la jornada es fan enquestes a peu d’urna, en què es pregunta pel vot a \(n=1000\) votants, i
correcte s’obté que \(350\) han votat que sí i \(650\) han votat que no.
Puntuació 0,50 L’objectiu és obtenir un interval de confiança del percentatge de votants que voten afirmativament,
sobre 2,00 considerant una confiança del \(99 \ \%\).
Amb aquesta informació, respon les preguntes següents:
a) Quina és l’anàlisi estadística que cal fer en aquest cas?
b) Quina és la distribució de probabilitat que cal utilitzar?
c) Quin és el límit inferior de l’interval de confiança per al paràmetre d’interès?
d) Quin és el límit superior de l’interval de confiança per al paràmetre d’interès?

Nota 1: per calcular els valors crítics en les distribucions de probabilitat, es recomana la pàgina web
següent:
https://www.geogebra.org/m/U5rw94DP
Important: per obrir l’enllaç, feu clic sobre el botó dret del ratolí i seleccioneu l’opció d’obrir
enllaç en una pestanya nova.
Nota 2: per a fer els càlculs intermitjos, utilitza sempre un mínim de quatre decimals.
Nota 3: a les preguntes c) i d), introdueix les respostes en tant per un, arrodonint a dos decimals i usant
la coma (,) com a separador decimal (no el punt).

a. Inferència sobre la proporció

b. Distribució t de Student

c. Límit inferior de l’interval: 45

d. Límit superior de l’interval: 45

Ja que l’interès de l’estudi és fer inferència sobre el paràmetre de la proporció poblacional (\(p\)),
l’estudi s’ha de basar en la inferència sobre la proporció. Per a aquesta mena d’inferència es
considera el valor crític de la distribució normal.
L’objectiu de l’estudi és fer inferència sobre el paràmetre poblacional \(p\), el qual desconeixem i que es
defineix com a proporció de vots afirmatius sobre el total:
\[p = \frac{\text{Vots afirmatius}}{\text{Vots totals}}\]
El primer pas és obtenir l’estimació d’aquest paràmetre, és a dir, la proporció mostral (a la qual
denotem com a \(\hat{p}\)), a partir de les dades de l’enquesta:
\[\hat{p} = \frac{\text{Vots afirmatius comptabilitzats}}{\text{Mida de la mostra}} = \frac{350}{1000} =
0,35\]
Amb l’estimació \(\hat{p}=0,35\) podem construir l’interval de confiança per al paràmetre \(p\) a partir de
la següent expressió:
\[\underbrace{\hat{p}}_{\text{Proporció mostral}} \pm \underbrace{z_{\alpha/2} \cdot \sqrt{\frac{\hat{p}
\cdot (1-\hat {p})}{n}}}_{\text{Marge d'error (ME)}}\]
Com veiem, l’interval de confiança es construeix a partir de la proporció mostral \(\hat{p}\), sumant i
restant un marge d’error que depèn de la proporció mostral \(\hat{p}\), la mida mostral \(n= 1000\) i el
nivell de significació \(\alpha = 0,01\).
El valor crític \(z_{\alpha / 2}\) és aquell valor que deixa a cadascuna de les cues de la distribució
normal la part \(\alpha / 2\) de la massa probabilística (sobre un total d’1). En el nostre cas, i tenint \
(\alpha / 2 = 0,01/2 = 0,005\), només cal acudir a la distribució normal estàndard (és a dir, amb \(\mu =
0\) i \(\sigma = 1\)) per trobar aquest valor:
Com veiem, el valor crític que estem buscant és \(z_{0,005} = 2,576\), ja que deixa a la dreta una cua
igual a \(0,005\). Amb aquesta informació ja podem calcular el marge d’error (ME):
\[ME = z_{0,005} \cdot \sqrt{\frac{\hat{p} \cdot (1-\hat{p})}{n}} = 2,576 \cdot \sqrt{\frac{0,35 \cdot (1-
0,35)}{1000}} = 2,576 \cdot 0,015 \approx 0,04\]
Així, doncs, l’interval de confiança per a la proporció és el següent:
\[IC_{p} = \hat{p} \pm ME = 0,35 \pm 0,04 \qquad \Longrightarrow \qquad IC_{p} = [0,31,\ 0,39]\]
Hi ha diverses maneres d’expressar aquest resultat. Una d’aquestes és establir que, si prenguéssim un
nombre suficientment gran de mostres aleatòries i representatives, el \(99\) per cent d’aquestes (ja que
\(1-0,01 = 0,99\)) donarà lloc a un interval que contingui el valor real del paràmetre proporció
poblacional (\(p\)).
\[p \in [0,35 - 0,04,\ 0,35 + 0,04] \qquad \Longrightarrow \qquad p \in [0,31,\ 0,39]\]
També es pot expressar aquest resultat de forma probabilística, de la manera següent:
\[P(0,31 \leq p \leq 0,39) = 0,99\]
Sumari de les respostes:
\[\begin{array}{|l|r|} \hline \text{Pregunta a)} & \text{Inferència sobre la proporció} \\ \hline \text{Pregunta
b)} & \text{Distribució normal} \\ \hline \text{Pregunta c)} & 0,31 \\ \hline \text{Pregunta d)} & 0,39 \\ \hline
\end{array}\]

◄ QP1a. Pràctiques amb la Normal

Salta a...
QP1c. Intèrvals de confiança (II) ►

You might also like