You are on page 1of 43

28/3/22, 16:09 BAT_MAP2.7.

BAT_MAP2.7.1

Institut d'Ensenyaments a Imprès Per: Víctor Cunill De Manuel


Lloc:
Distància de les Illes Balears Data: dilluns, 28 març 2022, 16:08
Matemàtiques aplicades a les
Curs:
ciències socials II
Llibre: BAT_MAP2.7.1

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 1/43
28/3/22, 16:09 BAT_MAP2.7.1

Taula de continguts
1. Les mostres estadístiques. Distribució normal.
1.1. Les mostres estadístiques
1.2. Distribució normal
1.3. Càlculs amb la N(0,1)
1.4. Intervals característics.

2. Inferència estadística. Estimació de la mitjana


2.1. L'estadística inferencial
2.2. Distribució de les mitjanes mostrals
2.3. Interval de confiança per a la mitjana
2.4. Nivell de confiança, error admissible i grandària de la mostra

3. Exercicis resolts.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 2/43
28/3/22, 16:09 BAT_MAP2.7.1

1. Les mostres estadístiques. Distribució normal.

En aquesta unitat començarem el primer capítol fent una breu introducció a les mostres
estadístiques, com les hem de triar perquè compleixin amb la funció de representació. Després
farem un repàs de la distribució normal, que heu treballat a primer curs perquè la tornarem
utilitzar en la resta d'unitat i en la següent.

En el segon capítol introduirem la inferència estadística. En l'estudi de les distribucions, com


hem fet a primer, a partir d'una distribució teòrica podem trobar les probabilitats de cada
resultat, però en aquest capítol enfocarem el problema d'una altra manera. El que volem és
justament a partir d'una mostra, poder treure una distribució teòrica que s'hi ajusti i a més poder
donar no l'error que cometem amb aquest ajustament, però si una estimació d'aquest error. A
partir d'aquí podrem emprar aquesta distribució teòrica per fer estimacions de la probabilitat.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 3/43
28/3/22, 16:09 BAT_MAP2.7.1

1.1. Les mostres estadístiques

El punt de vista més clàssic de l'estadística i el que coneix la majoria de la gent com estadística,
és el que s'anomena estadística descriptiva, que noltros diferenciarem de l'estadística
inferencial o inductiva, que és la que introduirem en aquesta unitat.


L'estadística descriptiva, a grans trets, consisteix en la descripció mitjançant taules o gràfics
o els anomenats paràmetres estadístics (mitjana, mediana, ...) de les característiques d'una
població. Per exemple, si jo vull descriure acadèmicament un grup d'alumnes puc donar la
mitjana aritmètica de les seves notes o la distribució d'aquestes o bé algun altre paràmetre i
el que el vegi podrà fer-se una idea de com és el grup. Així, per tant, té una funció descriptiva
IMPORTANT

del grup d'individus que el formen.


Per contra, l'estadística inferencial el que fa és agafar una mostra d'individus de la població i
a partir de les seves característiques calcula els mateixos paràmetres, per exemple la
mitjana d'una variable. Ja us podeu imaginar que aquest valor de la mitjana de la mostra
descriurà aquesta, però no té per què descriure la població en general, ja que només haurem
fet la mitjana de les notes d'una part dels alumnes que formen el grup en el mateix exemple
de l'apartat anterior. El que pretenem fer en aquest cas és a partir de la mitjana de la mostra
IMPORTANT

intentar trobar un valor el més aproximat possible de la mitjana de tota la població.

Per fer el que hem comentat, és evident que no podem agafar una mostra qualsevol. Vegem-ho
amb un exemple molt aclaridor. Imaginau que jo vull conèixer el nivell acadèmic del grup
d'alumnes que ja hem comentat i en lloc de mirar les notes de tots els alumnes (posem que
siguin 150), n'agafo només 15 i en faig la mitjana de les seves notes. La proximitat del valor real
de la mitjana de tots els alumnes, que és el que de fet vull conèixer, i la mitjana de la mostra de
15 alumnes, dependrà de l'atzar en la tria, però també de l'encertada que sigui aquesta tria. Si
agafo els alumnes que són més puntuals a l'aula, que més demanen i intervenen, probablement
la seva nota mitjana serà més alta que la del grup, llavors m'interessarà agafar alumnes que
descriguin el millor possible el grup. Aquesta tria de la mostra és el que discutirem en aquest
primer apartat.

Població i mostra


IMPORTANT

La població és el conjunt de tots els individus que observam en un estudi estadístic.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 4/43
28/3/22, 16:09 BAT_MAP2.7.1

Una mostra és un subconjunt extret de la població, al que li demanarem unes certes


IMPORTANT característiques perquè la representi el millor que pugui.

Exemples de població poden ser els alumnes d'un institut, els ciutadans residents en una ciutat,
els votants d'un partit polític, etc. mentre que mostes d'aquestes poblacions podrien ser un grup
de 25 alumnes agafats entre diferents cursos de l'institut, 200 residents a la ciutat agafats de
diferents barris o un grup de 500 votants del partit polític de diferents edats i d'ambdós sexes. El
fet que especifiquem que els individus de la mostra han de ser diversos no és casual, ja que
sempre ens interessarà que cobreixin totes les característiques de la població. Si vull estudiar el
una característica dels alumnes de l'institut no convé que n'agafi 25 d'un grup de 2n de
batxillerat, sinó que és millor que n'agafi 4 de cada nivell des de primer d'ESO fins a 2n de
batxillerat. O bé si vull estudiar el nivell de renda dels residents de la ciutat, no convé agafi tots
els membres de la mostra del mateix carrer, sinó que millor agafar-ne de diferents barris, ja que
en molts casos la renda va lligada a la zona on es resideix. D'aquesta tria se n'ocuparà la teoria
de mostres.

Les mostres estadístiques

El primer que hem de fer és veure la necessitat de recórrer a una mostra. El millor i de fet exacte
seria estudiar la població, si jo vull conèixer el nivell de renda dels habitants d'una ciutat els ho
demano a tots i en faig la mitjana. Però moltes vegades el grup de població és massa gran o no
és tot accessible o no disposem de prou temps d'estudiar tota la població, així el que hem de fer
és escollir-ne una mostra. També en altres exemples ens podem trobar que la característica que
volem estudiar de la població és destructiva per l'individu, com per exemple l'estudi de la durada
d'una bombeta. Si mesuram el temps que dura una bombeta, aquesta s'espatlla i ja no la podem
vendre i, per tant, el que fem és estudiar-ne una mostra que llavors extrapolam a tota la població.

Llavors en triar una mostra, fer el mostreig, hem d'escollir-la per aconseguir que sigui
representativa. La mostra ha de ser aleatòria, que és una manera de garantir que representi tota
la població. De totes maneres aquesta aleatorietat pot aconseguir-se de diferents maneres, i la
tria del mètode i la seva aplicació farà que aquesta mostra sigui més o menys representativa.


A partir d'aquesta mostra trobarem diferents paràmetres estadístics de la mostra en lloc de
la població que anomenarem estimadors per diferenciar-los dels valors de la població. Així
una població pot tenir una mitjana per una variable estadística, però nosaltres a partir de la
mostra en trobarem una estimació de la mitjana. Com que ens interessa utilitzar aquests
estimadors volem que siguin els més propers al valor de la mostra, que no variïn massa si
IMPORTANT

variam una mica la mostra i s'ha d'apropar més al valor real com més gran sigui la mostra.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 5/43
28/3/22, 16:09 BAT_MAP2.7.1

El mostreig, l'elecció de la mostra, és per si mateix un tema d'estudi que no farem en aquesta
unitat, però ens quedarem amb la idea que aquestes mostres han de ser prou grans i variades
per ser representatives.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 6/43
28/3/22, 16:09 BAT_MAP2.7.1

1.2. Distribució normal


En aquest apartat recordarem la N (0, 1) , una funció de distribució contínua, simètrica
respecte a l'eix OY que té el gràfic i l'expressió que teniu a continuació.

L'expressió és de fet la de la N (μ, σ), on μ és la mitjana, és a dir el punt al voltant del que és
simètrica i σ la desviació típica, que en el nostre cas seran μ = 0 iσ = 1 .
2
x−μ
1 −
1
( )
IMPORTANT

σ
y = −− ⋅ e
2

σ√2π

Recordeu que la funció de distribució ens dona la probabilitat que el valor de la variable es trobi
entre dos valors concrets, i aquesta probabilitat és justament l'àrea per davall de la corba entre
aquests valors. Per exemple si volem conèixer la probabilitat que una variable descrita per una
N (0, 1) estigui entre 0, 4 i 1, 7 haurem de calcular l'àrea de la regió compresa entre la corba i
l'eix OX entre aquests dos punts, representada a continuació.

Aquesta àrea l'hauríem de saber calcular a partir de la primitiva de la funció com hem fet, però
aquest càlcul no és del nivell de 2n de batxillerat i el que farem serà trobar el valor tal i com ho
férem al curs passat, a partir de la taula de valors de la N (0, 1) .

Recordeu que aquesta taula ens dona el valor de la probabilitat entre −∞ i un punt concret 'a',
és a dir el valor de P [x < a] . Si volguéssim la probabilitat P [x < 0, 32] , la superfície
representada és la que veim al gràfic següent:

i aquest valor, el podem aconseguir a la taula de valors de la normal. La taula la tenim a


continuació.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 7/43
28/3/22, 16:09 BAT_MAP2.7.1

Vegem com la podem utilitzar.

El primer que veim a la taula és que la primera fila i la primera columna estan representades en
un color diferent. Aquests valors representen els valors que pot prendre la variable x, i a més la
primera columna representa el valor de les unitats i les dècimes del valor de x i la primera fila el
valor de les centèsimes de la variable. Això vol dir que si estam cercant el valor de x = 0, 32 o
x = 1, 34 a la taula, ens hem de fixar en el valor 0, 3 de la primera columna i el valor 2 de la
primera fila, ja que aquests dos formen les unitats, dècimes i centèsimes del valor demanat, i el
mateix per l'altre valor. Aquests dos exemples estan marcats en color vermell i verd en la imatge
que teniu a continuació.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 8/43
28/3/22, 16:09 BAT_MAP2.7.1

Ens fixam que la fila i la columna marcades en cada cas, ens donen un valor dels que estan
inclosos en l'interior de la taula, pel cas x = 0, 32 el valor donat per la fila i columna triades és
0, 6255 mentre que pel cas de x = 1, 34 és 0, 9099. El que representa aquest valor és la
probabilitat que el valor de x estigui per davall del que determinen la fila i la columna.

Així tenim que P [x < 0, 32] = 0, 6255 i és la superfície representada al gràfic següent.

Mentre que P [x < 1, 34] = 0, 9099 és la superfície representada al gràfic següent.

De totes maneres, com hem vist als exemples dels apartats anteriors, no sempre ens interessa
conèixer la probabilitat d'un esdeveniment d'aquesta forma. Així hem de veure com podem
escriure els altres esdeveniments en funció d'aquests que podrem llegir a la taula.

Tenim tots els esdeveniments descrits a continuació i expressats en funció dels valors que
podem llegir a la taula:

P [x < a] si a ≥ 0 , el llegim directament a la taula.

P [x > a] = 1 − P [x < a] , que ja podem llegir a la taula si a ≥ 0 . (Si a < 0 necessitam


combinar-ho amb el següent cas).

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 9/43
28/3/22, 16:09 BAT_MAP2.7.1

Aquesta igualtat es veu gràficament si comparam les dues imatges que teniu a continuació.
La primera probabilitat P [x > a] és la complementària de la segona, P [x < a] , això vol dir
que les dues han de sumar 1 i per tant a partir d'una podem trobar l'altra.

P [x < a] si a < 0 , l'escriurem com P [x < a] = P [x > |a|] = 1 , que ja podem llegir
− P [x < |a|]

a la taula.
Fixau-vos que a la taula només tenim valors positius i les probabilitats comencen en el valor
0,5. Això és així perquè pels valors negatius, veim que la probabilitat és la mateixa que per un
valor positiu però canviant el sentit de la desigualtat. En els dos gràfics següents veim que
P [x < a] per a negatiu és igual a P [x > |a|] . (Aquesta segona probabilitat la calculam
amb el cas anterior).

P [a < x < b] = P [x < b] − P[x < a] que podem calcular amb el primer i tercer cas
anteriors segons si els valors d' a i b són positius o negatius.
En els gràfics següents es veu que la probabilitat entre dos punts és igual a la resta de les
dues donades.

Vegem-ne alguns exemples.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 10/43
28/3/22, 16:09 BAT_MAP2.7.1

P[x < 0, 61]

Llegim a la taula el valor que correspon a la fila començada amb 0, 6 i la columna començada amb 1 , i tenim:

P[x < 0, 61] = 0, 7291

P[x > 0, 23] = 1 − P[x < 0, 23]

Per tant, hem de llegir a la taula el valor de la fila que comença per 0, 2 i la columna que comença per 3 i ens
queda:

P[x > 0, 23] = 1 − P[x < 0, 23] = 1 − 0, .


5910 = 0, 4090

P[x < −1, 2] = P[x > 1, 2] = 1

− P[x < 1, 2]

Així segons el valor corresponent a la fila 1, 2 i la columna 0 , tenim:

P[x < −1, 2] = P[x > 1, 2] = 1 .


− P[x < 1.2] = 1 − 0, 8849 = 0, 1151

P[−1 < x < 2, 27] = P[x < 2, 27]

− P[x < −1] = P[x < 2, 27]

− (1 − P[x < 1])

Així hem de cercar a la taula els valors 2,27 i 1,00 i substituir-los a l'expressió i ens queda:

P[−1 < x < 2, 27] = P[x < 2, 27]

− P[x < −1] = P[x < 2, 27]

− (1 − P[x < 1]) = 0, 9884


EXEMPLE

− (1 − 0, 8413) = 0, 8297

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 11/43
28/3/22, 16:09 BAT_MAP2.7.1

 EXERCICIS:

1) Sabent que Z és una variable estadística amb una distribució N(0,1), calcula:

a) p(z < 0, 84) b) p(z < 1, 5) c) p(z < 2) d) p(z < 1, 87)

e) p(z < 2, 35) f) p(z < 0) g) p(z < 4) h) p(z = 1)

2) Amb la mateixa variable estadística anterior, calcula:

a) p(z > 1, 3) b) p(z < −1, 3) c) p(z > −1, 3) d)


p(1, 3 < z < 1, 96)

e) p(−1, 96 < z < −1, 3) f) p(−1, 3 < z < 1, 96) g) p(−1, 96 < z < 1, 96)

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 12/43
28/3/22, 16:09 BAT_MAP2.7.1

1.3. Càlculs amb la N(0,1)

En l'apartat anterior hem recordat com fer un càlcul de probabilitat amb la N [0, 1] a partir de la
taula de valors. Però ja vàrem veure al curs passat que no tots els càlculs que farem seran amb
aquesta distribució, sinó que en voldrem fer amb una distribució qualsevol N (μ, σ) . Com que
és impossible disposar d'una taula per cada parell de valors μ i σ, el que feim és convertir les
probabilitats d'una distribució N (μ, σ) i la seva variable x en probabilitats d'una distribució
N [0, 1] i la seva variable z.

En el gràfic que teniu a continuació, teniu representades dues distribucions normals, la funció
N (0, 1) en color blau i la N (3, 2) en color vermell. En el gràfic podem veure la relació entre les
dues corbes, ja que es poden relacionar amb transformacions simples, una translació, que ve
donada per un canvi de variable x → x − 3 , i una dilatació en el sentit de l'eix x donada per una
x
transformació x → (com que la funció ha d'estar normalitzada, és a dir la superfície total
2
tancada amb l'eix OX ha de ser igual a 1, també multiplicam la funció per 1

2
)


Així podem considerar que la primera funció f(z) i la segona, f(x) estan relacionades per la
x − μ
relació entre les seves variables, amb el canvi z = . Aquest canvi, que passa de la
σ
variable x d'una normal N (μ, σ) a una variable z d'una normal N (0, 1) , és el que
IMPORTANT

s'anomena tipificació de la variable.


Si x ve donada per una N (μ, σ), llavors la probabilitat P (x < a) la podem calcular fent

a − μ
P [x < a] = P [z < ]
σ
IMPORTANT

on z ve donada per una N (0, 1) .

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 13/43
28/3/22, 16:09 BAT_MAP2.7.1

Així per qualsevol càlcul que haguem de fer per una x que segueixi una N (μ, σ) , el convertirem
en un càlcul per z seguint una N (0, 1) , que farem amb el canvi de tipificació de la variable i
calcularem com hem vist en el darrer apartat.

Veurem ara alguns exemples de càlcul de probabilitats per variables que segueixin una
distribució normal N (μ, σ) qualsevol tipificant la variable. Per no confondre's en els canvis de
variable seguirem el criteri de representar amb una x la variable de la normal N (μ, σ) i amb
una z la variable de la normal N (0, 1) .


Calculem les probabilitats següents per una variable x en una N (3, 5) .

P [x < 4]

Començarem transformant la distribució a una normal N (0, 1) amb la tipificació


de la variable, per tant la probabilitat que cercam serà

4 − 3
P [x < 4] = P [z < ]
5

= P [z < 0, 20] = 0, 5793

P [x > 2]

Tipificant la variable la probabilitat que cercam serà

2 − 3
P [x > 2] = P [z > ]
5

= P [z > −0, 20] = 1

− P [z < −0, 20] = 1

− (1 − P [z < 0, 20])

= P [z < 0, 20] = 0, 5793

P [1 < x < 6]

Començarem transformant la distribució a una normal N (0, 1) amb la tipificació


de la variable, per tant la probabilitat que cercam serà

P [1 < x < 6]

1 − 3 6 − 3
= P [ < z < ]
5 5

= P [−0, 40 < z < 0, 60]

= P [z < 0, 60] − P [z < −0, 40] =

= P [z < 0, 60] − (1 − P [z < 0, 40])


EXEMPLE

= 0, 7257 − 1 + 0, 6554 = 0, 3811

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 14/43
28/3/22, 16:09 BAT_MAP2.7.1

Calculem la probabilitat P per x seguint una distribució N (3, .
1
[2 < x < 5] )
2

Tenim, un cop tipificada la variable,

P [2 < x < 5]

2 − 3 5 − 3
= P [ < z < ]
1/2 1/2

= P [−2 < z < 4] = P [z < 4]

− P [z < −2] =

= P [z < 4] − (1 − P [z < 2]) = 1,


EXEMPLE

0000 − 1 + 0, 9772 = 0, 9772


Tots els càlculs dels exemples anteriors els heu d'aprendre a fer amb la taula, però si disposau d'una
calculadora científica (moltes d'elles ho fan), podeu trobar directament els valors demanats. També ho
podeu fer a la pàgina web www.geobebra.org, que ja hem mostrat altres vegades, que a més de donar-
vos el valor demanat, també dóna el gràfic de la distribució.
AMPLIACIÓ

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 15/43
28/3/22, 16:09 BAT_MAP2.7.1

A més el Geogebra també permet fer càlculs directament amb qualsevol normal, no només
la N (0, 1) , com podeu veure continuació pel darrer càlcul fet perquè ho pugueu comparar.

De totes formes recordau que els càlculs els heu de saber fer només utilitzant la taula de la
N (0, 1) i que les calculadores només vos han de servir per comprovar els resultats. (Tant a
les tasques com als exàmens, s'han de deixar indicades les operacions tal i com les hem fet,
AMPLIACIÓ

tot i que és una bona manera de practicar i comprovar els resultats.)

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 16/43
28/3/22, 16:09 BAT_MAP2.7.1

 EXERCICIS:

1) En una distribució N(173, 6), troba les següents probabilitats:

a) p(x < 173)

b) p(x > 180, 5)

c) p(174 < x < 180, 5)

d) p(161 < x < 180, 5)

e) p(161 < x < 170)

f) p(x = 174)

g) p(x > 191)

h) p(x < 155)

2) En una distribució N(43,10), calcula:

a) p(x > 43) a) p(x < 30) a) p(40 < x < 55) a) p(30 < x < 40)

3) En una distribució N(151,15), calcula:

a) p(x ≤ 136) b) p(120 ≤ x ≤ 155) c) p(x ≥ 185) d) p(140 ≤ x ≤ 160)

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 17/43
28/3/22, 16:09 BAT_MAP2.7.1

1.4. Intervals característics.

En aquest darrer apartat del capítol introduirem el que s'anomenen intervals característics per
una distribució.


Donada una distribució N (0, 1) normalment els valors que ens interessaran seran els que
estiguin al voltant de la mitjana, el valor 0, així ens interessarà conèixer per una determinada
probabilitat p, quins són els valors k i −k perquè la distribució tengui P [−k < z < k] = p .
IMPORTANT

Aquest interval, (−k, k) pel valor de p donat serà el que anomenarem interval característic.


Vegem un exemple d'interval característic amb una distribució N (0, 1) .

Ens interessa conèixer l'interval característic corresponent a una probabilitat de 0, 9, això és


que si aquesta probabilitat o l'àrea que la representa ha de cobrir el 90% de la superfície
davall la corba de la funció i a més ha d'estar centrada al voltant del 0 , tenim que a cada
costat de l'àrea hi ha d'haver una àrea igual al 5%, ja que les dues han de sumar el 10% que
ens queda. A continuació teniu representada aquesta àrea.

En aquest gràfic només la tenim representada, però per fer-ho haurem de conèixer els punts
que la delimiten (que són (−1, 645; 1, 645) en aquest cas concret), que veurem com
trobar a continuació.
EXEMPLE

De moment ens quedam amb la idea que entre aquests dos punts s'hi troben el 90% dels valors
de la distribució.

Intervals característics en la N (0, 1)


Si volem conèixer l'interval característic corresponent a una probabilitat p, cercarem el valor
de k que verifiqui P [−k < z < k] = p , i aquest valor k s' anomena valor crític. Aquest
valor crític ha de verificar que la probabilitat en l'interval (−k, k) sigui igual a p, o sigui que
fora de l'interval sigui 1 − p . Aquest valor l'anomenam α = 1 − p , i també verifica
IMPORTANT

p = 1 − α (és a dir, si p=0,9, el 90%, α és 0,1, el 10% restant, és bo de calcular).

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 18/43
28/3/22, 16:09 BAT_MAP2.7.1

Així podem escriure la condició per l'interval característic com P [−k < z < k] = p = 1 − α ,
α
o aplicant les propietats vistes a l'apartat 2 per la normal, P [z > k] = , que també podem
2
α
escriure com P [z < k] = 1 − (seguint amb el mateix exemple d'abans, si p = 0, 9 , i tenim
2
α 0, 1
P [−k < z < k] = p = 0, 9 , podem escriure P [z < k] = 1 − = 1− = 1 − 0, 05 .
2 2

= 0, 95

Aquest és el valor que farem servir).

Així per trobar k tal que verifiqui que P [−k < z < k] = p , hem de fer:

α = 1−p

α
P [z < k] = 1 −
2

α
Si ens fixam en la darrera expressió veim que conegut k podem llegir 1 − a la taula de valors
2
α
de la normal i per tant conegut 1 − podrem trobar k, només hem de llegir la taula "a l'inrevés"
2
de com ho hem fet fins ara, cercant la probabilitat p i trobant el valor de k.

Veureu que en molts llibres, el valor de k es representa com z , per tant moltes vegades
α

2
α
escriurem P [−z α < z < z α ] = p = 1−α o P [z < z α ] = 1− , però és només una
2 2 2
2
manera d'escriure el mateix.

Vegem-ho amb un exemple.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 19/43
28/3/22, 16:09 BAT_MAP2.7.1

Volem l'interval característic donat per la probabilitat p = 0, 874 .

El primer que feim és α = 1 − p = 1 − 0, 874 = 0, 1260 .


α
Un cop conegut el valor d' α trobam 1 − , que és
2
α 0, 1260
1 − = 1 − = 1 − 0, 0630 = 0, 9370 . Així tenim que el valor de k cercat
2 2
ens ha de donar una probabilitat igual a 0,9730, així si anam a la taula de la normal i cercam
aquest valor. Trobam,

Així el valor de k per obtenir aquesta probabilitat ha de ser 1,53 i per tant l'interval
característic demanat, (−1.53, 1.53) , com tenim representat a continuació.
EXEMPLE

Si el valor de probabilitat que cercam a la taula no coincideix amb cap, agafarem el que més s'hi
aproximi o bé el valor mitjà entre els dos que l'afiten. Per exemple si el valor que cercam és
0, 7940 , i a la taula apareix el 0, 7939 , agafarem aquest i, per tant, el valor de k seria k = 0, 82 .

En canvi si el valor que cercam és 0, 8520, i a la taula apareixen 0, 8508 i 0, 8531, el valor
cercat es troba just al mig, per tant, a partir dels dos valors de k, 1, 04 i 1, 05 , n'agafam la
mitjana k = 1, 045 . A la figura següent teniu els dos valors representats.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 20/43
28/3/22, 16:09 BAT_MAP2.7.1

Comentau-ho sempre en donar un resultat si feu cap d'aquestes dues aproximacions.

Intervals característics per una N (μ, σ)

Anem a veure com calcular l'interval característic per una normal qualsevol N (μ, σ) . De fet el
procediment és el mateix, perquè utilitzarem la mateixa taula de la distribució N (0, 1) , però el
valor de k que trobam seria vàlid per la N (0, 1) i si el volem per una N (μ, σ) , hem de convertir-
x−μ
lo amb la mateixa transformació vista en l'apartat 3, z = .
σ

x−μ kx − μ
Així si z = , també ±kz = on kz és el valor de k trobat a la taula amb el
σ σ
procediment vist per la N (0, 1) i kx és el que volem trobar per la N (μ, σ) . Per tant l'interval
serà (−kx , kx ) = (μ − kz ⋅ σ, μ + kz ⋅ σ) .

Per una N (μ, σ) , l'interval característic és (−kx , kx ) , que verifica,

P [−kx < x < kx ] = p

Així calculam l'interval característic per N (0, 1) , (−kz , kz ) trobant el valor de kz que verifiqui,

P [−kz < z < kz ] = p

Finalment transformam l'interval amb la zk trobada a l'interval demanat,

(−kx , kx ) = (μ − kz ⋅ σ, μ + kz ⋅ σ) .

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 21/43
28/3/22, 16:09 BAT_MAP2.7.1

Volem l'interval característic per una N (3, 2) i una probabilitat del 80%, és a dir p = 0, 8 .

Així, cercarem l'interval característic per la N (0, 1) , i per tant si


α
p = 0, 8 ⇒ α = 0, 2 ⇒ 1 − = 0, 9 . A la taula de la distribució normal, tenim,
2

Com a valor de p podem agafar 0,8997, que s'hi aproxima més i tendrem kz = 1, 28 .

Per tant l'interval cercat, (−kx , kx ) , serà,

.
EXEMPLE

(−kx , kx ) = (μ − kz ⋅ σ, μ + kz ⋅ σ) = (3 − 2 ⋅ 1.28, 3 + 2 ⋅ 1.28) = (0.44, 5.56)

 EXERCICIS:

1) En una distribució N(173,6), troba els intervals característics per al 90%, el 95% i el 99%.

2) En una distribució N(18,4), troba els intervals característics per al 95% i el 99,8%.

3) Troba l'interval de confiança al 85% per a:

a) Una N(0,1).

b) Una N(2540,190).

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 22/43
28/3/22, 16:09 BAT_MAP2.7.1

2. Inferència estadística. Estimació de la mitjana

En aquest segon capítol introduirem la inferència estadística. El que hem fet fins ara és a partir
d'una distribució teòrica trobar la probabilitat que els valors estiguin en un interval concret o la
probabilitat d'obtenir uns valors concrets. Ara canviarem el tipus de problema, veurem primer
una nova utilitat de la distribució normal, que hem donada com la més important de les
distribucions contínues, i veurem ara que no ho és només pel que apareix en situacions reals,
sinó que per altres distribucions que no són normals, si agafam la distribució de les mitjanes,
aquesta tendeix a una normal per a un nombre de repeticions prou gran. Ho formalitzarem en el
teorema central del límit.

En segon lloc veurem un altre tipus de problemes, on a partir del comportament d'una mostra,
intentarem donar el valor de la mitjana de la població. El valor de la mitjana de la població no pot
deduir-se d'una mostra, perquè aquesta no serà sempre prou representativa però es podrà
inferir, això és que la podrem estimar sempre amb uns marges d'error que veurem com trobar.

Per acabar en la inferència estadística, ens faltarà l'estimació d'una proporció i el contrast
d'hipòtesis que introduirem en la següent unitat.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 23/43
28/3/22, 16:09 BAT_MAP2.7.1

2.1. L'estadística inferencial

Anem a veure en què consisteix la inferència estadística amb un exemple. Suposem que volem
conèixer quantes hores al dia passen els 1000 alumnes d'un institut connectats a alguna xarxa
social. Evidentment, una bona idea d'aquest temps per tot ells ens la dona la mitjana d'aquest
temps. Si podem demanar a tots els alumnes el temps que hi passen tendrem el valor d'aquesta
mitjana. Però en molts casos, per diversos motius que ja hem comentat, no podem accedir als
valors de tots els individus de la població. Així una bona aproximació del valor cercat el podríem
obtenir agafant-ne una mostra de, per exemple, 100 alumnes i suposar que la mitjana d'aquesta
mostra, és igual a la mitjana de la població.

Aquesta aproximació és el que anomenarem estimació puntual, és a dir suposarem que la


mitjana de la població, μ és igual a la mitjana de la mostra, que per diferenciar-la de l'altra
l'anomenarem mitjana mostral i la representarem per x̄
¯¯
. Està clar que aquesta aproximació serà
millor com més ben triada estigui la mostra, cosa que en aquest curs no podrem controlar,
perquè ja hem dit que suposarem que les mostres són representatives. Però hi ha altres
paràmetres que si podrem controlar per quantificar l'aproximació de μ per ¯¯
x.
¯

Evidentment, la millor forma de veure el grau d'aproximació de μ per ¯¯


x seria donar-ne l'error,
¯

però aquest no el podem conèixer, ja que si el coneguéssim, Error = |μ − x̄


¯¯
| tendríem el

valor real de μ, només en podrem donar una estimació d'aquest.

El que farem serà suposar que el valor de μ és igual al valor de ¯¯


x amb un cert marge, és a dir en
¯

un interval al voltant de ¯¯
x, que anomenarem interval de confiança. Aquest interval voldrem que
¯

sigui el més petit possible, però com que no el podem afitar, donarem una probabilitat de què el
valor es trobi en aquest interval. Així donarem expressions del tipus el temps que passen els
alumnes connectats a una xarxa social està entre 60 i 80 minuts. Amb una probabilitat del 90%
o bé el temps està entre 65 i 75 amb una probabilitat del 80%.

Fixau-vos que en l'exemple que hem donat abans, que tot i que no és calculat amb dades reals,
reflecteix el que ens trobarem en els càlculs que farem. Haurem calculat una mitjana mostral,
que serà 70, i el que farem serà donar un interval al voltant d'ell. Si aquest és més ample,
(60, 80) , llavors la probabilitat que el valor real estigui a dins serà més alta, 90%, que si donam
un interval més estret (65, 75) , que serà del 80%. Per tant, si volem més precisió en l'interval la
probabilitat que sigui correcte serà menor, així que haurem de jugar amb aquests dos valors.
Normalment, ens mourem en valors entre el 80 i el 95%, tot i que podrem agafar el que vulguem.

L'interval en el qual fitarem el valor de la mitjana l'anomenarem interval de confiança i el valor de


la probabilitat de què es compleixi l'anomenarem nivell de confiança.

En la unitat següent veurem les mateixes estimacions, però per una proporció. Per exemple
veurem que la proporció d'estudiants amb ulleres es troba en l'interval (0, 2; 0, 3) amb un nivell
de confiança del 98%.

Evidentment, l'amplada de l'interval de confiança i el nivell de confiança estan relacionats, i


venen donats per la grandària de la mostra. Així en els càlculs que farem donarem una estimació
de la mitjana i a partir del nivell de confiança que vulguem i la grandària de la mostra, n,
donarem l'interval.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 24/43
28/3/22, 16:09 BAT_MAP2.7.1

De la mateixa manera que estimam el valor de la mitjana a partir de la mitjana mostral, també
podríem estimar la desviació típica σ a partir de la desviació típica mostral, que anomenarem s
per distingir-les. Però aquesta no és tan fàcil de fer, de fet per a valors de n petits, sol esser
millor aproximació per la desviació típica el valor sn−1 en lloc de s , que ve donat per
−−−−−−−− − −
¯ 2
¯¯
∑(xi − x)
s n−1 = √
n−1

Però que en aquest curs no farem servir, per tant, en tots els càlculs suposarem que σ és
coneguda i la tendrem o l'aproximarem per la desviació típica mostral que hem calculat en
unitats anteriors.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 25/43
28/3/22, 16:09 BAT_MAP2.7.1

2.2. Distribució de les mitjanes mostrals

En aquest apartat introduirem l'anomenat Teorema central del límit, que ens diu que sigui quina
sigui una distribució, si té una mitjana μ i una desviació típica σ, tot i no ser normal, la
distribució de les mitjanes de les mostres de grandària n si que és normal i en podrem conèixer
la mitjana i la desviació típica a partir de les anteriors.

Aquest resultat l'utilitzarem per tractar una distribució de mitjanes d'una distribució desconeguda com a normal, i aprofitar
els càlculs que hem vist al primer capítol i després trobar els valors de μ i σ per inferència de la distribució desconeguda,
que no serà quasi mai normal.

Vegem-ho amb un cas pràctic.

El llançament d'un dau, que pot tenir sis resultats possibles, i equiprobables, ens dona una
distribució com teniu representada a continuació.

Sabem que la distribució no és normal i així es veu, però ara anem a representar el llançament
de 2 daus on observam la mitjana dels dos resultats. Ara els valors poden estar entre 1 i 6 com
abans, però són possibles resultats semi-enters, ja que si obtenim un 1 i un 2, la mitjana és 1, 5 .
El gràfic de la distribució és el que tenim a continuació.

Per acabar repetim el mateix amb tres daus, on ara els resultats es mouen entre 1 i 6, però amb
increments d' 1/3 i amb quatre daus, on els resultats es mouen amb increments d' 1/4. A més

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 26/43
28/3/22, 16:09 BAT_MAP2.7.1

d'augmentar el nombre de resultats possibles, també varia la distribució que cada cop és més
alta als resultats centrals i més "estreta".

De fet, a cada gràfic hi hem representat la mitjana, que no varia, sempre és igual a 3, 5 , i la
desviació típica, que si va disminuint. Així com més gran és n, la distribució de la mitjana dels n
llançaments d'un dau s'assembla més a una distribució normal. Si ho repetíssim per un valor de
n = 30 (llançam 30 daus i miram la mitjana dels resultats), la distribució seria molt semblant a

una normal.


Així podem introduir el Teorema central del límit, que teniu a continuació.

Donada una població amb una distribució qualsevol, amb una mitjana μ i una desviació
típica σ , la distribució de les mitjanes de les mostres de grandària n (és a dir el valor mitjà
de la distribució original si n'agafam n valors), ve donada per una distribució normal amb
una mitjana i una desviació típica que dependen de les originals i són:

La mitjana és la mateixa que la de la població original: μ.


σ
La desviació típica és igual a: − , on σ és la desviació típica de la distribució original.
√n

L'ajustament d'aquesta distribució, com hem vist a l'exemple anterior, millora a mesura que
IMPORTANT

es fa més gran n i és molt bo a partir de n = 30 .

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 27/43
28/3/22, 16:09 BAT_MAP2.7.1

Així per qualsevol distribució amb mitjana μ i desviació típica σ, sabem que els valors de les
mitjanes de mostres de mida n, venen donades per una distribució N (μ, σ
) . Per tant a partir
√n

de la distribució original podem conèixer com es distribuirà la distribució de mitjanes, però


també, a partir d'una mostra, trobant la mitjana de la mostra i la desviació de la mostra, podem
veure quines seran les de la distribució original, amb la mateixa relació. Això és el que farem en
els apartats següents, i que hem anomenat inferència de la mitjana a partir de la mostra.

Per acabar vegem un exemple d'aplicació del teorema central del límit per fer estimacions sobre
una mostra de mitjanes.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 28/43
28/3/22, 16:09 BAT_MAP2.7.1

Una fàbrica de galetes de Mallorca envassa les galetes en bosses de 400g en la seva
cadena de producció. Aquestes bosses segueixen una distribució amb mitjana μ = 400g i
desviació típica σ = 20g . Aquesta distribució no és normal (l'enunciat no ens ho diu) i, per
tant, si volem calcular la probabilitat que una bossa de galetes es desviï una certa quantitat
dels 400g, no ho sabem fer. Però si aquests bosses les aficam dins capses de 50 unitats, i
pesam la capsa, aquesta hauria de pesar 50 ⋅ 400 = 20000g = 20kg . Tanmateix, a més
sabem que la mitjana del pes de les 50 bosses segueix una distribució normal, ara sí perquè
és una mitjana d'una mostra de n , i aquesta és N (400, donades en grams. Per
20
= 50 )
√50

tant, tot i que no sabem calcular la probabilitat que una bossa de galetes tengui un pes
inferior a 390g, perquè no coneixem la distribució, sí que sabem calcular la probabilitat que
la mitjana del pes de les bosses de la capsa de 50 unitats sigui inferior a 390g, perquè
aquesta segueix una distribució normal.

Així tenim, P [x per x seguint una N (400, , que com hem


20
< 390] ) = N (400, 2.83)
√50

fet abans i tipificant la variable és:

390 − 400
P [x < 390] = P [z < ]
2, 83

= P [z < −3, 53] = 1 − P [z < 3, 53]

= 1 − 0.9998 = 0.0002

Fixau-vos que és una probabilitat molt petita, però és que no calculam la probabilitat que
una bossa tengui un pes inferior a 390 g, sinó la probabilitat que la mitjana d'una mostra de
50 bosses el tingui i entre aquestes bosses n'hi haurà que pesaran més i d'altres menys i les
diferències es compensaran entre elles.

Fixau-vos també que enlloc de calcular la probabilitat de la mitjana de les bosses de la


capsa, podríem calcular la probabilitat de tota la capsa que com que conté n bosses (n=50),
seguiria una distribució normal de mitjana n ⋅ μ , (en aquest cas

), i desviació típica n ⋅ , (que en aquest cas és
σ
50 ⋅ 400 = 20000g = 20kg = σ ⋅ √n
√n
−−
20 ⋅ √50 = 141, 4g ), i per tant N (20000, 141.4) donades en grams. Els càlculs amb
qualsevol de les dues són igualment vàlids.
EXEMPLE

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 29/43
28/3/22, 16:09 BAT_MAP2.7.1

 EXERCICIS:

1) Els paràmetres d'una variable són: μ = 16, 4 iσ = 4, 8 . Ens disposam a extreure una
mostra de n = 400 individus.

a) Troba l'interval característic per a les mitjanes mostrales corresponents a una probabilitat
p = 0, 99 .

b) Calcula p(16 < x̄ < 17) .

2) Els sous, en euros, dels treballadors d'una fàbrica es distribueixen N(1200,400). Es tria a
l'atzar una mostra de 25 d'ells. Quina és la probabilitat de què la suma dels seus sous sigui
superior a 35.000€? Troba l'interval característic per a les sumes de 25 individus,
corresponents a una probabilitat del 0,9.

3) L'alçada dels joves d'una ciutat segueix una distribució N (μ, σ). Si el 90% de les mitjanes
de les mostres de 81 joves estan en (173,4;175,8), troba μ i σ . [Indicació: Amb la fórmula
teòrica de l'interval característic munta un sistema de dues equacions igualant les dues
expressions als dos extrems coneguts de l'interval]

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 30/43
28/3/22, 16:09 BAT_MAP2.7.1

2.3. Interval de confiança per a la mitjana

Anem a veure com trobar l'interval de confiança per una distribució de la qual com ja hem
comentat suposam que coneixem el valor de la desviació típic σ. Per fer-ho agafam una mostra
de grandària n, i en calculam la mitjana mostral x̄
¯¯
.


Recordau que sigui quina sigui la distribució original, la distribució de mitjanes mostrals és
normal i l'aproximació és bona si la grandària de la mostra n és major o igual que 30. Si la
distribució original ja és normal, llavors la mostra pot ser de la grandària que vulguem i
IMPORTANT

continuarà essent normal.


Donada una distribució amb σ coneguda, un interval de confiança per la mitjana amb un
nivell de confiança (1 − α) , (mantenim la mateixa notació que pels intervals característics),
és

σ σ
¯¯ ¯¯
(x̄ − z α ⋅ − , x̄ + z
α ⋅ −)
2
√n 2
√n
IMPORTANT

Si el valor de σ no és conegut, el podem aproximar per la desviació típica mostral s.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 31/43
28/3/22, 16:09 BAT_MAP2.7.1

Tenim una variable aleatòria de la que en desconeixem la mitjana, però sabem que la
desviació típica és σ = 5 . Estimau la mitjana de la variable amb un interval de confiança,
amb un nivell de confiança del 95% si hem agafat una mostra de grandària n = 50 i hem
obtingut una mitjana mostral ¯x
¯
¯
= 32 .

Fixau-vos que no s'especifica si la variable aleatòria original és normal, però com que la
mostra té una grandària n = 50 > 30 no és necessari saber-ho. La distribució de la
mitjana mostral és normal.

Així, conegut el nivell de confiança 1 − α = 0, 95 tenim que α = 0, 05 i per tant hem de


trobar el valor de z per l'interval, que en l'apartat 1.4 anomenàvem k. Així cercam un k que
α

verifiqui P [z < k] = 0, 975 , ja que el valor de α = 0, 05 s'ha de dividir per 2 i sumar-lo al


0,95 del nivell de confiança. El valor cercat, a partir de la taula de la N (0, 1) és
k = z α = 1, 96 .
2

Per tant el valor de μ que volem estimar pertany a l'interval de confiança

σ σ
¯
¯¯ ¯
¯¯
(x − z α ⋅ −,x + z
α ⋅ −)
2
√n 2
√n

5 5
= (32 − 1.96 ⋅ −− , 32 + 1.96 ⋅ −−)
√50 √50

= (32 − 1.39, 32 + 1.39)

= (30.61, 33.39)

Així, a nivell de càlcul, el que hem de fer és trobar el valor de k o z α pel nivell de confiança
2

demanat i substituir-lo juntament amb els valors de ¯x , σ i n a l'expressió donada.


EXEMPLE

¯
¯

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 32/43
28/3/22, 16:09 BAT_MAP2.7.1

En una granja de conills volem estimar el pes mitjà dels conills quan arriben a l'edat de ser
venuts. El propietari n'agafa una mostra de 30 i els pesa, obtenint una mitjana de 2,6kg i una
desviació típica mostral s = 0, 1 . Si volem saber la mitjana del pes de tots els conills de la
granja amb un nivell de confiança del 90%, quin serà l'interval de confiança per aquesta
mitjana?

Cercam un interval de confiança per la mitjana μ i coneixem la desviació típica σ = 0, 1 , la


grandària de la mostra n = 30 i la mitjana mostral x̄
¯
¯
= 2, 6 . Així per un nivell de confiança

del 90% tenim 1 − α = 0, 9 i per tant volem P [z < z α ] = 0, 95 . A partir de la taula de la


2

distribució N (0, 1) tenim que z α = 1, 645 .


2

Per tant, un cop tenim totes les dades, l'interval de confiança per la mitjana és,

σ σ
¯¯ ¯¯
(x̄ − z α ⋅ − , x̄ + z
α ⋅ −)
2
√n 2
√n

0.1
= (2.6 − 1.645 ⋅ −− , 2.6 + 1.645
√30

0.1
⋅ −− ) = (2.6 − 0.03, 2.6 + 0.03)
√30
EXEMPLE

= (2.57, 2.63)

 EXERCICIS:

1) D'una variable estadística, coneixem la desviació típica, σ = 8 , però en desconeixem la


mitjana, μ. Per tal d'estimar-la, extreim una mostra de grandària n = 60 la mitjana de la qual
és x̄ = 37 . Estima μ mitjançant un interval de confiança del 99%.

2) A una mostra de 50 joves, trobam que la dedicació mitjana diària d'oci és de 400 minuts i la
seva desviació típica de 63 minuts. Calcula l'interval de confiança de la mitjana de la població
al 95% de nivell de confiança.

3) Les mides dels diàmetres d'una mostra a l'atzar de 200 coixinets de bolles donaren una
mitjana de 2 cm i una desviació típica de 0,1 cm. Troba els intervals de confiança del 68,26%,
95,44% i 99,73% per al diàmetre mitjà de tots els coixinets.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 33/43
28/3/22, 16:09 BAT_MAP2.7.1

2.4. Nivell de confiança, error admissible i grandària de la mostra

En l'apartat anterior hem trobat el valor de l'interval de confiança per la mitja d'una distribució a
partir dels valors de la desviació típica, del nivell de confiança i de la grandària de la mostra, σ,
1−α i n respectivament. Aquest és:

σ σ
¯¯ ¯¯
(x̄ −z α ⋅ , x̄ +z α ⋅ )
− −
2
√n 2
√n

on el valor crític z α el trobam amb la taula de la distribució N (0, 1) .


2


Si ens fixam en l'interval de confiança veim que l'interval està centrat en x̄
¯¯
i el podem
IMPORTANT

σ
escriure com (¯x
¯
¯
− E, x + E) , on E és anomenat error admissible i val E
¯
¯¯
= z α
⋅ − .
2
√n

Així el mateix exercici el podem plantejar des de tres punts de vista diferents, que tenim a
continuació.

Podem donar l'interval de confiança o l'error admissible com hem fet als exemples de
σ
l'apartat anterior. Tenim E = z α ⋅

i l'interval de confiança és
2
√n

σ σ
¯¯
(x̄ −z α ⋅

¯¯
, x̄ +z α ⋅

) , donat en funció de la grandària de la mostra i del nivell
2
√n 2
√n

de confiança.
Podem donar la grandària de la mostra que necessitam per un nivell de confiança donat i un
error admissible màxim. Simplement, hem d'aïllar el valor de n de l'expressió de l'error i tenim,
2
z α ⋅σ
n = (
2
) .
E

I podem donar el nivell de confiança per un error i una grandària de la mostra desitjats, aïllant

E ⋅ √n
el valor de z α de l'expressió de l'error admissible, z α = . Un cop tenim el valor de
2 2
σ
z α a la taula de la N (0, 1) trobam el nivell de confiança.
2

En tots tres casos el plantejament i en càlcul són els mateixos, només canviam el que coneixem
i volem aïllar. Vegem-ne dos exemples per trobar la grandària de la mostra i el nivell de
confiança.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 34/43
28/3/22, 16:09 BAT_MAP2.7.1

En el mateix exemple de la granja de conills de l'apartat anterior, on tenim σ = 0, 1 . Ara no
volem trobar l'error per una mostra de grandària donada com hem fet, sinó quina ha de ser la
grandària de la mostra perquè l'error sigui igual a 0,04 amb un nivell de confiança del 90%.

Tenim E = 0, 04 , 1 − α = 0, 9 i σ = 0, 1 . Aixi amb el nivell de confiança trobam el valor


critic z fent P [z < z ] = 0, 95 ⇒ z = 1, 645 , i substituïm a l'expressió de n,
α α α

2 2 2

2 2
z α ⋅ σ
2
1, 645 ⋅ 0, 1
n = ( ) = ( )
E 0, 04

= 16, 91

On agafarem sempre el valor sencer superior, en aquest cas n = 17 ha de ser la grandària


mínima de la mostra per aconseguir la precisió demanada.
EXEMPLE


En el mateix exemple de la granja de conills, ara volem saber quin és el nivell de confiança si
tenim el mateix valor de σ = 0, 1 , i volem un error admissible màxim de 0,05 per una
mostra de 20 conills.

Així tenim E ,
= 0, 05 n = 20 iσ = 0, 1 per tant, substituint a l'expressió de z α vista
2

abans, tenim,
− −−
E ⋅ √n 0, 05 ⋅ √20
z α
= = = 2, 24
2
σ 0, 1

A partir d'aquest valor de z , a la taula de la N (0, 1) trobam la probabilitat p


α = 0, 9875 ,
2

però alerta perquè aquesta probabilitat no és el nivell de confiança, ja que α s'ha dividit per
1 − 0, 9875
dos, per tant aquesta α

2
s'ha de restar: 0, 9875 − = 0, 98125 i per tant
2
tenim un nivell de confiança del 98,75%.
EXEMPLE


Fixau-vos que per trobar el valor del nivell de confiança hem de restar al valor de la
AMPLIACIÓ

probabilitat trobat a la taula la meitat del que li falta per arribar a 1.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 35/43
28/3/22, 16:09 BAT_MAP2.7.1

 EXERCICIS:

1) Sabem que la desviació típica dels pesos dels pollastres adults és 300 grams. Volem
estimar el pes mitjà dels pollastres adults d'un granja amb un error menor que 100 grams, i
per això, prenem una mostra de 50 individus. Amb quin nivell de confiança podrem realitzar
l'estimació?

2) S'ha pres una mostra aleatòria de 100 individus als quals se'ls ha mesurat el nivell de
glucosa en sang, obtenint-ne una mitjana mostral de 100 mg/cm3. Sabem que la desviació
típica de la població és de 20 mg/cm3.

a) Obteniu un interval de confiança, al 90%, per al nivell de glucosa en sang en la població.

b) Quin error màxim es comet a l'apartat a)?

3) Si el consum, en litres, de llet per persona al mes segueix una distribució normal amb
σ = 6 litres:

a) Quina grandària mostral es necessita per tal d'estimar el consum mitjà amb un error menor
que un litre i un nivell de confiança del 96%?

b) Si la mitjana del consum mensual de llet per persona fos igual a 21 litres, trobau la
probabilitat que la mitjana d'una mostra de 16 persones sigui més gran que 22 litres.

4) A certa població una variable aleatòria segueix una llei normal de mitjana desconeguda i
desviació típica 2.

a) Observada una mostra de grandària 400, presa a l'atzar, s'ha obtingut una mitjana mostral
igual a 50. Calculau un interval, con el 97% de confiança, per a la mitjana de la població.

b) Amb el mateix nivell de confiança, quina grandària mínima ha de tenir la mostra perquè
l'amplitud de l'interval que s'obtengui sigui, com a màxim, 1?

5) Suposem que, a partir d'un mostra aleatòria de grandària n = 25 , se ha calculat l'interval


de confiança per a la mitjana d'una població normal, obtenint-ne una amplitud igual a ±4. Si
la grandària de la mostra hagués estat n = 100 , romanent invariables tots els altres valors
que intervenen en el càlcul, quina hauria estat la grandària de l'interval?

6) Mitjançant una mostra de 100 individus, estimam l'alçada d'un col·lectiu de persones amb
un nivell de confiança del 95%. L'error màxim admissible obtingut és E = 1, 274 . Quina és la
desviació típica de la mostra obtinguda?

7) Un pagès vol estimar el pes mitjà de les taronges que produeix, amb un error menor que 10
grams, utilitzant una mostra de 81 taronges. Sabent que la desviació típica poblacional és de

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 36/43
28/3/22, 16:09 BAT_MAP2.7.1

36 grams, quin serà el màxim nivell de confiança amb què realitzarà l'estimació?

8) Es vol estimar el sou mitjà d'un treballador del transport públic. Es pren per a tal fi una
mostra de 625 treballadors i s'obté un sou mitjà mostral de 1.480€. Si la desviació típica és
igual a 250€:

a) Amb un nivell de confiança del 90%, determinau l'interval de confiança per al sou mitjà d'un
treballador del transport públic.

b) Si es vol que l'error màxim de l'estimació sigui de 10€, troba la grandària de la mostra que
s'ha de prendre considerant un nivell de confiança del 99%.

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 37/43
28/3/22, 16:09 BAT_MAP2.7.1

3. Exercicis resolts.

1. Volem conèixer el nivell de formació de la nostra ciutat a partir dels estudis cursats pels seus
habitants amb un estudi estadístic. Donau la població i la variable que estudiarem així com una
mostra, justificant-ne la seva tria per a que sigui el més representativa possible.

Mostrar solució
Ocultar solució

La població és el conjunt d'habitants que resideixen a la ciutat.

La variable estadística que estudiarem és el curs més elevat finalitzat per cada un dels individus
de la població: estudis primaris, secundaris, post-obligatoris, etc.

Pel que fa a l'enquesta, tot i que en alguns casos com per exemple al padró municipal, es
demana a tots els ciutadans la titulació que tenen, en aquest cas per qüestions de temps,
econòmiques o d'altres es vol fer l'estudi amb una mostra. Aquesta s'ha de triar, apart de
contenint un nombre suficient d'individus, amb una representativitat de tota la població.

Triarem la mateixa proporció d'individus per cada franja d'edat, per exemple de 10 anys
d'amplada, que té la població real. Això és important perquè no totes les generacions tingueren
les mateixes possibilitats d'estudiar i no són comparables una generació de 60 anys amb una de
30.

També respectarem la proporció de la mostra triada pel que fa al nivell econòmic, i al barri de
residència, ja que aquesta també influeix en l'hàbit o el nivell d'estudis, especialment en la
població de més edat.

Enllaçant amb el darrer punt també voldrem una mostra amb paritat de gènere, també important
en les possibilitats d'estudi en les generacions de més edat.

Finalment, dins aquests paràmetres, farem una tria a l'atzar, ja que si la mostra és prou gran, és
una bona manera d'aconseguir una mostra el més representativa possible.

2. Per una distribució N (0, 1) trobau el valor de les probabilitats següents:

, ,
P [x < 0, 27] P [x > 1, 46] P [x < −1, 75] i P [−0, 45 < x < 1, 27]

Mostrar solució
Ocultar

P[x < 0, 27]

Llegim a la taula el valor que correspon a la fila començada amb 0,2 i la columna començada
amb 7, i tenim P[x < 0, 27] = 0, 6065

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 38/43
28/3/22, 16:09 BAT_MAP2.7.1

P[x > 1, 46] = 1 − P[x < 1, 46]

Per tant hem de llegir a la taula el valor de la fila que comença per 1,4 i la columna que
comença per 6 i ens queda

P[x > 1, 46] = 1 − P[x < 1, 46] = 1 .


− 0, 9279 = 0, 0721

P[x < −1, 75] = P[x > 1, 75] = 1

− P[x < 1, 75]

Així segons el valor corresponent a la fila 1,7 i la columna 5, tenim

P[x < −1, 75] = P[x > 1, 75] = 1 .


− P[x < 1.75] = 1 − 0, 9599 = 0,

0401

P[−0, 45 < x < 1, 27] = P[x < 1, 27]

− P[x < −0, 45] = P[x < 1, 27]

− (1 − P[x < 0, 45])

Així hem de cercar a la taula els valors 1,27 i 0,45 i substituir-los a l'expressió i ens queda

P[−0, 45 < x < 1, 27] = P[x < 1, 27] .


− P[x < −0, 45] = P[x < 1, 27]

− (1 − P[x < 0, 45]) = 0, 8980

− (1 − 0, 6736) = 0, 5716

3. Calculem les probabilitats següents per una variable x en una N (2.1, 3.4) : P [x < 2, 5] ,
P [x > 3, 44] i P [1, 2 < x < 6, 1] .

Mostrar solució
Ocultar

P [x < 2, 5]

Començarem transformant la distribució a una normal N (0, 1) amb la tipificació de la


variable, per tant la probabilitat que cercam serà

2, 5 − 2, 1
P [x < 2, 5] = P [z < ]
3, 4

= P [z < 0, 12] = 0, 5478

P [x > 3, 44]

Tipificant la variable la probabilitat que cercam serà

3, 44 − 2, 1
P [x > 3, 44] = P [z > ]
3, 4

= P [z > 0, 39] = 1 − P [z < 0, 39] = 1

− 0, 6517 = 0, 3483

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 39/43
28/3/22, 16:09 BAT_MAP2.7.1

P [1, 2 < x < 6, 1]

Començarem transformant la distribució a una normal N (0, 1) amb la tipificació de la


variable, per tant la probabilitat que cercam serà

P [1, 2 < x < 6, 1]

1, 2 − 2, 1 6, 1 − 2, 1
= P [ < z < ]
3, 4 3, 4

= P [0, 26 < z < 1, 18] = P [z < 1, 18]

− P [z < 0, 26] = 0, 8810 − 0, 6026 = 0,

2784

4. Trobau els intervals característics corresponents a unes probabilitats del 75% i del 84%, per
una N (0, 1) i N (1, 3) respectivament.

Mostrar solució
Ocultar

Per una probabilitat del 75% a una N (0, 1) tenim, p = 0, 75 i volem,

P [−k < z < k] = P [−z α < z < z α ] = p = 1


2 2

− α = 0, 75 ⇒ α = 0, 25 ⇒ P [z < k] = 1

α
− = 0, 875
2

Per tant el valor de k o z α és 1,15 (el valor de p és 0,8749 molt proper a 0,875). Així l'interval
2

característic és (−1.15, 1.15) .

La representació de l'interval característic és,

Per una probabilitat del 84% a una N (1, 3) tenim, p = 0, 84 i volem,

P [−k < z < k] = P [−z α < z < z α ] = p = 1


2 2

− α = 0, 84 ⇒ α = 0, 16 ⇒ P [z < k] = 1

α
− = 0, 92
2

Per tant el valor de k o z α és 1,405 (els valors de p que trobam a la taula són 0,9192 i 0,9207
2

que corresponen a valors de k iguals a 1,40 i 1,41, per tant agafam el valor mitjà dels dos). Així
l'interval característic per z seria (−1.405, 1.405) i convertit a x, que és el que volem ens

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 40/43
28/3/22, 16:09 BAT_MAP2.7.1

queda, (−kx , kx ) = (μ − kz ⋅ σ, μ + kz ⋅ σ) .
= (1 − 1.405 ⋅ 3, 1 + 1.405 ⋅ 3)

= (−3.22, 5.22)

La representació de l'interval característic és, per la N (0, 1) i per la N (1, 3)

On podem apreciar bastant bé que tot i tenir una escala diferent als eixos, representen la
mateixa superfície.

5. En que consisteix l'estimació de la mitjana per inferència estadística a partir d'una mostra?

Mostrar solució
Ocultar

Consisteix en agafar una mostra d'una població de la que no en coneixem la mitjana μ, calcular
la mitjana de la mostra, ¯¯
x, i aproximar el valor de la mitjana poblacional μ per la mitjana mostral
¯

x sempre amb un error donat en forma d'interval degut a l'error estadístic comès en la tria de la
¯¯
¯

mostra. No direm que la μ és igual a x̄


¯¯
sinó que és troba en l'interval (x̄
¯¯ ¯¯
− E, x̄ + E) .

També podem dir que aquest error E depèn de la grandària de la mostra i de la seguretat que
volem de que el valor real estigui en l'interval donat, cosa que no podrem assegurar al 100%.

6. El temps d'espera mitjà dels pacients en un servei d'urgències és de 14 minuts amb una
desviació típica de 4 minuts i segueix una distribució normal.

a) Quina serà la distribució del temps mitjà d'espera d'un grup de 16 pacients?

b) Quina serà la probabilitat que le temps mitjà per aquests 16 pacients estigui comprès entre 10
i 15 minuts?

Mostrar solució
Ocultar

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 41/43
28/3/22, 16:09 BAT_MAP2.7.1

a) El primer que hem de veure en aquest exercici és que agafam una mostra de grandària
n = 16 que a partir del teorema central del límit volem aproximar per una distribució normal,
cosa que podem fer tot i que la mostra té una grandària inferior a 30 perquè la distribució
original ja és normal, és una N (14, 4) . (Si no fos així no seria aplicable).
σ
Així el teorema ens diu que la mitjana de la mostra segueix una distribució normal N (μ, −
)
√n

on μ i σ són els paràmetres de la distribució original. Per tant aquesta distribució serà
4
N (14, −− ) = N (14, 1) . Podem veure que la distribució té la mateixa mitjana que la
√16

original, és a dir que el temps d'espera mitjà és el mateix per la mostra que per la població total,
però la desviació típica és menor, és a dir, que la distribució és més "estreta" a la mostra, cosa
esperable, ja que si enlloc de mirar el temps d'espera d'una sola persona miram el d'un grup de
16, els excessos d'uns es compensaran pels defectes d'altres i així els valors reals s'aproximem
més als mitjans.

b) Ara, com que sabem quina és la distribució de la mitjana de els mostres, podem trobar la
probabilitat perquè una mitjana estigui entre dos valors, P [10 < x < 15] per la N (14, 1) .
Aquesta és,

10 − 14
P [10 < x < 15] = P [ < z
1

15 − 14
< ] = P [−4 < z < 1] = P [z < 1]
1

− P [z < −4] = P [z < 1] − (1 − P [z < 4])

= 0, 8413 − 1 + 1 = 0, 8413

Fixau-vos que a partir de z = 3, 9 el valor de la probabilitat ja és 1 a la taula utilitzada, tot i que


si tenguessim més xifres decimals, tendríem 0,999999...

7. El pes dels paquets rebuts en un magatzem es distribueix amb una desviació típica 5 kg. Quin
és l'interval de confiança per la mitjana, amb un 95% de nivell confiança, si en una mostra de 100
paquets, que és el que transporta normalment un vehicle de l'empresa, la mitjana del pes és
igual a 30 kg?

Mostrar solució
Ocultar

En aquest cas aproximam la mitjana dels pesos de la població per la d'una mostra de 100
σ σ
paquets, que estarà en l'interval (x̄
¯¯
−z α ⋅

¯¯
, x̄ +z α ⋅

) .
2
√n 2
√n

Hem de calcular z α a partir del nivell de confiança del 95% i això suposa
2

P [z < z α ] = 0, 975 ⇒ z α = 1, 96 .
2 2

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 42/43
28/3/22, 16:09 BAT_MAP2.7.1

σ σ
Així l'interval de confiança serà (¯¯
¯
x −z α ⋅

¯¯
¯
,x +z α ⋅

) , que és
2
√n 2
√n
5 5
(30 − 1.96 ⋅ −−− , 30 + 1.96 ⋅ −−−) .
√100 √100

= (29.02, 30.98)

Això vol dir que de cada 100 viatges que faci el vehicle, 95 tendran un pes pel 100 paquets entre
2902 i 3098 kg, però en 5 de cada 100 ens sortirem d'aquests límits. Això podria ser útil si
sabem que la càrrega màxima del vehicle és de 3100 kg, ja que així sabem que en un 5% dels
casos ens podem passar per sota però també per sobre.

8. Una marca de cotxes vos estudiar el consum dels seus vehicles als 100 km, que sap que es
distribueix amb una desviació típica de 0,7 l. Per fer-ho agafarà una mostra i vol que l'error
comès sigui menor de 0,1 l. Si volem que el nivell de confiança del resultat sigui del 98%, quina
ha de ser la grandària de la mostra?

Mostrar solució
Ocultar

En aquest cas coneixem el valor de l'error E i del nivell de confiança, que ens donarà z α i σ, i
2
2
z α ⋅σ
volem trobar n a partir de la fórmula n = ( 2
) .
E

Trobarem primer el valor de z α a partir del nivell de confiança del 98% i això suposa
2

P [z < z α ] = 0, 99 ⇒ z α = 2, 33 .
2 2

2 2
z α ⋅σ
2
2, 33 ⋅ 0, 7
n = ( ) = ( ) = 266, 01
E 0, 1

Així com que n ha de ser un nombre enter, agafarem el valor n=266 (tot i que també podríem
agafar 267).

https://iedib.net/avirtual/mod/book/tool/print/index.php?id=3420 43/43

You might also like