You are on page 1of 8

Exercicis Mòdul 5

Estadística
Bàtxelor en Informàtica
Javier González-Casallo

Els continguts d’aquesta obra estan subjectes a una llicència de Reconeixement - No comercial - Sense obres
derivades 3.0 de Creative Commons. Se’n permet la reproducció, distribució i comunicació pública sempre que
se’n citi l’autor i no se’n faci un ús comercial. La llicència completa es pot consultar
a: http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.ca
Exercici 1
Analitzant una mostra aleatòria 𝑋1 , … , 𝑋36 extreta d’una població 𝑋 que segueix una
distribució normal d’esperança 𝜇 i desviació típica 𝜎 = 0,15 s’obté 𝑋̅ = 2,25.
Contrasteu la hipòtesi 𝐻0 : 𝜇 = 2,5 contra 𝐻1 : 𝜇 ≠ 2,5 utilitzant un nivell de significació 𝛼 =
5%.

Exercici 2
Analitzant una mostra aleatòria 𝑋1 , … , 𝑋20 extreta d’una població 𝑋 que segueix una
distribució normal d’esperança 𝜇 i desviació típica 𝜎 s’obté 𝑋̅ = 20,44 i 𝑆 = 1,297.

1. Contrasteu la hipòtesi 𝐻0 : 𝜇 = 20,5 contra 𝐻1 : 𝜇 ≥ 20,5 utilitzant un nivell de significació


𝛼 = 1%.
2. Contrasteu la hipòtesi 𝐻0 : 𝜎 = 0,9 contra 𝐻1 : 𝜎 ≤ 0,9 utilitzant un nivell de significació
𝛼 = 5%.

Exercici 3
El temps necessari (en hores) per resoldre un determinat problema d’estadística segueix una
distribució normal 𝑁(2; 0,5). A fi de disminuir aquest temps, es decideix simplificar aquest
problema eliminant algun del seus apartats.

1. Especifiqueu quin contrast d’hipòtesis caldria realitzar per verificar que les simplificacions
realitzades han estat útils.
2. Especifiqueu quin estadístic de prova cal utilitzar per realitzar aquest contrast i quina serà la
regió crítica si 𝛼 = 5%.

Exercici 4
A fi d’avaluar el consum d’un nou model d’automòbil, el fabricant selecciona 10 conductors
voluntaris per efectuar proves. Els consums (en litres per 100 km) aconseguits per cadascun
dels 10 conductors desprès de recórrer una distància de 250 km han estat els següents:

9 9,23 9,52 9,15 10 10,01 9,85 9,95 10,5 10,6

El fabricant vol fer una campanya publicitària anunciant que per a viatges de més de 200 km, el
consum és inferior als 10 litres per cada 100 km.

Suposant que el consum (en litres per 100 km) es distribueix segons un model normal 𝑁(𝜇; 𝜎),
i treballant amb una significació del 5%, determineu si els resultats obtinguts en aquesta
mostra contradiuen l’afirmació del fabricant.
Exercici 5
Hem generat dues mostres de nombres aleatoris extrets de poblacions normals 𝑁(𝜇1 ; 𝜎1 ) i
𝑁(𝜇2 ; 𝜎2 ).

MOSTRA 1
16,7105 19,3667 13,3843 10,2034 14,9573 15,6362 12,9426
12,1883 9,9393 20,1271 14,9329 10,6105 13,7588 14,021
16,4171 16,0285 14,2832 14,2457 14,5469 17,0853 18,4146

MOSTRA 2
11,6558 11,1332 16,9702 15,6541 17,4125 14,3138 10,7664
13,4858 15,2028 13,5575 11,9374 16,6161 14,1234 13,5573
13,5892 13,5285 13,3482

1. Determineu si, treballant amb un nivell de significació del 5%, és assumible que ambdues
mostres provenen de poblacions amb idèntica esperança (𝜇1 = 𝜇2 ).
2. Repetiu la pregunta anterior per les variàncies 𝜎12 = 𝜎22 .

Exercici 6
Segons les dades facilitades pel ministeri de salut i benestar d’un determinat país, el 40% de la
població presenta problemes d’obesitat. Per comprovar si aquesta afirmació és compleix en
una determinada ciutat, s’avalua el pes d’una mostra aleatòria formada per 200 individus i
s’observa que 92 són obesos.

1. Contrasteu, amb un nivell de significació del 5%, si la proporció d’obesos d’aquesta ciutat és
diferent a la del conjunt del país.
2. Canvia alguna cosa si s’utilitza un nivell de significació del 1%?
3. Determineu entre quins valors (mínim i màxim) pot variar el nombre d'obesos mostral per a
què la conclusió del contrast, a un nivell de significació del 5%, sigui no refusar la hipòtesi
nul·la 𝐻0 : 𝑝 = 0,4.

Exercici 7
El preu P d’un article es pot modelitzar per una variable aleatòria 𝑁(𝜇; 10). Per contrastar les
dues hipòtesis 𝐻0 i 𝐻1 definides com:
𝐻0 : 𝜇 = 30
{
𝐻1 : 𝜇 > 30 (𝜇 = 40)

es selecciona una mostra de 25 articles, s’anota el preu de cadascun.


Si s’adopta la següent regla de decisió:

“Si la mitjana mostral és inferior o igual a 35 aleshores s’accepta 𝐻0 ”.

1. Determineu la probabilitat de cometre un error de tipus I.


2. Determineu la probabilitat de cometre un error de tipus II.
3. Determineu quina és la regla de decisió i la probabilitat de cometre un error de tipus II si se
sap que 𝛼 = 1%.
Exercici 8
Es disposa d’una mostra aleatòria formada per 40 individus extreta d’una població P . Per fer
inferència sobre el valor de 𝜇 , es contrasta les hipòtesis definides com:

𝐻0 : 𝜇 = 16
{
𝐻1 : 𝜇 = 24

adoptant la regla de decisió R definida com:

R: Si la mitjana mostral és inferior o igual a 20 aleshores s’accepta 𝐻0 i,


en cas contrari, s’accepta 𝐻1

Sabent que P segueix una distribució normal amb desviació típica 3, calculeu:

1. La probabilitat de cometre un error de tipus I.


2. La probabilitat de cometre un error de tipus II.
3. La regla de decisió i la probabilitat de cometre un error de tipus II quan 𝛼 = 5%.

Exercici 9
El temps T (en hores) necessari per preparar un control presencial d’una determinada
assignatura és en promig d’unes 4 hores. D’altra banda, se sap que un 90% dels alumnes
dediquen més de 3,5 hores per preparar cada control. Suposem que T segueix una distribució
normal amb esperança 𝜇 i variància 𝜎 2 .

1. Calculeu el valor de 𝜎 suposant que 𝜇 = 4 i que la probabilitat que T sigui superior o igual a
3,5 hores és del 90%.
2. Avaluant els temps que han trigat 100 estudiants per preparar un dels controls s’ha
obtingut un temps mitjà de preparació de 4,06 hores i una desviació típica mostral 𝑆 =
0,387. A partir d’aquests resultats efectueu una prova d’hipòtesis bilateral per decidir si es
pot acceptar que 𝜇 = 4 (utilitzeu un nivell de significació del 5%).
3. D’altra banda, avaluant els temps que han trigat 250 estudiants per preparar un dels
controls, hem obtingut que 218 han trigat més de 3,5 hores. A partir d’aquest resultat
efectueu una prova d’hipòtesis per determinar si es pot acceptar que el 90% del estudiants
dediquen més de 3,5 hores per preparar el seus controls (utilitzeu un nivell de significació
dels 5%)

Exercici 10
Fa 7 anys, 30 persones van invertir un part dels seus estalvis en diferents productes financers.
A data d’avui, les rendibilitats (en percentatge) d’aquestes 30 inversions 𝑋1 , … , 𝑋30 són les que
es detallen en les mostres 1 i 2 següents.

MOSTRA 1
2,2 5 3,9 7 2,7 5,3 3,2 4,3 3 3
4 4,6 3,8 4,6 4,8 5 2,6 2,4 1,7 2,6
MOSTRA 2
8 8,3 4 5 5,2 7,8 3 4,5 1,1 2,8

Concretament, les rendibilitats de la mostra 1 corresponen a persones que es consideren


expertes en finances. Les de la mostra 2, en canvi, corresponen a persones que no tenen cap
coneixement financer. D’altra banda, es suposa que les mostres 1 i 2 s’han extret de dues
poblacions normals independents 𝑁(𝜇1 , 𝜎1 ) i 𝑁(𝜇2 , 𝜎2 ).

1. Determineu si, treballant amb un nivell de significació del 5%, és assumible que ambdues
mostres provenen de poblacions amb idèntica esperança (𝜇1 = 𝜇2 ).
2. Repetiu la pregunta anterior per les variàncies (𝜎12 = 𝜎22 ).
3. Quines conclusions es poden treure dels resultats obtinguts en els dos apartats anteriors?

Exercici 11
A fi de comercialitzar el seu nou producte estrella, un agent comercial d’una companya
asseguradora visita 8 llars cada dia, durant un període de 150 dies. El nombre de nous
contractes aconseguits per dia es resumeix en la següent taula:

Nombre de nous
0 1 2 3 4 5 6 7 8
contractes
Nombre de dies 4 15 30 43 31 18 5 3 1

A partir d’aquests resultats, determineu, utilitzant un nivell de significació del 10%, si el


nombre de contractes diaris es pot modelitzar per una distribució binomial B(8; 0.4).

Exercici 12
S’ha analitzat, durant 90 períodes d’una hora escollits de forma aleatòria, el nombre d’usuaris
d’un caixer automàtic d’una determinada entitat bancària. Els resultats obtinguts es mostren
en la següent taula:

Nombre
Nombre d'hores
d'usuaris
0 15
1 5
2 25
3 40
4 2
5 1
6 2

Determineu, utilitzant un nivell de significació del 1%, si el nombre de clients per hora es pot
modelitzar per una distribució de Poisson P(3).
Exercici 13
Es generen de forma aleatòria 60 números del 0 al 9 {0, 1, 2, 3,..., 9}. Els resultats obtinguts
han estat els següents:

Números 0 1 2 3 4 5 6 7 8 9

Freqüència 5 5 8 5 5 5 9 5 6 7

Determineu si aquests números es distribueixen de manera uniforme (utilitzeu un nivell de


significació del 5%).

Exercici 14
Una empresa de distribució vol estudiar si l’edat D dels seus empleats es pot modelitzar per
una distribució Normal N(μ; 100) . Considerant l’edat de cada empleat s’obté la següent
distribució de freqüències:

Intervals
[10, 20[ [20, 30[ [30, 40[ [40, 50[ [50, 60[ [60, 70[
d'edat
Nombre
9 13 22 10 7 4
d'empleats

Argumenteu a quina conclusió s’arribarà si s’utilitza una prova d’hipòtesis apropiada al 5% de


significació.

Exercici 15
Es vol realitzar un estudi estadístic per contrastar la hipòtesi segons la qual, en cada
naixement, la probabilitat de tenir un nen és igual a la probabilitat de tenir una nena. Després
d’analitzar el nombre de nenes d’una mostra aleatòria de famílies que han tingut 6 infants,
s’obtenen els següents resultats:

Nombre de Nombre de
nenes famílies
0 6
1 35
2 66
3 59
4 28
5 3
6 3

Utilitzant una prova del khi-quadrat, determineu si la distribució de freqüències obtinguda és


compatible amb la hipòtesi d’igualtat dels sexes al naixement. (Justifiqueu la resposta i
utilitzeu un nivell de significació del 5%).
Exercici 16
Una universitat té un programa de concessió de beques d’investigació. La quantia de les
beques depèn del tema del treball que es vol desenvolupar i de la dedicació de cada estudiant.
Examinant la quantia d’una mostra de 150 beques s’obté la següent distribució de freqüències:

Quantia de la beca Nombre de


(en centenars d'€) beques
[40, 50[ 9
[50, 60[ 24
[60, 65[ 28
[65, 70[ 35
[70, 75[ 30
[75, 80[ 21
[80, 100[ 3

A partir d’aquests resultats, determineu si, amb un nivell de significació del 5%, es pot afirmar
que la quantia de les beques es distribueix segons un model N(μ, 𝜎).

Indicació: Es recorda que els estimadors de màxima versemblança de μ i 𝜎 són


∑𝑋 ∑(𝑋 −𝜇) 2
𝑋̅ = 𝑛 𝑖 i 𝑆 ′ = √ 𝑖𝑛 , respectivament.

Exercici 17
Recollint dades en una empresa de 200 treballadors s’ha construït la següent taula de
freqüències conjuntes d’antiguitats i salaris:

Antiguitat
Poca Mitjana Molta
Baix 62 10 2
Salari

Mitjà 14 38 12
Alt 2 9 51

Discutiu la independència entre aquestes dues característiques a l’1% de significació.


Exercici 18
Les següents observacions corresponen als temps en minuts que han trigat 50 clients d’una
entitat bancària per realitzar una transacció.

2,3 0,2 2,9 0,4 2,8


2,4 4,4 5,8 2,8 3,3
3,3 9,7 2,5 5,6 9,5
1,8 4,7 0,7 6,2 1,2
7,8 0,8 0,9 0,4 1,3
3,1 3,7 7,2 1,6 1,9
2,4 4,6 3,8 1,5 2,7
0,4 1,3 1,1 5,5 3,4
4,2 1,2 0,5 6,8 5,2
6,3 7,6 1,4 0,5 1,4

1. Utilitzant una prova del khi-quadrat amb un nivell de significació del 1%, determineu si el
temps que triga un client per realitzar una transacció es pot modelitzar per una distribució
exponencial E(0,3125).
2. Repetiu la pregunta anterior utilitzant la prova de Kolmogorov-Smirnov.

Exercici 19
Una companyia asseguradora vol estudiar si l’edat de les persones està relacionada amb les
seves despeses sanitàries. Després de seleccionar una mostra de 70 persones, es classifica
cada persona, en funció de la seva edat, en una de les tres franges següents: inferior als 50
anys, entre 50 i 65 anys i més grans de 65 anys.
També es considera la despesa sanitària trimestral de cada persona i es classifica en les dues
categories següents: despesa inferior a 150 euros i despesa superior o igual a 150 euros.
A partir de les dades recollides, es construeix la següent taula de contingència.

Edat
E<50 50<E<65 E>65 Total
D<150€ 20 12 3 35
Despesa

D>150€ 5 18 12 35
Total 25 30 15 70

Amb un nivell de significació del 5%, determineu si l’edat i la despesa en cobertura


sanitària es poden considerar independents.

You might also like