Professional Documents
Culture Documents
Estadística
Bàtxelor en Informàtica
Javier González-Casallo
Els continguts d’aquesta obra estan subjectes a una llicència de Reconeixement - No comercial - Sense obres
derivades 3.0 de Creative Commons. Se’n permet la reproducció, distribució i comunicació pública sempre que
se’n citi l’autor i no se’n faci un ús comercial. La llicència completa es pot consultar
a: http://creativecommons.org/licenses/by-nc-nd/3.0/es/legalcode.ca
Exercici 1
Analitzant una mostra aleatòria 𝑋1 , … , 𝑋36 extreta d’una població 𝑋 que segueix una
distribució normal d’esperança 𝜇 i desviació típica 𝜎 = 0,15 s’obté 𝑋̅ = 2,25.
Contrasteu la hipòtesi 𝐻0 : 𝜇 = 2,5 contra 𝐻1 : 𝜇 ≠ 2,5 utilitzant un nivell de significació 𝛼 =
5%.
Exercici 2
Analitzant una mostra aleatòria 𝑋1 , … , 𝑋20 extreta d’una població 𝑋 que segueix una
distribució normal d’esperança 𝜇 i desviació típica 𝜎 s’obté 𝑋̅ = 20,44 i 𝑆 = 1,297.
Exercici 3
El temps necessari (en hores) per resoldre un determinat problema d’estadística segueix una
distribució normal 𝑁(2; 0,5). A fi de disminuir aquest temps, es decideix simplificar aquest
problema eliminant algun del seus apartats.
1. Especifiqueu quin contrast d’hipòtesis caldria realitzar per verificar que les simplificacions
realitzades han estat útils.
2. Especifiqueu quin estadístic de prova cal utilitzar per realitzar aquest contrast i quina serà la
regió crítica si 𝛼 = 5%.
Exercici 4
A fi d’avaluar el consum d’un nou model d’automòbil, el fabricant selecciona 10 conductors
voluntaris per efectuar proves. Els consums (en litres per 100 km) aconseguits per cadascun
dels 10 conductors desprès de recórrer una distància de 250 km han estat els següents:
El fabricant vol fer una campanya publicitària anunciant que per a viatges de més de 200 km, el
consum és inferior als 10 litres per cada 100 km.
Suposant que el consum (en litres per 100 km) es distribueix segons un model normal 𝑁(𝜇; 𝜎),
i treballant amb una significació del 5%, determineu si els resultats obtinguts en aquesta
mostra contradiuen l’afirmació del fabricant.
Exercici 5
Hem generat dues mostres de nombres aleatoris extrets de poblacions normals 𝑁(𝜇1 ; 𝜎1 ) i
𝑁(𝜇2 ; 𝜎2 ).
MOSTRA 1
16,7105 19,3667 13,3843 10,2034 14,9573 15,6362 12,9426
12,1883 9,9393 20,1271 14,9329 10,6105 13,7588 14,021
16,4171 16,0285 14,2832 14,2457 14,5469 17,0853 18,4146
MOSTRA 2
11,6558 11,1332 16,9702 15,6541 17,4125 14,3138 10,7664
13,4858 15,2028 13,5575 11,9374 16,6161 14,1234 13,5573
13,5892 13,5285 13,3482
1. Determineu si, treballant amb un nivell de significació del 5%, és assumible que ambdues
mostres provenen de poblacions amb idèntica esperança (𝜇1 = 𝜇2 ).
2. Repetiu la pregunta anterior per les variàncies 𝜎12 = 𝜎22 .
Exercici 6
Segons les dades facilitades pel ministeri de salut i benestar d’un determinat país, el 40% de la
població presenta problemes d’obesitat. Per comprovar si aquesta afirmació és compleix en
una determinada ciutat, s’avalua el pes d’una mostra aleatòria formada per 200 individus i
s’observa que 92 són obesos.
1. Contrasteu, amb un nivell de significació del 5%, si la proporció d’obesos d’aquesta ciutat és
diferent a la del conjunt del país.
2. Canvia alguna cosa si s’utilitza un nivell de significació del 1%?
3. Determineu entre quins valors (mínim i màxim) pot variar el nombre d'obesos mostral per a
què la conclusió del contrast, a un nivell de significació del 5%, sigui no refusar la hipòtesi
nul·la 𝐻0 : 𝑝 = 0,4.
Exercici 7
El preu P d’un article es pot modelitzar per una variable aleatòria 𝑁(𝜇; 10). Per contrastar les
dues hipòtesis 𝐻0 i 𝐻1 definides com:
𝐻0 : 𝜇 = 30
{
𝐻1 : 𝜇 > 30 (𝜇 = 40)
𝐻0 : 𝜇 = 16
{
𝐻1 : 𝜇 = 24
Sabent que P segueix una distribució normal amb desviació típica 3, calculeu:
Exercici 9
El temps T (en hores) necessari per preparar un control presencial d’una determinada
assignatura és en promig d’unes 4 hores. D’altra banda, se sap que un 90% dels alumnes
dediquen més de 3,5 hores per preparar cada control. Suposem que T segueix una distribució
normal amb esperança 𝜇 i variància 𝜎 2 .
1. Calculeu el valor de 𝜎 suposant que 𝜇 = 4 i que la probabilitat que T sigui superior o igual a
3,5 hores és del 90%.
2. Avaluant els temps que han trigat 100 estudiants per preparar un dels controls s’ha
obtingut un temps mitjà de preparació de 4,06 hores i una desviació típica mostral 𝑆 =
0,387. A partir d’aquests resultats efectueu una prova d’hipòtesis bilateral per decidir si es
pot acceptar que 𝜇 = 4 (utilitzeu un nivell de significació del 5%).
3. D’altra banda, avaluant els temps que han trigat 250 estudiants per preparar un dels
controls, hem obtingut que 218 han trigat més de 3,5 hores. A partir d’aquest resultat
efectueu una prova d’hipòtesis per determinar si es pot acceptar que el 90% del estudiants
dediquen més de 3,5 hores per preparar el seus controls (utilitzeu un nivell de significació
dels 5%)
Exercici 10
Fa 7 anys, 30 persones van invertir un part dels seus estalvis en diferents productes financers.
A data d’avui, les rendibilitats (en percentatge) d’aquestes 30 inversions 𝑋1 , … , 𝑋30 són les que
es detallen en les mostres 1 i 2 següents.
MOSTRA 1
2,2 5 3,9 7 2,7 5,3 3,2 4,3 3 3
4 4,6 3,8 4,6 4,8 5 2,6 2,4 1,7 2,6
MOSTRA 2
8 8,3 4 5 5,2 7,8 3 4,5 1,1 2,8
1. Determineu si, treballant amb un nivell de significació del 5%, és assumible que ambdues
mostres provenen de poblacions amb idèntica esperança (𝜇1 = 𝜇2 ).
2. Repetiu la pregunta anterior per les variàncies (𝜎12 = 𝜎22 ).
3. Quines conclusions es poden treure dels resultats obtinguts en els dos apartats anteriors?
Exercici 11
A fi de comercialitzar el seu nou producte estrella, un agent comercial d’una companya
asseguradora visita 8 llars cada dia, durant un període de 150 dies. El nombre de nous
contractes aconseguits per dia es resumeix en la següent taula:
Nombre de nous
0 1 2 3 4 5 6 7 8
contractes
Nombre de dies 4 15 30 43 31 18 5 3 1
Exercici 12
S’ha analitzat, durant 90 períodes d’una hora escollits de forma aleatòria, el nombre d’usuaris
d’un caixer automàtic d’una determinada entitat bancària. Els resultats obtinguts es mostren
en la següent taula:
Nombre
Nombre d'hores
d'usuaris
0 15
1 5
2 25
3 40
4 2
5 1
6 2
Determineu, utilitzant un nivell de significació del 1%, si el nombre de clients per hora es pot
modelitzar per una distribució de Poisson P(3).
Exercici 13
Es generen de forma aleatòria 60 números del 0 al 9 {0, 1, 2, 3,..., 9}. Els resultats obtinguts
han estat els següents:
Números 0 1 2 3 4 5 6 7 8 9
Freqüència 5 5 8 5 5 5 9 5 6 7
Exercici 14
Una empresa de distribució vol estudiar si l’edat D dels seus empleats es pot modelitzar per
una distribució Normal N(μ; 100) . Considerant l’edat de cada empleat s’obté la següent
distribució de freqüències:
Intervals
[10, 20[ [20, 30[ [30, 40[ [40, 50[ [50, 60[ [60, 70[
d'edat
Nombre
9 13 22 10 7 4
d'empleats
Exercici 15
Es vol realitzar un estudi estadístic per contrastar la hipòtesi segons la qual, en cada
naixement, la probabilitat de tenir un nen és igual a la probabilitat de tenir una nena. Després
d’analitzar el nombre de nenes d’una mostra aleatòria de famílies que han tingut 6 infants,
s’obtenen els següents resultats:
Nombre de Nombre de
nenes famílies
0 6
1 35
2 66
3 59
4 28
5 3
6 3
A partir d’aquests resultats, determineu si, amb un nivell de significació del 5%, es pot afirmar
que la quantia de les beques es distribueix segons un model N(μ, 𝜎).
Exercici 17
Recollint dades en una empresa de 200 treballadors s’ha construït la següent taula de
freqüències conjuntes d’antiguitats i salaris:
Antiguitat
Poca Mitjana Molta
Baix 62 10 2
Salari
Mitjà 14 38 12
Alt 2 9 51
1. Utilitzant una prova del khi-quadrat amb un nivell de significació del 1%, determineu si el
temps que triga un client per realitzar una transacció es pot modelitzar per una distribució
exponencial E(0,3125).
2. Repetiu la pregunta anterior utilitzant la prova de Kolmogorov-Smirnov.
Exercici 19
Una companyia asseguradora vol estudiar si l’edat de les persones està relacionada amb les
seves despeses sanitàries. Després de seleccionar una mostra de 70 persones, es classifica
cada persona, en funció de la seva edat, en una de les tres franges següents: inferior als 50
anys, entre 50 i 65 anys i més grans de 65 anys.
També es considera la despesa sanitària trimestral de cada persona i es classifica en les dues
categories següents: despesa inferior a 150 euros i despesa superior o igual a 150 euros.
A partir de les dades recollides, es construeix la següent taula de contingència.
Edat
E<50 50<E<65 E>65 Total
D<150€ 20 12 3 35
Despesa
D>150€ 5 18 12 35
Total 25 30 15 70