You are on page 1of 21

Capitolo 2

Richiami di probabilità

Esercizi
2.1 
Sia Y il numero di “teste” osservate nel lancio di due monete. Si assuma che la probabilità di ottenere “testa” sia di 0,4 per
entrambe le monete.
a. Si derivi la distribuzione di probabilità di Y.
b. Si derivi la distribuzione di probabilità cumulata di Y.
2.2 
Si usi la distribuzione di probabilità fornita nella Tabella 2.2 per calcolare: (a) E(Y) ed E(X ); (b) s X2 e s Y2; e (c) sXY e
corr(X, Y).
Usando le variabili casuali X e Y della Tabella 2.2, si considerino due nuove variabili causali W = 4 + 8X e V = 11
2.3 
− 2Y. Si calcolino: (a) E(W) e E(V); (b) s W2 e s V2; (c) sWV e corr(W, V).
Sia X una variabile casuale di Bernoulli con P(X = 1) = p.
2.4 
a. Si mostri che E(X 3) = p.
b. Si mostri che E(X k) = p per k > 0.
c. Si supponga che p = 0,3. Si calcolino la media, la varianza, l’asimmetria e la curtosi di X. (Suggerimento: può essere
utile l’impiego delle formule date nell’Esercizio 2.21.)
2.5 In luglio, la temperatura massima giornaliera della città di Fairtown ha una media di 65°F e una deviazione standard di
5°F. Quali sono la media, la deviazione standard e la varianza in °C?
2.6 
La tabella seguente fornisce la distribuzione di probabilità congiunta dello stato occupazionale e del livello scolare per
individui impiegati oppure in cerca di occupazione (disoccupati) appartenenti alla popolazione in età lavorativa del Paese
A.

Disoccupato (Y = 0) Occupato (X = 1) Totale


Non laureato X = 0 0,078 0,673 0,751
Laureato X = 1 0,042 0,207 0,249
Totale 0,12 0,88 1,000

a. Si calcoli E(Y).
b. Il tasso di disoccupazione è la frazione della forza lavoro che è disoccupata. Si mostri che il tasso di disoccupazione
è dato da 1 − E(Y).
c. Si calcoli E(YX = 1) e E(Y X = 0).
d. Si calcoli il tasso di disoccupazione per (i) i laureati e (ii) i non laureati.
e. Un membro di questa popolazione selezionato a caso dichiara di essere disoccupato. Qual è la probabilità che questo
lavoratore sia (i) laureato, (ii) non laureato?
f. Livello d’istruzione e stato occupazionale sono indipendenti? Si argomenti la risposta.

Stock_02_soluzioni_esercizi.indd 1 2/29/2016 11:36:31 AM


2.7 In una data popolazione di coppie maschio/femmina, dove entrambi sono percettori di reddito, le retribuzioni maschili hanno
una media di 50.000$ all’anno e una deviazione standard di 15.000$. Le retribuzioni femminili hanno una media di 48.000$
all’anno e una deviazione standard di 13.000$. La correlazione tra le retribuzioni maschili e femminili all’interno di una
coppia è di 0,90. Siano C le retribuzioni complessive di una coppia selezionata a caso.
a. Qual è la media di C?
b. Qual è la covarianza tra la retribuzione maschile e quella femminile?
c. Qual è la deviazione standard di C?
d. Si convertano le risposte ai punti (a)-(c) da $ (dollari) a € (euro).
2.8 
La variabile casuale Y ha media 4 e varianza 1/9. Sia Z = 3(Y – 4). Si trovino media e varianza di Z.
2.9 Siano X e Y variabili casuali discrete con la seguente distribuzione congiunta:

Valore di Y
2 4 6 8 10
3 0,04 0,09 0,03 0,12 0,01
Valore di X 6 0,10 0,06 0,15 0,03 0,02
9 0,13 0,11 0,04 0,06 0,01

Ovvero, Pr(X = 3, Y = 2) = 0,04 e così via.


a. Si calcolino la distribuzione di probabilità, la media e la varianza di Y.
b. Si calcolino la distribuzione di probabilità, la media e la varianza di Y data X = 6.
c.
Si calcolino la covarianza e la correlazione tra X e Y.
2.10 Si calcolino le seguenti probabilità:
a.
Pr(Y  5), con Y distribuito come una N(4, 9);
Pr(Y > 2), con Y distribuito come una N(5, 16);
b.
c.
Pr(2  Y  5), con Y distribuito come una N(1, 4);
d.
Pr(1  Y  4), con Y distribuito come una N(2, 1).
2.11 Si calcolino le seguenti probabilità:
a.
Pr(Y  6,25), con Y distribuito come una c23;
b.
Pr(Y  15,51), con Y distribuito come una c82;
c.
Pr(Y  1,94), con Y distribuito come una F8,.
d.
Perché le risposte alle domande b e c sono identiche?
e. Si calcoli Pr(Y  0,5), con Y distribuito come una c12. (Suggerimento: si usi la definizione della distribuzione c12.)
2.12 Si calcolino le seguenti probabilità:
a. Pr(Y  1,36), con Y distribuito come una t12.
b. Pr(−1,70  Y  1,70), con Y distribuito come una t30.
c. Pr(−1,70  Y  1,70), con Y distribuito come una N(0, 1).
d. Quand’è che i valori critici della distribuzione normale e della distribuzione t coincidono?
e. Pr(Y > 3,36) con Y distribuito come una F4,11.
f. Pr(Y > 4,87) con Y distribuito come una F3,21.
2.13 
X è una variabile casuale di Bernoulli con Pr(X = 1) = 0,90, Y si distribuisce come una N(0, 4), W si distribuisce come
una N(0, 16), X, e Y e W sono indipendenti. Sia S = XY + (1 – X)W. (Ovvero S = Y quando X = 1 e S = W quando X = 0.)
a.
Si mostri che E(Y 2) = 4 e E(W 2) = 16.
b. Si mostri che E(Y 3) = 0 e E(W 3) = 0. (Suggerimento: qual è l’asimmetria di una distribuzione simmetrica?)
c. Si mostri che E(Y 4) = 3 × 42 e E(W4) = 3 × 162. (Suggerimento: si usi il fatto che la curtosi di una distribuzione normale
è 3.)
d. Si derivino E(S), E(S2), E(S3) e E(S4). (Suggerimento: si usi la legge delle aspettative iterate condizionatamente a X =
0 e X = 1.)

Stock_02_soluzioni_esercizi.indd 2 2/29/2016 11:36:31 AM


e.
Si derivino l’asimmetria e la curtosi di S.
In una popolazione mY = 50 e s Y2 = 21. Si usi il teorema limite centrale per calcolare le seguenti probabilità:
2.14 

a. Pr(Y ≤ 51) in un campione casuale di dimensione n = 50;

b. Pr(Y > 49) in un campione casuale di dimensione n = 150;

c. Pr(50,5 ≤ Y ≤ 51) in un campione casuale di dimensione n = 45.
Si supponga che Yi, i = 1, 2,...,n, siano variabili casuali i.i.d., ognuna distribuita come una N(10, 4).
2.15 

a. Si calcoli Pr(9,6 ≤ Y ≤ 10,4) quando (i) n = 20, (ii) n = 100, (iii) n = 1,000.

b. Si supponga che c sia un numero positivo. Si mostri che Pr(10 – c ≤ Y ≤ 10 + c) diventa prossimo a 1,0 al crescere di
n.

c. Si usi la risposta alla domanda (b) per dedurre che Y converge in probabilità a 10.
Y si distribuisce come una N(5,100) e si vuole calcolare Pr(Y < 3,6). Sfortunatamente, non avendo il manuale non è
2.16 
possibile consultare la tabella della probabilità normale come la Tabella 1 dell’appendice finale. Tuttavia, si hanno un
computer e un programma che può generare estrazioni i.i.d. dalla distribuzione N(5,100). Si spieghi come utilizzare il
computer per calcolare un’accurata approssimazione per Pr(Y < 3,6).

2.17 
Yi, i = 1,...,n, sono variabili casuali bernoulliane i.i.d. con p = 0,6. Sia Y la media campionaria.
a. Si usi il teorema limite centrale per calcolare le approssimazioni alle seguenti probabilità:

i. Pr(Y ≥ 0,64) quando n = 50.

ii. Pr(Y ≥ 0,56) quando n = 200.

b. Quanto grande dovrebbe essere n per essere sicuri che Pr(0,65 > Y > 0,55) = 0,95? (Si usi il teorema limite centrale
per calcolare una risposta approssimativa.)
2.18 
Ogni anno, i temporali possono causare danni alle case. Sulla base di un confronto anno su anno, il danno è casuale. Si
indichi con Y il valore in dollari del danno subito in un dato anno. Si supponga che nel 95% degli anni sia Y = 0$, ma nel
5% degli anni sia Y = 20.000$.
a.
Quali sono la media e la deviazione standard del danno subito per ciascun anno?
b. Si consideri una “assicurazione congiunta” per 120 persone le cui case siano sufficientemente disperse, cosicché, in
ogni anno, i danni a case diverse possano essere visti come variabili casuali indipendentemente distribuite. Si indichi
– –
con Y il danno medio subito da queste 120 case in un anno. (i) Qual è il valore atteso del danno medio Y ? (ii) Qual

è la probabilità che Y superi 3000$?
2.19 
Si considerino due variabili casuali X e Y . Si supponga che Y possa assumere k valori, y1,...,yk, e che X possa assumere l
valori, x1,...,xl.
l
Si mostri che Pr(Y = y j ) = ∑ Pr(Y = y j X = x i ) Pr( X = x i ) .
a.
i =1
(Suggerimento: si usi la definizione di Pr(Y = yj  X = xi)).
b.
Si usi la risposta alla domanda (a) per verificare l’Equazione (2.19).
Si supponga che X e Y siano indipendenti. Si mostri che sXY = 0 e corr(X, Y) = 0.
c.
2.20 
Si considerino tre variabili casuali X, Y e Z. Si supponga che Y possa assumere k valori, y1,...,yk, che X possa assu-
mere l valori, x1,...,xl, e che Z possa assumere m valori, z1,...,zm. La distribuzione di probabilità congiunta di X, Y e
Z è Pr( X = x, Y = y, Z = z), e la distribuzione di probabilità condizionata di Y date X e Z è Pr(Y = y | X = x, Z = z) =
Pr(Y = y, X = x , Z = z )
.
Pr( X = x , Z = z )
a. Si spieghi come si può calcolare la probabilità marginale che Y = y dalla distribuzione di probabilità congiunta.
(Suggerimento: questa è una generalizzazione della (2.19).)
b. Si mostri che E(Y) = E[E(Y | X,Z)]. (Suggerimento: questa è una generalizzazione delle (2.19) e (2.20).)
2.21 X è una variabile casuale con momenti E(X), E(X 2), E(X 3), e così via.
a. Si mostri che E(X − m)3 = E(X 3) − 3[E(X 2)][ E(X)] + 2[E(X)]3.
b. Si mostri che E(X − m)4 = E(X 4) − 4[E(X)][ E(X 3)] + 6[E(X)]2[E(X 2)] − 3[E(X)]4.

Stock_02_soluzioni_esercizi.indd 3 2/29/2016 11:36:32 AM


2.22 Si supponga di avere una somma da investire – per semplicità, 1$ – e che si pensi di investirne una frazione w in un fondo
comune azionario e la restante parte, 1 – w, in un fondo comune obbligazionario. Si supponga che l’1$ investito in un
fondo azionario frutti Rs dopo un anno e che l’1$ investito in un fondo obbligazionario frutti Rb, che Rs sia una variabile
casuale con media di 0,08 (8%) e deviazione standard di 0,07, e che Rb sia una variabile casuale con media di 0,05 (5%) e
deviazione standard di 0,04. La correlazione tra Rs e Rb è 0,25. Se si investe una frazione w del denaro nel fondo azionario
e la restante parte, 1 – w, nel fondo obbligazionario, allora il profitto dell’investimento sarà R = wRs + (1 – w)Rb.
a. Si supponga che w = 0,5. Si calcolino la media e la deviazione standard di R.
b. Si supponga che w = 0,75. Si calcolino la media e la deviazione standard di R.
c. Quale valore di w rende la media di R massima? Qual è la deviazione standard di R per tale valore di w?
d. (Difficile) Qual è il valore di w che minimizza la deviazione standard di R? (Lo si può dimostrare utilizzando un gra-
fico, l’algebra o il calcolo).
2.23 
Questo esercizio fornisce un esempio di una coppia di variabili casuali X e Y per le quali la media condizionata di Y data
X dipende da X, ma corr(X,Y) = 0. Siano X e Z due variabili casuali normali standard indipendentemente distribuite e sia
Y = X 2 + Z.
a. Si mostri che E(Y  X) = X 2.
b. Si mostri che mY = 1.
c. Si mostri che E(XY) = 0. (Suggerimento: si usi la proprietà della variabile casuale normale standard di avere momenti
di ordine dispari tutti nulli.)
d. Si mostri che cov(X, Y) = 0 e perciò che corr(X, Y ) = 0.
2.24 Si supponga che Yi, i = 1,...,n, siano variabili casuali i.i.d. che si distribuiscono come una N(0, s 2).
a. Si mostri che E(Y 2i/σ2) = 1.
1
b. Si mostri che W = 2 ∑ i =1 Y2i si distribuisce come una c2n.
n

σ
c. Si mostri che E(W) = n. [Suggerimento: si usi la risposta alla domanda (a).]

∑ i=2 Y2i
n

d. Si mostri che V = Y1 si distribuisce come una tn-1.


n −1

2.25 
(Ripasso sulla sommatoria). Si indichi con x1,...,xn una sequenza di numeri, con y1,...,yn un’altra sequenza di numeri e con
a, b e c tre costanti. Si mostri che:
n n
a. ∑ ax i = a ∑ x i
i=1 i=1
n n n
b. ∑ (x i + yi ) = ∑ x i + ∑ yi
i=1 i=1 i=1
n
c. ∑ a = na
i=1
n n n n n
d. ∑ (a + bx i + cyi ) = na 2 + b 2 ∑ x i2 + c 2 ∑ yi2 +2 ab ∑ x i +2 ac ∑ yi +
i=1 i=1 i=1 i=1 i=1
n
2 bc ∑ x i yi
i=1

Stock_02_soluzioni_esercizi.indd 4 2/29/2016 11:36:33 AM


2.26 
Si supponga che Y1, Y2,...,Yn siano variabili casuali con media comune mY, varianza comune s2Y e la stessa correlazione r
(quindi la correlazione tra Yi e Yj è uguale a r per tutte le coppie i e j dove i ≠ j.

a. Si mostri che cov(Yi, Yj) = rs2Y per i ≠ j.


– 1 1
b. Si supponga che n = 2 e si mostri che E(Y ) = mY e var(Y ) = σ Y2 + ρσ Y2 .
2 2
– –
c. Per n ≥ 2 si mostri che E(Y ) = mY e var(Y ) = s2Y /n + [(n – 1)/n]rs2Y.

d. Si mostri che var(Y ) ≈ rs2Y quando n è molto grande.
2.27 
X e Z sono due variabili casuali congiuntamente distribuite. Si supponga di conoscere il valore di Z, ma non quello di X.
~ ~
Si indichi con X = E(X|Z) una previsione del valore di X ottenuta utilizzando le informazioni su Z, e con X – X l’errore
associato a tale previsione.

a. Si mostri che E(W) = 0 (suggerimento: si utilizzi la legge delle aspettative iterate).

b. Si mostri che E(WZ) = 0.


^ ^
c. Si indichi con X =g(Z) un’altra previsione di X ottenuta usando Z, e con V = X – X il suo errore. Si mostri che E(V2) ≥
E(W2) [suggerimento: sia h(Z) = g(Z) – E(X|Z), così che V = [X – E(X|Z)] – h(Z). Si ricavi E(V2)].

Stock_02_soluzioni_esercizi.indd 5 2/29/2016 11:36:34 AM


Capitolo 2
Richiami di probabilità – SOLUZIONI

2.1. (a) Funzione di distribuzione di probabilità per Y

Risultato (numero di “testa”) Y=0 Y=1 Y=2


Probabilità 0,36 0,48 0,16

(b) 𝜇 = 𝐸(𝑌) = (0 × 0,36) + (1 × 0,48) + (2 × 0,16) = 0,8.

Usando il Concetto chiave 2.3: var(Y ) = E (Y 2 ) − [ E (Y )]2 ,


e
𝐸(𝑌 2 ) = 2 × 0,6 × 0,4 + 0,82 = 1,12

quindi
𝑣𝑎𝑟(𝑌) = 𝐸(𝑌 2 ) − [𝐸(𝑌)]2 = 1,12 − 0,82 = 0,48

2.2. Dalla Tabella 2.2 sappiamo che Pr (Y = 0) = 0, 22, Pr (Y = 1) = 0,78, Pr ( X = 0) = 0,30,


Pr ( X = 1) = 0,70. Quindi
(a) µY = E (Y ) = 0 × Pr (Y = 0) + 1 × Pr (Y = 1)
= 0 × 0, 22 + 1 × 0,78 = 0,78,
µ X = E ( X ) = 0 × Pr ( X = 0) + 1 × Pr ( X = 1)
= 0 × 0,30 + 1 × 0,70 = 0,70.
(b) σ 2X = E[( X − µ X ) 2 ]
= (0 − 0,70) 2 × Pr ( X = 0) + (1 − 0,70) 2 × Pr ( X = 1)
= ( −0,70) 2 × 0,30 + 0,302 × 0,70 = 0, 21,
σ Y2 = E[(Y − µY ) 2 ]
= (0 − 0,78) 2 × Pr (Y = 0) + (1 − 0,78) 2 × Pr (Y = 1)
= ( −0,78) 2 × 0, 22 + 0, 222 × 0,78 = 0,1716.
(c) σ XY = cov (X , Y ) = E[( X − µ X )(Y − µY )]
= (0 − 0,70)(0 − 0,78) Pr( X = 0, Y = 0)
+ (0 − 0,70)(1 − 0,78) Pr ( X = 0, Y = 1)
+ (1 − 0,70)(0 − 0,78) Pr ( X = 1, Y = 0)
+ (1 − 0,70)(1 − 0,78) Pr ( X = 1, Y = 1)
= ( −0,70) × ( −0,78) × 0,15 + ( −0,70) × 0, 22 × 0,15
+ 0,30 × ( −0,78) × 0,07 + 0, 30 × 0, 22 × 0,63
= 0,084,
σ XY 0,084
corr (X , Y ) = = = 0, 4425.
σ X σY 0, 21 × 0,1716

2.3. Per le due nuove variabili casuali 𝑊 = 4 + 8𝑋 e 𝑉 = 11 − 2𝑌 si ha:


a. 𝐸(𝑉) = 𝐸(11 − 2𝑌) = 11 − 2𝐸(𝑌) = 11 − 2 × 0,78 = 9,44,
𝐸(𝑊) = 𝐸(4 + 8𝑋) = 4 + 8𝐸(𝑋) = 4 + 8 × 0,70 = 9,6

b. 𝜎𝑤2 = 𝑣𝑎𝑟(4 + 8𝑋) = 82 𝜎𝑥2 = 64 × 0,21 = 13,44,


𝜎𝑣2 = 𝑣𝑎𝑟(11 − 2𝑌) = (−2)2 𝜎𝑦2 = 4 × 0,1716 = 0,6864

c. 𝜎𝑤𝑣 = 𝑐𝑜𝑣(4 + 8𝑋, 11 − 2𝑌) = 6 × (−2)𝑐𝑜𝑣(𝑋, 𝑌) = −12 × 0,084 = −1,008


𝜎𝑤𝑣 −1,008
𝑐𝑜𝑟𝑟(𝑊, 𝑉) = = = −0,3319
𝜎𝑤 𝜎𝑣 √13,44 ×0,6864
2.4. (a) E ( X 3 ) = 03 × (1 − p) + 13 × p = p
(b) E ( X k ) = 0k × (1 − p ) + 1k × p = p
(c) E ( X ) = 0,3
var(X) = E(X2)− [E(X)]2 = 0,3 − 0,09 = 0,21
Quindi s = 0, 21 = 0,46.
Per calcolare l’asimmetria, usiamo la formula dall’Esercizio 2.21:
E ( X − µ )3 = E ( X 3 ) − 3[ E ( X 2 )][ E ( X )] + 2[ E ( X )]3
= 0,3 − 3 × 0,32 + 2 × 0,33 = 0,084

In alternativa, E ( X − µ )3 = [(1 − 0,3)3 × 0,3] + [(0 − 0,3)3 × 0,7] = 0,084


Quindi, l’asimmetria = E ( X − µ )3/σ 3 = 0,084/0, 463 = 0,87.
Per calcolare la curtosi usiamo la formula dall’Esercizio 2.21:
E ( X − µ ) 4 = E ( X 4 ) − 4[ E ( X )][ E ( X 3 )] + 6[ E ( X )]2 [ E ( X 2 )] − 3[ E ( X )]4
= 0,3 − 4 × 0,32 + 6 × 0,33 − 3 × 0,34 = 0,0777

In alternativa, E ( X − µ ) 4 = [(1 − 0,3) 4 × 0,3] + [(0 − 0,3) 4 × 0,7] = 0,0777


Quindi la curtosi è E ( X − µ ) 4 /σ 4 = 0,0777/0, 464 = 1,76

2.5. Sia X la temperatura in °F e Y la temperatura in °C. Ricordiamo che Y = 0 quando X = 32 e


Y = 100 quando X = 212; questo implica Y = (100/180) × ( X − 32) o Y = −17,78 + (5/9) × X.
Usando il Concetto chiave 2.3, mX = 65oF implica che 𝜇𝑥 = – 17,78 + (5/9) × 65 = 18,33°C
e sX = 5oF implica che 𝜎𝑌 = (5/9) × 5 = 2,78°C.
2.6. La tabella mostra che Pr(𝑋 = 0, 𝑌 = 0) = 0,078,
Pr(X = 0, Y = 1) = 0,673, Pr(X = 1, Y = 0) = 0,042,
Pr(X = 1, Y = 1) = 0,207, Pr(X = 0) = 0,751,
Pr(X = 1) = 0,249, Pr(Y = 0) = 0,12, Pr(Y = 1) = 0,88

(a) 𝐸(𝑌) = 𝜇𝑦 = 0 × Pr(𝑌 = 0) + 1 × Pr(𝑌 = 1)


= 0 × 0,12 + 1 × 0,88 = 0,88
# (disoccupati)
(b) Tasso di disoccupazione = = Pr (Y = 0) = 0,12.
# (forza lavoro)
(c) Calcoliamo prima le probabilità condizionate:
Pr(𝑋=0,𝑌=0) 0,078
Pr(𝑌 = 0| 𝑋 = 0) = = = 0,104 ,
Pr(𝑋=0) 0,751
Pr(𝑋=0,𝑌=1) 0,673
Pr(𝑌 = 1| 𝑋 = 0) = = = 0,896 ,
Pr(𝑋=0) 0,751
Pr(𝑋=1,𝑌=0) 0,042
Pr(𝑌 = 0| 𝑋 = 1) = = = 0,169 ,
Pr(𝑋=1) 0,249
Pr(𝑋=1,𝑌=1) 0,207
Pr(𝑌 = 1| 𝑋 = 1) = = = 0,831.
Pr(𝑋=1) 0,249

Le aspettative condizionate sono


𝐸(𝑌|𝑋 = 1) = 0 × Pr(𝑌 = 0|𝑋 = 1) + 1 × Pr(𝑌 = 1|𝑋 = 1)
= 0 + 1 × 0,831 = 0,831
𝐸(𝑌|𝑋 = 0) = 0 × Pr(𝑌 = 0|𝑋 = 0) + 1 × Pr(𝑌 = 1|𝑋 = 0)
= 0 + 1 × 0,896 = 0,896
(d) Usiamo la soluzione del punto (c),
Tasso di disoccupazione tra i laureati = 1 – E(Y|X = 1) = 1 – 0,831 = 0,169
Tasso di disoccupazione tra i non laureati = 1 – E(Y|X = 0) = 1 – 0,896 = 0,104
(e) La probabilità che un lavoratore scelto a caso e indicato come disoccupato sia laureato è

Pr(𝑋 = 1, 𝑌 = 0) 0,042
Pr(𝑋 = 1|𝑌 = 0) = = = 0,35
Pr(𝑌 = 0) 0,12

La probabilità che il lavoratore non sia laureato è


Pr(𝑋 = 0|𝑌 = 0) = 1 − Pr(𝑋 = 1|𝑌 = 0) = 1 − 0,35 = 0,65

(f) Livello di istruzione e stato occupazionale non sono indipendenti perché non
soddisfano la condizione che, per tutti i valori di x e y,
Pr ( X = x |Y = y ) = Pr ( X = x).
Per esempio, dal punto (e) si ha Pr(X = 0|Y = 0) = 0,65, mentre dalla tabella si ha
Pr(X = 0) = 0,751.
2.7. Utilizzando una notazione ovvia, C = M + F ; quindi µC = µ M + µ F e
σ C2 = σ M2 + σ F2 + 2cov ( M , F ). Ciò implica
(a) 𝜇𝐶 = 50 + 48 = $98.000 per anno.
cov( M , F )
(b) corr ( M , F ) = , quindi cov( M , F ) = σ M σ F corr ( M , F ). Quindi
σ Mσ F
cov ( M , F ) = 15 × 13 × 0,9 = 175,50, dove le unità sono migliaia di dollari
l’anno al quadrato.
(c) σ C2 = σ M2 + σ F2 + 2cov ( M , F ), perciò 𝜎𝐶2 = 152 + 132 + 2(175,5) = 745, e
𝜎𝐶 = √745 = 27,295 migliaia di dollari l’anno.
(d) Per prima cosa occorre cercare il tasso di cambio euro/dollaro attuale sul Wall Street
Journal, sul sito web della Federal Reserve o consultando altre fonti di informazioni
finanziarie. Supponiamo che il tasso di cambio sia e (per esempio e = 0,75 euro per
dollaro); quindi 1 dollaro vale e euro. La media è quindi e × sC (in migliaia di euro
l’anno) e la deviazione standard è e × sC (in migliaia di euro l’anno). La correlazione è
indipendente dall’unità di misura ed è invariata.

1
2.8. 𝐸(𝑌) = 4; 𝑣𝑎𝑟(𝑌) = ; 𝑍 = 3(𝑌 − 4)
9
𝜇𝑍 = 𝐸�3(𝑌 − 4)� = 3(𝐸(𝑌) − 4) = 3(4 − 4) = 0
1
𝜎𝑍2 = 𝑣𝑎𝑟�3(𝑌 − 4)� = 9𝑣𝑎𝑟(𝑌) = 9 × =1
9
2.9.
Valore di Y Distribuzione
di
2 4 6 8 10 probabilità
di X
3 0,04 0,09 0,03 0,12 0,01 0,29
Valore
6 0,10 0,06 0,15 0,03 0,02 0,36
di X
9 0,13 0,11 0,04 0,06 0,01 0,35
Distribuzione di
0,27 0,26 0,22 0,21 0,04 1,00
probabilità di Y
(a) La distribuzione di probabilità è data nella tabella precedente.

𝐸(𝑌) = 2 × 0,27 + 4 × 0,26 + 6 × 0,22 + 8 × 0,21 + 10 × 0,04 = 4,98

𝐸(𝑌 2 ) = 22 × 0,27 + 42 × 0,26 + 62 × 0,22 + 82 × 0,21 + 102 × 0,04 = 30,6

Var(𝑌) = 𝐸(𝑌 2 ) – [𝐸(𝑌)]2 = 30,60 – 4,98 = 25,62


(b) La probabilità condizionata di Y|X = 6 è data nella tabella seguente

Valore di Y
2 4 6 8 10
0,10/0,36 0,06/0,36 0,15/0,36 0,03/0,36 0,02/0,36

𝐸(𝑌|𝑋 = 6) = 2(0,10/0,36) + 4(0,06/0,36) + 6(0,15/0,36)

+ 8(0,03/0,36) + 10(0,02/0,36) = 4,944

𝐸(𝑌 2 |𝑋 = 6) = 22 (0,10/0,36) + 42 (0,06/0,36) + 62 (0,15/0,36)

+ 82 (0,03/0,36) + 102 (0,02/0,36) = 29,667

𝑉𝑎𝑟(𝑌) = 29,667 − 4,944 = 24,723


(c) 𝐸(𝑋𝑌) = (3 × 2 × 0,04) + (3 × 4 × 0,09) + ⋯ + (9 × 10 × 0,01) = 29,4

Cov(𝑋, 𝑌) = 𝐸(𝑋𝑌) – 𝐸(𝑋)𝐸(𝑌) = 29,4 – 6,18 × 4,98 = −1,3764


Corr(𝑋, 𝑌) = cov(𝑋, 𝑌)/(var(𝑋)var(𝑌)) = −1,3764/(5,7276 × 24,723) =
−0,0097
Y − µY
2.10. Utilizzando il fatto che, se Y  N  µY , σ Y2  allora ~ N (0, 1) e la Tavola 1 riportata
σY
nell’Appendice del volume stampato, si ha
 Y − 4 3 − 1 1
(a) Pr (Y ≤ 5) = Pr  ≤  = Φ ( ) = 0,6304.
 3 2  3
 Y − 5 2 − 5  1
(b) Pr(Y > 2) = 1 − Pr  ≤  = 1 − Φ  −  = 0,5987.
 4 4 4
 2 − 1 Y − 1 5 − 1  1
(c) Pr (2 ≤ Y ≤ 5) = Pr  ≤ ≤  = Φ (2) − Φ   = 0, 2857.
 2 2 2 2
(d)

 1 − 2 Y − 2 1 − 2
Pr (1 ≤ Y ≤ 4) = Pr  ≤ ≤  = Φ (2) − Φ ( −1) = Φ (2) − (1 − Φ (1)) = 0,8185.
 1 1 1 

2.11. (a) 0,90


(b) 0,95
(c) 0,95
(d) Quando Y ~ χ102 , allora Y /10 ~ F10,∞ .

(e) Y = Z , dove Z ~ N (0,1), quindi Pr (Y ≤ 0,5) = Pr ( −0,5 ≤ Z ≤ 0,5) = 0,383.


2

2.12. (a) 0,90


(b) 0,90
(c) 0,9108
(d) La distribuzione tdf e N(0, 1) sono approssimativamente uguali solo quando N diventa
grande, o il numero di gradi di libertà diventa grande.
(e) 0,95
(f) 0,01
2.13. (a) E (Y 2 ) = Var (Y ) + µY2 = 4 + 0 = 4; E (W 2 ) = Var (W ) + µW2 = 16 + 0 = 16.
(b) Y e W sono simmetrici attorno a 0, quindi l’asimmetria è uguale a 0; poiché la loro
media è zero, ciò significa che il terzo momento è zero.
E (Z − µZ )4
(c) La curtosi della normale è 3, 3 = ; trasformando Y e W nella normale
σ Z4
standard si ottengono i risultati.
(d) Prima si pone la condizione su X = 0, così che S = W :
E ( S | X = 0) = 0; E ( S 2 | X = 0) = 16, E ( S 3 |X = 0) = 0, E ( S 4 | X = 0) = 3 × 162.
Similmente,
E ( S | X = 1) = 0; E ( S 2 | X = 1) = 4, E ( S 3 | X = 1) = 0, E ( S 4 | X = 1) = 3 × 42.
Dalla legge delle aspettative iterate
E ( S ) = E ( S | X = 0) × Pr (X = 0) + E ( S | X = 1) × Pr( X = 1) = 0
E ( S 2 ) = E ( S 2 | X = 0) × Pr (X = 0) + E ( S 2 | X = 1) × Pr( X = 1) = 16 × 0,01 + 4 × 0,9 = 5, 2
E ( S 3 ) = E ( S 3 | X = 0) × Pr (X = 0) + E ( S 3 | X = 1) × Pr( X = 1) = 0
E ( S 4 ) = E ( S 4 | X = 0) × Pr (X = 0) + E ( S 4 | X = 1) × Pr( X = 1) = 3 × 162 × 0,1 + 3 × 42 × 0,9 = 120

(e) µ S = E ( S ) = 0, quindi E ( S − µ S )3 = E ( S 3 ) = 0 dal punto (d). Quindi l’asimmetria è 0.


Similmente, σ S2 = E ( S − µ S ) 2 = E ( S 2 ) = 5, 2, e E ( S − µ S ) 4 = E ( S 4 ) = 120. Quindi la
curtosi è = 120 / (5, 22 ) = 4, 44
2.14. Il teorema limite centrale suggerisce che, quando la dimensione del campione (n) è grande,
la distribuzione della media campionaria (Y ) è approssimativamente N  µY , σ Y2  con
σ Y2
σ =
2
Y
. Dati µY = 50, σ Y2 = 21,
n
σ Y2 21
(a) Con n = 50 e σ Y2 = = = 0, 21
n 100
 Y − 50 51 − 50   Y − 50 
Pr (Y ≤ 51) = Pr  ≤  = Pr  ≤ 2,1822 = 0,9853
 0, 21 0, 21   0, 21 
σ Y2 21
(b) Con n = 150 e σ Y2 = = = 0,14 , e
n 150

 Y − 50 49 − 50   Y − 50 
Pr (Y ≤ 49) = 1 − Pr (Y ≤ 49) = 1 − Pr  ≤  = 1 − Pr  ≤ −2,6726 = 0,9962
 0,14 0,14   0,14 

σ Y2 21
(c) Con n = 45 e σ Y2 = = = 0, 467 , e
n 45
 50,5 − 50 Y − 50 51 − 50 
Pr (50,5 ≤ Y ≤ 51) = Pr  ≤ ≤  = Φ (1, 4633) − Φ (0,7317) = 0,9245 − 0,7647 = 0,1598
 0, 467 0, 467 0, 467 
 9,6 − 10 Y − 10 10, 4 − 10 
2.15. (a) Pr (9,6 ≤ Y ≤ 10, 4) = Pr  ≤ ≤ 
 4/n 4/n 4/n 
 9,6 − 10 10, 4 − 10 
= Pr  ≤Z≤ 
 4/n 4/n 
dove Z ~ N(0, 1). Quindi,
 9,6 − 10 10, 4 − 10 
(i) n = 20; Pr  ≤Z≤  = Pr (−0,89 ≤ Z ≤ 0,89) = 0,63
 4/n 4/n 
 9,6 − 10 10, 4 − 10 
(ii) n = 100; Pr  ≤Z≤  = Pr(−2,00 ≤ Z ≤ 2,00) = 0,954
 4/n 4/n 
 9,6 − 10 10, 4 − 10 
(iii) n = 1000; Pr  ≤Z≤  = Pr(−6,32 ≤ Z ≤ 6,32) = 1,000
 4/n 4/n 
 −c Y − 10 c 
(b) Pr (10 − c ≤ Y ≤ 10 + c) = Pr  ≤ ≤ 
 4/n 4/n 4/n 
 −c c 
= Pr  ≤Z ≤ .
 4/n 4/n 
c
Al crescere di n cresce anche , e la probabilità converge a 1.
4/n
(c) Segue da (b) e dalla definizione di convergenza in probabilità fornita nel Concetto chiave
2.6.

2.16. Esistono diversi modi per farlo; uno è il seguente. Generare n estrazioni di Y, Y1, Y2, … Yn.
Sia Xi = 1 se Yi < 3,6, Xi = 0 altrimenti. Si noti che Xi sono variabili casuali di Bernoulli con
µX = Pr(X = 1) = Pr(Y < 3,6). Calcolare X .
Poiché X converge in probabilità a µX = Pr(X = 1) = Pr(Y < 3,6), X sarà
un’approssimazione accurata se n è grande.
2.17. µY = 0,6 e σ Y2 = 0, 4 × 0,6 = 0, 24
 
 Y − 0,6 0,64 − 0,6 
(a) (i) P( Y ≥ 0,64) = Pr  ≤ 
 0, 24 0, 24 
 
n n
   
 Y − 0,6 0,04   Y − 0,6 
= Pr  ≤  = ≤ 0,577 = 0, 2157
 0, 24 0, 24   0, 24 
   
n n n
   
 Y − 0,6 0,56 − 0,6   Y − 0,6 
(ii) P( Y ≤ 0,56) = Pr  ≤  = Pr  ≤ 1,157 = 0,12
 0, 24 0, 24   0, 24 
   
n n n
(b) È noto che Pr (–1,96 ≤ Z ≤ 1,96) = 0,95, quindi si vuole che n soddisfi
0,65 − 0,60 0,65 − 0,60
0,61 = > −1,96 e < −1,96. Risolvendo queste disuguaglianze
0, 24 0, 24
n n
si ottiene n ≥ 368.

2.18. Pr (Y = $0) = 0,95, Pr (Y = $30000) = 0,05.


(a) La media di Y è
µY = 0 × Pr (Y = $0) + 30000 × Pr (Y = $30000) = $1500.
La varianza di Y è
σ Y2 = E  (Y − µY ) 2 
= (0 − 1500) 2 × Pr(Y = 50) + (30000 − 1500) 2 × Pr (Y = 30000)
= ( −1500) 2 × 0,95 + (28500) 2 × 0,05 = 4, 27 × 107,

quindi la deviazione standard di Y è σ Y = (4, 27 × 107 ) 2 = $6538,35.


1

σ Y2 107
(b) (i) σ Y2 = = 4, 27 ×= 355833.
n 120
(ii) Utilizzando il teorema limite centrale,
Pr (Y > 3000) = 1 − Pr (Y ≤ 3000)
 Y − 1500 3000 − 1500 
= 1 − Pr  ≤ 
 355833 355833 
= 1 − Φ (2,5145) = 1 − 0,9939 = 0 (corretto a 4 cifre decimali)
l
2.19. (a) Pr (Y = y j ) = ∑ Pr ( X = xi , Y = y j )
i =1
l
= ∑ Pr (Y = y j | X = xi )Pr ( X = xi )
i =1
k k l
(b) E (Y ) = ∑ y j Pr (Y = yj ) = ∑ yj ∑ Pr (Y = yj |X = xi ) Pr ( X = xi )
j =1 j =1 i =1

l k 
=∑



∑y j

Pr (Y = yj |X = xi )  Pr ( X = xi )

i =1  j =1 
l
=∑ E (Y | X = xi )Pr ( X = xi ).
i =1

(c) Quando X e Y sono indipendenti,


Pr (X = xi , Y = yj ) = Pr (X = xi )Pr (Y = yj ),

quindi
σ XY = E[( X − µ X )(Y − µY )]
l k
=∑ ∑ ( xi − µ X )( y j − µY ) Pr ( X = xi , Y = y j )
i =1 j =1
l k
=∑ ∑( xi − µ X )( y j − µY ) Pr ( X = xi ) Pr (Y = y j )
i =1 j =1

 l  k 
=  ∑ ( xi − µ X ) Pr ( X = xi )   ∑ ( yj − µY ) Pr (Y = yj 
 i =1   j =1 
= E ( X − µ X ) E (Y − µY ) = 0 × 0 = 0,
σ XY 0
corr(X , Y ) = = = 0.
σ XσY σ XσY
l m
2.20. (a) Pr (Y = yi ) = ∑∑ Pr (Y = yi | X = xj , Z = zh ) Pr (X = xj , Z = zh )
j =1 h =1

k
(b) E (Y ) = ∑ yi Pr (Y = yi ) Pr (Y = yi )
i =1
k l m
= ∑ yi ∑∑ Pr (Y = yi | X = xj , Z = zh ) Pr (X = xj , Z = zh )
i =1 j =1 h =1
l m
 k 
= ∑∑  ∑ yi Pr (Y = yi | X = xj , Z = zh )  Pr (X = xj , Z = zh )
j =1 h =1  i =1 
l m
= ∑∑ E (Y | X = xj , Z = zh ) Pr (X = xj , Z = zh )
j =1 h =1

dove la prima riga è la definizione della media, la seconda utilizza (a), la terza è una
riformulazione e l’ultima sfrutta la definizione di valore atteso condizionato.

2.21. (a) E ( X − µ )3 = E[( X − µ ) 2 ( X − µ )] = E[ X 3 − 2 X 2 µ + X µ 2 − X 2 µ + 2 X µ 2 − µ 3 ]


= E ( X 3 ) − 3E ( X 2 ) µ + 3E ( X ) µ 2 − µ 3 = E ( X 3 ) − 3E ( X 2 ) E ( X )
+ 3E ( X )[ E ( X )]2 − [ E ( X )]3
= E ( X 3 ) − 3E ( X 2 ) E ( X ) + 2 E ( X )3
(b) E ( X − µ ) 4 = E[( X 3 − 3 X 2 µ + 3 X µ 2 − µ 3 )( X − µ )]
= E[ X 4 − 3 X 3 µ + 3 X 2 µ 2 − X µ 3 − X 3 µ + 3 X 2 µ 2 − 3 X µ 3 + µ 4 ]
= E ( X 4 ) − 4 E ( X 3 ) E ( X ) + 6 E ( X 2 ) E ( X ) 2 − 4 E ( X ) E ( X )3 + E ( X ) 4
= E ( X 4 ) − 4[ E ( X )][ E ( X 3 )] + 6[ E ( X )]2 [ E ( X 2 )] − 3[ E ( X )]4
2.22. La media e la varianza di R sono date da
µ = w × 0,08 + (1 − w) × 0,05
σ 2 = w2 × 0,07 2 + (1 − w) 2 × 0,042 + 2 × w × (1 − w) × [0,07 × 0,04 × 0, 25]

dove 0,07 × 0,04 × 0,25 = Cov ( Rs , Rb ) segue dalla definizione della correlazione tra Rs e
Rb.
(a) µ = 0,065; σ = 0,044
(b) µ = 0,0725; σ = 0,056
(c) w = 1 massimizza µ ; σ = 0,07 per questo valore di w.
(d) La derivata di σ2 rispetto a w è
dσ 2
= 2 w × 0,07 2 − 2(1 − w) × 0,042 + (2 − 4 w) × [0,07 × 0,04 × 0, 25]
dw
= 0,0102 w − 0,0018
Risolvendo rispetto a w si ottiene w = 18 / 102 = 0,18 (si noti che la derivata seconda è
positiva e che perciò si tratta del minimo assoluto). Con w = 0,18, σ R = 0,038.

2.23. X e Z sono due variabili casuali normali standard distribuite in modi indipendenti, così che
µ X = µ Z = 0, σ X2 = σ Z2 = 1, σ XZ = 0.
(a) Data l'indipendenza tra X e Z , Pr ( Z = z| X = x) = Pr ( Z = z ), e E ( Z |X ) = E ( Z ) = 0.
Quindi E (Y | X ) = E ( X 2 + Z| X ) = E ( X 2| X ) + E ( Z |X ) = X 2 + 0 = X 2 .
(b) E ( X 2 ) = σ X2 + µ X2 = 1, e µY = E ( X 2 + Z ) = E ( X 2 ) + µ Z = 1 + 0 = 1.
(c) E ( XY ) = E ( X 3 + ZX ) = E ( X 3 ) + E ( ZX ). Poiché i momenti dispari di una variabile
casuale normale standard sono tutti zero, si ha E ( X 3 ) = 0. Per l’indipendenza tra X e
Z , si ha E ( ZX ) = µ Z µ X = 0. Quindi E ( XY ) = E ( X 3 ) + E ( ZX ) = 0.
(d) cov (XY ) = E[( X − µ X )(Y − µY )] = E[( X − 0)(Y − 1)]
= E ( XY − X ) = E ( XY ) − E ( X )
= 0 − 0 = 0.
σ XY 0
corr (X , Y ) = = = 0.
σ XσY σ XσY
2.24. (a) E (Yi 2 ) = σ 2 + µ 2 = σ 2 e il risultato segue direttamente.
(b) (Yi/σ) è i.i.d. N(0,1), W = ∑ i =1 (Yi /σ ) 2 , e il risultato discende dalla definizione di
n

variabile casuale χ n2 .
n
Yi 2 n
Yi 2
(c) E (W ) = E ∑ = ∑E = n.
i =1 σ2 i =1 σ2
(d) Si scriva
Y1 Y1 /σ
V= =
∑in=2 Yi2 ∑in=2 (Y /σ ) 2
n −1 n −1

che si ottiene dividendo il numeratore e il denominatore per σ. Y1/σ ~ N(0,1),


∑ i =2 (Yi /σ )2 ~ χ n2−1 , e Y1/σ e ∑ i =2 (Yi /σ )2 sono indipendenti. Il risultato si ricava
n n

allora dalla definizione della distribuzione t.

n n
2.25. (a) ∑ axi = (ax1 + ax2 + ax3 +  + axn ) = a( x1 + x2 + x3 +  + xn ) = a∑ xi
i =1 i =1
n
(b) ∑ (x + y ) = (x
i =1
i i 1 + y1 + x2 + y2 +  xn + yn )

= ( x1 + x2 +  xn ) + ( y1 + y2 +  yn )
n n
= ∑ xi + ∑ yi
i =1 i =1
n
(c) ∑ a = (a + a + a +  + a) = na
i =1
n n
(d) ∑ (a + bxi + cyi )2 = ∑ (a 2 + b2 xi2 + c 2 yi2 + 2abxi + 2acyi + 2bcxi yi )
i =1 i =1
n n n n n
= na 2 + b 2 ∑ xi2 + c 2 ∑ yi2 + 2ab∑ xi + 2ac ∑ yi + 2bc ∑ xi yi
i =1 i =1 i =1 i =1 i =1
cov(Yi , Y j ) cov(Yi , Y j ) cov(Yi , Y j )
2.26. (a) corr(Yi,Yj) = = = = ρ ; nella prima uguaglianza si
σY σY
i j
σYσY σ Y2
utilizza la definizione di correlazione, nella seconda il fatto che Yi e Yj hanno uguale
varianza (e deviazione standard), nella terza la definizione di deviazione standard e
nella quarta la correlazione data nel problema. Risolvendo rispetto a cov(Yi, Yj)
dall'ultima uguaglianza, si ottiene il risultato desiderato.

1 1 1 1
(b) Y = Y1 + Y2 , perciò E( Y ) = E (Y )1 + E (Y2 ) = µY
2 2 2 2
1 1 2 σ 2 ρσ Y2
var(Y ) = var(Y1 ) + var(Y2 ) + cov(Y1 , Y2 ) = Y +
4 4 4 2 2

1 n 1 n 1 n
(c) Y = ∑
n i =1
Yi , perciò E (Y ) = ∑ E (Yi ) = ∑ µY = µY
n i =1 n i =1
1 n 
var(Y ) = var  ∑ Yi 
 n i =1 
n −1
1 n 2 n
= 2 ∑ var(Yi ) + 2 ∑ ∑ cov(Y , Y ) i j
n i =1 n i =1 j = i +1
n n −1 n
1 2
=
n2
∑σ Y2 +
i =1 n2
∑ ∑ ρσ
i =1 j = i +1
2
Y

σ n(n − 1)
2
= Y
2
+ ρσ Y2
n n
σ 2
 1
= Y + 1 −  ρσ Y2
n  n
n −1 n
an(n − 1)
Nella quarta riga si utilizza ∑ ∑ a = a(1 + 2 + 3 +  + n − 1) =
i =1 j = i +1 2
per ogni

variabile a.
σ Y2 1
(d) Quando n è grande ≈0 e ≈ 0 , e il risultato segue da (c).
n n

2.27 (a) E(W) = E[E(W|Z)] = E[E(X − X )|Z] = E[E(X|Z) − E(X|Z)] = 0.


(b) E(WZ) = E[E(WZ|Z)] = E[ZE(W)|Z] = E[ Z × 0] = 0
(c) Utilizzando il suggerimento: V = W − h(Z), quindi E(V2) = E(W2) + E[h(Z)2] − 2 × E[W
× h(Z)]. Utilizzando un argomento come quello in (b), E[W × h(Z)] = 0.
Quindi, E(V2) = E(W2) + E[h(Z)2], e il risultato si ricava riconoscendo che E[h(Z)2] ≥ 0
perché h(z)2 ≥ 0 per ogni valore di z.