You are on page 1of 18

Lê Bình Minh- 20172298

Bài tập chương 6 – Xử lý số liệu thực nghiệm

Phần 6.1
6.1. Nêu rõ mỗi số in đậm là một tham số hay thống kê
a. Một lô hàng gồm 100 cầu chì thì có 3 cầu chì bị lỗi. Một mẫu gồm 25 cầu chì có 0
cầu chì: 3 là tham số và 0 là thống kê
b. Tốc độ của 100 xe được theo dõi. Có 63 phương tiện vượt quá tốc độ quy định: 63
là thống kê
c. Một cuộc thăm dò qua điện thoại của các cử tri đã đăng ký một tuần trước cuộc
bầu cử toàn tiểu bang cho thấy 48% sẽ bỏ phiếu cho thống đốc đương nhiệm của thc,
người đang ra tranh cử tái đắc cử. Kết quả bầu cử cuối cùng cho thấy người đương
nhiệm đã giành chiến thắng với 52% số phiếu bầu: 48% là thống kê, 52% là tham số.

6.2. Cho X1, X2, X3, X4 là i.i.d. quan sát từ phân phối với giá trị trung bình  và
phương sai 2. Hãy xem xét bốn công cụ ước lượng sau của 

a. Chứng minh cả 4 công thức trên đều không bias (chệch)


Bias ( ^μ1) = E ( ^μ1) - θ = E (X1) - m1 = m - m = 0
X2+ X3 μ+μ
Bias ( ^μ2) = E ( ^μ2) - θ = E ( ) - q = 2 −μ = 0
2
Bias ( ^μ3) = E ( ^μ3) - θ = E (0,1X1 + 0,2X2 + 0,3X3 + 0,4X4) - θ
= 0,1m + 0,2m + 0,3m + 0,4 m - m = 0
Bias ( ^μ4 ) = E ( ^μ4 ) – θ = E ( X ) - θ = μ−μ = 0
Dựa vào các giá trị Bias tính được, ta thấy 4 công thức trên đều không có độ chệch
b. Tính phương sai mỗi công thức ước lượng, phương sai nào nhỏ nhất
Var ( ^μ1) = Var (X1) = σ 2
X2+ X3
Var ( ^μ2) = Var ( ) = 0,52 Var (X2) + 0,52 Var (X3) = 0,25s2 + 0,25s2 = 0,5s2
2
Var ( ^μ3) = Var (0,1X1 + 0,2X2 + 0,3X3 + 0,4X4)
= 0,12s2 + 0,22s2 + 0,32s2 + 0,42s2 = 0,3s2
2
σ
Var ( ^μ4 ) = var ( X ¿ = = 0,25s2
4
Giá trị Var ( ^μ4 ) là nhỏ nhất
c. ^μ = a1X1 + a2X2 + … + anXn; Var ( ^μ) = (a12 + a22 + … + an2)s2

[( ) ( ) ( ) ]
2 2 2
1 1 1 1 2 n 2 σ2
Khi a1 = a2 = … = an = thì Var ( ^μ) = + +…+ σ = σ =
n n n n n2 n

Trang 1
Ta thấy: Var ( ^μ)= Var ( X ) nên ^μ= X

6.3. Cho X1, X2, …, Xn là mẫu ngẫu nhiên từ phân phối U [0, ). Sử dụng kết quả của
Bài tập 5.44 để chỉ ra những điều sau đây
a. Xmax là ước lượng chệch của . Độ chệch của nó là bao nhiêu?

( n
Bias (Xmax) = E (Xmax) - q = n+1 −θ = θ n+1 −1 = n+1 θ ) −1

b. Xmin + Xmax là ước lượng không chệch của . Từ đó suy ra rằng khoảng giữa, được
định nghĩa là (Xmin + Xmax)/2, là một ước lượng không chệch của /2, là giá trị trung
bình của phân phối U [0, ]
θ nθ
Bias (Xmin + Xmax) = E (Xmin + Xmax) – θ = + −θ = 0
n+1 n+1

6.4. Cho X1, X2. . .., Xn là mẫu ngẫu nhiên từ phân phối có trung bình  và phương
sai 2. Chứng tỏ rằng ( X )2 là một ước lượng chệch của 2. Độ chệch của nó là gì?
(Gợi ý: E (( X )2 - 2) = Var ( X )= 2/n.)
Bài giải: Ta có: E ( X ) = m, E (( X )2) = Var ( X ) + (E ( X ))2
 Var ( X ) = E (( X )2) - μ2 > 0
 E (( X )2) > μ2 → E (( X )2) ≠ μ2
Vậy ( X )2 là một ước lượng chệch của 2 và có độ chệch là
σ2
Bias (( X )2 ) = E (( X )2 ) - μ2 = Var ( X ) + μ2 - μ2 = Var ( X ) =
n
6.5. Giả sử chúng ta có n thử nghiệm Bernoulli độc lập với xác suất thành công thực
sự là p. Xem xét hai ước lượng của p: ^p1= ^p trong đó ^p là một Tỷ lệ mẫu thành công
và ^p2= 1/2. của một hằng số cố định.
a. Tìm giá trị kỳ vọng và độ chệch mỗi công cụ ước lượng

Hàm Bernoulli: f (x) = P (X = x) = { p ( khi x=1 )


1− p ( khi x=0 )
1 1
Giá trị kì vọng: E ( ^p1) = E ( ^p) = p; E ( ^p2) = E ( ) =
2 2
^
p ^
p
Độ chệch: Bias ( 1) = E ( 1) – p = p – p = 0, không có độ chệch
1
Bias ( ^p2) = E ( ^p2) – p = – p
2
b. Tìm phương sai mỗi công cụ ước lượng
1 1
Var ( ^p1 ¿ = Var [ (X1 + X2 + … + Xn)] = [ Var (X1) + Var (X2) + … + Var (Xn)]
n n2
1 p ( 1−p )
= 2 (n (p – p )) =
2
n n

Trang 2
1
Var ( ^p2) = Var ( ) = 0
2
Công cụ tính ^p2 có phương sai thấp hơn
Công thức tính var trong phân bố Bernouli: Var (X) = E (X2) – [E (X)]2 = p(1-p)
c. Tính MSE của mỗi công cụ ước lượng (MSE: Mean square error)
p ( 1−p ) p− p2
MSE ( ^p1) = Var ( ^p1) + [Bias ( ^p ¿¿ 1)¿]2 = =
n n

( )
2
1
MSE ( ^p2) = Var ( ^p2) + [Bias ( ^p2)]2 = − p
2
Vẽ đồ thị MSE so với p với n = 4
p− p2
MSE ( ^p1) =
4

( )
2 2
p− p 1
Đồ thị MSE ( ^p1) = Đồ thị MSE ( ^p2) = − p
4 2
1 1
Nhận xét đồ thị: Đồ thị MSE ( ^p1) có dạng parabol hình đi qua các điểm (0,0), ( , ),
2 16

(1,0). Đồ thị MSE ( ^p2) có dạng parabol đi qua các điểm 0 , ( 14 ), ( 12 , 0), (1 , 14 )
Vì vậy: ^p1 nhìn chung là một đường cong phẳng hơn đồng nghĩa với ít rủi ro hơn.
Tuy nhiên ^p2 có MSE thấp hơn với p gần 0,5 vì thế ^p1 không phải lúc nào cũng là
công cụ tốt hơn.
6.6. Biểu thị θ^ 1 và θ^ 2 là 2 ước lượng độc lập không chệch của θ . Giả sử rằng Var ( θ^ 1)
= σ 21, Var (θ^ 2 ) = σ 22. Hãy xem xét một công cụ ước lượng tổng hợp θ=ω ^ ^ ^
1 θ1 +ω2 θ2 ,

trong đó ω 1 và ω 2 là cố định trọng lượng


a. Chứng minh θ^ là không chệch nếu 1 + 2 = 1
có 1 + 2 = 1 nên 2 = 1 - 1
Bias (θ^ ) = E (θ^ ) – θ = E (ω 1 θ^ 1 +ω 2 θ^ 2) – θ = ω 1 E ( θ^ 1) + ( 1−ω1 ) E ( θ^ 2 )−θ
= ω 1 θ+ ( 1−ω1 ) θ−θ = 0
Vậy θ^ là không chệch nếu 1 + 2 = 1
b. Chứng tỏ rằng Var (θ^ ) = ω 21 σ 21+ ω22 σ 22 là cực tiểu khi
Trang 3
σ 22 σ 21
ω 1= ; ω 2=1−ω 1=
σ 21 +σ 22 σ 21 +σ 22

( ) ( ) σ 42 ⋅ σ 21+ σ 21 ⋅σ 42 σ 21 σ 22 (σ 21+ σ 22 )
2 2 2 2
σ2 σ1
Var (θ^ ) = ω 21 σ 21+ ω22 σ 22 =
2 2
⋅σ +1 ⋅σ =2 2 =
2
σ 1 +σ 2
2 2
σ 1 +σ 2
2
( σ 21 +σ 22) ( σ 21 +σ 22)
2

2 2
σ1 σ2
= 2 2
σ 1 +σ 2

6.7. Một mẫu ngẫu nhiên gồm 10 lon cà phê được lấy từ một dây chuyền sản xuất và
cân các thành phần bên trong. Các trọng số (tính bằng oz.) Như sau

Tính giá trị trung bình của mẫu như một ước tính của giá trị trung bình c ủa quá trình
và sai số chuẩn của trung bình (SEM).
1
Bài giải: Giá trị trung bình của mẫu: X = ( x + x +…+ x10 ) = 26,15 (oz)
10 1 2
1
Giá trị phương sai mẫu: s2 = ∑
n−1 x
(
2
x i−x ) = 0,2316 = σ 2


2
Sai số chuẩn của chung bình: SEM = σ = 0,152
n
6.8. Vào đầu chính quyền tổng thống của Bill Clinton, ông đã đề xuất những cải cách
sinh thái được đề xuất. Một mẫu người đã nghe bài phát biểu (n = 611) được hỏi li ệu
họ có ủng hộ thuế cao hơn đối với tất cả các dạng năng lượng hay không. 43% trả lời
Có "Coi tỷ lệ phần trăm phổ biến này là ước tính của phần trăm dân số (dân số ở đây
là bao nhiêu?), Hãy tính sai số chuẩn của nó.
Bài giải: Số người đồng ý: x = 611 x 43% = 262.73 ~ 263
^( ^) ( )

Sai số chuẩn của mẫu là: SE ( ^p) = p 1− p = 0,43 1−0,43 = 0,0200
n √ 611
6.9. Tìm phương pháp ước lượng mômen của các tham số 1 và 2 trong phân bố
gamma với hàm mật độ xác suất

dựa trên một mẫu ngẫu nhiên X 1, X2, ...., Xn. Cân bằng giá trị trung bình và phương
μ
^1 ^ 21
^ 2− μ
μ
sai của phân bố gamma, cho các đại lượng mẫu tương ứng và tương ứng
θθ1 ⋅ x θ −1 ⋅ ⅇ−θ
2 2 1 x

Bài giải: Hàm phân bố Gamma f (x) =


Γ ( θ2 )
Có E (X) = X = ^μ và Var (X) = s2 = ^μ− μ^ 2 (theo đề bài cho)
θ2
Theo hàm f (x), có E(X) = = μ^ ; từ đó θ2= μ^ ⋅θ 1 (1)
θ1
Trang 4
θ2
Var (X) = 2 = ^μ− μ^ 2; từ đó: θ2= ( ^μ− μ^ 2 ) θ1 = σ 2 ⋅ θ1(2)
θ1
^
μ μ^ ^μ
Chia (1) và (2) theo từng vế: 1= = 2 → θ1= 2 (3)
( ^μ −μ^ ) θ 1 σ ⋅θ1
2
σ
μ^ 2
Thay (3) vào (2) ta được: θ2= 2
σ
6.10. Tìm phương pháp ước lượng mô men của các tham số 1 và 2 trong phân phối
beta với hàm mật độ xác suất

dựa trên một mẫu ngẫu nhiên X 1, X2, ...., Xn. Cân bằng giá trị trung bình và phương
μ
^1 ^ 21
^ 2− μ
μ
sai của phân bố gamma, cho các đại lượng mẫu tương ứng và tương ứng
Γ ( θ1 +θ2 ) θ2−1
Bài giải: Hàm phân bố Beta: f (x) = x θ −1 ( 1−x )
1

Γ ( θ1 ) Γ ( θ 2 )
Có E (X) = X = ^μ và Var (X) = s = ^μ− μ^ 2 (theo đề bài cho)
2

θ1
Theo hàm f (x), có E(X) = = ^μ
θ1+ θ2
θ1 θ2
Var (X) = 2 = s2
( θ1 +θ2 ) ( θ1 +θ2 +1 )
Phần 6.2.
6.11. Xem xét xác suất sau:


Trong đó là giá trị trung bình của một tập hợp ngẫu nhiên có kích thước n được rút
ra từ phân phối N (,2).
a. Tìm khoảng tin cậy của μ, mức độ tin cậy của khoảng này
X−μ
Ta có Z= là phân bố chuẩn tắc của X
σ /√n
P (-1,645 ≤ Z ≤ 1,645) = 0,95 – 0,05 = 0,90
Mức độ tin cậy ở đây là 90% và khoảng tin cậy ở đây là:

[ x−1,645
σ
√n
, x +1,645
σ
√n ]
b. Mẫu có n = 100, lấy từ quần thể có s = 10, giá trị trung bình mẫu là 30, tính
khoảng tin cậy

[
90% CI = 30−1,645 ⋅
10
√100
,30+ 1,645⋅
10
√ 100 ]
= [28,355; 31,645]
c. Mặc dù P ( x - 1,645 ≤ Z ≤ x + 1,645) = 0,90 nhưng xác suất
Trang 5
P (28,355 ≤ μ ≤ 31,645) là 0 hoặc 1 không phải là 0,90
6.12. Mô phỏng 25 mẫu cỡ 20 từ phân phối N (50, 62) và tìm 95% CI cho mỗi mẫu.
a. Có bao nhiêu khoảng trong số các khoảng chứa giá trị trung bình thực 50? sai có
nghĩa 53?
Thực hiện tạo ngẫu nhiên 25 mẫu (x = 25) với kích th ước n = 20 t ừ phân b ố chu ẩn
trên Minitab và thực hiện tính khoảng tin cậy 95% cho mỗi mẫu, ta được kết quả như
sau

Từ bảng giá trị trên ta thấy được các số khoảng chứa giá trị trung bình 50 là: 20
khoảng giá trị (tất cả các khoảng giá trị), chứa giá trị trung bình 53 là khoảng 7
khoảng giá trị
b. Nếu kích thước mẫu được tăng lên n = 100, điều gì sẽ xảy ra với chiều rộng của
95% CI? Bạn có mong đợi nhiều hơn hay ít hơn những khoảng này chứa giá trị trung
bình thực sự là 50? sai có nghĩa là 53?
Với kích thước mẫu khi tăng lên 100 thì độ rộng của các khoảng tin cậy sẽ không
đổi do số mẫu không đổi. Khoảng tin cậy có chứa giá trị trung bình 50 sẽ không có ở
tất cả các khoảng giá trị mà chỉ có khoảng 95 khoảng giá trị. Khoảng tin cậy có chứa
giá trị 53 sẽ nhiều hơn, khoảng 30 khoảng giá trị.
c. Nếu không biết rằng giá trị trung bình thực sự là 50, ta có thể cho khoảng giá trị
bằng cách sử dụng công thức theo Z để kiểm chứng µ đúng
Khoàng tin cậy được tính như sau:
σ
¿ ; X + z α /2 . ]
√n
6.13. Giả sử rằng 100 các mẫu ngẫu nhiên có kích thước 9 được tạo ra từ phân phối
N (70, 32) và CI 95% liên quan được tính cho mỗi mẫu

Trang 6
a. Có bao nhiêu khoảng trong 100 khoảng có chứa giá trị trung bình đúng μ = 70?
Khoảng tin cậy ở đây có mức độ tin cậy là 95% nên sẽ có 100 x 0,95 = 95 khoảng tin
cậy có chứa giá trị trung bình đúng μ = 70
b. Gọi X là khoảng trong số 100 khoảng có chứa  đúng. Sự phân bố của r.v của X là:
Phân bố của X là phân bố nhị thức với X ~ Bin (100, 0.95)
6.14. Một mẫu ngẫu nhiên có kích thước 25 từ phân phối N (, 62) có giá trị trung

bình = 16,3
a. Tính CI cho  để có ba mức độ tin cậy: 80%, 90%, và 99%. Độ rộng CI thay đổi
như thế nào? ( x̄ = 16,3, s2 = 6)
Khoàng tin cậy của giá trị  có khoảng tin cậy là 1 – α là:
σ σ
[ X −z α/ 2 .
; X + z α /2 . ]
√n √n
+) Với độ tin cậy là 80% thì 1 – α = 0,8 và α = 0,2, z α ∕ 2=z 0,1 = 1,282
6 6
Khoảng tin cậy là [16,3 – 1,282. ; 16,3 + 1,282. ] = [14,7616; 17,8384]
√25 √25
Tương tự với khoảng tin cậy bằng 90% và 99% ứng với z0,05 = 1,645 và z0,005 = 2,576
Với khoảng tin cậy 90%: [14,326; 18,274]
Khoảng tin cậy 99%: [13,2088; 19,3912]
Nhận thấy rằng độ rộng của khoảng tin cậy sẽ tăng lên khi ta tăng mức độ tin cậy
b. Độ rộng khoảng tin cậy sẽ như nào nếu tăng n lên 100
σ
Độ rộng của khoảng tin cậy là 2 z α /2 ⋅
√n
Khi n tăng lên 100 thì n tăng lên 4 lần còn √ n tăng lên 2 lần do đó độ rộng khoảng tin
cậy sẽ giảm đi 2 lần
6.15. Chúng tôi muốn ước tính điện áp đầu ra trung bình của một loạt đơn vị cung cấp
điện Một mẫu ngẫu nhiên gồm 10 đơn vị được thử nghiệm và giá trị trung bình của
mẫu được tính là 110,5 vôn Giả sử rằng các phép đo được phân phối bình thường với
=3vôn
a. Tính CI 95% hai phía trên điện áp đầu ra trung bình. Giả sử rằng các thông số kỹ
thuật về điện áp đầu ra trung bình thực là 110  2,5volt, CI có đáp ứng hay không?
σ σ
Khoảng tin cậy như sau: [ X −z α / 2 .; X + z α /2 . ],
√n √n
z
Ta có độ tin cậy bằng 95% nên α = 0,05 vì vậy α ∕ 2 = z0,025 = 1,96
Thay các giá trị X = 110,5V; n = 10, =3, z0,025 = 1,96, khoảng tin cậy với mức độ tin
cậy 95%
3 3
[110,5 – 1,96. ; 110,5 + 1,96. ] = [108,64; 112,36]
√10 √10

Trang 7
Với giá trị trung bình thực là 110  2,5 (V) thì khoảng tin cậy với độ tin cậy 95% trên
là hợp lý
b. Giả sử có thể áp dụng thông số kĩ thuật thấp hơn. Tính CI 95% một phía thích hợp
trên điện áp đầu ra trung bình và giải thích cách sử dụng nó để kiểm tra xem giới hạn
thông số kỹ thuật thấp hơn có được đáp ứng hay không?
Áp dụng thông số kĩ thuật thấp hơn thì khoảng tin cậy có độ tin cậy 95% là
σ
[ x−z α ⋅ ; ∞)
√n
Thay số z0,05 = 1,645, X = 110,5V, =3, n = 10 vậy khoảng tin cậy là
3
[110,5 – 1,645. ; ∞ ) = [108,9; ∞ )
√10
Vì 108,9 lớn hơn giá trị giới hạn nhỏ nhất là 107,5 do đó khoảng tin cậy đáp ứng
c. Giả sử rằng chỉ áp dụng thông số kỹ thuật trên, vì mối quan tâm chính là điện áp
quá cao có thể gây ra sự cố của thiết bị. Tính độ tin cậy 95% một phía thích hợp được
tìm thấy trên điện áp đầu ra trung bình và giải thích cách sử dụng nó để kiểm tra xem
giới hạn thông số kỹ thuật trên có được đáp ứng hay không?
Áp dụng công thức tính khoảng tin cậy 1 chiều với điện áp cao hơn như sau
σ
(−∞ ; x + z α ⋅ ]
√n
Thay số z0,05 = 1,645, X = 110,5V, =3, n = 10 vậy khoảng tin cậy là
3
(−∞ ; 110,5 + 1,645. ] = (−∞ ; 112,06]
√10
Ta có 112,06 nhỏ hơn giá trị giới hạn trên là 112,5 do đó khoảng tin cậy 1 chiều cao
hơn này thỏa mãn
μ̄
6.16. Gọi X1, X2, ...., Xn là mẫu ngẫu nhiên từ phân phối liên tục với trung vị . Nếu
μ̄
[Xmin, Xmax] được sử dụng làm CI cho , mức độ tin cậy của nó là bao nhiêu? Mức độ
tin cậy là bao nhiêu nếu n = 10?
Bài giải: Với bất kì biến X ngẫu nhiên liên tục nào thì luôn có: P (X ≤ a) = P (X < a)
Do μ là giá trị trung vị của mẫu nên ta có P (xi < μ) = 0,5
1
Ta có P (Xmin > μ) = 1 – F(1)( μ) = (1 – F( μ))n =
2n
1
P (Xmax < μ) = F(n)( μ) = [F( μ)]n =
2n
1
Ta có giá trị là giá trị xác suất ước lượng trên và xác suất ước lượng dưới nên độ
2n
tin cậy của khoảng giá trị [Xmin, Xmax] sẽ là
1 1 2 1
Confident Level = n
+ n = n = n−1
2 2 2 2
Với n = 10 thì khoảng tin cậy sẽ là:
Trang 8
1 1 2 1 1
Confident Level = n
+ n = n = n−1 = 9
2 2 2 2 2
Phần 6.3.
6.17. Trong mỗi trường hợp sau, hãy nêu giả thuyết vô hiệu H o và giả thuyết thay thế
H1 về tỷ lệ dân số p được kiểm tra. Giải thích p trong mỗi giả thiết.
a. Người chiến thắng trong cuộc bầu cử quốc hội vừa qua nhận được 54% số phiếu
bầu. Một năm trước cuộc bầu cử tiếp theo, nghị sĩ đã thuê một cơ quan bỏ phiếu để
tiến hành một cuộc khảo sát lấy mẫu các cử tri để xác định xem liệu quy trình này có
thay đổi hay không.
Answer: Do câu hỏi ở đây là liệu rằng tỉ lệ trúng cử của các nghị sĩ quốc hội có
thay đổi hay không nên đây là kiểm tra giả thuyết 2 chiều nên H 0: p = 54%, H1: p ≠
54%, p là tỷ lệ thực tế số người vote cho nghị sĩ quốc hội
b. Tỷ lệ sách quá hạn trong thư viện là 5%. Tôi dự kiến sẽ tăng tiền phạt cho những
cuốn sách quá hạn từ 5 xu lên 10 xu mỗi ngày. Người ta cảm thấy rằng điều này sẽ
làm giảm tỷ lệ sách quá hạn
Answer: Câu hỏi ở đây là tỉ lệ p cúa sách quá hạn sẽ giữ nguyên hay giảm xuống
nên đây là giả thiết một chiều với ước lượng thấp hơn vì thế ta có: H o: p = 5% và H1:
p < 5%, p là tỉ lệ sách quá hạn
c. Tỷ lệ phế phẩm trong vật liệu chế tạo thùng rác cao hơn 40%. Một sản xuất mới
quy trình được đề xuất để giảm tỷ lệ phế phẩm
Answer: Ở đây giả thiết sẽ là giả thiết 1 chiều với ước lượng thấp hơn do đó ta có
giả thiết: Ho: p = 40%, H1: p < 40%, p là tỷ lệ phế phẩm
d. Gatorade và All Sport là hai loại đồ uống phổ biến đối với các vận động viên Một
công ty tiếp thị muốn xác định xem tỷ lệ người thích hương vị của Gatorade hay All
Spurt nhiều hơn. Vì mục đích này, một bài kiểm tra mù được tiến hành trong đó hai
loại đồ uống được cung cấp theo thứ tự ngẫu nhiên cho một người yêu thích các Bậc
thầy, những người sau đó được yêu cầu chỉ ra sở thích đối với đồ uống này hay đồ
uống khác
Answer: Xác suất p ở đây là thích Gatorade hay All Sport nhiều hơn. Không thể
biết được 2 đồ ăn này tỷ lệ thích như nào do đó đây là giả thiết 2 chiều với p = ½ và
p ≠ ½ trong đó p = P (là tỉ lệ thích Gatorade.
6.18. Trong mỗi phương án sau đây nêu giả thuyết vô hiệu H o và giả thuyết thay thế
H1 về trung bình dân số p đang được kiểm định. Giải thích p trong mỗi trường hợp
a. Một nhóm cơ quan giám sát người tiêu dùng nghi ngờ rằng một loại sữa chua được
quảng cáo là không có chất béo 98% thực sự có hàm lượng chất béo cao hơn. Nhóm
dự kiến đo hàm lượng chất béo trong 25 cốc sữa chua (mỗi cốc chứa 170 gram) để
xác minh nghi ngờ rằng hàm lượng chất béo trung bình thực sự trên mỗi cốc là hơn
2%, tức là 3,4 gam
Trang 9
Answer: Phương án này đang kiểm định hàm lượng chất béo ở đây là bằng hay
lớn hơn 3,4g, vậy đây là thiết 1 chiều với ước lượng cao hơn vì vây giả thiết là:
H0: μ = 3,4g; H1: μ > 3,4 g
b. Thông số kỹ thuật với độ bền cắt của dây buộc được sử dụng trong lắp ráp cơ khí
là 10.000 psi. Một mẫu dây buộc ngẫu nhiên từ một lô lớn do nhà cung cấp cung cấp
được thử nghiệm để xem liệu độ bền cắt trung bình của lô có đáp ứng yêu cầu kỹ
thuật hay không. Hãy xem xét hai tình huống: (i) Nhà cung cấp là người mới, vì vậy
có rất ít lịch sử quá khứ về chất lượng lô hàng của họ. (ii) Nhà cung cấp đã cũ và lịch
sử trong quá khứ cho thấy rằng các lô của họ thường đáp ứng các thông số kỹ thuật
Answer: Giá trị trung bình ở đây là độ bền cắt của dây buộc trong lắp ráp cơ khí,
vì vậy Ho: μ = 10000 psi
Trường hợp 1: Nhà cung cấp là người mới, chưa có lịch sử quá khứ về chất lượng
lô hang của họ vì vậy trường hợp này độ bền cắt của dây phải đủ lớn do đó H 1: μ
>10000.
Trường hợp 2: Nhà cung cấp đã cũ và lịch sử trong quá khứ cho thấy rằng các lô
của họ thường đáp ứng các thông số kĩ thuật nên H1: μ < 10000
c. Thời gian đi làm trung bình của một người đi làm từ giờ đến nơi làm việc là 25
phút. Anh ta muốn thử một tuyến đường khác trong một tháng để xem liệu nó có làm
giảm thời gian đi làm trung bình hay không
Answer: Ở đây là thời gian làm việc trung bình ít hơn hay bằng 25 phút. Do đó
ở đây là ước lượng 1 chiều với ước lượng thấp hơn: H0: μ = 25; H1: μ < 25
d. Tham khảo phần (d) của bài tập trước, nhưng bây giờ thay vì chỉ đơn giản chỉ ra sở
thích, giả sử rằng người nếm thử chỉ định một số điểm trên thang điểm từ 1 đến 10
cho mỗi đồ uống. Sự khác biệt giữa Gatorade và All Sport thử tạo thành tập dữ liệu
Answer: μ là giá trị trung bình sự khác nhau giữa 2 điểm, ở đây là giả thiết 2
chiều với H0: μ = 0 và H1: μ ≠ 0
6.19. Trong mỗi trường hợp sau, hãy giải thích giả thuyết nào nên được thiết lập là
giá vô hiệu và giả thuyết nào nên được thiết lập làm phương án thay thế bằng cách
quyết định giả thuyết nào nếu được phản ánh không chính xác, sẽ dẫn đến sai sót
nghiêm trọng hơn. Đây là giả thuyết nên được thiết lập là vô hiệu. Nêu bất kỳ giả
định nào mà bạn đưa ra
a. Một hợp chất hóa học được sử dụng làm chất phụ gia bị nghi ngờ là chất gây ung
thư. Hai giả thuyết được đưa ra là: (i) nó an toàn, (ii) nó không an toàn với lượng tiêu
thụ thông thường
Answer: Ở đây H0: (ii) nó không an toàn với lượng tiêu thụ thông thường; H 1: nó
an toàn. Giả định ở đây là không thể kết luận sản phẩm là an toàn khi giả định nó
không an toàn và chúng không an toàn thì không nên bán trên thị trường
b. Một loại thuốc giảm đau mới đã được phát triển bởi một công ty dược phẩm. 2 giả
thiết là: (i) nó có hiệu quả. (ii) nó không hiệu quả
Trang 10
Answer: Ở đây H0: (ii) nó không hiệu quả và H1: (i) Nó hiệu quả
Nếu (i), loại thuốc giảm đau mới có hiệu quả nhưng bị từ chối khi nó có hiệu quả,
thì một loại thuốc hữu ích sẽ không được bán trên thị trường. Nếu (ii), thuốc giảm
đau mới không có hiệu quả, bị từ chối khi nó thực sự không hiệu quả, thì một loại
thuốc không hữu ích sẽ được bán trên thị trường. Nhưng chúng ta đã có thuốc giảm
đau hiệu quả, vì vậy hãy tạo (ii) H0.
c. Để một sản phẩm chung mới được cơ quan quản lý chấp thuận, nó phải được
chứng minh. Ngoài ra, nó tương thích về mặt sinh học với thuốc gốc. Hai giả thuyết
là: (i) nó là tương đương sinh học, (ii) nó không tương đương sinh học.
Answer: H0: Nó không tương đương sinh học; H1: Nó tương đương sinh học.
d. Người ta khẳng định rằng gieo hạt theo đám mây là một kỹ thuật hiệu quả để tăng
lượng mưa. Hai giả thuyết là: (i) nó hiệu quả, (ii) nó không hiệu quả
Answer: H0: nó không hiệu quả; H1: nó hiệu quả
Nếu (i), tạo mây làm tăng lượng mưa, bị từ chối, chúng tôi sẽ sử dụng một cách để
tạo mưa. Nếu (ii), việc gieo hạt trên đám mây không làm tăng lượng mưa, bị từ chối,
thì một kỹ thuật không hiệu quả sẽ được đưa vào thực tế
4.20. Cho X là một Bernoulli r.v. với P (X = 1) = p và P (X = 0) = 1 - p. Chúng ta
muốn kiểm tra Ho: p = 1/4 và H1: p= ¾
a. Giả sử rằng dựa trên một quan sát duy nhất X, quy tắc quyết định là: không bác bỏ
Ho nếu X = 0; bác bỏ Ho nếu X= 1. Tìm xác suất của lỗi loại I và loại II?
Xác suất của lỗi loại I là
α = P (type I error) = P (Reject H0| H0 true) = P (X = 1| H0: p = ¼) = ¼
Xác suất của lỗi loại II là:
Β = P (type II error) = P (Do not reject H 0|H0 false) = P (X = 0| H 1: p = ¾) = 1 – ¾ =
¼
b. Giả sử rằng dựa trên hai i.i.d. quan sát X 1 và X2 quy tắc quyết định là: không bác
bỏ Ho nếu X1 + X2 = 0 hoặc 1; nếu không thì từ chối H o. Tìm xác suất của lỗi loại I và
loại II cho quy tắc này
Xác suất loại I của quy tắc này là:
α = P (type I error) = P (Reject H0| H0 true) = P (2 successes|H0: p = ¼) = (1/4)2 =
1/16
Xác suất loại II của quy tắc là:
Β = P (type II error) = P (Do not reject H 0|H0 false) = P (not 2 successes|H0: p = ¾) =
= 1 – (3/4)2 = 7/16
6.21. Xem xét kế hoạch lấy mẫu chấp nhận lấy mẫu ngẫu nhiên gồm 50 từ một lô lớn
và chấp nhận Int nếu số lượng thám tử không quá 2; nếu không thì nó từ chối rất
nhiều. Gọi p là phân số chưa biết bị lỗi trong lô. Lô hàng được coi là “đạt yêu cầu”
nếu p= 0,02 trở xuống và “không đạt yêu cầu” nếu p = 0,1 trở lên. Vẽ đường cong
OC của quy tắc này bằng cách tính xác suất chấp nhận Ho cho p= 0,01 đến 0,05 trong
Trang 11
các bước 0.01 và p = 0.05 đến 0.20 trong các bước 0.05. Nguy cơ  hay  nào cung
cấp các giá trị của quy tắc này cho p= 0,02 và p= 0.1, tương ứng? Công suất của p=
0,15 là bao nhiêu
2

Bài giải: Công thức tính OC: OC (p) = ∑ (50i )⋅ p ⅈ ⋅ ( 1−P )50−ⅈ
i=0

Ta có bảng giá trị p và OC (p) như sau:


Xác suất Số lượng chấp nhận Số mẫu OC (p)
0,01 2 50 0,986
0,02 2 50 0,922
0,03 2 50 0,811
0,04 2 50 0,677
0,05 2 50 0,541
0,1 2 50 0,112
0,15 2 50 0,014
0,2 2 50 0,001
Và đồ thị đường OC (p) là

Dựa vào đồ thị ta thấy: α = 1 – 0,922 = 0,778; β = 0,112


Power (0,15) = 1 – P (Type 2 error) = 1 – β = 1- 0,014 = 0,986
6.22. Tham khảo Bài tập 6.17, phần (d). Gọi p là tỷ lệ những người trong dân số thích
Gatorade hơn Tất cả các môn thể thao. Chúng tôi muốn quyết định xem có nhiều
người thích Gatorade hơn không. Các giả thuyết được thiết lập dưới dạng Ho: p  1/2
trái lại H1: p > 1/2. 15 người nếm thử đã tham gia vào thí nghiệm kiểm tra mùi vị
a. Giả sử rằng 11 trong số 15 người thử nghiệm thích Gatorade hơn All Sport. Cái gì
là giá trị P? Bạn có thể từ chối Ho tại = 0.10 không
Answer: Cho X là số người thử vị thích Gatorade trong tất cả các môn thể thao. Giá
trị p- value là mức ý nghĩa quan sát, là mức α nhỏ nhất mà ở đó kết quả thử nghiệm

Trang 12
quan sát được là có ý nghĩa. Nếu α > P thì ta từ chối H 0, còn α < P thì ta không từ
chối H0. Do đó p- value là xác suất dưới H0 thu được 1 kết quả ít nhất là cực đoan như
kết quả được quan sát.
1
Ở đây dưới H0 ta có xác suất p = vậy xác suất 11 người hoặc nhiều hơn trong 15
2
người tham gia thử vị nếu p = ½ là: P (X ≥ 11), ta có n = 15 và p = ½, tra bảng ta có
P (X < 11) = P (X≤10) = 0,941, vì vậy: P (X ≥ 11) = 1 - 0,941 = 0,059
Vì P < 0,10, ta có thể bác bỏ H0 tại α = 0,10 vì thế kiểm định giả thiết 1 chiều với
90% có thể kết luận rằng p không nhỏ hơn ½, vì vậy Gartorade được thích hơn All
Sport
b. Giả sử rằng tiên nghiệm không có lý do gì để tuyên bố rằng một loại đồ uống được
ưa thích hơn đồ uống khác. Chúng tôi muốn thí nghiệm kiểm tra mùi vị cho chúng tôi
biết liệu có sự khác biệt đáng kể hay không, và nếu có, thì hướng nào. Do đó, giả
thuyết thay thế Hiện tại là hai phía. Giá trị P là gì? bạn có thể từ chối H o ở =0.10?
Answer: Ở đây xác suất được tính là xác suất 11 người hoặc nhiều người thích 1
trong 2 đồ uống nếu p = ½, ta cần phải tìm P (X ≥ 11 or X ≤ 4) = 0,059 + 0,059 =
0,118
Khi P > 0,10, khi đó H0 không thể bác bỏ tại α = 0,10, do đó giả thiết 2 chiều 90%
không thể kết luận được đây là sự khác nhau về sở thích giữa 2 loại đồ uống

6.23. Mục đích của bài tập này là cung cấp cho bạn cảm giác về rủi ro  và  của một
bài kiểm tra như tỷ lệ của các lỗi loại I và loại II trong một chuỗi dài các ứng dụng
của cùng một bài kiểm tra khi Ho đúng và khi H1 là đúng, tương ứng. Xem xét kiểm
định Ho: = 0 và H1:  > 0 ở mức ý nghĩa 5% dựa trên mẫu có kích thước 9 từ phân
phối chuẩn trung bình  không biết và đã biết  = 1.
a. Rủi ro thứ  của quy tắc này là gì? Rủi ro  của quy tắc này là bao nhiêu nếu  =1
σ
Answer: Ta có: x=μ+ z 0,05 (thay μ = 0; z0,05 = 1,645, σ =1 và n = 9), x = 0,548
√n
α = P (Type I error) = P ( x > 0,548| μ = 0) = P (Z > 1,644) = 1 – P (Z≤ 1,644) = 0,05
β = P (Type II error) = P ( x ≤ 0,548|m = 1) = P (Z ≤ - 1,356) = 0,087
b. Mô phỏng thời gian thử nghiệm này cho = 0 (bằng cách vẽ các mẫu có kích thước
9 từ phân bố N (0,1) và thực hiện thử nghiệm) và đếm tỷ lệ số lần lỗi I là cam kết (Ho
bị từ chối). Lặp lại với  = 1 và tính tỷ lệ số lần lỗi loại II được phạm phải (Ho không
bị từ chối). Tỷ lệ này gần như thế nào với rủi ro và ?
σ
Answer: Ta có x=μ+ z 0,05
√n
thay μ = 0; z0,05 = 1,645, σ =1 và n = 9) thì x = 0,548
thay μ = 1; z0,05 = 1,645, σ =1 và n = 9), thì x = 1,548
α = P (Type I error) = P ( x > 0,548| μ = 0) = P (Z > 1,644) = 1 – P (Z≤ 1,644) = 0,05

Trang 13
β = P (Type II error) = P ( x ≤ 1,548|m = 1) = P (Z ≤ 1,644) = 0,05
Tỉ lệ này gần đúng với tỉ lệ tính ở câu a.
6.24. Một công ty mua ốc vít kim loại theo lô lớn Độ bền cắt trung bình ít nhất phải là
l0,000 psi để lô hàng có thể chấp nhận được. Điều này có thể được hình thành như
một vấn đề kiểm tra giả thuyết với Ho:  l0,000 ngược lại H1:  > 10,000. Một mẫu
gồm 10 ốc vít được thử nghiệm, và nếu giá trị trung bình của mẫu vượt quá 10.500
psi, thì Ho bị loại và lô được chấp nhận. Giả sử =1000 psi. Tính toán rủi ro  và 
cho quy tắc này nếu đúng =10000 và 11000 psi, tương ứng
x−μ
Bài giải: x = 10500 psi, =1000 psi, n =10, Ho: =10000, H1: =11000, Z =
σ ∕ √n
α = P (Type error 1) = P ( x > 10500| =10000) = P (Z > 1,581|=10000)
= 1 – 0,9431 = 0,0569
β = P (Type error II) = P ( x ≤ 10500| = 11000) = P (Z≤ -1,581) = 0,057
Power = 1 – β = 1 – 0,057 = 0,943
6.25. Tham khảo bài tập 6.24. Vẽ đường cong OC của quy tắc này bằng cách tính
toán khả năng không từ chối H o đối với các giá trị  từ 9600 đến 11.600 trong các
bước 200
x−μ
x = 10500 psi, =1000 psi, n =10, Z =
σ ∕ √n
10500−μ
OC (p) = P (Z < )
1000 ∕ √ 10
Bảng giá trị và đồ thị đường cong OC (p) của quy tắc này là:
m Xác suất
9600 0,99779
9800 0,98657
10000 0,94308
10200 0,82861
10400 0,62409
10600 0,37591
10800 0,17139
11000 0,05692
11200 0,01343
11400 0,00221
11600 0,00025
6.26. Tham khảo Bài tập 6.25. Giả sử công ty muốn kiểm soát rủi ro  ở mức 0,01.

Quy tắc quyết định về mặt là gì? Rủi ro  và công suất của nó là bao nhiêu khi  =
11,000 psi? Lặp lại các phép tính với giả định cỡ mẫu là 20. Bạn kết luận gì?
Trang 14
Bài giải: Quy tắc quyết định x là P ( x > 10.500| p =0,99)
Rủi ro β khi  = 11000 psi là 0,05692
Power = 1 – β = 1 – 0,05692 = 0,94308
Lặp lại với cỡ mẫu n = 20: P ( x ≤ 10500 | = 11000) = P (Z≤ -2,236) = 0,01
Khi n = 20 thì giá trị β nhỏ hơn
6.27. Để rút ngắn thời gian chu kỳ của một quy trình lắp ráp, một kỹ sư công nghiệp
đã đơn giản hóa- hoàn thiện các hoạt động và thiết kế một bộ cố định mới. Với
phương pháp cũ, thời gian trung bình cho lắp ráp là 10 phút Để kiểm tra tuyên bố của
mình, một thí nghiệm được tiến hành trong đó 15 công nhân được đào tạo theo
phương pháp mới tham gia.
a. Thiết lập các giả thuyết để chỉ ra rằng thời gian lắp ráp trung bình với phương pháp
mới dưới 10 phút: giả thuyết là H0: μ = 10 mins; H1: μ < 10 mins
b. Giả sử rằng trung bình của mẫu đối với 15 công nhân là 8,7 phút Nếu  = 2 phút
thì có bằng chứng có ý nghĩa thống kê rằng thời gian trung bình được giảm xuống?
Sử dụng  = 0,05.
x−μ
Ta có Z = ; thay số: x = 8,7; μ = 10; n = 15; σ = 2 ta được z = - 2,517
σ ∕ √n
Ta có z < - z0,05 (-2,517 < -1,645), ta có thể bác bỏ H 0 do đó có thể thấy được thời
giant trung bình μ giảm xuống.
c. Kỹ sư công nghiệp tuyên bố rằng phương pháp mới sẽ giảm thời gian trung bình ít
nhất 1,5 phút. Tính cơ hội để thử nghiệm này có thể thử nghiệm được
Power = 0,8962 (???)
6.28. Năm 1993, một gia đình Mỹ điển hình đã chi 22% thu nhập sau thuế của mình
cho quần áo, giải trí và các hoạt động khác trong khi 78% còn lại được chi cho các
nhu cầu thiết yếu như nhà ở, thực phẩm, phương tiện đi lại, chăm sóc sức khỏe và bảo
hiểm. đề xuất chi phí thiết yếu tăng kể từ năm 1993, tỷ lệ phần trăm thu nhập trung
bình chi cho ba mặt hàng đầu tiên đã giảm. Để kiểm tra đề xuất của đề xuất này,
một mẫu ngẫu nhiên gồm 50 hộ gia đình được lấy và xác định tỷ lệ phần trăm chi
tiêu cho ba mặt hàng này. Giả sử rằng tỷ lệ phần trăm này thay đổi giữa các gia
đình theo phân phối chuẩn với p trung bình chưa biết và = 5% đã biết. (Lưu ý rằng
tỷ lệ phần trăm này không phải là tỷ lệ nhị thức)
σ
a. Thiết lập các giả thiết trên μ: μ0 = x + z α ⋅
√n
H0: μ=μ 0; H1: μ< μ0
b. Nếu tỷ lệ phần trăm trung bình của 50 gia đình là 20,5%, bạn có kết luận rằng đây
là một mức giảm đáng kể so với mức năm 1993 không? Sử dụng =0.01.
Ta có x = 22%, μ = 20,5; = 5%; n = 50
Nên: z = 2,121 < z0,10 = 2,3263 (Để từ chối H0 thì z < -z0,01)

Trang 15
Vậy trường hợp này ta không thể kết luận được là đây là mức giảm đáng kể so với
năm 1993.
c. Tiến hành thử nghiệm trong (b) bằng cách tính giá trị P
Z = 2,121; P = 0,9803
6.29. Ví dụ 6.26 sử dụng biểu đồ kiểm soát 3 sigma để kiểm soát giá trị trung bình
của một quá trình Ở một số quốc gia, biểu đồ kiểm soát 2.5-sigma được sử dụng, tức

là các giới hạn kiểm soát là o - 2.5 /


√n √n
và o + 2.5 / , trong đó o là giá trị
mục tiêu cho giá trị trung bình của quá trình ,  là độ lệch chuẩn của quá trình, và n
là cỡ mẫu.
a. Sử dụng dữ liệu từ Ví dụ 6.26 để tính toán các giới hạn kiểm soát và rủi ro α cho
biểu đồ kiểm soát 2,5 σ . So sánh kết quả với biểu đồ kiểm soát 3-sigma và nhận xét.
Answer: Số liệu từ ví dụ 6.26: m0 = 16, s = 0,1, n = 5
Giới hạn kiểm soát 2,5 sigma được tính
[o - 2.5 / √ n ; μ0+ 2.5/ √ n ] = [15,888; 16,112]
So sánh với khoảng kiểm soát 3 sigma [15,186; 16,134]; giới hạn kiểm soát 3 sigma
rộng hơn giới hạn kiểm soát 2,5 sigma
Giá trị rủi ro α của biểu đồ kiểm soát 2,5 sigma là
α = P ( x > 16,112) + P ( x < 15,888) = P (Z > 2,50) + P (Z <-2,50)
= 1 – 0,9938 + 0,0062 = 0,0124
b. Tính toán rủi ro  cho cả hai biểu đồ nếu giá trị trung bình dịch chuyển 0,1 oz so
với mục tiêu giá trị 16 oz. So sánh kết quả và nhận xét
Answer: μ=μ 0 + 0,1 = 16,1 (oz)
Với biểu đồ kiểm soát 2,5 sigma ta có:
β = P (15,888 ≤ x ≤ 16,112| μ = 16,1)
= P ( x ≤ 16,112| μ = 16,1) - P ( x ≤ 15,888| μ = 16,1) = ø(0,268) – ø(-4,74) =
0,605
Với biểu đồ 3 sigma ta có:
β = P (15,186 ≤ x ≤ 16,134| μ = 16,1)
= P ( x ≤ 16,134| μ = 16,1) - P( x ≤ 15,186| μ = 16,1) = ø(0,76) – ø(-20,43) =
0,776
6.30. Một nhà nghiên cứu đang cố gắng tìm ra sự khác biệt có ý nghĩa thống kê giữa
hai nhóm có dữ liệu về 20 biến từ mỗi nhóm. Ông kiểm tra 20 giả thuyết rỗng, mỗi
giả thuyết rỗng là giá trị trung bình của hai nhóm của một biến đã cho là bằng nhau,
hy vọng sẽ tìm thấy sự khác biệt đáng kể trên ít nhất một biến.
a. Giả sử rằng 20 phép thử độc lập với nhau và được tiến hành riêng lẻ với mức ý
nghĩa 5%. Xác suất để ít nhất một giả thuyết rỗng bị bác bỏ sai ngay cả khi tất cả các
giả thuyết rỗng đều đúng?

Trang 16
Answer: Giả thiết được đặt ra ở đây là: H0: μ1=μ 2; H1: μ1 ≠ μ2
Xác suất để ít nhất một giả thuyết rỗng bị bác bỏ sai ngay khi các giả thuyết rỗng điều
đúng với mức ý nghĩa 5% là p = 0,95
α = P (Type I error) = P (Reject H0|Ho true) = P (X ≥ 1| p = 0,05)
1

i=0
(i)
= 1 - ∑ 20 p ( 1−P ) = 1- 0,736 = 0,264
i 20−i

b. Phép tính trên cho bạn biết điều gì về sự nguy hiểm của việc tìm kiếm ý nghĩa bằng
thử nghiệm nhiều lần?
Từ kết quả tính được ở trên cho thấy khi thử nghiệm nhiều lần thì xác suất sai
loại I sẽ thấp.
6.31. Xem xét thử nghiệm Ho:  = 0 vx H1:  > 0 dựa trên mẫu ngẫu nhiên có kích

thước n từ phân phối N (, 1). Tính giá trị P cho ba trường hợp sau: (i) = 0,1, n
x̄ x̄
=100, (ii) = 0,1, n = 400, (iii) = 0,1, n = 900. Bạn kết luận gì.
Bài giải: x̄ = 0,1, σ = 1;  = 0
x−μ
P- value = P ( x > 0,1|  = 0) = 1 – P ( x ≤ 0,1| = 0) = 1 – P ( x ≤ )
σ ∕ √n
Với n = 100; P – value = 1 – ø (1) = 1 – 0,8413 = 0,1587
Với n = 400; P – value = 1 – ø (2) = 1 – 0,9772 = 0,0228
Với n = 900; P – value = 1 – ø (3) = 1 – 0,9987 = 0,0013
Nhận thấy khi kích thước mẫu càng lớn thì giá trị P càng nhỏ cho thấy rằng ngay cả
những khác biệt nhỏ so với giá trị trung bình được giả thuyết cũng sẽ có ý nghĩa nếu
kích thước mẫu đủ lớn.
Bài tập nâng cao
6.32. Gọi X1, X2, ..., Xn là một mẫu ngẫu nhiên từ phân phối đồng đều trên khoảng (0,
) có nghĩa là  = /2 và phương sai 2= 2/12. Hãy xem xét hai ước lượng của :
θ^ 1=x max ; θ2=2 x
^ ^ ^
a. Sử dụng kết quả của Bài tập 5.44 (b) để tìm E ( θ1 ), Var ( θ1 ) và MSE ( θ1 ).

()
n−1
t 1
Kết quả của bài 5.44: f(n) = n ⋅ ⋅
θ θ
θ
n n n
+) E (θ^ 1) = E (Xn) = n ∫ t ⅆt =
n
⋅θ = 2 μ ⋅
θ 0 n+1 n+1
+) Var (θ^ 1) = E ( X n) – (E (Xn))2
2

θ
n n 2 n n
n∫
Ta có: E ( X 2n) =
n+1
t ⅆt = θ = ( 2 μ )2 = 4 μ 2 ⋅
θ 0 n+2 n+2 n+2

( ) ( ) ( )
^ n 2 n 2
2 n n
θ X
2
Var ( 1)= E ( n) – (E (Xn)) =
2
θ − θ =θ 2 = 12s
2
n+2 n+1 ( n+2 ) ( n+1 ) ( n+2 ) ( n+1 )2

Trang 17
+) MSE (θ^ 1) = Var (θ^ 1) + (Bias (θ^ 1))2
n −θ
Bias (θ^ 1) = E (θ^ 1) – θ = θ−θ =
n+1 n+1

MSE (θ^ 1) = Var (θ^ 1) + (Bias (θ^ 1))2 = 2 θ ⋅


2
(( n+1
)
n+2 ) ( n+1 )
2
(
2 = 2θ ⋅
1
( n+2 ) (n+1) )
^ ^ ^
b. Tìm E ( θ2 ), Var ( θ2 ) và MSE ( θ2 ).
+) E (θ^ 2 ) = E (2 x) = 2 E ( x ) = 2 μ = θ
1 2
^ σ
2
θ θ
2
+) Var (θ2 ) = Var (2 x) = 4 Var ( x ) = 4 = 4. 12 =
n 3n
n
+) MSE (θ^ 2 ) = Var (θ^ 2 ) + (Bias (θ^ 2 ))2
Bias (θ^ 2) = E (θ^ 2 ) - θ = 0
θ2
Vậy MSE (θ^ 2 ) = Var (θ^ 2 ) =
3n
c. So sánh MSE (θ^ 1) và MSE (θ^ 2): MSE (θ^ 1) ≤ MSE (θ^ 2 )

6.27c, 6.33, 6.34, 6.35

Trang 18

You might also like