You are on page 1of 32

CHƯƠNG 6

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

1. Khái niệm về giả thuyết thống kê;


2. Phương pháp chung để kiểm định giả thuyết thống kê;
3. Kiểm định giả thuyết về kỳ vọng;
4. Kiểm định giả thuyết về phương sai;
5. Kiểm định giả thuyết về tỷ lệ.
1. Khái niệm giả thuyết thống kê
Khi nghiên cứu nhu cầu thị trường về một loại hàng hóa nào đó́, ta có thể đưa ra
các cặp nhận định sau:

— H0: Nhu cầu trung bình về loại hàng hóa này là 1000kg/
tháng, H1: Nhu cầu trung bình về loại hàng hóa này khác1000 kg/tháng.

— H0: Nhu cầu trung bình về loại hàng hóa này là <= 1000kg/
tháng, H1: Nhu cầu trung bình về loại hàng hóa này > 1000 kg/tháng.

— H0: Nhu cầu trung bình về loại hàng hóa này là >= 1000kg/
tháng, H1: Nhu cầu trung bình về loại hàng hóa này < 1000 kg/tháng.

Sự đúng hay sai của các nhận định này không thể biết được một cách chắc chắn,
trừ khi ta khảo sát được toàn bộ tổng thể. Muốn chấp nhận hay bác bỏ các nhận
định này ta phải dựa vào lấy mẫu về nhu cầu loại hàng hóa này.

H0, H1 được gọi là các giả thuyết thống kê.


§2 PHƯƠNG  PHÁP CHUNG ĐỂ
— Một giả thuyết thống kê thường là một nhận định về tổng thể.
Giả KIỂM  ĐỊNH
thuyết mà ta nghi
GIẢngờTHUYẾT
nó sai, muốn bác bỏ được ký hiệu là
THỐNG  KÊ
H0 (gọi là “giả thuyết không”). Còn giả thuyết đối lập với nó
được ký hiệu là H1 (gọi là “đối thuyết”)
Giả sử taxuất
— Việc cần phát
kiểm  định
từ một một
mẫu giả thuyết
để chấp H0hay
nhận nào  đó.  Trước
bác bỏ các giả
thuyết H0, H1 được gọi là kiểm định giả thuyết.
hết ta giả sử H0 đúng  và  từ đó  dựa  vào  mẫu ngẫu  nhiên  
— Giả sử ta cần kiểm định một giả thuyết H0 nào đó. Trước hết ta
tổng  quát  và  một
giả sử H đúng sốvà dương  
từ đó dựa rất  bé  cho  trước
vào mẫu ngẫu nhiên đểtổng
tìm  một
quát và
0

biếnmột
cố Asố sao cho𝛼 rất bé cho trước để tìm một biến cố A sao cho
dương

𝑃{𝐴|H0 đúng} = .
3. Một số khái niệm liên quan tới bài toán KĐ
— Tiêu chuẩn kiểm định giả thuyết thống kê:
Chọn lập thống kê (tiêu chuẩn kiểm định):
G = f(X1, X2, … , Xn, θ0)
Trong đó θ0 – tham số liên quan đến giả thuyết cần kiểm định.
— Miền bác bỏ giả thuyết H0
Sau khi đã chọn được TCKĐ G, với xác suất khá bé α cho trước
có thể tìm được miền 𝑊! tương ứng sao cho

Giá trị α được gọi là mức ý nghĩa của kiểm định, 𝑊! được gọi
là miền bác bỏ giả thuyết H0 với mức ý nghĩa α.
— Giá trị quan sát của TCKĐ
Thay các số liệu của mẫu vào TCKĐ G, ta được giá trị quan sát, ký
hiệu là Gqs:
Gqs = f(x1, x2, …, xn, θ_α)
— Kết luận:
- Nếu Gqs thuộc 𝑊! thì H0 sai, bác bỏ H0;
- Nếu Gqs không thuộc 𝑊! chưa đủ cơ sở khẳng định H0 sai, tức
chưa đủ cơ sở để bác bỏ H0 (thực tế là vẫn thừa nhận H0)
— Sai lầm:
- Sai lầm loại 1: Bác bỏ H0 khi thực ra H0 đúng.
- Sai lầm loại 2: Chấp nhận H0 khi thực ra H0 sai.
Người ta muốn đưa ra một cách kiểm định làm giảm thiểu cả hai loại
sai lầm này, nhưng không bao giờ tồn tại một cách như vậy.
2.5. Thủ tục kiểm định GTTK

— Xây dựng giả thuyết gốc H0 cần kiểm định;


— Chọn tiêu chuẩn kiểm định G và xác định luật phân phối xác
suất của G với giả thuyết H0 đúng;
— Với mức ý nghĩa α cho trước xác định miền bác bỏ 𝑊! tốt
nhất tuỳ thuộc vào đối thuyết H1;

— Lập mẫu cụ thể, tính giá trị Gqs; So sánh Gqs với 𝑊! ; nếu Gqs
thuộc 𝑊! thì bác bỏ H0, ngược lại thì chưa đủ cơ sở để bác
bỏ H0 (tạm thời chấp nhận H0).
3. Kiểm định giả thuyết về kỳ vọng

Bài toán kiểm định: Cho mẫu (x1, x2, … , xn) rút ra từ tổng thể X.
Với mức ý nghĩa α.

— Ta có 3 dạng bài toán kiểm định những nhận định về kỳ vọng


H0: μ = μ0; H1 : μ ≠ μ0; (bt1)

H0: μ ≤ μ0; H1 : μ > μ0; (bt2)

H0: μ ≥ μ0; H1 : μ < μ0; (bt3)


Vấn đề xác định H0, H1 như thế nào cho đúng và dễ làm:
— Nghi ngờ cái gì thì ta sẽ kiểm định cái đó, cái đó sẽ là H0;
— Giả thuyết H0 thường được chọn là nhận định có chứa dấu “=“.
Khi giả thuyết cần kiểm định không chứa dấu bằng, thì giải quyết
như thế nào?
H0: μ > μ0; H1 : μ ≤ μ0 (i)
H0: μ < μ0; H1 : μ ≥ μ0 (ii)
Chứng minh được:
(i) ó H0: μ ≤ μ0; H1 : μ > μ0; (i’)
(ii) ó H0: μ ≥ μ0; H1 : μ < μ0; (ii’)
Ví dụ: Số liệu mẫu về số tiền dư thừa trong các tài khoản thẻ vào cuối tháng của
các cá nhân được cho trong bảng sau:

Tiền dư (triệu đ) 0 1.5 2 2.5 3


Số tài khoản thẻ 15 18 28 21 18

a. Tính các thống kê đặc trưng mẫu: trung bình, phương sai và độ lệch chuẩn?

b. Với mức ý nghĩa 5% có thể cho rằng lượng tiền dư thừa trung bình trong các
tài khoản thẻ vào cuối tháng là nhiều hơn 1.5 triệu đồng hay không?

c. Với mức ý nghĩa 5% có thể cho rằng độ lệch tiêu chuẩn của lượng tiền dư
thừa trong các tài khoản thẻ vào cuối tháng không lớn hơn 1 triệu đồng mỗi
thẻ hay không?

d. Với độ tin cậy 95%, lượng tiền dư thừa trung bình trong các tài khoản thẻ
vào cuối tháng nằm trong khoảng nào?

Biết rằng lượng tiền dư thừa trong các tài khoản thẻ vào cuối tháng là BNN tuân
theo quy luật phân phối xấp xỉ chuẩn.
1. Trường hợp 1: X ~ N(ℳ, σ2) biết σ2

— Chọn TCKĐ Bài toán 1:


!!!!!
! = !! = !
!!! — H0: μ = μ0; H1 : μ ≠ μ0; (bt1)
— Nếu giả thuyết H0 đúng, U có — Với mức ý nghĩa 𝛼 cho trước
phân phối chuẩn hoá N(0,12).
— P( G ∈ W! : H" đúng) =𝛼
— P[ U < −u! ⋃ U > u! ] = 𝛼
" "

— W! = (−∞; −u! ) ∪
"
(u!/$ ; +∞)

— Với mẫu cụ thể: tính được Gqs;


— So sánh Gqs với W! => Kết luận
Bài toán 3: Bài toán 2:
H0: μ ≥ μ0; H1 : μ < μ0; (bt3) H0: μ ≤ μ0; H1 : μ > μ0; (bt2)
Xét TCKĐ
Xét TCKĐ
! !
"#$
! !
"#$ G= n ~ Ν 0, 1& khi H' đúng
G= %
n ~ Ν 0, 1& khi H' đúng %

P U > u( = 𝛼 nên
P U < −u( = 𝛼 nên
W( = −∞; −u( W( = (u( ; +∞; )
Ví dụ: Ví dụ 1: Trong 1 năm, khối lượng trung bình của một con bò ở trong một trại
chăn nuôi A là 380kg. Năm nay trại áp dụng phương pháp chăm sóc mới Sau thời
gian áp dụng thử, người ta lấy ngẫu nhiên 50 con bò ra cân trước khi xuất chuồng và
tính được khối lượng trung bình của chúng là 390 kg. Vậy với mức ý nghĩa α = 0.01
có thể cho rằng việc áp dụng chế độ chăm sóc mới có hiệu quả? Giả sử, khối lượng
của bò là bnn có phân phối chuẩn với độ lệch chuẩn là 35.2 kg.

— 3 bước bắt buộc: Tên biến X; xác định luật phân phối xs của x; tính các giá trị
đặc trưng của mẫu

— 4 bước của bài toán kiểm định:

Nếu kiểm định về kỳ vọng (phương sai, xác suất): cần chỉ rõ 𝜇' = ? (𝜎'& =
? , p' = ? )

B1: Xây dựng cặp GT H0, H1

B2: Chọn TCKĐ

B3: Xác định miền bác bỏ H0

B4: Tính Gqs => Kết luận.


1. Trường hợp 2: X ~ N(ℳ, σ2) không biết σ2

— Chọn TCKĐ Bài toán 1:


#%&!
$ — H0: μ = μ0; H1 : μ ≠ μ0; (bt1)
— G= n ~ T ()%*) khi H, đúng
'
— Với mức ý nghĩa 𝛼 cho trước
— Ta có:
()%*) ()%*)
— P( G ∈ W- : H, đúng) =𝛼
— P[ T < −t -// ∪ U> t // = 𝛼
— P[ T < −t ()%*)
-// ∪ U > t
()%*)
// = 𝛼

— W- = (−∞; −t ()%*)
-// ) ∪ (t
()%*)
-// ; +∞)

— Với mẫu cụ thể: tính được Gqs;


— So sánh Gqs với W- => Kết luận
Bài toán 3: Bài toán 2:
H0: μ ≤ μ0; H1 : μ > μ0; (bt2) H0: μ ≥ μ0; H1 : μ < μ0; (bt3)

Xét TCKĐ Xét TCKĐ

! ! " $%!
#
"#$ '$(
G= n~T *#+
khi H' đúng G= &
n~T khi H) đúng
)
('$()
(*#+) P T > t* = 𝛼 nên
P T< −t ( = 𝛼 nên ('$()
(*#+)
W* = t * ; +∞
W( = −∞; −t (
TÓM LẠI

— Bài toán 1: W( = −∞; −t (*#+)


(/& ∪ t
(*#+)
(/& ; +∞

— Bài toán 2: W( = (t (*#+)


( ; +∞)

— Bài toán 3: W( = (−∞; −t (*#+)


( )
Ví dụ: Định mức thời gian hoàn thành của một sản phẩm là 14 phút.
nếu theo dõi thời gian hoàn thành một sản phẩm ở 25 công nhân, ta
thu được số liệu sau:

TG SX SP 10 – 12 12 – 14 14 – 16 16 – 18 18 - 20
(phút)
Số CN 2 6 10 4 3

Với mức ý nghiã 𝛼 = 0.05, có cần thay đổi định mức không? Giả sử
định mức thời gian hoàn thành sản phẩm tuân theo quy luật phân
phối xấp xỉ chuẩn.

Biết t(24)(0.025) =2.064


1. Trường hợp 3: X ~ quy luật không nhất thiết chuẩn, với n > 30

— Chọn TCKĐ Bài toán 1:


#%&!
$ — H0: μ = μ0; H1 : μ ≠ μ0; (bt1)
— G= n ~ N(0, 1/ ) H, đúng
'
— Với mức ý nghĩa 𝛼 cho trước
— Ta có:
— P( G ∈ W- : H, đúng) =𝛼
— P[ U < −u-// ∪ U > u// = 𝛼
— P[ U < −u" ⋃ U > u" ] = 𝛼
# #

— W- = (−∞; −u") ∪ (u-//; +∞)


#

— Với mẫu cụ thể: tính được Gqs;


— So sánh Gqs với W- => Kết luận
Bài toán 3: Bài toán 2:
H0: μ ≤ μ0; H1 : μ > μ0; (bt2) H0: μ ≥ μ0; H1 : μ < μ0; (bt3)

Xét TCKĐ Xét TCKĐ


! !
"#$ & ! !
"#$
G= %
n ~ Ν 0, 1 khi H' đúng G= %
n ~ Ν 0, 1& khi H' đúng

P U < −u( = 𝛼 nên P U > u( = 𝛼 nên


W( = −∞; −u(
W( = (u( ; +∞; )

KL: Miền bác bỏ của 3 bài toán giống


trường hợp 1
Ví dụ: Một giám đốc cho biết lương trung bình của một công nhân ở xí nghiệp
của ông là 3,8 triệu đ/tháng. Chọn ngẫu nhiên 36 công nhân của xí nghiệp này
thấy lương trung bình là 3,5 triệu đ/tháng, với S= 0.4. Với mức ý nghĩa 𝛼 = 0,05,
hãy xét xem giám đốc có nói quá lên không?

— X = mức lương của 1 công nhân trong 1 tháng; Đv: triêụ đồng
— X tuân theo quy luật bất kỳ với n = 36>30
— Ta có > = 3.5;
X S = 0.4 n = 36

Gọi μ là EX, μ0 = 3.8

B1: XD cặp giả thuyết H0: μ ≥μ0 = 3.8; H1: μ < 3.8

B2: Chọn TCKĐ G = ( X ngang – μ0)/S * n1/2 ~ N(0,12) khi H0 đúng

B3: Miền bác bỏ H0 : (- ∞; -u! ) = (-∞; -1.65)

B4: Tính Gqs = (3.5-3.8)/0.4*6 = -4.5 thuộc W! => chấp nhận H1 => GĐ có nói
quá lên so với thực tế.
4. Kiểm định những nhận định về phương sai:
X ~ N(𝜇; 𝜎 & ) ∶ 𝜇 chưa biết
X ~ N(𝜇; 𝜎 & ) ∶ 𝜇 đã biết
Trường hợp 1: X ~ N(𝜇; 𝜎 & ) 𝜇 chưa biết Trường hợp 2: X ~ N(𝜇; 𝜎 & ) ∶ 𝜇 đã biết

Chọn TCKĐ:
TH 1: X ~ Ν (μ; σ2): μ chưa biết
!
n − 1 S
Chọn TCKĐ G = !!(!!!) = ! ~ !!(!!!) nếu H! đúng
!!
! !!! ! !!!
Ta có P (!! !!! ≤ !!! !/! ) ∪< (!! !!! ≥ !!/! ) = !

Khi đó miền bác bỏ H0 tương ứng với 3 bài toán trên là:
Ví dụ: Để kiểm tra độ chính xác của máy đóng gói, người ta cân thử một số sản
phẩm của nhà máy đó sản xuất. Thu được kết quả ở bảng sau:

60 60,2 70 60,8 50,6 50,8 50,9 60,1


50,3 60,5 60,1 60,2 60,3 50,8 60 70

Với mức ý nghĩa α = 0,05, hãy xem xét máy đóng gói có hoạt động bình thường
hay không? Biết rằng khối lượng sản phẩm là biên ngẫu nhiên tuân theo quy luật
phân phối chuẩn, dung sai theo thiết kế là 0,04 g2

X = khối lượng của 1 sản phẩm (gam)

X~ N(μ; σ2)

Bảng tần số: … => S2 = 39.894

— XD cặp GT:
— Chọn TCKĐ
— Miền bác bỏ H0
— Tính Gqs… => Kết luận:
5. Kiểm định giả thuyết về xác suất (tham số p) của biến ngẫu
nhiên phân phối không – một

Cho mẫu định tính kích thước n, trong đó biến cố A xuất


hiện m lần, f = m/n là tỷ lệ mẫu, p = p(A) chưa biết. Với mức ý
nghĩa α, hãy kiểm định các trường hợp nhận định có thể có của P:

— H0: p = p0, H1: p ≠ p0 (1)

— H0: p ≤ p0, H1: p > p0 (2)

— H0: p ≥ p0, H1: p < p0 (3)


O PQ!
Xét TCKĐ: G = U = n~N(0, 1S) khi H0 đúng và
Q! (R P Q! )
(np0 ≥ 5 và n(1-p0) ≥ 5)

Khi đó, miền bác bỏ ứng với 3 bài toán trên là:
Ví dụ: Một báo cáo nói rằng 18% SV ở VN có laptop. Để kiểm tra điều này, người ta khảo
sát 80 sv ở Hà Nội, thấy có 22 bạn có laptop. Với mức ý nghĩa 0.02, hãy kiểm định xem
liệu tỷ lệ SV ở HN có laptop có cao hơn tỷ lệ chung hay không?

— B1: Gọi flà tỷ lệ các phần tử có tính chất cần quan tâm trong mẫu:

f = Tỷ lệ sinh viên ở HN có Laptop trong mẫu, f = 22/80;

— B2: Gọi p là tỷ lệ phần tử có tính chất cần quan tâm trong tổng thể:
P = tỷ lệ sinh viên ở HN có laptop trong tổng thể.

— B3 (chỉ có khi bài toán là ước lượng số phần tử): Gọi N = số phần tử cần ước lượng.
Giải quyết bài toán KĐ: (có 4 bước)

— B1: XD cặp GT
H0: p ≤ p0= 0.18; H1: p>0.18
/ # 0!
— B2: Chọn TCKĐ G = 0!(+# 0!)
n

Nếu H0 đúng và ta có np0= 14.4>5 và n(1-p0) = 65.6 > 5 nên G ~ N(0,12)


B3: Tính MBB H0

Wα = (u_α; +∞) = (u0.02; +∞) = (2.05; +∞)

B4: Tính Gqs = 2.211 € Wα => Bac bỏ H0, chấp nhận H1

KL: tỷ lệ sv ở HN có laptop cao hơn tỷ lệ chung.

Nếu sai lầm gặp phải thì sai lầm đó là sai lầm loại mấy: sai lầm gặp phải là sai lầm
loại 1

Ví dụ 2: Một công ty tuyên bố rằng 60% khách hàng ưa thích sản phẩm của công ty.
Điều tra 400 khách hàng, thấy có 230 người ưa thích sản phẩm của công ty. Với mức
ý nghĩa 5%, tỷ lệ trong tuyên bố của công ty có tin được không?

Gọi f = tỷ lệ khách hang ưa thích sản phẩm của công ty trong mẫu: f = 230/400;

Gọi p là tỷ lê khách hang ưa thích sản phẩm của công ty trong tổng thể

P0 = 0.6

— B1: H0: p ≥ p0= 0.6; H1: p <0.6 (!!!!) !


G"="! =! ! !!(!!!!)
"
— B2: Chọn TCKĐ
— B3: Miền bác bổ H0: W_α = (-∞, -u_α) = (-∞, - u0.05) = (-∞, -1.65)
— Gqs = -1.0206 ¢ W_α => chấp nhận H0, tức là tỷ lệ trong tuyên bố là đúng.
* Kiểm định giả thuyết về 2 tham số p của 2 biến ngẫu nhiên
phân phối không-một.

Giả sử Xi ≈ A(pi): i = 1,2

Nếu pi chưa biết, song có cơ sở để giả thuyết chúng bằng nhau.


Xây dựng giả thuyết thống kê: H0: p1 = p2.

Ta có 3 bài toán kiểm định:

a. H0: p1 = p2; H1: p1 ≠ p2


b. H0: p1 = p2; H1: p1 > p2
c. H0: p1 = p2; H1: p1 < p2
Từ 2 tổng thể rút ra 2 mẫu W1, W2 với các kính thước n,m tương
ứng.

Xét TCKĐ:

Nếu n và m > 30, U có phân phối chuẩn hoá N(0,1).

Nếu H0 đúng thì TCKĐ là


!! − !!
! = !! =! !
1 1
p 1 − p (n + m)
Thường thì p được thay bởi f*:
Với mức ý nghĩa α, miền bác bỏ tương ứng với 3 bài toán trên là:

!! − !!
!! =!{! =! :!! > !!! } !!
1 1
!∗ 1 − !∗ !+!
Ví dụ: Kiểm tra ngẫu nhiên các sản phẩm cùng loại do 2 nhà máy
sản xuất được các số liệu sau:

Nhà máy Số sản phẩm được Số phế phẩm


kiểm tra
A n = 1000 x1 = 20
B m = 900 x2 = 30

Với mức ý nghĩa α = 0.05 có thể coi tỷ lệ phế phẩm của hai nhà
máy là như nhau hay không?
ÔN TẬP PHẦN THỐNG KÊ

1. Các cách trình bày một mẫu số liệu.

2. Các đặc trưng mẫu và cách tính.

3. Ước lượng tham số:


— Các kết quả về ước lượng điểm của kì vọng, phương sai, xác suất.
— Tìm khoảng tin cậy cho kỳ vọng, phương sai, xác suất.
— Xác định độ tin cậy và kích thước mẫu.
4) Kiểm định giả thuyết thống kê:

— Phương pháp chung để kiểm định giả thuyết thống kê;


— Kiểm định giả thuyết về kì vọng, phương sai, xác suất.

You might also like