You are on page 1of 48

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Chương này nhằm giúp SV:


✓ Hiểu được thế nào là kiểm định giả thuyết thống kê.
✓ Hiểu và áp dụng được một số bài toán kiểm định
tham số như: kiểm định trung bình, phương sai và
tỉ lệ.
✓ Hiểu và áp dụng được một số bài toán kiểm định
phi tham số như: kiểm định luật phân phối, kiểm
định tính độc lập,…
Nội dung

1. Bài toán kiểm định giả thuyết thống kê

2. Kiểm định giả thuyết về giá trị trung bình

3. Kiểm định giả thuyết về tỉ lệ

4. Kiểm định giả thuyết về phương sai

5. Bài toán so sánh

6. Kiểm định phi tham số (SV đọc thêm)


Tóm tắt các đặc trưng quan trọng của mẫu và tổng thể

Tổng thể Mẫu (cụ thể)


Trung bình 1 𝑘 𝑘 1 𝑘 𝑘
𝜇 = ෍ 𝑛𝑖 𝑥𝑖 = ෍ 𝑝𝑖 𝑥𝑖 𝑋 = ෍ 𝑛𝑖 𝑥𝑖 = ෍ 𝑝𝑖 𝑥𝑖
𝑁 𝑖=1 𝑖=1 𝑛 𝑖=1 𝑖=1

Phương sai 1 𝑘 𝑘 1 𝑘
𝜎 2 = ෍ 𝑛𝑖 (𝑥𝑖 − 𝜇)2 = ෍ 𝑝𝑖 𝑥𝑖 𝑆 2 = 𝑆𝑋2 = ෍ 𝑛𝑖 (𝑥𝑖 − 𝑋)2
𝑁 𝑖=1 𝑖=1 𝑛 − 1 𝑖=1
Độ lệch 𝜎= 𝜎2 𝑆= 𝑆2

Tỉ lệ 𝑀 𝑚
𝑃= 𝑝=𝑓=
𝑁 𝑛
Ghi chú 𝑁, 𝑛: kích thước tổng thể (mẫu); 𝑛𝑖 : tần số của giá trị 𝑥𝑖 ;
𝑝𝑖 : tần suất của giá trị 𝑥𝑖 ; 𝑋: trung bình mẫu;
𝑀, 𝑚: số phần tử có dấu hiệu hay tính chất mà ta quan tâm trong tổng thể (mẫu).
𝑆 2 : phương sai mẫu (hiệu chỉnh); 𝑆: độ lệch mẫu (hiệu chỉnh); 3
1. Bài toán kiểm định giả thuyết thống kê

• Chương trước, chúng ta đã sử dụng các đặc trưng của mẫu để ước lượng
các đặc trưng của tổng thể.

• Trong chương này, chúng ta sẽ học cách sử dụng các đặc trưng của mẫu để
đánh giá xem một giả thuyết nào đó về tổng thể là đúng (chấp nhận) hay sai
(bác bỏ). Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết được
gọi là kiểm định giả thuyết.

• Ví dụ mở đầu: “Tỉ lệ có việc làm của sinh viên sau khi ra trường”
Ví dụ mở đầu: “Tỉ lệ có việc làm của sinh viên sau khi ra trường”
• Một trường đại học, sau khảo sát về tỉ lệ có việc làm của sinh viên sau khi
ra trường 1 năm, đã công bố: “Có ít nhất 90% SV có việc làm sau khi ra
trường 1 năm”. Chúng ta nên hiểu như thế nào về công bố này?!
• Trước hết, về cơ bản, Trường ĐH gần như không thể có được tất cả thông
tin về việc làm của SV sau khi ra trường, do đó số liệu mà trường công bố
là kết quả của bài toán ước lượng (điểm).
• Trong tình huống này, vì trường đại học muốn khẳng định về uy tín và
chất lượng đào tạo của mình nên thường có xu hướng nâng tỉ lệ này lên.
Do đó công bố này có thể đúng, cũng có thể sai và được xem là một giả
thuyết thống kê. Lúc này, ta có bài toán kiểm định giả thuyết:

𝐻0 : 𝑃 ≥ 0,9

𝐻1 : 𝑃 < 0,9
1.1. Giả thuyết, đối thuyết, kiểm định giả thuyết thống kê
• Định nghĩa: Giả thuyết thống kê là giả thuyết về
1. Quy luật phân phối xác suất của biến ngẫu nhiên, hoặc
2. Các tham số đặc trưng của biến ngẫu nhiên, hoặc
3. Tính độc lập của các biến ngẫu nhiên.
• Một giả thuyết thống kê bao gồm:
✓ Giả thuyết 𝐻0 : là một phát biểu mang tính khẳng định về tổng thể;
✓ Đối thuyết 𝐻1 : phát biểu phủ định 𝐻0 .
• Kiểm định giả thuyết có thể hiểu là một quy trình dựa vào thông tin thu
được từ mẫu để ra quyết định “bác bỏ” hay “chấp nhận” giả thuyết 𝐻0 .
• Ví dụ 1. Khi nghiên cứu nhu cầu thị trường 𝑋 về một loại hàng hóa nào đó,
ta có thể có các giả thuyết:
✓ 𝐻0 : 𝑋 có phân phối chuẩn.
✓ 𝐻0 : Nhu cầu trung bình μ = 50 tấn/tháng.
✓ 𝐻0 : Nhu cầu 𝑋 và giá 𝑌 là độc lập.

Khi đó, các đối thuyết của từng 𝐻0 tương ứng như sau:
✓ 𝐻1 : 𝑋 không có phân phối chuẩn
✓ 𝐻1 : Nhu cầu trung bình μ ≠ 50 tấn/tháng.
✓ 𝐻1 : Nhu cầu 𝑋 và giá 𝑌 là phụ thuộc.

• Trong chương này, chúng ta sẽ tập trung vào kiểm định giả thuyết về các
tham số đặc trưng 𝜃 của biến ngẫu nhiên (𝜃 có thể là trung bình, phương
sai, hay tỉ lệ của tổng thể).
1.2. Bài toán kiểm định giả thuyết về các tham số đặc trưng
Gọi 𝜃 là một tham số đặc trưng của tổng thể. Khi đó, giả thuyết cần kiểm
định về tham số đặc trưng 𝜃 thường quy về 1 trong các dạng sau:
❖ Kiểm định hai bên: 𝐻0: 𝜃 = 𝜃0 ; 𝐻1: 𝜃 ≠ 𝜃0
(miền bác bỏ nằm về hai phía của miền chấp nhận).
❖ Kiểm định một bên:
✓ Kiểm định bên phải: 𝐻0: 𝜃 ≤ 𝜃0; 𝐻1: 𝜃 > 𝜃0
(miền bác bỏ nằm phía bên phải của miền chấp nhận).
✓ Kiểm định bên trái: 𝐻0: 𝜃 ≥ 𝜃0; 𝐻1: 𝜃 < 𝜃0
(miền bác bỏ nằm phía bên trái của miền chấp nhận).
𝐻 0: 𝜃 = 𝜃 0; 𝐻1: 𝜃 ≠ 𝜃 0

𝐻0: 𝜃 ≤ 𝜃0; 𝐻1: 𝜃 > 𝜃0 𝐻0: 𝜃 ≥ 𝜃0; 𝐻1: 𝜃 < 𝜃0

𝑊𝛼
Miền bác bỏ
1.3. Sai lầm loại một, sai lầm loại hai
• Vì chỉ dựa trên một mẫu để kết luận các giá trị của tổng thể nên ta có thể
phạm sai lầm khi đưa ra kết luận về giả thuyết 𝐻0. Các sai lầm đó là:
a) Sai lầm loại một: Giả thuyết 𝐻0 đúng nhưng ta bác bỏ nó.
b) Sai lầm loại hai: Giả thuyết 𝐻0 sai nhưng ta chấp nhận nó.

• Khi kiểm định, người ta mong muốn khả năng mắc sai lầm loại một không
vượt quá một số 𝛼 cho trước, nghĩa là xác suất bác bỏ 𝐻0 khi nó đúng là 𝛼
thì xác suất chấp nhận nó là 1– 𝛼. Ta gọi 𝛼 là mức ý nghĩa của kiểm định.

• Trong một bài toán kiểm định, nếu khả năng phạm sai lầm loại một giảm
thì khả năng phạm sai lầm loại hai lại tăng lên. Do đó người ta thường
chọn 𝛼 trong khoảng từ 1% đến 10%.
1.4. Các bước cần thực hiện trong bài toán kiểm định giả thuyết
Một bài toán kiểm định giả thuyết bao gồm 5 bước sau đây.
• Bước 1. Thiết lập giả thuyết 𝐻0 và 𝐻1.
• Bước 2. Tính giá trị kiểm định.
(Mỗi loại kiểm định có công thức riêng nhằm đánh giá giả thuyết).
• Bước 3. Chọn mức ý nghĩa 𝛼 và xác định miền bác bỏ giả thuyết 𝑊𝛼 (nếu
giá trị kiểm định nằm trong miền này thì 𝐻0 bị bác bỏ).
• Bước 4. Đưa ra kết luận về mặt thống kê, nghĩa là ở một mức ý nghĩa 𝛼
nào đó ta sẽ bác bỏ hay chấp nhận giả thuyết 𝐻0.
• Bước 5. Kết luận cuối cùng về nội dung bài toán nhằm trả lời một cách rõ
ràng câu hỏi mà bài toán đặt ra (không dùng thuật ngữ thống kê).
• Ví dụ 2. Một máy đóng mì gói tự động quy định khối lượng trung bình là
75 gam, độ lệch chuẩn là 15 gam. Sau một thời gian sản xuất, kiểm tra 80
gói ta có khối lượng trung bình mỗi gói là 72 gam. Hãy kết luận về việc
đóng gói ở mức ý nghĩa 5%, biết rằng khối lượng mì gói do máy đóng ra
có phân phối chuẩn.
• B1. 𝐻0 : 𝜇 = 75; 𝐻1 : 𝜇 ≠ 75
• B2. 𝛼 = 0,05 → 𝑍𝛼/2 = 1,96 → Wα = −∞; −1,96 ∪ 1,96; +∞ ;
• B3. Tính giá trị kiểm định 𝜇0 = 75 → 𝑍 = −1,79;
• B4. Vì 𝑍 ∉ Wα nên ta chấp nhận giả thuyết 𝐻0 ;
• B5. Vậy việc đóng gói đảm bảo yêu cầu.

−𝑍𝛼/2 𝑋≡0 𝑍𝛼/2 = 1,96


2. Kiểm định giả thuyết về giá trị trung bình
2.1. Bài toán
• Giả sử, ta cần kiểm định giả thuyết có dạng:
𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0
൜ ; hoặc ൜ ; hoặc ൜ .
𝐻1 : 𝜇 ≠ 𝜇0 𝐻1 : 𝜇 < 𝜇0 𝐻1 : 𝜇 > 𝜇0
(𝜇0 là một giá trị cụ thể) ở mức ý nghĩa 𝛼 cho trước.
• Muốn vậy, từ tổng thể ta lấy một mẫu gồm 𝑛 quan sát được chọn ngẫu
nhiên, độc lập với 𝑋, 𝑆 tương ứng là trung bình và độ lệch mẫu hiệu
chỉnh.
• Khi đó, tùy vào từng trường hợp, giá trị kiểm định (ở bước 2) được thực
hiện như sau.
2.2. Trường hợp tổng thể có phân phối chuẩn, đã biết 𝝈
• Giá trị kiểm định được tính bởi công thức:
𝑋−𝜇0
𝑍= 𝑛
𝜎

• Miền bác bỏ:

Giả thuyết Miền bác bỏ −𝑍𝛼/2 𝑍𝛼/2

𝐻0 : 𝜇 = 𝜇0 ; 𝐻1 : 𝜇 ≠ 𝜇0 𝑊𝛼 = −∞; −𝑍𝛼 ∪ 𝑍𝛼 ; +∞
2 2

𝐻0 : 𝜇 ≥ 𝜇0 ; 𝐻1 : 𝜇 < 𝜇0 𝑊𝛼 = −∞; −𝑍𝛼

𝐻0 : 𝜇 ≤ 𝜇0 ; 𝐻1 : 𝜇 > 𝜇0 𝑊𝛼 = 𝑍𝛼 ; +∞
−𝑍𝛼
• Ví dụ 3. Một máy đóng mì gói tự động quy định khối lượng trung bình là
75 gam, độ lệch chuẩn là 15 gam. Sau một thời gian sản xuất, kiểm tra 80
gói ta có khối lượng trung bình mỗi gói là 72 gram. Biết rằng khối lượng
mì gói do máy đóng ra có phân phối chuẩn.
a) Hãy kết luận về việc đóng gói ở mức ý nghĩa 5%.
b) Tìm giá trị 𝑝.

• Giải. Tổng thể là toàn bộ số gói mì do máy đó đóng gói. Theo quy định thì
khối lượng trung bình của mỗi gói phải là 75 gam, nhưng trên thực tế thì
khối lượng trung bình là 𝜇 chưa biết. Ta cần kiểm định giả thuyết:
𝐻0 : 𝜇 = 75; 𝐻1 : 𝜇 ≠ 75
Nếu giả thuyết 𝐻0 đúng (được chấp nhận) thì việc đóng gói vẫn đảm bảo.
Nếu giả thuyết 𝐻0 sai (bị bác bỏ) thì việc đóng gói không đảm bảo yêu
cầu. Ta cần kiểm định giả thuyết đó ở mức ý nghĩa 5%.
Theo đề bài ta có: 𝑋 = 72, 𝑛 = 80, 𝜇0 = 75, 𝛼 = 0,05.
Giá trị kiểm định

𝑋 − 𝜇0 72 − 75
𝑍= 𝑛= 80 = −1,78875 ≈ −1,79
𝜎 15
Từ mức ý nghĩa 𝛼 = 0,05, tra bảng hàm số Laplace, ta có

1 𝛼 1 − 0,05
𝜑(𝑍𝛼 ) = − = = 0,475 ⇒ 𝑍𝛼 = 1,96
2 2 2 2 2

Suy ra miền bác bỏ Wα = −∞; −1,96 ∪ 1,96; +∞


Vì 𝑍 ∉ Wα nên ta chấp nhận giả thuyết 𝐻0 .
Vậy việc đóng gói vẫn đảm bảo yêu cầu ở mức ý nghĩa 5%.
−𝑍𝛼/2 𝑋≡0 𝑍𝛼/2 = 1,96

1−𝛼
• p-value là giá trị của 𝛼 mà 𝜑 𝑍 = 𝜑 𝑍 =
𝛼 .
2 2
1−𝛼
𝜑(1,79) = 0,4633 = ⇒ 𝛼 = 1 − 2.0,4633 = 0,0734
2
• Vậy 𝑝 = 0,07346 = 7,346 %.
• Lưu ý rằng khi đó giả thuyết 𝐻0 sẽ bị bác bỏ ở bất kì mức ý nghĩa 𝛼 nào
lớn hơn 𝑝 = 7,346 %, và ngược lại sẽ chấp nhận 𝐻0.
𝛼 ≤ 𝑝 → Chấp nhận 𝐻0 𝑝 < 𝛼 → Bác bỏ 𝐻0

𝒑
• Ví dụ 4. Một hãng sản xuất lốp xe ôtô tuyên bố sản phẩm của hãng có thể
sử dụng không dưới 100.000 km, độ lệch tiêu chuẩn bằng 12.000 km. Một
công ty vận tải mua 64 lốp xe, sau một thời gian sử dụng thấy độ bền
trung bình là 98500 km. Hãy kết luận về tuyên bố của hãng sản xuất lốp
xe với mức ý nghĩa 5%.
2.3. Trường hợp chưa biết phương sai của tổng thể
a) Với mẫu có kích thước 𝒏 ≥ 𝟑𝟎, và tổng thể có phân phối bất kỳ.
• Giá trị kiểm định:
𝑋−𝜇0
𝑍= 𝑛
𝑆

• Miền bác bỏ:

Giả thuyết Miền bác bỏ


−𝑍𝛼/2 𝑍𝛼/2

𝐻0 : 𝜇 = 𝜇0 ; 𝐻1 : 𝜇 ≠ 𝜇0 𝑊𝛼 = −∞; −𝑍𝛼 ∪ 𝑍𝛼 ; +∞
2 2

𝐻0 : 𝜇 ≥ 𝜇0 ; 𝐻1 : 𝜇 < 𝜇0 𝑊𝛼 = −∞; −𝑍𝛼

𝐻0 : 𝜇 ≤ 𝜇0 ; 𝐻1 : 𝜇 > 𝜇0 𝑊𝛼 = 𝑍𝛼 ; +∞
−𝑍𝛼
2.4. Trường hợp chưa biết phương sai của tổng thể
b) Với mẫu có kích thước 𝒏 < 𝟑𝟎, và tổng thể có phân phối chuẩn.
• Giá trị kiểm định:
𝑋−𝜇0
𝑇= 𝑛
𝑆

• Miền bác bỏ:

Giả thuyết Miền bác bỏ

𝐻0 : 𝜇 = 𝜇0 ; 𝐻1 : 𝜇 ≠ 𝜇0 𝑊𝛼 = −∞; −𝑇𝑛−1;𝛼 ∪ 𝑇𝑛−1;𝛼 ; +∞


2 2

𝐻0 : 𝜇 ≥ 𝜇0 ; 𝐻1 : 𝜇 < 𝜇0 𝑊𝛼 = −∞; −𝑇𝑛−1;𝛼

𝐻0 : 𝜇 ≤ 𝜇0 ; 𝐻1 : 𝜇 > 𝜇0 𝑊𝛼 = 𝑇𝑛−1;𝛼 ; +∞
• Ví dụ 5. Một nhà máy sản xuất đèn chụp hình cho biết tuổi thọ trung bình
của sản phẩm là 100 giờ. Người ta chọn ngẫu nhiên 15 bóng thử nghiệm
thấy tuổi thọ trung bình là 99,7 giờ, phương sai mẫu hiệu chỉnh là 0,15.
Giả sử tuổi thọ của đèn có phân phối chuẩn. Cho kết luận về tuổi thọ bóng
đèn của nhà máy với mức ý nghĩa 1%.

• Giải. Ta kiểm định giả thuyết 𝐻0 : 𝜇 = 100; 𝐻1 : 𝜇 ≠ 100


𝛼
Ta có 𝑛 = 15; 𝑋 = 99,7; 𝑆 2 = 0,15; 𝛼 = 0,01 ⇒ = 0,005
2
𝑋−𝜇0 99,7−100
Giá trị kiểm định 𝑇 = 𝑛= 15 = −3
𝑆 0,15
Tra bảng Student dòng 14, cột 0,005: 𝑇14;0,005 = 2,977
Suy ra miền bác bỏ: 𝑊𝛼 = −∞; −2,977 ∪ 2,977; +∞
Vì 𝑍 ∈ Wα nên ta bác bỏ 𝐻0.
Vậy tuổi thọ bóng đèn thấp hơn 100 giờ (𝑋 = 99,7 < 100 = 𝜇0 ).
TÓM TẮT

1. Tổng thể có phân


2. Chưa biết 𝜎, và 𝑛 ≥ 30 3. Chưa biết 𝜎, và 𝑛 < 30
phối chuẩn, đã biết 𝜎
𝑊𝛼 = −∞; −𝑍𝛼 𝑊𝛼 = −∞; −𝑍𝛼 𝑊𝛼 = −∞; −𝑇𝑛−1;𝛼
𝐻0 : 𝜇 = 𝜇0 ; 2 2 2
𝐻1 : 𝜇 ≠ 𝜇0 . ∪ 𝑍𝛼 ; +∞ ∪ 𝑍𝛼 ; +∞ ∪ 𝑇𝑛−1;𝛼 ; +∞
2 2 2

𝐻0 : 𝜇 ≥ 𝜇0 ;
𝑊𝛼 = −∞; −𝑍𝛼 𝑊𝛼 = −∞; −𝑍𝛼 𝑊𝛼 = −∞; −𝑇𝑛−1;𝛼
𝐻1 : 𝜇 < 𝜇0 .

𝐻0 : 𝜇 ≤ 𝜇0 ; 𝑊𝛼 = 𝑇𝑛−1;𝛼 ; +∞
𝑊𝛼 = 𝑍𝛼 ; +∞ 𝑊𝛼 = 𝑍𝛼 ; +∞
𝐻1 : 𝜇 > 𝜇0 .

Bảng tra Laplace Laplace Student


• Ví dụ 6. Một loại đèn chiếu được nhà sản xuất quảng cáo có tuổi thọ trung bình
thấp nhất là 65 giờ. Kết quả kiểm tra ngẫu nhiên 21 đèn cho thấy tuổi thọ trung
bình là 62,5 giờ, 𝑆 = 3 giờ. Với mức ý nghĩa 1% có thể kết luận gì về lời quảng
cáo đó?
• Ví dụ 7. Năng suất lúa trung bình ở vụ trước là 4,5 tấn/ha. Vụ lúa năm nay
người ta áp dụng biện pháp kĩ thuật mới cho toàn bộ diện tích trồng lúa trong
vùng. Theo dõi 100 ha, ta có bảng năng suất lúa sau đây

Năng suất Diện tích Năng suất Diện tích


(tạ/ha) (ha) (tạ/ha) (ha)
30 – 35 7 50 – 55 20
35 – 40 12 55 – 60 8
40 – 45 18 60 – 65 5
45 – 50 27 65 – 70 3

Với  = 0,01 có thể nói biện pháp kĩ thuật mới cho năng suất cao hơn không?!
HƯỚNG DẪN THỰC HIỆN
KIỂM ĐỊNH TRUNG BÌNH BẰNG EXCEL

24
3. Kiểm định giả thuyết về tỉ lệ
Bài toán
• Giả sử tổng thể có hai loại phần tử, một trong hai loại có tính chất A nào đó
mà ta quan tâm. Tỉ lệ phần tử có tính chất A là 𝑃 chưa biết. Ta cần kiểm
định giả thuyết thống kê có dạng như sau:
𝑎) 𝐻0 : 𝑃 = 𝑝0 ; 𝐻1 : 𝑃 ≠ 𝑝0
𝑏) 𝐻0 : 𝑃 ≥ 𝑝0 ; 𝐻1 : 𝑃 < 𝑝0
𝑐) 𝐻0 : 𝑃 ≤ 𝑝0 ; 𝐻1 : 𝑃 > 𝑝0 ; (𝑝0 là 1 giá trị cho trước)
• Muốn vậy, từ tổng thể, ta lấy một mẫu có kích thước 𝑛 ≥ 30. Gọi 𝑓 là tỉ lệ
phần tử của mẫu có tính chất A. Khi đó, các bước kiểm định giả thuyết về
𝑃 với mức ý nghĩa 𝛼 cũng được thực hiện tương tự với công thức tính giá
trị kiểm định (bước 2) như sau:
𝑓 − 𝑝0
𝑍= 𝑛
𝑝0 (1 − 𝑝0 )
• Miền bác bỏ:

Giả thuyết Miền bác bỏ

𝐻0 : 𝑃 = 𝑝0 ; 𝐻1 : 𝑃 ≠ 𝑝0 𝑊𝛼 = −∞; −𝑍𝛼 ∪ 𝑍𝛼 ; +∞
2 2

𝐻0 : 𝑃 ≥ 𝑝0 ; 𝐻1 : 𝑃 < 𝑝0 𝑊𝛼 = −∞; −𝑍𝛼

𝐻0 : 𝑃 ≤ 𝑝0 ; 𝐻1 : 𝑃 > 𝑝0 𝑊𝛼 = 𝑍𝛼 ; +∞

• Ví dụ 8. Theo báo cáo, tỉ lệ hàng phế phẩm trong kho là 10%. Kiểm tra
ngẫu nhiên 100 sản phẩm thấy có 8 phế phẩm. Hỏi báo cáo trên có đáng tin
ở mức ý nghĩa 5% không?
• Giải.
Gọi 𝑃 là tỉ lệ phế phẩm trong kho hàng, 𝑃 chưa biết. Ta kiểm tra giả thuyết:
𝐻0 : 𝑃 = 0,1; 𝐻1 : 𝑃 ≠ 0,1 với  = 5%.
8
Ta có 𝑛 = 100, 𝑓 = = 0,08.
100
0,08−0,1
Giá trị kiểm định: 𝑍 = . 100 ≈ −0,667
0,1(1−0,1)

Tra bảng hàm số Laplace ta được: 𝑍𝛼 = 1,96


2

Suy ra miền bác bỏ Wα = −∞; −1,96 ∪ 1,96; +∞


Vì 𝑍 ∉ Wα nên ta chấp nhận giả thuyết 𝐻0 .
Nghĩa là báo cáo đáng tin ở mức ý nghĩa 5%.
• Ví dụ 9. Giả sử sản phẩm của một công ty sản xuất lốp xe ôtô đã chiếm
được 42% thị trường. Trước sự cạnh tranh của các đối thủ và điều kiện
thay đổi môi trường kinh doanh, Ban lãnh đạo công ty nghi ngờ thị trường
của công ty đang bị giảm sút. Kiểm tra ngẫu nhiên 550 ôtô trên đường, kết
quả cho thấy có 219 xe sử dụng lốp của công ty. Có thể kết luận gì về điều
nghi ngờ trên với mức ý nghĩa 10%?
4. Kiểm định giả thuyết về phương sai

• Giả sử trong tổng thể, biến ngẫu nhiên 𝑋 có phân phối 𝑁(𝜇, 𝜎 2 ) , với 𝜇 và
𝜎 2 chưa biết. Ta cần kiểm định giả thuyết có dạng:

𝐻0 : 𝜎 2 = 𝜎02 𝐻0 : 𝜎 2 ≥ 𝜎02 𝐻0 : 𝜎 2 ≤ 𝜎02


ቊ 2 2 ; hoặc ቊ 2 2 ; hoặc ቊ 2 2.
𝐻1 : 𝜎 ≠ 𝜎0 𝐻1 : 𝜎 < 𝜎0 𝐻1 : 𝜎 > 𝜎0

(𝜎02 là một giá trị cụ thể) ở mức ý nghĩa 𝛼 cho trước.

• Các bước thực hiện cũng tương tự như 2 bài toán trên, với giá trị kiểm định

𝑛−1 .𝑆 2
𝜒2 = ∼ 𝜒 2 (𝑛 − 1) (Tra bảng Chi bình phương)
𝜎02
• Bằng cách tra bảng Chi bình phương với 𝑛 − 1 bậc tự do, ta được miền
bác bỏ như sau:

Giả thuyết Miền bác bỏ


2 2
𝐻0 : 𝜎 2 = 𝜎02 ; 𝐻1 : 𝜎 2 ≠ 𝜎02 𝑊𝛼 = −∞; 𝜒1−𝛼/2 (𝑛 − 1) ∪ 𝜒𝛼/2 (𝑛 − 1); +∞

2
𝐻0 : 𝜎 2 ≥ 𝜎02 ; 𝐻1 : 𝜎 2 < 𝜎02 𝑊𝛼 = −∞; 𝜒1−𝛼 𝑛−1

𝐻0 : 𝜇1 ≤ 𝜇2 ; 𝐻1 : 𝜇1 > 𝜇2 𝑊𝛼 = 𝜒𝛼2 𝑛 − 1 ; +∞
• Ví dụ 10. Để kiểm tra độ chính xác của một máy, người ta đo ngẫu nhiên kích
thước của 15 chi tiết do máy đó sản xuất và tính được 𝑆𝑋2 = 14,6. Biết rằng kích
thước chi tiết là biến ngẫu nhiên phân phối chuẩn có phương sai theo thiết kế là
12. Với mức ý nghĩa 1%, hãy cho kết luận phương sai của chi tiết máy có đúng
theo thiết kế ban đầu không?!
• Giải. Gọi 𝑋 là kích thước chi tiết do máy đó sản xuất, 𝑋~𝑁(𝜇; 𝜎 2 ).
Ta có 𝑛 = 15; 𝑆𝑋2 = 14,6; 𝜎02 = 12; 𝛼 = 0,01.
𝐻0 : 𝜎 2 = 12
Ta có cặp giả thuyết cần kiểm định: ൝
𝐻1 : 𝜎 2 ≠ 12
𝑛−1 .𝑆 2 14×14,6
Giá trị kiểm định: 𝜒2 = = ≈ 17,033.
𝜎02 12
2
𝜒0,005 (14) ≈ 31,319
Tra bảng: ൝ 2 → 𝑊𝛼 = −∞; 4,075 ∪ 31,319; +∞
𝜒0,995 (14) ≈ 4,075
Vì 𝑍 ∉ Wα nên ta chấp nhận giả thuyết 𝐻0 . Nghĩa là chi tiết máy tuân theo đúng
thiết kế ban đầu ở mức ý nghĩa 5%.
HƯỚNG DẪN THỰC HIỆN
KIỂM ĐỊNH PHƯƠNG SAI BẰNG EXCEL

32
5. Bài toán so sánh (Kiểm định trên hai mẫu)

Tổng thể thứ nhất: Tổng thể thứ hai:


𝜃1 : 1; 1; 𝑃1 𝜃2 : 2; 2; 𝑃2
Mẫu Mẫu

𝑛1 ; 𝑋1 ; 𝑆1 ; 𝑓1 𝑛2 ; 𝑋2 ; 𝑆2 ; 𝑓2

𝐻0 : 𝜃1 = 𝜃2 𝐻0 : 𝜃1 ≥ 𝜃2 𝐻0 : 𝜃1 ≤ 𝜃2
൜ ; hoặc ൜ ; hoặc ൜ .
𝐻1 : 𝜃1 ≠ 𝜃2 𝐻1 : 𝜃1 < 𝜃2 𝐻1 : 𝜃1 > 𝜃2
5.1. So sánh trung bình 𝝁𝟏 và 𝝁𝟐 của hai tổng thể
• Về cơ bản, các bước thực hiện bài toán so sánh hai trung bình, cũng như
phân chia các trường hợp tương tự như kiểm định trung bình trên 1 mẫu.
a) Đã biết 𝝈𝟐𝟏 và 𝝈𝟐𝟐 .
𝑋1 −𝑋2
• Giá trị kiểm định: 𝑍 =
𝜎2 2
1 +𝜎2
𝑛1 𝑛2

• Miền bác bỏ:


Giả thuyết Miền bác bỏ

𝐻0 : 𝜇1 = 𝜇2 ; 𝐻1 : 𝜇1 ≠ 𝜇2 𝑊𝛼 = −∞; −𝑍𝛼 ∪ 𝑍𝛼 ; +∞
2 2

𝐻0 : 𝜇1 ≥ 𝜇2 ; 𝐻1 : 𝜇1 < 𝜇2 𝑊𝛼 = −∞; −𝑍𝛼

𝐻0 : 𝜇1 ≤ 𝜇2 ; 𝐻1 : 𝜇1 > 𝜇2 𝑊𝛼 = 𝑍𝛼 ; +∞
b) Không biết 𝝈𝟐𝟏 và 𝝈𝟐𝟐 , nhưng 𝒏𝟏 , 𝒏𝟐 ≥ 𝟑𝟎
𝑋1 −𝑋2
• Giá trị kiểm định: 𝑍 =
𝑆2 2
1 + 𝑆2
𝑛1 𝑛2

• Miền bác bỏ:

Giả thuyết Miền bác bỏ

𝐻0 : 𝜇1 = 𝜇2 ; 𝐻1 : 𝜇1 ≠ 𝜇2 𝑊𝛼 = −∞; −𝑍𝛼 ∪ 𝑍𝛼 ; +∞
2 2

𝐻0 : 𝜇1 ≥ 𝜇2 ; 𝐻1 : 𝜇1 < 𝜇2 𝑊𝛼 = −∞; −𝑍𝛼

𝐻0 : 𝜇1 ≤ 𝜇2 ; 𝐻1 : 𝜇1 > 𝜇2 𝑊𝛼 = 𝑍𝛼 ; +∞
c) Không biết 𝝈𝟐𝟏 và 𝝈𝟐𝟐 , và 𝒏𝟏 < 𝟑𝟎 hoặc 𝒏𝟐 < 𝟑𝟎
𝑋1 −𝑋2 2 (𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22
• Giá trị kiểm định: 𝑇 = , trong đó 𝑆 = .
1 1 𝑛1 +𝑛2 −2
𝑆 2 𝑛 +𝑛
1 2

• Miền bác bỏ:


Giả thuyết Miền bác bỏ

𝐻0 : 𝜇1 = 𝜇2 ; 𝐻1 : 𝜇1 ≠ 𝜇2 𝑊𝛼 = −∞; −𝑇𝑛 𝛼 ∪ 𝑇𝑛 𝛼 ; +∞
1 +𝑛2 −2, 2 1 +𝑛2 −2, 2

𝐻0 : 𝜇1 ≥ 𝜇2 ; 𝐻1 : 𝜇1 < 𝜇2 𝑊𝛼 = −∞; −𝑇𝑛1+𝑛2−2,𝛼

𝐻0 : 𝜇1 ≤ 𝜇2 ; 𝐻1 : 𝜇1 > 𝜇2 𝑊𝛼 = 𝑇𝑛1 +𝑛2 −2,𝛼 ; +∞

• Trong trường hợp giả thuyết 𝐻0 : 𝜇1 = 𝜇2 bị bác bỏ,


* Nếu 𝑋1 > 𝑋2 thì ta kết luận 𝜇1 > 𝜇2 ;
* Nếu 𝑋1 < 𝑋2 thì ta kết luận 𝜇1 < 𝜇2 .
• Ví dụ 11. Người ta cân trẻ sơ sinh ở hai khu vực thành thị và nông thôn,
thu được kết quả như sau:

Với mức ý nghĩa 1%, có thể coi trọng lượng trung bình của trẻ sơ sinh ở
hai khu vực bằng nhau được hay không?

• Giải. Gọi 𝜇𝑁 , 𝜇 𝑇 tương ứng là cân nặng trung bình của trẻ sơ sinh ở nông
thôn và thành thị. Ta có cặp giả thuyết cần kiểm định:

𝐻0 : 𝜇𝑁 = 𝜇 𝑇 ;

𝐻1 : 𝜇𝑁 ≠ 𝜇 𝑇 .
Theo đề bài: 𝑛𝑁 = 2500; 𝑋𝑁 = 3; 𝑆𝑁2 = 200;

𝑛 𝑇 = 500; 𝑋 𝑇 = 3,1; 𝑆𝑇2 = 5;

𝑋𝑁 −𝑋𝑇 3−3,1
Giá trị kiểm định: 𝑍 = = = −0,33.
200 5
𝑆2 2
𝑁 + 𝑆𝑇 +
2500 500
𝑛𝑁 𝑛𝑇

𝛼 = 1% → 𝑍𝛼 = 2,58 → 𝑊𝛼 = −∞; −2,58 ∪ 2,58; +∞ .


2

Vì 𝑍 ∉ 𝑊𝛼 nên ta chấp nhận giả thuyết 𝐻0 .


Nghĩa là, cân nặng trung bình của trẻ sơ sinh ở nông thôn và thành thị là như nhau ở
mức ý nghĩa 1%.
• Ví dụ 12. Nghiên cứu về hai nhãn hiệu pin X và Y. Chọn ngẫu nhiên mỗi
loại 100 pin, kết quả ghi nhận được như sau. Pin X có thời gian sử dụng
trung bình là 308 phút, độ lệch mẫu hiệu chỉnh là 64 phút. Đối vối pin Y
các chỉ số tương ứng là 266 và 40 phút. Có ý kiến cho rằng thời gian sử
dụng trung bình của pin X lớn hơn pin Y. Với mức ý nghĩa  = 0,01 bạn
có nhận xét gì về ý kiến trên?
HƯỚNG DẪN THỰC HIỆN
SO SÁNH HAI TRUNG BÌNH BẰNG EXCEL

40
5.2. So sánh tỉ lệ 𝑷𝟏 và 𝑷𝟐 của hai tổng thể
• Một lần nữa, các bước thực hiện bài toán so sánh hai tỉ lệ cũng tương tự
như bài toán kiểm định tỉ lệ trên 1 mẫu.
𝑓1 −𝑓2 𝑛1 𝑓1 +𝑛2 𝑓2
• Giá trị kiểm định:𝑍 = ෠
, trong đó 𝑃0 =
1 1 𝑛1 +𝑛2
𝑃෠0 (1−𝑃෠0 ) 𝑛 +𝑛
1 2

• Miền bác bỏ:

Giả thuyết Miền bác bỏ

𝐻0 : 𝑃1 = 𝑃2 ; 𝐻1 : 𝑃1 ≠ 𝑃2 𝑊𝛼 = −∞; −𝑍𝛼 ∪ 𝑍𝛼 ; +∞
2 2

𝐻0 : 𝑃1 ≥ 𝑃2 ; 𝐻1 : 𝑃1 < 𝑃2 𝑊𝛼 = −∞; −𝑍𝛼

𝐻0 : 𝑃1 ≤ 𝑃2 ; 𝐻1 : 𝑃1 > 𝑃2 𝑊𝛼 = 𝑍𝛼 ; +∞
• Ví dụ 13. Chọn ngẫu nhiên 200 em bé sống ở thành phố thấy có 20 em béo phì.
Chọn 220 em sống ở nông thôn thấy có 5 em béo phì. Hãy kiểm định giả thuyết
cho rằng tỉ lệ trẻ em béo phì ở thành phố cao hơn nông thôn với mức ý nghĩa 5%.

• Giải. Gọi 𝑃𝑥, 𝑃𝑦 lần lượt là tỉ lệ trẻ em béo phì ở thành phố và nông thôn. Ta cần
kiểm định giả thuyết:

𝐻0 : 𝑃𝑥 ≤ 𝑃𝑦 ; 𝐻1 : 𝑃𝑥 > 𝑃𝑦 .
20 5
Theo đề bài 𝑛𝑥 = 200; 𝑓𝑥 = = 0,1; 𝑛𝑦 = 220; 𝑓𝑦 = = 0,0227.
200 220

𝑓𝑥 −𝑓𝑦 20+5
Giá trị kiểm định: 𝑍 = = 3,3 với 𝑃෠0 = = 0,0595.
1 1
200+220
𝑃෠0 (1−𝑃෠0 ) 𝑛 +𝑛
𝑥 𝑦

α = 0,05 → 𝑍𝛼 = 1,65 → 𝑊𝛼 = 1,65; +∞ .

Vì 𝑍 ∈ 𝑊𝛼 nên ta bác bỏ 𝐻0, chấp nhận 𝐻1 . Nghĩa là tỉ lệ béo phì của trẻ em thành
phố cao hơn nông thôn.
5.3. So sánh phương sai 𝝈𝟐𝟏 và 𝝈𝟐𝟐 của hai tổng thể
𝑺𝟐𝟏
• Giá trị kiểm định: 𝐹 = ~𝐹 𝑛1 − 1, 𝑛2 − 1 .
𝑺𝟐𝟐
• Để xác định miền bác bỏ, ta tra bảng Fisher với cột 𝑛1 − 1, hàng 𝑛2 − 1. Cụ thể,
miền bác bỏ như sau:

Giả thuyết Miền bác bỏ


𝑊𝛼 = −∞; 𝐹1−𝛼/2 𝑛1 − 1, 𝑛2 − 1 ∪
𝐻0 : 𝜎12 = 𝜎22 ; 𝐻1 : 𝜎12 ≠ 𝜎22
𝐹𝛼/2 𝑛1 − 1, 𝑛2 − 1 ; +∞
𝐻0 : 𝜎12 ≥ 𝜎22 ; 𝐻1 : 𝜎12 < 𝜎22 𝑊𝛼 = −∞; 𝐹1−𝛼 𝑛1 − 1, 𝑛2 − 1

𝐻0 : 𝜎12 ≤ 𝜎22 ; 𝐻1 : 𝜎12 > 𝜎22 𝑊𝛼 = 𝐹𝛼 𝑛1 − 1, 𝑛2 − 1 ; +∞


• Ví dụ 14. Quan sát cân nặng của bé trai (X) và bé gái (Y) lúc sơ sinh (đơn
vị gam), ta có kết quả

Ở mức ý nghĩa 5%, có thể cho rằng phương sai cân nặng của bé trai lớn
hơn bé gái không?!

44
𝐻0 : 𝜎𝑋2 ≤ 𝜎𝑌2
• Giải. Ta có giả thuyết cần kiểm định: ൝
𝐻1 : 𝜎𝑋2 > 𝜎𝑌2
Từ bảng số liệu ta được: 𝑛𝑋 = 25; S𝑋2 = 40266,67;
𝑛𝑌 = 28, S𝑌2 = 37407,41.

𝑺𝟐𝑿 40266,67
Giá trị kiểm định: 𝐹 = = ≈ 1,076.
𝑺𝟐𝒀 37407,41

Tra bảng Fisher với mức ý nghĩa 5%: 𝐹0,05 24, 27 ≈ 1,93.
Suy ra miền bác bỏ: 𝑊𝛼 = 1,93; +∞ .
Vì 𝑍 ∉ 𝑊𝛼 nên ta chấp nhận giả thuyết 𝐻0 .
Vậy chưa thể khẳng định phương sai cân nặng của bé trai lớn hơn bé gái.
45
HƯỚNG DẪN THỰC HIỆN
SO SÁNH HAI PHƯƠNG SAI BẰNG EXCEL

46
Dặn dò
Các bước thực hiện bài toán kiểm định
Kiểm định giả thuyết về trung bình: có 3 trường hợp
• Biết 𝜎, tổng thể có phân phối chuẩn;
• Không biết 𝜎, 𝑛 ≥ 30; tổng thể có phân phối bất kỳ;
• Không biết 𝜎, 𝑛 < 30, tổng thể có phân phối chuẩn.
Kiểm định giả thuyết về tỉ lệ: chỉ có 1 trường hợp.
Kiểm định giả thuyết về phương sai: 1 trường hợp.
Bài toán So sánh
• Hai trung bình (của hai tổng thể);
• Hai tỉ lệ (của hai tổng thể);
• Hai phương sai (của hai tổng thể);
• Làm bài tập: 1, 2, 3, 6, 9, 10, 11, 12 (Chương 4)
48

You might also like