You are on page 1of 104

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Nguyễn Văn Hạnh

Tháng 6 năm 2021

NV HANH Xác suất thống kê Tháng 6 năm 2021 1 / 37


Nội dung

1 Bài toán kiểm định giả thuyết

2 Kiểm định giá trị trung bình của một tổng thể

3 Kiểm định (so sánh) giá trị trung bình của hai tổng thể

NV HANH Xác suất thống kê Tháng 6 năm 2021 2 / 37


Bài toán kiểm định giả thuyết

Giả thuyết thống kê

Trong nhiều lĩnh vực, chúng ta hay nêu ra các nhận xét khác nhau về
các đối tượng quan tâm. Những nhận xét như vậy thường được coi là
các giả thuyết, chúng có thể đúng và cũng có thể sai.

NV HANH Xác suất thống kê Tháng 6 năm 2021 3 / 37


Bài toán kiểm định giả thuyết

Giả thuyết thống kê

Trong nhiều lĩnh vực, chúng ta hay nêu ra các nhận xét khác nhau về
các đối tượng quan tâm. Những nhận xét như vậy thường được coi là
các giả thuyết, chúng có thể đúng và cũng có thể sai.
Vấn đề xác định đúng sai của một giả thuyết sẽ được gọi là kiểm định.

NV HANH Xác suất thống kê Tháng 6 năm 2021 3 / 37


Bài toán kiểm định giả thuyết

Giả thuyết thống kê

Trong nhiều lĩnh vực, chúng ta hay nêu ra các nhận xét khác nhau về
các đối tượng quan tâm. Những nhận xét như vậy thường được coi là
các giả thuyết, chúng có thể đúng và cũng có thể sai.
Vấn đề xác định đúng sai của một giả thuyết sẽ được gọi là kiểm định.
Trong thống kê, từ một mẫu (x1 , x2 , . . . , xn ) được chọn từ một tập
nền chưa biết phân phối hoặc có phân phối F (x, θ) nhưng chưa biết
tham số θ. Các nhận xét khác nhau về yếu tố chưa biết đó gọi là các
giả thuyết thống kê.

NV HANH Xác suất thống kê Tháng 6 năm 2021 3 / 37


Bài toán kiểm định giả thuyết

Ví dụ

Biết rằng tiền điện trung bình của các hộ gia đình tại một khu vực (gồm
khoảng 1 triệu hộ) trong tháng 5/2020 là 200 nghìn đồng. Khảo sát tiền
điện tháng 6/2020 của 200 hộ, ta thu được bảng số liệu như sau:

NV HANH Xác suất thống kê Tháng 6 năm 2021 4 / 37


Bài toán kiểm định giả thuyết

Ví dụ

Phân bố của dữ liệu có thể xấp xỉ bởi phân bố chuẩn:

NV HANH Xác suất thống kê Tháng 6 năm 2021 5 / 37


Bài toán kiểm định giả thuyết

Ví dụ

Mô hình hoá: Ta có thể giả sử tiền điện X của các hộ gia đình cá
nhân tháng 6/2020 tại khu vực trên có phân bố chuẩn với tham số
θ = (µ, σ 2 ).

NV HANH Xác suất thống kê Tháng 6 năm 2021 6 / 37


Bài toán kiểm định giả thuyết

Ví dụ

Mô hình hoá: Ta có thể giả sử tiền điện X của các hộ gia đình cá
nhân tháng 6/2020 tại khu vực trên có phân bố chuẩn với tham số
θ = (µ, σ 2 ).
Tham số µ là trung bình tổng thể (là tiền điện trung bình tháng
6/2020 của tất cả các hộ trong khu vực).

NV HANH Xác suất thống kê Tháng 6 năm 2021 6 / 37


Bài toán kiểm định giả thuyết

Ví dụ

Mô hình hoá: Ta có thể giả sử tiền điện X của các hộ gia đình cá
nhân tháng 6/2020 tại khu vực trên có phân bố chuẩn với tham số
θ = (µ, σ 2 ).
Tham số µ là trung bình tổng thể (là tiền điện trung bình tháng
6/2020 của tất cả các hộ trong khu vực).
Trung bình mẫu x̄ = 236.78 (tiền điện trung bình của 200 hộ được
quan sát là 236.78 nghìn đồng cao hơn trung bình trong tháng 5).

NV HANH Xác suất thống kê Tháng 6 năm 2021 6 / 37


Bài toán kiểm định giả thuyết

Ví dụ

Mô hình hoá: Ta có thể giả sử tiền điện X của các hộ gia đình cá
nhân tháng 6/2020 tại khu vực trên có phân bố chuẩn với tham số
θ = (µ, σ 2 ).
Tham số µ là trung bình tổng thể (là tiền điện trung bình tháng
6/2020 của tất cả các hộ trong khu vực).
Trung bình mẫu x̄ = 236.78 (tiền điện trung bình của 200 hộ được
quan sát là 236.78 nghìn đồng cao hơn trung bình trong tháng 5).
Câu hỏi: Ta có thể kết luận rằng tiền điện trung bình của tất cả các
hộ trong khu vực trên trong tháng 6 cao hơn tháng 5 hay không?

NV HANH Xác suất thống kê Tháng 6 năm 2021 6 / 37


Bài toán kiểm định giả thuyết

Ví dụ

Mô hình hoá: Ta có thể giả sử tiền điện X của các hộ gia đình cá
nhân tháng 6/2020 tại khu vực trên có phân bố chuẩn với tham số
θ = (µ, σ 2 ).
Tham số µ là trung bình tổng thể (là tiền điện trung bình tháng
6/2020 của tất cả các hộ trong khu vực).
Trung bình mẫu x̄ = 236.78 (tiền điện trung bình của 200 hộ được
quan sát là 236.78 nghìn đồng cao hơn trung bình trong tháng 5).
Câu hỏi: Ta có thể kết luận rằng tiền điện trung bình của tất cả các
hộ trong khu vực trên trong tháng 6 cao hơn tháng 5 hay không?
Tức là ta cần đưa ra quyết định có chấp nhận hay không chấp nhận
giả thuyết ”µ > 200”.

NV HANH Xác suất thống kê Tháng 6 năm 2021 6 / 37


Bài toán kiểm định giả thuyết

Kiểm định giả thuyết: Các khái niệm

Giả thuyết nghiên cứu (research hypothesis): ”µ > 200” là giả thuyết
cần đưa ra quyết định có chấp nhận hay bác bỏ.

NV HANH Xác suất thống kê Tháng 6 năm 2021 7 / 37


Bài toán kiểm định giả thuyết

Kiểm định giả thuyết: Các khái niệm

Giả thuyết nghiên cứu (research hypothesis): ”µ > 200” là giả thuyết
cần đưa ra quyết định có chấp nhận hay bác bỏ.
Ta xây dựng giả thuyết trái với giả thuyết nghiên cứu gọi là giả
thuyết không (hay giả thuyết đảo: null hypothesis), kí hiệu là
H0 : µ ≤ 200 (tiền điện trung bình của tất cả các hộ trong khu vực
trên trong tháng 6 không cao hơn tháng 5).

NV HANH Xác suất thống kê Tháng 6 năm 2021 7 / 37


Bài toán kiểm định giả thuyết

Kiểm định giả thuyết: Các khái niệm

Giả thuyết nghiên cứu (research hypothesis): ”µ > 200” là giả thuyết
cần đưa ra quyết định có chấp nhận hay bác bỏ.
Ta xây dựng giả thuyết trái với giả thuyết nghiên cứu gọi là giả
thuyết không (hay giả thuyết đảo: null hypothesis), kí hiệu là
H0 : µ ≤ 200 (tiền điện trung bình của tất cả các hộ trong khu vực
trên trong tháng 6 không cao hơn tháng 5).
Để đưa ra quyết định chấp nhận giả thuyết nghiên cứu, ta đi kiểm
định xem thông tin từ mẫu là "bằng chứng" có đủ "mạnh" để bác bỏ
giả thuyết đảo H0 hay không.

NV HANH Xác suất thống kê Tháng 6 năm 2021 7 / 37


Bài toán kiểm định giả thuyết

Kiểm định giả thuyết: Các khái niệm

Giả thuyết nghiên cứu (research hypothesis): ”µ > 200” là giả thuyết
cần đưa ra quyết định có chấp nhận hay bác bỏ.
Ta xây dựng giả thuyết trái với giả thuyết nghiên cứu gọi là giả
thuyết không (hay giả thuyết đảo: null hypothesis), kí hiệu là
H0 : µ ≤ 200 (tiền điện trung bình của tất cả các hộ trong khu vực
trên trong tháng 6 không cao hơn tháng 5).
Để đưa ra quyết định chấp nhận giả thuyết nghiên cứu, ta đi kiểm
định xem thông tin từ mẫu là "bằng chứng" có đủ "mạnh" để bác bỏ
giả thuyết đảo H0 hay không.
Đối thuyết (alternative hypothesis) H1 : là giả thuyết nghiên cứu
(µ > 200).

NV HANH Xác suất thống kê Tháng 6 năm 2021 7 / 37


Bài toán kiểm định giả thuyết

Kiểm định giả thuyết: Các khái niệm

Giả thuyết nghiên cứu (research hypothesis): ”µ > 200” là giả thuyết
cần đưa ra quyết định có chấp nhận hay bác bỏ.
Ta xây dựng giả thuyết trái với giả thuyết nghiên cứu gọi là giả
thuyết không (hay giả thuyết đảo: null hypothesis), kí hiệu là
H0 : µ ≤ 200 (tiền điện trung bình của tất cả các hộ trong khu vực
trên trong tháng 6 không cao hơn tháng 5).
Để đưa ra quyết định chấp nhận giả thuyết nghiên cứu, ta đi kiểm
định xem thông tin từ mẫu là "bằng chứng" có đủ "mạnh" để bác bỏ
giả thuyết đảo H0 hay không.
Đối thuyết (alternative hypothesis) H1 : là giả thuyết nghiên cứu
(µ > 200).
Kiểm định giả thuyết H0 : µ ≤ 200 với đối thuyết H1 : µ > 200.

NV HANH Xác suất thống kê Tháng 6 năm 2021 7 / 37


Bài toán kiểm định giả thuyết

Kiểm định giả thuyết: Các khái niệm

Bài toán kiểm định: kiểm định giả thuyết H0 : µ ≤ 200 với đối thuyết
H1 : µ > 200.
Các khả năng của bài toán kiểm định:

NV HANH Xác suất thống kê Tháng 6 năm 2021 8 / 37


Bài toán kiểm định giả thuyết

Kiểm định giả thuyết: Các khái niệm

Bài toán kiểm định: kiểm định giả thuyết H0 : µ ≤ 200 với đối thuyết
H1 : µ > 200.
Các khả năng của bài toán kiểm định:

Sai lầm loai I (Type I error): Ta kết luận tiền điện tháng 6 cao hơn
tháng 5 nhưng thực tế không phải vậy.

NV HANH Xác suất thống kê Tháng 6 năm 2021 8 / 37


Bài toán kiểm định giả thuyết

Kiểm định giả thuyết: Các khái niệm

Bài toán kiểm định: kiểm định giả thuyết H0 : µ ≤ 200 với đối thuyết
H1 : µ > 200.
Các khả năng của bài toán kiểm định:

Sai lầm loai II (Type II error): Ta kết luận tiền điện tháng 6 không
cao hơn tháng 5 nhưng thực tế không phải vậy.

NV HANH Xác suất thống kê Tháng 6 năm 2021 9 / 37


Bài toán kiểm định giả thuyết

Kiểm định giả thuyết: Các khái niệm

Bài toán kiểm định: kiểm định giả thuyết H0 : µ ≤ 200 với đối thuyết
H1 : µ > 200.
Các khả năng của bài toán kiểm định:

Lực lượng kiểm định (power of test):


P(chấp nhận H1 |H1 đúng) = 1 − β (là xác suất khi ta kết luận tiền
điện tháng 6 cao hơn tháng 5 và thực tế đúng như vậy).

NV HANH Xác suất thống kê Tháng 6 năm 2021 10 / 37


Bài toán kiểm định giả thuyết

Kiểm định giả thuyết: Các khái niệm

Bài toán kiểm định: kiểm định giả thuyết H0 : µ ≤ 200 với đối thuyết
H1 : µ > 200.
Các khả năng của bài toán kiểm định:

Kiểm định mức ý nghĩa (test of significance) ở mức α(= 5%) là bài
toán kiểm định sao cho xác suất sai lầm loại I không lớn hơn α (và α
gọi là mức ý nghĩa).

NV HANH Xác suất thống kê Tháng 6 năm 2021 11 / 37


Bài toán kiểm định giả thuyết

Các bước thực hiện bài toán kiểm định

Bước 1: Xét giả thiết trong bài toán kiểm định.

NV HANH Xác suất thống kê Tháng 6 năm 2021 12 / 37


Bài toán kiểm định giả thuyết

Các bước thực hiện bài toán kiểm định

Bước 1: Xét giả thiết trong bài toán kiểm định.


Bước 2: Xây dựng cặp giả thuyết - đối thuyết: H0 , H1

NV HANH Xác suất thống kê Tháng 6 năm 2021 12 / 37


Bài toán kiểm định giả thuyết

Các bước thực hiện bài toán kiểm định

Bước 1: Xét giả thiết trong bài toán kiểm định.


Bước 2: Xây dựng cặp giả thuyết - đối thuyết: H0 , H1
Bước 3: Tính toán giá trị thống kê (test statistic) của bài toán kiểm
định (gọi là tiêu chuẩn kiểm định).

NV HANH Xác suất thống kê Tháng 6 năm 2021 12 / 37


Bài toán kiểm định giả thuyết

Các bước thực hiện bài toán kiểm định

Bước 1: Xét giả thiết trong bài toán kiểm định.


Bước 2: Xây dựng cặp giả thuyết - đối thuyết: H0 , H1
Bước 3: Tính toán giá trị thống kê (test statistic) của bài toán kiểm
định (gọi là tiêu chuẩn kiểm định).
Bước 4: Xây dựng quy tắc kiểm định
Bước 5: Đưa ra kết luận

NV HANH Xác suất thống kê Tháng 6 năm 2021 12 / 37


Bài toán kiểm định giả thuyết

Tiêu chuẩn kiểm định

Từ mẫu (x1 , x2 , . . . , xn ), ta xây dựng một thống kê

K = K (x1 , x2 , . . . , xn )

có thể phụ thuộc vào tham số đã biết trong giả thuyết H0 .

NV HANH Xác suất thống kê Tháng 6 năm 2021 13 / 37


Bài toán kiểm định giả thuyết

Tiêu chuẩn kiểm định

Từ mẫu (x1 , x2 , . . . , xn ), ta xây dựng một thống kê

K = K (x1 , x2 , . . . , xn )

có thể phụ thuộc vào tham số đã biết trong giả thuyết H0 .


Nếu giả thuyết H0 đúng thì luật phân phối của thống kê K phải hoàn
toàn xác định.
Một thống kê như vậy được gọi là tiêu chuẩn kiểm định.

NV HANH Xác suất thống kê Tháng 6 năm 2021 13 / 37


Bài toán kiểm định giả thuyết

Quy tắc kiểm định

Nguyên tắc chung của kiểm định giả thuyết thống kê là dựa trên
nguyên lý xác suất nhỏ: một sự kiện có xác suất xuất hiện khá bé thì
có thể coi rằng nó không xảy ra khi thực hiện một phép thử có liên
quan đến sự kiện đó.

NV HANH Xác suất thống kê Tháng 6 năm 2021 14 / 37


Bài toán kiểm định giả thuyết

Quy tắc kiểm định

Nguyên tắc chung của kiểm định giả thuyết thống kê là dựa trên
nguyên lý xác suất nhỏ: một sự kiện có xác suất xuất hiện khá bé thì
có thể coi rằng nó không xảy ra khi thực hiện một phép thử có liên
quan đến sự kiện đó.
Quy tắc kiểm định: Ta thành tìm cách chia miền xác định của tiêu
chuẩn K thành hai miền Bα và B̄α sao cho:

P(Ktn ∈ Bα |H0 đúng) = α và P(Ktn ∈ B̄α |H0 sai) = β

trong đó Ktn là giá trị của thống kê K trên mẫu cụ thể đang xét.

NV HANH Xác suất thống kê Tháng 6 năm 2021 14 / 37


Bài toán kiểm định giả thuyết

Quy tắc kiểm định

Với một mẫu (x1 , x2 , . . . , xn ) mà Ktn = K (x1 , x2 , . . . , xn )) ∈ Bα , ta sẽ


bác bỏ H0 vì nếu chấp nhận H0 đúng thì sự kiện "Ktn ∈ Bα |H0 đúng"
với xác suất nhỏ (là α) đã xãy ra (mâu thuẫn với nguyên lý xác suất
nhỏ).

NV HANH Xác suất thống kê Tháng 6 năm 2021 15 / 37


Bài toán kiểm định giả thuyết

Quy tắc kiểm định

Với một mẫu (x1 , x2 , . . . , xn ) mà Ktn = K (x1 , x2 , . . . , xn )) ∈ Bα , ta sẽ


bác bỏ H0 vì nếu chấp nhận H0 đúng thì sự kiện "Ktn ∈ Bα |H0 đúng"
với xác suất nhỏ (là α) đã xãy ra (mâu thuẫn với nguyên lý xác suất
nhỏ).
Miền Bα gọi là miền bác bỏ H0 và miền B̄α gọi là miền chấp nhận
H0 . Miền bác bỏ H0 còn được gọi là miền tới hạn của tiêu chuẩn K .

NV HANH Xác suất thống kê Tháng 6 năm 2021 15 / 37


Bài toán kiểm định giả thuyết

Quy tắc kiểm định

Với một mẫu (x1 , x2 , . . . , xn ) mà Ktn = K (x1 , x2 , . . . , xn )) ∈ Bα , ta sẽ


bác bỏ H0 vì nếu chấp nhận H0 đúng thì sự kiện "Ktn ∈ Bα |H0 đúng"
với xác suất nhỏ (là α) đã xãy ra (mâu thuẫn với nguyên lý xác suất
nhỏ).
Miền Bα gọi là miền bác bỏ H0 và miền B̄α gọi là miền chấp nhận
H0 . Miền bác bỏ H0 còn được gọi là miền tới hạn của tiêu chuẩn K .
Quy tắc kiểm định: Nếu Ktn ∈ Bα thì ta bác bỏ H0 và chấp nhận H1 ,
còn nếu Ktn ∈ B̄α thì thì ta chấp nhận H0 và bác bỏ H1 .

NV HANH Xác suất thống kê Tháng 6 năm 2021 15 / 37


Bài toán kiểm định giả thuyết

Kiểm định tham số và phi tham số

Mô hình tham số: xét mẫu ngẫu nhiên (X1 , X2 , . . . , Xn ) lấy từ tổng
thể X có phân bố f (x, θ) với tham số θ thuộc một không gian hữu
hạn chiều, ta biết thông tin về dạng phân bố f của tổng thể X . Kiểm
định về tham số θ hay về phân bố f là kiểm định tham số (parametric
test).

NV HANH Xác suất thống kê Tháng 6 năm 2021 16 / 37


Bài toán kiểm định giả thuyết

Kiểm định tham số và phi tham số

Mô hình tham số: xét mẫu ngẫu nhiên (X1 , X2 , . . . , Xn ) lấy từ tổng
thể X có phân bố f (x, θ) với tham số θ thuộc một không gian hữu
hạn chiều, ta biết thông tin về dạng phân bố f của tổng thể X . Kiểm
định về tham số θ hay về phân bố f là kiểm định tham số (parametric
test).
Mô hình phi tham số: xét mẫu ngẫu nhiên (X1 , X2 , . . . , Xn ) lấy từ
tổng thể X có phân bố f (x) thuộc một lớp không gian các hàm có số
chiều vô hạn (ta biết thông tin về dạng phân bố f của tổng thể X ).
Kiểm định về phân bố f là kiểm định phi tham số (nonparametric
test).

NV HANH Xác suất thống kê Tháng 6 năm 2021 16 / 37


Bài toán kiểm định giả thuyết

Kiểm định giá trị trung bình

Kiểm định giá trị trung bình của một tổng thể (ta quan sát được một
mẫu): t-test (kiểm định tham số: phân bố chuẩn)

NV HANH Xác suất thống kê Tháng 6 năm 2021 17 / 37


Bài toán kiểm định giả thuyết

Kiểm định giá trị trung bình

Kiểm định giá trị trung bình của một tổng thể (ta quan sát được một
mẫu): t-test (kiểm định tham số: phân bố chuẩn)
Kiểm định (so sánh) giá trị trung bình của hai một tổng thể (ta quan
sát được hai mẫu): t-test (kiểm định tham số: phân bố chuẩn),
mann-whitney-wilcoxon test (kiểm định phi tham số)

NV HANH Xác suất thống kê Tháng 6 năm 2021 17 / 37


Bài toán kiểm định giả thuyết

Kiểm định giá trị trung bình

Kiểm định giá trị trung bình của một tổng thể (ta quan sát được một
mẫu): t-test (kiểm định tham số: phân bố chuẩn)
Kiểm định (so sánh) giá trị trung bình của hai một tổng thể (ta quan
sát được hai mẫu): t-test (kiểm định tham số: phân bố chuẩn),
mann-whitney-wilcoxon test (kiểm định phi tham số)
Kiểm định (so sánh) giá trị trung bình của nhiều hơn hai một tổng
thể (ta quan sát được nhiều hơn mẫu): mô hình ANOVA (kiểm định
tham số), kruskal wallis test (kiểm định phi tham số)

NV HANH Xác suất thống kê Tháng 6 năm 2021 17 / 37


Bài toán kiểm định giả thuyết

Kiểm định giá trị trung bình

NV HANH Xác suất thống kê Tháng 6 năm 2021 18 / 37


Kiểm định giá trị trung bình của một tổng thể

Kiểm định giá trị trung bình của một tổng thể

Giả thiết: ta lấy một mẫu (X1 , X2 , . . . , Xn ) từ tổng thể có phân bố


chuẩn N (µ, σ 2 ).

NV HANH Xác suất thống kê Tháng 6 năm 2021 19 / 37


Kiểm định giá trị trung bình của một tổng thể

Kiểm định giá trị trung bình của một tổng thể

Giả thiết: ta lấy một mẫu (X1 , X2 , . . . , Xn ) từ tổng thể có phân bố


chuẩn N (µ, σ 2 ).
Giả thuyết đảo: Quy tắc kiểm định cho giả thuyết đơn H0 : µ = µ0
hay giả thuyết hợp (H0 : µ ≤ µ0 ; hoặc H0 : µ ≥ µ0 ) là giống nhau
nên chúng ta chỉ xét giả thuyết đơn H0 : µ = µ0 .

NV HANH Xác suất thống kê Tháng 6 năm 2021 19 / 37


Kiểm định giá trị trung bình của một tổng thể

Kiểm định giá trị trung bình của một tổng thể

Giả thiết: ta lấy một mẫu (X1 , X2 , . . . , Xn ) từ tổng thể có phân bố


chuẩn N (µ, σ 2 ).
Giả thuyết đảo: Quy tắc kiểm định cho giả thuyết đơn H0 : µ = µ0
hay giả thuyết hợp (H0 : µ ≤ µ0 ; hoặc H0 : µ ≥ µ0 ) là giống nhau
nên chúng ta chỉ xét giả thuyết đơn H0 : µ = µ0 .
Ba đối thuyết được xét là:
Đối thuyết một phía về bên phải H1 : µ > µ0 (khi trung bình mẫu
x̄ >> µ0 ).

NV HANH Xác suất thống kê Tháng 6 năm 2021 19 / 37


Kiểm định giá trị trung bình của một tổng thể

Kiểm định giá trị trung bình của một tổng thể

Giả thiết: ta lấy một mẫu (X1 , X2 , . . . , Xn ) từ tổng thể có phân bố


chuẩn N (µ, σ 2 ).
Giả thuyết đảo: Quy tắc kiểm định cho giả thuyết đơn H0 : µ = µ0
hay giả thuyết hợp (H0 : µ ≤ µ0 ; hoặc H0 : µ ≥ µ0 ) là giống nhau
nên chúng ta chỉ xét giả thuyết đơn H0 : µ = µ0 .
Ba đối thuyết được xét là:
Đối thuyết một phía về bên phải H1 : µ > µ0 (khi trung bình mẫu
x̄ >> µ0 ).
Đối thuyết một phía về bên trái H1 : µ < µ0 (khi trung bình mẫu
x̄ << µ0 )

NV HANH Xác suất thống kê Tháng 6 năm 2021 19 / 37


Kiểm định giá trị trung bình của một tổng thể

Kiểm định giá trị trung bình của một tổng thể

Giả thiết: ta lấy một mẫu (X1 , X2 , . . . , Xn ) từ tổng thể có phân bố


chuẩn N (µ, σ 2 ).
Giả thuyết đảo: Quy tắc kiểm định cho giả thuyết đơn H0 : µ = µ0
hay giả thuyết hợp (H0 : µ ≤ µ0 ; hoặc H0 : µ ≥ µ0 ) là giống nhau
nên chúng ta chỉ xét giả thuyết đơn H0 : µ = µ0 .
Ba đối thuyết được xét là:
Đối thuyết một phía về bên phải H1 : µ > µ0 (khi trung bình mẫu
x̄ >> µ0 ).
Đối thuyết một phía về bên trái H1 : µ < µ0 (khi trung bình mẫu
x̄ << µ0 )
Đối thuyết hai phía H1 : µ 6= µ0 (khi trung bình mẫu x̄ ≈ µ0 ).

NV HANH Xác suất thống kê Tháng 6 năm 2021 19 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 1: Biết phương sai σ 2

x̄−µ
√0 .
Tiêu chuẩn của bài toán kiểm định là K = σ/ n
Nếu H0 đúng thì K
có phân bố chuẩn tắc N(0, 1) (đối xứng qua gốc toạ độ O).

NV HANH Xác suất thống kê Tháng 6 năm 2021 20 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 1: Biết phương sai σ 2

x̄−µ
√0 .
Tiêu chuẩn của bài toán kiểm định là K = σ/ n
Nếu H0 đúng thì K
có phân bố chuẩn tắc N(0, 1) (đối xứng qua gốc toạ độ O).
Miền tới hạn (miền bác bỏ H0 ): xét đối thuyết 1 phía bên phải
H1 : µ > µ0 :
Ta bác bỏ H0 , chấp nhận H1 nếu x̄ đủ lớn hơn µ0 (x̄ >> µ0 ), hay tiêu
x̄−µ
chuẩn K = σ/ √ 0 > z, với điểm tới hạn z nào đó.
n

NV HANH Xác suất thống kê Tháng 6 năm 2021 20 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 1: Biết phương sai σ 2

x̄−µ
√0 .
Tiêu chuẩn của bài toán kiểm định là K = σ/ n
Nếu H0 đúng thì K
có phân bố chuẩn tắc N(0, 1) (đối xứng qua gốc toạ độ O).
Miền tới hạn (miền bác bỏ H0 ): xét đối thuyết 1 phía bên phải
H1 : µ > µ0 :
Ta bác bỏ H0 , chấp nhận H1 nếu x̄ đủ lớn hơn µ0 (x̄ >> µ0 ), hay tiêu
x̄−µ
chuẩn K = σ/ √ 0 > z, với điểm tới hạn z nào đó.
n
Từ điều kiện P(Ktn ∈ Bα |H0 đúng) = P(K > z|K ∼ N(0, 1)) = α, ta
suy ra z = Z1−α với φ(Z1−α ) = 1 − α

NV HANH Xác suất thống kê Tháng 6 năm 2021 20 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 1: Biết phương sai σ 2

x̄−µ
√0 .
Tiêu chuẩn của bài toán kiểm định là K = σ/ n
Nếu H0 đúng thì K
có phân bố chuẩn tắc N(0, 1) (đối xứng qua gốc toạ độ O).
Miền tới hạn (miền bác bỏ H0 ): xét đối thuyết 1 phía bên phải
H1 : µ > µ0 :
Ta bác bỏ H0 , chấp nhận H1 nếu x̄ đủ lớn hơn µ0 (x̄ >> µ0 ), hay tiêu
x̄−µ
chuẩn K = σ/ √ 0 > z, với điểm tới hạn z nào đó.
n
Từ điều kiện P(Ktn ∈ Bα |H0 đúng) = P(K > z|K ∼ N(0, 1)) = α, ta
suy ra z = Z1−α với φ(Z1−α ) = 1 − α
Miền tới hạn là Bα = (Z1−α , +∞): ta bác bỏ H0 , chấp nhận H1 nếu
Ktn > Z1−α .

NV HANH Xác suất thống kê Tháng 6 năm 2021 20 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 1: Biết phương sai σ 2

Miền tới hạn (miền bác bỏ H0 ): tương tự với đối thuyết 1 phía bên
trái H1 : µ < µ0 :
Ta bác bỏ H0 , chấp nhận H1 nếu x̄ đủ nhỏ hơn µ0 (x̄ << µ0 ), hay tiêu
x̄−µ
chuẩn K = σ/ √ 0 < z, với điểm tới hạn z nào đó.
n

NV HANH Xác suất thống kê Tháng 6 năm 2021 21 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 1: Biết phương sai σ 2

Miền tới hạn (miền bác bỏ H0 ): tương tự với đối thuyết 1 phía bên
trái H1 : µ < µ0 :
Ta bác bỏ H0 , chấp nhận H1 nếu x̄ đủ nhỏ hơn µ0 (x̄ << µ0 ), hay tiêu
x̄−µ
chuẩn K = σ/ √ 0 < z, với điểm tới hạn z nào đó.
n
Từ điều kiện P(Ktn ∈ Bα |H0 đúng) = P(K < z|K ∼ N(0, 1)) = α, ta
suy ra z = Zα với φ(Zα ) = α

NV HANH Xác suất thống kê Tháng 6 năm 2021 21 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 1: Biết phương sai σ 2

Miền tới hạn (miền bác bỏ H0 ): tương tự với đối thuyết 1 phía bên
trái H1 : µ < µ0 :
Ta bác bỏ H0 , chấp nhận H1 nếu x̄ đủ nhỏ hơn µ0 (x̄ << µ0 ), hay tiêu
x̄−µ
chuẩn K = σ/ √ 0 < z, với điểm tới hạn z nào đó.
n
Từ điều kiện P(Ktn ∈ Bα |H0 đúng) = P(K < z|K ∼ N(0, 1)) = α, ta
suy ra z = Zα với φ(Zα ) = α
Miền tới hạn là Bα = (−∞, Zα ): ta bác bỏ H0 , chấp nhận H1 nếu
Ktn < Zα = −Z1−α .

NV HANH Xác suất thống kê Tháng 6 năm 2021 21 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 1: Biết phương sai σ 2

Miền tới hạn (miền bác bỏ H0 ): tương tự với đối thuyết 2 phía
H1 : µ 6= µ0 :
Ta bác bỏ H0 , chấp nhận H1 nếu x̄ đủ khác µ0 (|x̄µ0 | đủ lớn hơn 0),
hay tiêu chuẩn |K | = |x̄−µ |
√ 0 > z, với điểm tới hạn z > 0 nào đó.
σ/ n

NV HANH Xác suất thống kê Tháng 6 năm 2021 22 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 1: Biết phương sai σ 2

Miền tới hạn (miền bác bỏ H0 ): tương tự với đối thuyết 2 phía
H1 : µ 6= µ0 :
Ta bác bỏ H0 , chấp nhận H1 nếu x̄ đủ khác µ0 (|x̄µ0 | đủ lớn hơn 0),
hay tiêu chuẩn |K | = |x̄−µ |
√ 0 > z, với điểm tới hạn z > 0 nào đó.
σ/ n
Từ điều kiện P(Ktn ∈ Bα |H0 đúng) = P(|K | > z|K ∼ N(0, 1)) = α, ta
suy ra z = Z1−α/2 với φ(Z1−α/2 ) = 1 − α/2

NV HANH Xác suất thống kê Tháng 6 năm 2021 22 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 1: Biết phương sai σ 2

Miền tới hạn (miền bác bỏ H0 ): tương tự với đối thuyết 2 phía
H1 : µ 6= µ0 :
Ta bác bỏ H0 , chấp nhận H1 nếu x̄ đủ khác µ0 (|x̄µ0 | đủ lớn hơn 0),
hay tiêu chuẩn |K | = |x̄−µ |
√ 0 > z, với điểm tới hạn z > 0 nào đó.
σ/ n
Từ điều kiện P(Ktn ∈ Bα |H0 đúng) = P(|K | > z|K ∼ N(0, 1)) = α, ta
suy ra z = Z1−α/2 với φ(Z1−α/2 ) = 1 − α/2
Miền tới hạn là Bα = (−∞, −Z1−α/2 ) ∪ (Z1−α/2 , +∞): ta bác bỏ H0 ,
chấp nhận H1 nếu |Ktn | > Z1−α/2 .

NV HANH Xác suất thống kê Tháng 6 năm 2021 22 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 1
Ví dụ 1: Một máy tiện sản xuất ra một loại chi tiết có đưòng kính trung
bình là 1,5 cm (giả sử đường kính đó tuân theo luật chuẩn), biết rằng độ
lệch chuẩn của toàn bộ số chi tiết sản xuất ra là 0,01 cm. Người ta chọn
ngẫu nhiên ra 25 chi tiết thì thấy đường kính trung bình là 1,505cm. Ở
mức ý nghĩa 0.05, có thể cho rằng máy tiện trên không đạt yêu cầu hay
không?

NV HANH Xác suất thống kê Tháng 6 năm 2021 23 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 1
Ví dụ 1: Một máy tiện sản xuất ra một loại chi tiết có đưòng kính trung
bình là 1,5 cm (giả sử đường kính đó tuân theo luật chuẩn), biết rằng độ
lệch chuẩn của toàn bộ số chi tiết sản xuất ra là 0,01 cm. Người ta chọn
ngẫu nhiên ra 25 chi tiết thì thấy đường kính trung bình là 1,505cm. Ở
mức ý nghĩa 0.05, có thể cho rằng máy tiện trên không đạt yêu cầu hay
không?
Bước 1: Giả thiết: đường kính của các chi tiết máy tuân theo luật
chuẩn với kỳ vọng µ và độ lệch chuẩn σ = 0, 01.

NV HANH Xác suất thống kê Tháng 6 năm 2021 23 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 1
Ví dụ 1: Một máy tiện sản xuất ra một loại chi tiết có đưòng kính trung
bình là 1,5 cm (giả sử đường kính đó tuân theo luật chuẩn), biết rằng độ
lệch chuẩn của toàn bộ số chi tiết sản xuất ra là 0,01 cm. Người ta chọn
ngẫu nhiên ra 25 chi tiết thì thấy đường kính trung bình là 1,505cm. Ở
mức ý nghĩa 0.05, có thể cho rằng máy tiện trên không đạt yêu cầu hay
không?
Bước 1: Giả thiết: đường kính của các chi tiết máy tuân theo luật
chuẩn với kỳ vọng µ và độ lệch chuẩn σ = 0, 01.
Bước 2: Xây dựng cặp giả thuyết - đối thuyết: H0 : µ = 1, 5 với đối
thuyết 2 phía H1 : µ 6= 1, 5.

NV HANH Xác suất thống kê Tháng 6 năm 2021 23 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 1
Ví dụ 1: Một máy tiện sản xuất ra một loại chi tiết có đưòng kính trung
bình là 1,5 cm (giả sử đường kính đó tuân theo luật chuẩn), biết rằng độ
lệch chuẩn của toàn bộ số chi tiết sản xuất ra là 0,01 cm. Người ta chọn
ngẫu nhiên ra 25 chi tiết thì thấy đường kính trung bình là 1,505cm. Ở
mức ý nghĩa 0.05, có thể cho rằng máy tiện trên không đạt yêu cầu hay
không?
Bước 1: Giả thiết: đường kính của các chi tiết máy tuân theo luật
chuẩn với kỳ vọng µ và độ lệch chuẩn σ = 0, 01.
Bước 2: Xây dựng cặp giả thuyết - đối thuyết: H0 : µ = 1, 5 với đối
thuyết 2 phía H1 : µ 6= 1, 5.
Bước 3: Tiêu chuẩn kiểm định:
x̄ − µ0 1, 505 − 1, 5
Ktn = √ = √ = 2.5
σ/ n 0, 01/ 25

NV HANH Xác suất thống kê Tháng 6 năm 2021 23 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 1

Ví dụ 1: Một máy tiện sản xuất ra một loại chi tiết có đưòng kính trung
bình là 1,5 cm (giả sử đường kính đó tuân theo luật chuẩn), biết rằng độ
lệch chuẩn của toàn bộ số chi tiết sản xuất ra là 0,01 cm. Người ta chọn
ngẫu nhiên ra 25 chi tiết thì thấy đường kính trung bình là 1,505cm. Ở
mức ý nghĩa 0.05, có thể cho rằng máy tiện trên không đạt yêu cầu hay
không?
Bước 3: Tiêu chuẩn kiểm định: Ktn = 2.5 và điểm tới hạn
z = Z1−α/2 = Z0,975 = 1, 96.

NV HANH Xác suất thống kê Tháng 6 năm 2021 24 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 1

Ví dụ 1: Một máy tiện sản xuất ra một loại chi tiết có đưòng kính trung
bình là 1,5 cm (giả sử đường kính đó tuân theo luật chuẩn), biết rằng độ
lệch chuẩn của toàn bộ số chi tiết sản xuất ra là 0,01 cm. Người ta chọn
ngẫu nhiên ra 25 chi tiết thì thấy đường kính trung bình là 1,505cm. Ở
mức ý nghĩa 0.05, có thể cho rằng máy tiện trên không đạt yêu cầu hay
không?
Bước 3: Tiêu chuẩn kiểm định: Ktn = 2.5 và điểm tới hạn
z = Z1−α/2 = Z0,975 = 1, 96.
Bước 4: Vì |Ktn | > Z1−α/2 nên ta bác bỏ H0 , chấp nhận H1 .

NV HANH Xác suất thống kê Tháng 6 năm 2021 24 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 1

Ví dụ 1: Một máy tiện sản xuất ra một loại chi tiết có đưòng kính trung
bình là 1,5 cm (giả sử đường kính đó tuân theo luật chuẩn), biết rằng độ
lệch chuẩn của toàn bộ số chi tiết sản xuất ra là 0,01 cm. Người ta chọn
ngẫu nhiên ra 25 chi tiết thì thấy đường kính trung bình là 1,505cm. Ở
mức ý nghĩa 0.05, có thể cho rằng máy tiện trên không đạt yêu cầu hay
không?
Bước 3: Tiêu chuẩn kiểm định: Ktn = 2.5 và điểm tới hạn
z = Z1−α/2 = Z0,975 = 1, 96.
Bước 4: Vì |Ktn | > Z1−α/2 nên ta bác bỏ H0 , chấp nhận H1 .
Bước 5: Kết luận: Có đủ cơ sở thống kê để có thể cho rằng máy tiện
trên không đạt yêu cầu ở mức ý nghĩa 0,05.

NV HANH Xác suất thống kê Tháng 6 năm 2021 24 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 2: không biết phương sai σ 2

Giả thiết: ta lấy một mẫu (X1 , X2 , . . . , Xn ) từ tổng thể có phân bố


chuẩn N (µ, σ 2 ), với σ 2 không biết.

NV HANH Xác suất thống kê Tháng 6 năm 2021 25 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 2: không biết phương sai σ 2

Giả thiết: ta lấy một mẫu (X1 , X2 , . . . , Xn ) từ tổng thể có phân bố


chuẩn N (µ, σ 2 ), với σ 2 không biết.
x̄−µ
Tiêu chuẩn kiểm định là K = √0 ,
s/ n
với s 2 là phương sai mẫu đã hiệu
chỉnh.

NV HANH Xác suất thống kê Tháng 6 năm 2021 25 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 2: không biết phương sai σ 2

Giả thiết: ta lấy một mẫu (X1 , X2 , . . . , Xn ) từ tổng thể có phân bố


chuẩn N (µ, σ 2 ), với σ 2 không biết.
x̄−µ
Tiêu chuẩn kiểm định là K = √0 ,
s/ n
với s 2 là phương sai mẫu đã hiệu
chỉnh.
Khi H0 đúng, ta đã biết K sẽ có phân phối Student tn−1 với n − 1
bậc tự do.

NV HANH Xác suất thống kê Tháng 6 năm 2021 25 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 2: không biết phương sai σ 2

Giả thiết: ta lấy một mẫu (X1 , X2 , . . . , Xn ) từ tổng thể có phân bố


chuẩn N (µ, σ 2 ), với σ 2 không biết.
x̄−µ
Tiêu chuẩn kiểm định là K = √0 ,
s/ n
với s 2 là phương sai mẫu đã hiệu
chỉnh.
Khi H0 đúng, ta đã biết K sẽ có phân phối Student tn−1 với n − 1
bậc tự do.
Do phân phối Student tn−1 đối xứng qua gốc toạ độ nên cách làm
tương tự như trường hợp 1 (σ 2 đã biết) bằng cách thay thế điểm tới
hạn Z bằng điểm tới hạn tn−1 .

NV HANH Xác suất thống kê Tháng 6 năm 2021 25 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 2: không biết phương sai σ 2

Miền bác bỏ H0 (miền tới hạn): Đặt các điểm tới hạn tn−1,1−α và
tn−1,1−α/2 sao cho: P(tn−1 < tn−1,1−α ) = 1 − α và
P(tn−1 < tn−1,1−α/2 ) = 1 − α/2
Với đối thuyết H1 : µ > µ0 : thì miền tới hạn là Bα = (tn−1;1−α ; +∞)

NV HANH Xác suất thống kê Tháng 6 năm 2021 26 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 2: không biết phương sai σ 2

Miền bác bỏ H0 (miền tới hạn): Đặt các điểm tới hạn tn−1,1−α và
tn−1,1−α/2 sao cho: P(tn−1 < tn−1,1−α ) = 1 − α và
P(tn−1 < tn−1,1−α/2 ) = 1 − α/2
Với đối thuyết H1 : µ > µ0 : thì miền tới hạn là Bα = (tn−1;1−α ; +∞)
Với đối thuyết H1 : µ < µ0 : thì miền tới hạn là Bα = (−∞; −tn−1;1−α )

NV HANH Xác suất thống kê Tháng 6 năm 2021 26 / 37


Kiểm định giá trị trung bình của một tổng thể

Trường hợp 2: không biết phương sai σ 2

Miền bác bỏ H0 (miền tới hạn): Đặt các điểm tới hạn tn−1,1−α và
tn−1,1−α/2 sao cho: P(tn−1 < tn−1,1−α ) = 1 − α và
P(tn−1 < tn−1,1−α/2 ) = 1 − α/2
Với đối thuyết H1 : µ > µ0 : thì miền tới hạn là Bα = (tn−1;1−α ; +∞)
Với đối thuyết H1 : µ < µ0 : thì miền tới hạn là Bα = (−∞; −tn−1;1−α )
Với đối thuyết H1 : µ 6= µ0 : thì miền tới hạn là
Bα = (−∞; −tn−1;1−α/2 ) ∪ (tn−1;1−α/2 ; +∞)

NV HANH Xác suất thống kê Tháng 6 năm 2021 26 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 2
Ví dụ 2: Một nhà nhân chủng học cho rằng chiều cao trung bình của một
bộ tộc người thiểu số lớn hơn 160 cm. Người ta chọn ngẫu nhiên ra 16
người của bộ tộc người đó thì thấy chiều cao trung bình là 164,25 cm với
độ lệch chuẩn mẫu hiệu chỉnh là 6,25 cm. Có thể cho rằng bộ tộc người
đó có chiều cao trung bình lớn hơn 160 cm hay không (giả sử chiều cao
tuân theo luật phân phối chuẩn và chọn α bằng 0,05)?

NV HANH Xác suất thống kê Tháng 6 năm 2021 27 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 2
Ví dụ 2: Một nhà nhân chủng học cho rằng chiều cao trung bình của một
bộ tộc người thiểu số lớn hơn 160 cm. Người ta chọn ngẫu nhiên ra 16
người của bộ tộc người đó thì thấy chiều cao trung bình là 164,25 cm với
độ lệch chuẩn mẫu hiệu chỉnh là 6,25 cm. Có thể cho rằng bộ tộc người
đó có chiều cao trung bình lớn hơn 160 cm hay không (giả sử chiều cao
tuân theo luật phân phối chuẩn và chọn α bằng 0,05)?
Bước 1: Giả thiết: chiều cao của bộ tộc người thiểu số này tuân theo
luật chuẩn với kỳ vọng µ và độ lệch chuẩn σ không biết.

NV HANH Xác suất thống kê Tháng 6 năm 2021 27 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 2
Ví dụ 2: Một nhà nhân chủng học cho rằng chiều cao trung bình của một
bộ tộc người thiểu số lớn hơn 160 cm. Người ta chọn ngẫu nhiên ra 16
người của bộ tộc người đó thì thấy chiều cao trung bình là 164,25 cm với
độ lệch chuẩn mẫu hiệu chỉnh là 6,25 cm. Có thể cho rằng bộ tộc người
đó có chiều cao trung bình lớn hơn 160 cm hay không (giả sử chiều cao
tuân theo luật phân phối chuẩn và chọn α bằng 0,05)?
Bước 1: Giả thiết: chiều cao của bộ tộc người thiểu số này tuân theo
luật chuẩn với kỳ vọng µ và độ lệch chuẩn σ không biết.
Bước 2: Xây dựng cặp giả thuyết - đối thuyết: H0 : µ = 160 với đối
thuyết 1 phía H1 : µ > 160.

NV HANH Xác suất thống kê Tháng 6 năm 2021 27 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 2
Ví dụ 2: Một nhà nhân chủng học cho rằng chiều cao trung bình của một
bộ tộc người thiểu số lớn hơn 160 cm. Người ta chọn ngẫu nhiên ra 16
người của bộ tộc người đó thì thấy chiều cao trung bình là 164,25 cm với
độ lệch chuẩn mẫu hiệu chỉnh là 6,25 cm. Có thể cho rằng bộ tộc người
đó có chiều cao trung bình lớn hơn 160 cm hay không (giả sử chiều cao
tuân theo luật phân phối chuẩn và chọn α bằng 0,05)?
Bước 1: Giả thiết: chiều cao của bộ tộc người thiểu số này tuân theo
luật chuẩn với kỳ vọng µ và độ lệch chuẩn σ không biết.
Bước 2: Xây dựng cặp giả thuyết - đối thuyết: H0 : µ = 160 với đối
thuyết 1 phía H1 : µ > 160.
Bước 3: Tiêu chuẩn kiểm định:
x̄ − µ0 164, 25 − 160
Ktn = √ = √ = 1, 36
s/ n 6, 25/ 16

NV HANH Xác suất thống kê Tháng 6 năm 2021 27 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 2

Bước 3: Tiêu chuẩn kiểm định: Ktn = 1, 36 và điểm tới hạn


tn−1;1−α = t15;0,95 = 1, 753.

NV HANH Xác suất thống kê Tháng 6 năm 2021 28 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 2

Bước 3: Tiêu chuẩn kiểm định: Ktn = 1, 36 và điểm tới hạn


tn−1;1−α = t15;0,95 = 1, 753.
Bước 4: Vì Ktn < tn−1;1−α , tức là Ktn ∈
/ Bα nên chấp nhận H0 và bác
bỏ H1 .

NV HANH Xác suất thống kê Tháng 6 năm 2021 28 / 37


Kiểm định giá trị trung bình của một tổng thể

Ví dụ 2

Bước 3: Tiêu chuẩn kiểm định: Ktn = 1, 36 và điểm tới hạn


tn−1;1−α = t15;0,95 = 1, 753.
Bước 4: Vì Ktn < tn−1;1−α , tức là Ktn ∈
/ Bα nên chấp nhận H0 và bác
bỏ H1 .
Bước 5: Kết luận: Chưa có đủ cơ sở thống kê để có thể cho rằng bộ
tộc người đó có chiều cao trung bình lớn hơn 160 cm ở mức ý nghĩa
0,05.

NV HANH Xác suất thống kê Tháng 6 năm 2021 28 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

So sánh giá trị trung bình của hai tổng thể

Giả thiết: ta lấy 2 mẫu độc lập (X1 , X2 , . . . , Xn ) và (Y1 , Y2 , . . . , Ym )


từ 2 tổng thể X và Y có phân bố chuẩn là N (µ1 , σ12 ) và N (µ2 , σ22 ).

NV HANH Xác suất thống kê Tháng 6 năm 2021 29 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

So sánh giá trị trung bình của hai tổng thể

Giả thiết: ta lấy 2 mẫu độc lập (X1 , X2 , . . . , Xn ) và (Y1 , Y2 , . . . , Ym )


từ 2 tổng thể X và Y có phân bố chuẩn là N (µ1 , σ12 ) và N (µ2 , σ22 ).
Để so sánh µ1 với µ2 , ý tưởng là ta so sánh E (X − Y ) = µ1 − µ2 với
0. Ta xét giả thuyết đảo: H0 : µ1 − µ2 = 0

NV HANH Xác suất thống kê Tháng 6 năm 2021 29 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

So sánh giá trị trung bình của hai tổng thể

Giả thiết: ta lấy 2 mẫu độc lập (X1 , X2 , . . . , Xn ) và (Y1 , Y2 , . . . , Ym )


từ 2 tổng thể X và Y có phân bố chuẩn là N (µ1 , σ12 ) và N (µ2 , σ22 ).
Để so sánh µ1 với µ2 , ý tưởng là ta so sánh E (X − Y ) = µ1 − µ2 với
0. Ta xét giả thuyết đảo: H0 : µ1 − µ2 = 0
Ba đối thuyết được xét là:
Đối thuyết một phía về bên phải H1 : µ1 − µ2 > 0 (nếu x̄ − ȳ >> 0).

NV HANH Xác suất thống kê Tháng 6 năm 2021 29 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

So sánh giá trị trung bình của hai tổng thể

Giả thiết: ta lấy 2 mẫu độc lập (X1 , X2 , . . . , Xn ) và (Y1 , Y2 , . . . , Ym )


từ 2 tổng thể X và Y có phân bố chuẩn là N (µ1 , σ12 ) và N (µ2 , σ22 ).
Để so sánh µ1 với µ2 , ý tưởng là ta so sánh E (X − Y ) = µ1 − µ2 với
0. Ta xét giả thuyết đảo: H0 : µ1 − µ2 = 0
Ba đối thuyết được xét là:
Đối thuyết một phía về bên phải H1 : µ1 − µ2 > 0 (nếu x̄ − ȳ >> 0).
Đối thuyết một phía về bên trái H1 : µ1 − µ2 < 0 (nếu x̄ − ȳ << 0).

NV HANH Xác suất thống kê Tháng 6 năm 2021 29 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

So sánh giá trị trung bình của hai tổng thể

Giả thiết: ta lấy 2 mẫu độc lập (X1 , X2 , . . . , Xn ) và (Y1 , Y2 , . . . , Ym )


từ 2 tổng thể X và Y có phân bố chuẩn là N (µ1 , σ12 ) và N (µ2 , σ22 ).
Để so sánh µ1 với µ2 , ý tưởng là ta so sánh E (X − Y ) = µ1 − µ2 với
0. Ta xét giả thuyết đảo: H0 : µ1 − µ2 = 0
Ba đối thuyết được xét là:
Đối thuyết một phía về bên phải H1 : µ1 − µ2 > 0 (nếu x̄ − ȳ >> 0).
Đối thuyết một phía về bên trái H1 : µ1 − µ2 < 0 (nếu x̄ − ȳ << 0).
Đối thuyết hai phía H1 : µ1 − µ2 6= 0 (nếu x̄ − ȳ ≈ 0).

NV HANH Xác suất thống kê Tháng 6 năm 2021 29 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

So sánh giá trị trung bình của hai tổng thể

Ta xét một số trường hợp sau:


Trường hợp 1: ta biết 2 phương sai tổng thể σ12 , σ22

NV HANH Xác suất thống kê Tháng 6 năm 2021 30 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

So sánh giá trị trung bình của hai tổng thể

Ta xét một số trường hợp sau:


Trường hợp 1: ta biết 2 phương sai tổng thể σ12 , σ22
Trường hợp 2: ta không biết 2 phương sai tổng thể σ12 , σ22 nhưng kích
thước 2 mẫu đủ lớn (n, m > 30).

NV HANH Xác suất thống kê Tháng 6 năm 2021 30 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

So sánh giá trị trung bình của hai tổng thể

Ta xét một số trường hợp sau:


Trường hợp 1: ta biết 2 phương sai tổng thể σ12 , σ22
Trường hợp 2: ta không biết 2 phương sai tổng thể σ12 , σ22 nhưng kích
thước 2 mẫu đủ lớn (n, m > 30).
Trường hợp 3: ta không biết 2 phương sai tổng thể σ12 , σ22 và n, m
khá bé nhưng giả thiết 2 phương sai bằng nhau (σ12 = σ22 )

NV HANH Xác suất thống kê Tháng 6 năm 2021 30 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Trường hợp 1: ta biết σ12 , σ22

Trường hợp 1: ta biết 2 phương sai tổng thể σ12 , σ22


Tiêu chuẩn kiểm định là K = r x̄−ȳ . Nếu H0 đúng thì K có phân
σ2 σ2
1+ 2
n m

phối chuẩn tắc N(0, 1). Khi đó ta so sánh Ktn với phân vị của phân
phối chuẩn tắc để có được quy tắc kiểm định.

NV HANH Xác suất thống kê Tháng 6 năm 2021 31 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Trường hợp 1: ta biết σ12 , σ22

Trường hợp 1: ta biết 2 phương sai tổng thể σ12 , σ22


Tiêu chuẩn kiểm định là K = r x̄−ȳ . Nếu H0 đúng thì K có phân
σ2 σ2
1+ 2
n m

phối chuẩn tắc N(0, 1). Khi đó ta so sánh Ktn với phân vị của phân
phối chuẩn tắc để có được quy tắc kiểm định.
Miền tới hạn (miền bác bỏ H0 ):
Đối thuyết H1 : µ1 − µ2 > 0: thì Bα = (Z1−α ; +∞)

NV HANH Xác suất thống kê Tháng 6 năm 2021 31 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Trường hợp 1: ta biết σ12 , σ22

Trường hợp 1: ta biết 2 phương sai tổng thể σ12 , σ22


Tiêu chuẩn kiểm định là K = r x̄−ȳ . Nếu H0 đúng thì K có phân
σ2 σ2
1+ 2
n m

phối chuẩn tắc N(0, 1). Khi đó ta so sánh Ktn với phân vị của phân
phối chuẩn tắc để có được quy tắc kiểm định.
Miền tới hạn (miền bác bỏ H0 ):
Đối thuyết H1 : µ1 − µ2 > 0: thì Bα = (Z1−α ; +∞)
Đối thuyết H1 : µ1 − µ2 : thì Bα = (−∞; −Z1−α )

NV HANH Xác suất thống kê Tháng 6 năm 2021 31 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Trường hợp 1: ta biết σ12 , σ22

Trường hợp 1: ta biết 2 phương sai tổng thể σ12 , σ22


Tiêu chuẩn kiểm định là K = r x̄−ȳ . Nếu H0 đúng thì K có phân
σ2 σ2
1+ 2
n m

phối chuẩn tắc N(0, 1). Khi đó ta so sánh Ktn với phân vị của phân
phối chuẩn tắc để có được quy tắc kiểm định.
Miền tới hạn (miền bác bỏ H0 ):
Đối thuyết H1 : µ1 − µ2 > 0: thì Bα = (Z1−α ; +∞)
Đối thuyết H1 : µ1 − µ2 : thì Bα = (−∞; −Z1−α )
Đối thuyết H1 : µ1 − µ2 6= 0: thì
Bα = (−∞; −Z1−α/2 ) ∪ (Z1−α/2 ; +∞)

NV HANH Xác suất thống kê Tháng 6 năm 2021 31 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Trường hợp 2: σ12 , σ22 không biết nhưng n, m > 30

Trường hợp 2: ta không biết 2 phương sai tổng thể σ12 , σ22 nhưng kích
thước 2 mẫu đủ lớn (n, m > 30).
Tiêu chuẩn kiểm định là K = rx̄−ȳ , với s12 và s22 lần lượt là phương
s2 s2
1+ 2
n m

sai đã hiệu chỉnh của 2 mẫu (x1 , x2 , . . . , xn ) và (y1 , y2 , . . . , ym ).

NV HANH Xác suất thống kê Tháng 6 năm 2021 32 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Trường hợp 2: σ12 , σ22 không biết nhưng n, m > 30

Trường hợp 2: ta không biết 2 phương sai tổng thể σ12 , σ22 nhưng kích
thước 2 mẫu đủ lớn (n, m > 30).
Tiêu chuẩn kiểm định là K = rx̄−ȳ , với s12 và s22 lần lượt là phương
s2 s2
1+ 2
n m

sai đã hiệu chỉnh của 2 mẫu (x1 , x2 , . . . , xn ) và (y1 , y2 , . . . , ym ).


Nếu H0 đúng thì K xấp xỉ với phân phối chuẩn tắc N(0, 1). Khi đó
miền tới hạn của trường hợp này giống với trường hợp 1.

NV HANH Xác suất thống kê Tháng 6 năm 2021 32 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Trường hợp 3: σ12 = σ22 không biết và n, m nhỏ

Trường hợp 3: ta không biết 2 phương sai tổng thể σ12 , σ22 và n, m khá bé
nhưng giả thiết 2 phương sai bằng nhau (σ12 = σ22 )
(n−1)s12 +(m−1)s22
Tiêu chuẩn kiểm định là K = q x̄−ȳ  , với s 2 = n+m−2
s 2 n1 + m
1

NV HANH Xác suất thống kê Tháng 6 năm 2021 33 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Trường hợp 3: σ12 = σ22 không biết và n, m nhỏ

Trường hợp 3: ta không biết 2 phương sai tổng thể σ12 , σ22 và n, m khá bé
nhưng giả thiết 2 phương sai bằng nhau (σ12 = σ22 )
(n−1)s12 +(m−1)s22
Tiêu chuẩn kiểm định là K = q x̄−ȳ  , với s 2 = n+m−2
s 2 n1 + m
1

Nếu H0 đúng thì K có phân phối Student với n + m − 2 bậc tự do.


Khi đó ta so sánh Ktn với phân vị của tn+m−2 để xác định miền tới
hạn.
Miền tới hạn (miền bác bỏ H0 ):
Đối thuyết H1 : µ1 − µ2 > 0: thì Bα = (tn+m−2;1−α ; +∞)

NV HANH Xác suất thống kê Tháng 6 năm 2021 33 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Trường hợp 3: σ12 = σ22 không biết và n, m nhỏ

Trường hợp 3: ta không biết 2 phương sai tổng thể σ12 , σ22 và n, m khá bé
nhưng giả thiết 2 phương sai bằng nhau (σ12 = σ22 )
(n−1)s12 +(m−1)s22
Tiêu chuẩn kiểm định là K = q x̄−ȳ  , với s 2 = n+m−2
s 2 n1 + m
1

Nếu H0 đúng thì K có phân phối Student với n + m − 2 bậc tự do.


Khi đó ta so sánh Ktn với phân vị của tn+m−2 để xác định miền tới
hạn.
Miền tới hạn (miền bác bỏ H0 ):
Đối thuyết H1 : µ1 − µ2 > 0: thì Bα = (tn+m−2;1−α ; +∞)
Đối thuyết H1 : µ1 − µ2 < 0: thì Bα = (−∞; −tn+m−2;1−α )

NV HANH Xác suất thống kê Tháng 6 năm 2021 33 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Trường hợp 3: σ12 = σ22 không biết và n, m nhỏ

Trường hợp 3: ta không biết 2 phương sai tổng thể σ12 , σ22 và n, m khá bé
nhưng giả thiết 2 phương sai bằng nhau (σ12 = σ22 )
(n−1)s12 +(m−1)s22
Tiêu chuẩn kiểm định là K = q x̄−ȳ  , với s 2 = n+m−2
s 2 n1 + m
1

Nếu H0 đúng thì K có phân phối Student với n + m − 2 bậc tự do.


Khi đó ta so sánh Ktn với phân vị của tn+m−2 để xác định miền tới
hạn.
Miền tới hạn (miền bác bỏ H0 ):
Đối thuyết H1 : µ1 − µ2 > 0: thì Bα = (tn+m−2;1−α ; +∞)
Đối thuyết H1 : µ1 − µ2 < 0: thì Bα = (−∞; −tn+m−2;1−α )
Đối thuyết H1 : µ1 − µ2 6= 0: thì
Bα = (−∞; −tn+m−2;1−α/2 ) ∪ (tn+m−2;1−α/2 ; +∞)

NV HANH Xác suất thống kê Tháng 6 năm 2021 33 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Ví dụ 3

Người ta muốn nghiên cứu xem cách thiết kế công việc (đề cập đến các
chuyển động của công nhân) có ảnh hưởng đến năng suất của công nhân
hay không. Hai thiết kế công việc đang được xem xét để sản xuất bàn máy
tính mới. Hai mẫu được chọn ngẫu nhiên và độc lập: mẫu gồm 25 công
nhân lắp ráp bàn theo thiết kế A và mẫu gồm 25 công nhân lắp ráp bàn
theo thiết kế B. Thời gian lắp ráp được ghi lại. Hỏi rằng thời gian lắp ráp
trung bình theo hai thiết kế có khác nhau ở mức ý nghĩa α = 5% không?

NV HANH Xác suất thống kê Tháng 6 năm 2021 34 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Ví dụ 3
Gọi µ1 , µ2 lần lượt là thời gian lắp ráp trung bình theo hai thiết kế A
và B. Ta kiểm định cặp giả thuyết - đối thuyết: H0 : µ1 − µ2 = 0 với
H1 : µ1 − µ2 6= 0

NV HANH Xác suất thống kê Tháng 6 năm 2021 35 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Ví dụ 3
Gọi µ1 , µ2 lần lượt là thời gian lắp ráp trung bình theo hai thiết kế A
và B. Ta kiểm định cặp giả thuyết - đối thuyết: H0 : µ1 − µ2 = 0 với
H1 : µ1 − µ2 6= 0
Ta có n = m = 25 chưa đủ lớn;
x̄ = 6.288; ȳ = 6.016; s12 = 0.814; s22 = 1.251

NV HANH Xác suất thống kê Tháng 6 năm 2021 35 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Ví dụ 3
Gọi µ1 , µ2 lần lượt là thời gian lắp ráp trung bình theo hai thiết kế A
và B. Ta kiểm định cặp giả thuyết - đối thuyết: H0 : µ1 − µ2 = 0 với
H1 : µ1 − µ2 6= 0
Ta có n = m = 25 chưa đủ lớn;
x̄ = 6.288; ȳ = 6.016; s12 = 0.814; s22 = 1.251
Ta có thể giả sử 2 phương sai của tổng thể bằng nhau, nên ta tính
phương sai chung là
(n − 1)s12 + (m − 1)s22
s2 = = 1.0324
n+m−2

NV HANH Xác suất thống kê Tháng 6 năm 2021 35 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Ví dụ 3
Gọi µ1 , µ2 lần lượt là thời gian lắp ráp trung bình theo hai thiết kế A
và B. Ta kiểm định cặp giả thuyết - đối thuyết: H0 : µ1 − µ2 = 0 với
H1 : µ1 − µ2 6= 0
Ta có n = m = 25 chưa đủ lớn;
x̄ = 6.288; ȳ = 6.016; s12 = 0.814; s22 = 1.251
Ta có thể giả sử 2 phương sai của tổng thể bằng nhau, nên ta tính
phương sai chung là
(n − 1)s12 + (m − 1)s22
s2 = = 1.0324
n+m−2

Tiêu chuẩn kiểm định là


x̄ − ȳ
Ktn = q  = 0.95
s 2 n1 + 1
m

NV HANH Xác suất thống kê Tháng 6 năm 2021 35 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Ví dụ 3

Giá trị phân vị là tn+m−2;1−α/2 = t48;0,975 = 2, 01

NV HANH Xác suất thống kê Tháng 6 năm 2021 36 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Ví dụ 3

Giá trị phân vị là tn+m−2;1−α/2 = t48;0,975 = 2, 01


Ta chấp nhận H0 vì |Ktn | < tn+m−2;1−α/2 .

NV HANH Xác suất thống kê Tháng 6 năm 2021 36 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Ví dụ 3

Giá trị phân vị là tn+m−2;1−α/2 = t48;0,975 = 2, 01


Ta chấp nhận H0 vì |Ktn | < tn+m−2;1−α/2 .
Kết luận: Với mức ý nghĩa 0,05, thời gian lắp ráp trung bình theo hai
thiết kế không khác nhau nên cách thiết kế công việc không ảnh
hưởng đến năng suất của công nhân.

NV HANH Xác suất thống kê Tháng 6 năm 2021 36 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Chú ý:
Nếu kích thước 2 mẫu đủ lớn (n, m>30), ta có thể bỏ giả thiết chuẩn
của đầu bài.

NV HANH Xác suất thống kê Tháng 6 năm 2021 37 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Chú ý:
Nếu kích thước 2 mẫu đủ lớn (n, m>30), ta có thể bỏ giả thiết chuẩn
của đầu bài.
Để ý là hai đối thuyết µ1 < µ2 và µ1 > µ2 dễ dàng chuyển đổi cho
nhau bằng cách thay đổi thứ tự của hai mẫu.

NV HANH Xác suất thống kê Tháng 6 năm 2021 37 / 37


Kiểm định (so sánh) giá trị trung bình của hai tổng thể

Chú ý:
Nếu kích thước 2 mẫu đủ lớn (n, m>30), ta có thể bỏ giả thiết chuẩn
của đầu bài.
Để ý là hai đối thuyết µ1 < µ2 và µ1 > µ2 dễ dàng chuyển đổi cho
nhau bằng cách thay đổi thứ tự của hai mẫu.
Nếu 2 mẫu phụ thuộc được lấy theo cặp (xi , yi ) thì ta thiết lập hiệu
zi = xi − yi và đưa về kiểm định một giá trị trung bình với
H0 : µ = E (Z ) = 0. Trường hợp này gọi là so sánh cặp đôi.

NV HANH Xác suất thống kê Tháng 6 năm 2021 37 / 37

You might also like