You are on page 1of 132

XÁC SUẤT THỐNG KÊ - PROBABILITY AND

STATISTICS

Nguyễn Hữu Hiếu

12/10/2020

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 1 / 34


Nội dung

Kiểm định giả thiết dựa trên một mẫu đơn.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 2 / 34


Nội dung

Kiểm định giả thiết dựa trên một mẫu đơn.


Kiểm định trung bình

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 2 / 34


Nội dung

Kiểm định giả thiết dựa trên một mẫu đơn.


Kiểm định trung bình
Kiểm định tỉ lệ

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 2 / 34


Nội dung

Kiểm định giả thiết dựa trên một mẫu đơn.


Kiểm định trung bình
Kiểm định tỉ lệ
Kiểm định hai trung bình

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 2 / 34


Nội dung

Kiểm định giả thiết dựa trên một mẫu đơn.


Kiểm định trung bình
Kiểm định tỉ lệ
Kiểm định hai trung bình
Kiểm định hai tỉ lệ

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 2 / 34


Nội dung

Kiểm định giả thiết dựa trên một mẫu đơn.


Kiểm định trung bình
Kiểm định tỉ lệ
Kiểm định hai trung bình
Kiểm định hai tỉ lệ
Kiểm định t cặp

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 2 / 34


Nội dung

Kiểm định giả thiết dựa trên một mẫu đơn.


Kiểm định trung bình
Kiểm định tỉ lệ
Kiểm định hai trung bình
Kiểm định hai tỉ lệ
Kiểm định t cặp
Tương quan và hồi qui tuyến tính

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 2 / 34


Kiểm định giả thiết dựa trên mẫu đơn

Định nghĩa 1
(Giả thiết thống kê) Giả thiết thống kê là một khẳng định về giá trị của một tham
số đơn (đặc trưng cho một phân phối xác suất) hoặc về hình dạng của phân phối
xác suất.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 3 / 34


Kiểm định giả thiết dựa trên mẫu đơn

Định nghĩa 1
(Giả thiết thống kê) Giả thiết thống kê là một khẳng định về giá trị của một tham
số đơn (đặc trưng cho một phân phối xác suất) hoặc về hình dạng của phân phối
xác suất.

Ví dụ 1
Điểm trung bình môn XSTK năm 2020 của các bạn SV là 8.5.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 3 / 34


Kiểm định giả thiết dựa trên mẫu đơn

Định nghĩa 1
(Giả thiết thống kê) Giả thiết thống kê là một khẳng định về giá trị của một tham
số đơn (đặc trưng cho một phân phối xác suất) hoặc về hình dạng của phân phối
xác suất.

Ví dụ 1
Điểm trung bình môn XSTK năm 2020 của các bạn SV là 8.5.
Xác suất rớt môn XSTK của các bạn SV năm 2020 là 0.01.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 3 / 34


Kiểm định giả thiết dựa trên mẫu đơn

Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 4 / 34


Kiểm định giả thiết dựa trên mẫu đơn

Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.

Cách kiểm định bài Toán.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 4 / 34


Kiểm định giả thiết dựa trên mẫu đơn

Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.

Cách kiểm định bài Toán.


(i) (Tính) một đại lượng thống kê kiểm định là một hàm số của mẫu dữ liệu mà
dựa vào đó ta quyết định bác bỏ H0 hay chấp nhận H0 .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 4 / 34


Kiểm định giả thiết dựa trên mẫu đơn

Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.

Cách kiểm định bài Toán.


(i) (Tính) một đại lượng thống kê kiểm định là một hàm số của mẫu dữ liệu mà
dựa vào đó ta quyết định bác bỏ H0 hay chấp nhận H0 .
(ii) (Tìm) miền bác bỏ là tập hợp các giá trị thống kê mà ở đó H0 bị bác bỏ.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 4 / 34


Kiểm định giả thiết dựa trên mẫu đơn

Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.

Cách kiểm định bài Toán.


(i) (Tính) một đại lượng thống kê kiểm định là một hàm số của mẫu dữ liệu mà
dựa vào đó ta quyết định bác bỏ H0 hay chấp nhận H0 .
(ii) (Tìm) miền bác bỏ là tập hợp các giá trị thống kê mà ở đó H0 bị bác bỏ.

Chú ý 1
Giả thiết H0 bị bác bỏ khi các giá trị thống kê kiểm định nằm trong miền bác bỏ.
Có hai loại sai lầm thường gặp khi kiểm định giả thiết.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 4 / 34


Kiểm định giả thiết dựa trên mẫu đơn

Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.

Cách kiểm định bài Toán.


(i) (Tính) một đại lượng thống kê kiểm định là một hàm số của mẫu dữ liệu mà
dựa vào đó ta quyết định bác bỏ H0 hay chấp nhận H0 .
(ii) (Tìm) miền bác bỏ là tập hợp các giá trị thống kê mà ở đó H0 bị bác bỏ.

Chú ý 1
Giả thiết H0 bị bác bỏ khi các giá trị thống kê kiểm định nằm trong miền bác bỏ.
Có hai loại sai lầm thường gặp khi kiểm định giả thiết.
(i) Sai lầm loại I : Bác bỏ H0 khi H0 đúng.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 4 / 34


Kiểm định giả thiết dựa trên mẫu đơn

Định nghĩa 2
(Kiểm định giả thiết) Là phương pháp mà sử dụng dữ liệu mẫu để kết luận có từ
chối giả thiết không (giả thiết ban đầu) H0 hay không.

Cách kiểm định bài Toán.


(i) (Tính) một đại lượng thống kê kiểm định là một hàm số của mẫu dữ liệu mà
dựa vào đó ta quyết định bác bỏ H0 hay chấp nhận H0 .
(ii) (Tìm) miền bác bỏ là tập hợp các giá trị thống kê mà ở đó H0 bị bác bỏ.

Chú ý 1
Giả thiết H0 bị bác bỏ khi các giá trị thống kê kiểm định nằm trong miền bác bỏ.
Có hai loại sai lầm thường gặp khi kiểm định giả thiết.
(i) Sai lầm loại I : Bác bỏ H0 khi H0 đúng.
(ii) Sai lầm loại II : Không bác bỏ H0 khi H0 sai.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 4 / 34


Kiểm định trung bình

Nhận xét 1
Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên cùng phân phối chuẩn với trung bình
(µ) và độ lệch chuẩn (σ). Khi đó, X ∼ N(µ, σ 2 /n).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 5 / 34


Kiểm định trung bình

Nhận xét 1
Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên cùng phân phối chuẩn với trung bình
(µ) và độ lệch chuẩn (σ). Khi đó, X ∼ N(µ, σ 2 /n).

Xét thống kê Z với H0 đúng:


X − µ0
Z= √ .
σ/ n

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 5 / 34


Kiểm định trung bình

Đặt giả thiết không H0 : µ = µ0 .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 6 / 34


Kiểm định trung bình

Đặt giả thiết không H0 : µ = µ0 .


Giá trị kiểm định thống kê:
x − µ0
z= √ .
σ/ n

giả thiết thay thế Miền bác bỏ kiểm định mức α.


(giả thiết đối)
Ha : µ > µ 0 z ≥ zα (kiểm định bên phải)
Ha : µ < µ 0 z ≤ −zα (kiểm định bên trái)
Ha : µ 6= µ0 |z| ≥ zα/2 (kiểm định hai bên)

trong đó, α được gọi là mức ý nghĩa.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 6 / 34


Kiểm định trung bình

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 7 / 34


Kiểm định trung bình

Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 8 / 34


Kiểm định trung bình

Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?

Giải. Đặt tham số µ là nhiệt độ trung bình kích hoạt hệ thống.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 8 / 34


Kiểm định trung bình

Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?

Giải. Đặt tham số µ là nhiệt độ trung bình kích hoạt hệ thống.


Khi đó, giả thiết không: H0 : µ = µ0 = 130

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 8 / 34


Kiểm định trung bình

Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?

Giải. Đặt tham số µ là nhiệt độ trung bình kích hoạt hệ thống.


Khi đó, giả thiết không: H0 : µ = µ0 = 130 và đối thiết Ha : µ 6= 130.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 8 / 34


Kiểm định trung bình

Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?

Giải. Đặt tham số µ là nhiệt độ trung bình kích hoạt hệ thống.


Khi đó, giả thiết không: H0 : µ = µ0 = 130 và đối thiết Ha : µ 6= 130.
Tính giá trị kiểm định thống kê:

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 8 / 34


Kiểm định trung bình

Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?

Giải. Đặt tham số µ là nhiệt độ trung bình kích hoạt hệ thống.


Khi đó, giả thiết không: H0 : µ = µ0 = 130 và đối thiết Ha : µ 6= 130.
Tính giá trị kiểm định thống kê:
x − µ0
z= √
σ/ n

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 8 / 34


Kiểm định trung bình

Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?

Giải. Đặt tham số µ là nhiệt độ trung bình kích hoạt hệ thống.


Khi đó, giả thiết không: H0 : µ = µ0 = 130 và đối thiết Ha : µ 6= 130.
Tính giá trị kiểm định thống kê:
x − µ0 131.08 − 130
z= √ = √ = 2.16.
σ/ n 1.5/ 9

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 8 / 34


Kiểm định trung bình

Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?

Giải. Đặt tham số µ là nhiệt độ trung bình kích hoạt hệ thống.


Khi đó, giả thiết không: H0 : µ = µ0 = 130 và đối thiết Ha : µ 6= 130.
Tính giá trị kiểm định thống kê:
x − µ0 131.08 − 130
z= √ = √ = 2.16.
σ/ n 1.5/ 9

Với mức ý nghĩa α = 0.01, ta có zα/2 = z0.005 = 2.5758.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 8 / 34


Kiểm định trung bình

Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?

Giải. Đặt tham số µ là nhiệt độ trung bình kích hoạt hệ thống.


Khi đó, giả thiết không: H0 : µ = µ0 = 130 và đối thiết Ha : µ 6= 130.
Tính giá trị kiểm định thống kê:
x − µ0 131.08 − 130
z= √ = √ = 2.16.
σ/ n 1.5/ 9

Với mức ý nghĩa α = 0.01, ta có zα/2 = z0.005 = 2.5758.


So sánh ta thấy |z| < zα/2 . Do đó, không thể bác bỏ giả thiết H0 (chấp nhận H0 ).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 8 / 34


Kiểm định trung bình

Ví dụ 2
Nhà sản xuất hệ thống vòi phun nước để chống cháy trong chung cư cho rằng
nhiệt độ trung bình để hệ thống kích hoạt là 130o F . Một mẫu n = 9 hệ thống,
khi kiểm tra thấy nhiệt độ trung bình kích hoạt là 131.08o F . Nếu phân phối của
thời gian hoạt động là phân phối chuẩn với độ lệch chuẩn 1.5o F . Dữ liệu có mâu
thuẫn với phát biểu của nhà sản xuất với mức ý nghĩa α = 0.01 hay không?

Giải. Đặt tham số µ là nhiệt độ trung bình kích hoạt hệ thống.


Khi đó, giả thiết không: H0 : µ = µ0 = 130 và đối thiết Ha : µ 6= 130.
Tính giá trị kiểm định thống kê:
x − µ0 131.08 − 130
z= √ = √ = 2.16.
σ/ n 1.5/ 9

Với mức ý nghĩa α = 0.01, ta có zα/2 = z0.005 = 2.5758.


So sánh ta thấy |z| < zα/2 . Do đó, không thể bác bỏ giả thiết H0 (chấp nhận H0 ).
Kết luận, dữ liệu không làm thay đổi phát biểu nhà sản xuất.
N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 8 / 34
Kiểm định trung bình

Kiểm định trung bình với cỡ mẫu lớn (n ≥ 40)


Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên cùng phân phối chuẩn với trung bình
(µ) và độ lệch chuẩn (σ). Khi đó, X ∼ N(µ, σ 2 /n).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 9 / 34


Kiểm định trung bình

Kiểm định trung bình với cỡ mẫu lớn (n ≥ 40)


Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên cùng phân phối chuẩn với trung bình
(µ) và độ lệch chuẩn (σ). Khi đó, X ∼ N(µ, σ 2 /n).
Đặt giả thiết không H0 : µ = µ0 .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 9 / 34


Kiểm định trung bình

Kiểm định trung bình với cỡ mẫu lớn (n ≥ 40)


Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên cùng phân phối chuẩn với trung bình
(µ) và độ lệch chuẩn (σ). Khi đó, X ∼ N(µ, σ 2 /n).
Đặt giả thiết không H0 : µ = µ0 .
Giá trị kiểm định thống kê:
x − µ0
z= √ .
s/ n

giả thiết thay thế Miền bác bỏ kiểm định mức α.


(giả thiết đối)
Ha : µ > µ 0 z ≥ zα (kiểm định bên phải)
Ha : µ < µ 0 z ≤ −zα (kiểm định bên trái)
Ha : µ 6= µ0 |z| ≥ zα/2 (kiểm định hai bên)

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 9 / 34


Kiểm định trung bình

Ví dụ 3
Một máy cần đóng gói các sản phẩm có khối lượng 1(kg ). Nghi ngờ máy hoạt
động không bình thường, người ta chọn ra một mẫu 100 sản phẩm thì thấy như
sau.
Khối lượng (kg ) 0.95 0.97 0.99 1.01 1.03 1.05
Số gói 9 31 40 15 3 2

a. Với mức ý nghĩa α = 0.05, hãy kết luận nghi ngờ trên.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 10 / 34


Kiểm định trung bình

Ví dụ 3
Một máy cần đóng gói các sản phẩm có khối lượng 1(kg ). Nghi ngờ máy hoạt
động không bình thường, người ta chọn ra một mẫu 100 sản phẩm thì thấy như
sau.
Khối lượng (kg ) 0.95 0.97 0.99 1.01 1.03 1.05
Số gói 9 31 40 15 3 2

a. Với mức ý nghĩa α = 0.05, hãy kết luận nghi ngờ trên.
b. Người ta còn nghi ngờ máy hoạt động không bình thường và đóng gói sản
phẩm dưới 1(kg ). Từ mẫu số liệu, với mức ý nghĩa α = 0.05, hãy kiểm định
nghi ngờ trên.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 10 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.
Từ mẫu số liệu ta có.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 0.9856
n

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 0.9856
n

r
2
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s = (x − xi )2 = 0.02.
n−1
Tính giá trị kiểm định thống kê:

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 0.9856
n

r
2
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s = (x − xi )2 = 0.02.
n−1
Tính giá trị kiểm định thống kê:
x − µ0
z= √
s/ n

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 0.9856
n

r
2
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s = (x − xi )2 = 0.02.
n−1
Tính giá trị kiểm định thống kê:
x − µ0 0.9856 − 1
z= √ = √ = −7.2.
s/ n 0.02/ 100

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 0.9856
n

r
2
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s = (x − xi )2 = 0.02.
n−1
Tính giá trị kiểm định thống kê:
x − µ0 0.9856 − 1
z= √ = √ = −7.2.
s/ n 0.02/ 100

Với mức ý nghĩa α = 0.05, ta có zα/2 = z0.025 = 1.96.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 0.9856
n

r
2
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s = (x − xi )2 = 0.02.
n−1
Tính giá trị kiểm định thống kê:
x − µ0 0.9856 − 1
z= √ = √ = −7.2.
s/ n 0.02/ 100

Với mức ý nghĩa α = 0.05, ta có zα/2 = z0.025 = 1.96.


So sánh ta thấy |z| > zα/2 . Do đó, bác bỏ giả thiết H0 (không chấp nhận H0 ).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 0.9856
n

r
2
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s = (x − xi )2 = 0.02.
n−1
Tính giá trị kiểm định thống kê:
x − µ0 0.9856 − 1
z= √ = √ = −7.2.
s/ n 0.02/ 100

Với mức ý nghĩa α = 0.05, ta có zα/2 = z0.025 = 1.96.


So sánh ta thấy |z| > zα/2 . Do đó, bác bỏ giả thiết H0 (không chấp nhận H0 ).
Kết luận, máy hoạt động không bình thường.
b. Với mức ý nghĩa α = 0.05, ta có zα = z0.05 = 1.6449.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 0.9856
n

r
2
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s = (x − xi )2 = 0.02.
n−1
Tính giá trị kiểm định thống kê:
x − µ0 0.9856 − 1
z= √ = √ = −7.2.
s/ n 0.02/ 100

Với mức ý nghĩa α = 0.05, ta có zα/2 = z0.025 = 1.96.


So sánh ta thấy |z| > zα/2 . Do đó, bác bỏ giả thiết H0 (không chấp nhận H0 ).
Kết luận, máy hoạt động không bình thường.
b. Với mức ý nghĩa α = 0.05, ta có zα = z0.05 = 1.6449.
So sánh ta thấy z < −zα/2 . Do đó, bác bỏ giả thiết H0 (không chấp nhận H0 ).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34


Kiểm định trung bình
Giải. a. Đặt tham số µ là khối lượng trung bình của gói sản phẩm.
Khi đó, giả thiết không: H0 : µ = µ0 = 1 và đối thiết Ha : µ 6= 1.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 0.9856
n

r
2
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s = (x − xi )2 = 0.02.
n−1
Tính giá trị kiểm định thống kê:
x − µ0 0.9856 − 1
z= √ = √ = −7.2.
s/ n 0.02/ 100

Với mức ý nghĩa α = 0.05, ta có zα/2 = z0.025 = 1.96.


So sánh ta thấy |z| > zα/2 . Do đó, bác bỏ giả thiết H0 (không chấp nhận H0 ).
Kết luận, máy hoạt động không bình thường.
b. Với mức ý nghĩa α = 0.05, ta có zα = z0.05 = 1.6449.
So sánh ta thấy z < −zα/2 . Do đó, bác bỏ giả thiết H0 (không chấp nhận H0 ).
Kết luận, máy hoạt động không bình thường và đóng gói sản phẩm dưới 1(kg ).
N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 11 / 34
Kiểm định trung bình

Kiểm định trung bình với cỡ mẫu nhỏ (n < 40)


Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên cùng phân phối chuẩn với trung bình
X − µ0
(µ) và độ lệch chuẩn (σ). Khi đó, biến ngẫu nhiên T = √ có phân phối t
S/ n
với bậc tự do n − 1.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 12 / 34


Kiểm định trung bình

Kiểm định trung bình với cỡ mẫu nhỏ (n < 40)


Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên cùng phân phối chuẩn với trung bình
X − µ0
(µ) và độ lệch chuẩn (σ). Khi đó, biến ngẫu nhiên T = √ có phân phối t
S/ n
với bậc tự do n − 1.
Đặt giả thiết không H0 : µ = µ0 .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 12 / 34


Kiểm định trung bình

Kiểm định trung bình với cỡ mẫu nhỏ (n < 40)


Cho X1 , X2 , . . . , Xn là các biến ngẫu nhiên cùng phân phối chuẩn với trung bình
X − µ0
(µ) và độ lệch chuẩn (σ). Khi đó, biến ngẫu nhiên T = √ có phân phối t
S/ n
với bậc tự do n − 1.
Đặt giả thiết không H0 : µ = µ0 .
Giá trị kiểm định thống kê:
x − µ0
t= √ .
s/ n

giả thiết thay thế Miền bác bỏ kiểm định mức α.


(giả thiết đối)
Ha : µ > µ0 t ≥ tα,n−1 (kiểm định bên phải)
Ha : µ < µ0 t ≤ −tα,n−1 (kiểm định bên trái)
Ha : µ 6= µ0 |t| ≥ tα/2,n−1 (kiểm định hai bên)

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 12 / 34


Kiểm định trung bình

Ví dụ 4
Glyxerol là thành phần chính trong quá trình lên men của rượu vang, góp phần
tăng độ ngọt, hương vị rượu. Người ta lấy 5 mẫu rượu và đo nồng độ (mg /ml)
Glyxerol, thu được kết quả.

2.67; 4.62; 4.14; 3.81; 3.83

Giả sử nồng độ Glyxerol mong muốn là 4, với mức ý nghĩa α = 0.05 xét xem nồng
độ Glyxerol có được như mong muốn không.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 13 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.


Khi đó, giả thiết không: H0 : µ = µ0 = 4

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.


Khi đó, giả thiết không: H0 : µ = µ0 = 4 và đối thiết Ha : µ 6= 4.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.


Khi đó, giả thiết không: H0 : µ = µ0 = 4 và đối thiết Ha : µ 6= 4.
Từ mẫu số liệu ta có.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.


Khi đó, giả thiết không: H0 : µ = µ0 = 4 và đối thiết Ha : µ 6= 4.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 3.814
n

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.


Khi đó, giả thiết không: H0 : µ = µ0 = 4 và đối thiết Ha : µ 6= 4.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 3.814
n

r
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s 2 = (x − xi )2 = 0.718.
n−1
Tính giá trị kiểm định thống kê:

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.


Khi đó, giả thiết không: H0 : µ = µ0 = 4 và đối thiết Ha : µ 6= 4.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 3.814
n

r
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s 2 = (x − xi )2 = 0.718.
n−1
Tính giá trị kiểm định thống kê:
x − µ0
t= √
s/ n

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.


Khi đó, giả thiết không: H0 : µ = µ0 = 4 và đối thiết Ha : µ 6= 4.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 3.814
n

r
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s 2 = (x − xi )2 = 0.718.
n−1
Tính giá trị kiểm định thống kê:
x − µ0 3.814 − 4
t= √ = √ = −0.58.
s/ n 0.718/ 5

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.


Khi đó, giả thiết không: H0 : µ = µ0 = 4 và đối thiết Ha : µ 6= 4.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 3.814
n

r
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s 2 = (x − xi )2 = 0.718.
n−1
Tính giá trị kiểm định thống kê:
x − µ0 3.814 − 4
t= √ = √ = −0.58.
s/ n 0.718/ 5

Với mức ý nghĩa α = 0.05, ta có tα/2,n−1 = t0.025,4 = 2.776.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.


Khi đó, giả thiết không: H0 : µ = µ0 = 4 và đối thiết Ha : µ 6= 4.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 3.814
n

r
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s 2 = (x − xi )2 = 0.718.
n−1
Tính giá trị kiểm định thống kê:
x − µ0 3.814 − 4
t= √ = √ = −0.58.
s/ n 0.718/ 5

Với mức ý nghĩa α = 0.05, ta có tα/2,n−1 = t0.025,4 = 2.776.


So sánh ta thấy |t| < tα/2 . Do đó, không bác bỏ giả thiết H0 (chấp nhận H0 ).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định trung bình

Giải. a. Đặt tham số µ là nồng độ của Glixerol.


Khi đó, giả thiết không: H0 : µ = µ0 = 4 và đối thiết Ha : µ 6= 4.
Từ mẫu số liệu ta có.
1P
Trung bình mẫu: x = xi = 3.814
n

r
1 P
Độ lệch chuẩn mẫu hiệu chỉnh: s = s 2 = (x − xi )2 = 0.718.
n−1
Tính giá trị kiểm định thống kê:
x − µ0 3.814 − 4
t= √ = √ = −0.58.
s/ n 0.718/ 5

Với mức ý nghĩa α = 0.05, ta có tα/2,n−1 = t0.025,4 = 2.776.


So sánh ta thấy |t| < tα/2 . Do đó, không bác bỏ giả thiết H0 (chấp nhận H0 ). Kết
luận, nồng độ Glixerol thu được như mong muốn.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 14 / 34


Kiểm định tỉ lệ

Kiểm định cỡ mẫu lớn liên quan đến tỉ lệ p là một trường hợp đặc biệt của quá
trình mẫu lớn nói chung. Đặt p là ước lượng không chệch của p và p có xấp xỉ
phân phối chuẩn. Khi đó,

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 15 / 34


Kiểm định tỉ lệ

Kiểm định cỡ mẫu lớn liên quan đến tỉ lệ p là một trường hợp đặc biệt của quá
trình mẫu lớn nói chung. Đặt p là ước lượng không chệch của p và p có xấp xỉ
phân phối chuẩn. Khi đó, Đặt giả thiết không H0 : p = p0 .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 15 / 34


Kiểm định tỉ lệ

Kiểm định cỡ mẫu lớn liên quan đến tỉ lệ p là một trường hợp đặc biệt của quá
trình mẫu lớn nói chung. Đặt p là ước lượng không chệch của p và p có xấp xỉ
phân phối chuẩn. Khi đó, Đặt giả thiết không H0 : p = p0 .
Giá trị kiểm định thống kê:
p − p0
z=p .
p0 (1 − p0 )/n

Giả thiết thay thế Miền bác bỏ kiểm định mức α.


(Giả thiết đối)
Ha : p > p0 z ≥ zα (kiểm định bên phải)
Ha : p < p0 z ≤ −zα (kiểm định bên trái)
Ha : p 6= p0 |z| ≥ zα/2 (kiểm định hai bên)

Lưu ý: Điều kiện kiểm định: np0 ≥ 10 và n(1 − p0 ) ≥ 10.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 15 / 34


Kiểm định tỉ lệ

Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 16 / 34


Kiểm định tỉ lệ

Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?

Giải. Gọi p là tham số tỉ lệ chai bị hư hỏng do nút chai.


Khi đó, giả thiết không: H0 : p = p0 = 0.15

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 16 / 34


Kiểm định tỉ lệ

Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?

Giải. Gọi p là tham số tỉ lệ chai bị hư hỏng do nút chai.


Khi đó, giả thiết không: H0 : p = p0 = 0.15 và đối thiết Ha : p > 0.15.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 16 / 34


Kiểm định tỉ lệ

Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?

Giải. Gọi p là tham số tỉ lệ chai bị hư hỏng do nút chai.


Khi đó, giả thiết không: H0 : p = p0 = 0.15 và đối thiết Ha : p > 0.15.
Từ mẫu số liệu ta có.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 16 / 34


Kiểm định tỉ lệ

Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?

Giải. Gọi p là tham số tỉ lệ chai bị hư hỏng do nút chai.


Khi đó, giả thiết không: H0 : p = p0 = 0.15 và đối thiết Ha : p > 0.15.
X 16
Từ mẫu số liệu ta có. p = = = 0.1758.
n 91
Tính giá trị kiểm định thống kê:

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 16 / 34


Kiểm định tỉ lệ

Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?

Giải. Gọi p là tham số tỉ lệ chai bị hư hỏng do nút chai.


Khi đó, giả thiết không: H0 : p = p0 = 0.15 và đối thiết Ha : p > 0.15.
X 16
Từ mẫu số liệu ta có. p = = = 0.1758.
n 91
Tính giá trị kiểm định thống kê:
p − p0 0.1758 − 0.15
z=p = = 0.69.
p0 (1 − p0 )/n 0.15(1 − 0.15)/91

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 16 / 34


Kiểm định tỉ lệ

Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?

Giải. Gọi p là tham số tỉ lệ chai bị hư hỏng do nút chai.


Khi đó, giả thiết không: H0 : p = p0 = 0.15 và đối thiết Ha : p > 0.15.
X 16
Từ mẫu số liệu ta có. p = = = 0.1758.
n 91
Tính giá trị kiểm định thống kê:
p − p0 0.1758 − 0.15
z=p = = 0.69.
p0 (1 − p0 )/n 0.15(1 − 0.15)/91
Với mức ý nghĩa α = 0.1, ta có zα = z0.1 = 1.28.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 16 / 34


Kiểm định tỉ lệ

Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?

Giải. Gọi p là tham số tỉ lệ chai bị hư hỏng do nút chai.


Khi đó, giả thiết không: H0 : p = p0 = 0.15 và đối thiết Ha : p > 0.15.
X 16
Từ mẫu số liệu ta có. p = = = 0.1758.
n 91
Tính giá trị kiểm định thống kê:
p − p0 0.1758 − 0.15
z=p = = 0.69.
p0 (1 − p0 )/n 0.15(1 − 0.15)/91
Với mức ý nghĩa α = 0.1, ta có zα = z0.1 = 1.28.
So sánh ta thấy |z| < zα . Do đó, không bác bỏ giả thiết H0 (chấp nhận H0 ).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 16 / 34


Kiểm định tỉ lệ

Ví dụ 5
Nút chai làm từ thành phần tự nhiên trong những chai rượu vang có thể bị hư
hỏng. Vì thế rượu vang trong chai có thể bị bẩn, mất hương vị. Một báo cáo cho
rằng trong quảng cáo về mùi vị của của rượu làm từ nho Chardonnay, trong 91
chai thì có 16 chai bị hư hỏng có liên quan đến nút chai. Với mức ý nghĩa 10% thì
dữ liệu này có cung cấp bằng chứng mạnh mẽ cho việc kết luận rằng hơn 15% của
tất cả các chai bị nhiễm bẩn do nút chai hay không?

Giải. Gọi p là tham số tỉ lệ chai bị hư hỏng do nút chai.


Khi đó, giả thiết không: H0 : p = p0 = 0.15 và đối thiết Ha : p > 0.15.
X 16
Từ mẫu số liệu ta có. p = = = 0.1758.
n 91
Tính giá trị kiểm định thống kê:
p − p0 0.1758 − 0.15
z=p = = 0.69.
p0 (1 − p0 )/n 0.15(1 − 0.15)/91
Với mức ý nghĩa α = 0.1, ta có zα = z0.1 = 1.28.
So sánh ta thấy |z| < zα . Do đó, không bác bỏ giả thiết H0 (chấp nhận H0 ).
Kết luận, có không quá 15% chai bị nhiễm bẩn do nút chai.
N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 16 / 34
Bài tập

BT1. Biết mức độ rò rỉ khí ga tại van bình ga GP đã nạp ga 50 lần là biến ngẫu
nhiên X có phân phối chuẩn, khảo sát mức độ rò rỉ khí ga tại van của 200 bình ga
GP đã nạp ga 50 lần ta thu được kết quả sau.
X (LEL) 0.07 0.08 0.11 0.13 0.15 0.17 0.19
Số bình 18 19 38 55 31 23 16

a. Tìm khoảng ước lượng với độ tin cậy 95% cho mức độ rò rỉ ga trung bình tại
van của bình ga GP đã nạp ga 50 lần.
b. Nếu mức độ rò rỉ ga trung bình tại van của bình ga GP đã nạp ga 50 lần vượt
quá 0.1(LEL) thì nhà sản xuất sẽ tiến hành thu hồi những bình ga. Ở mức ý
nghĩa 1% hãy cho biết nhà sản xuất có tiến hành việc thu hồi này không?
c. Nếu tỉ lệ bình ga có múc độ rò rỉ khí ga tại van vượt quá 0.1(LEL) trong
tổng số bình ga GP đã nạp ga 50 lần là trên 80% thì nhà sản xuất cần cải
tiến qui trình sản xuất. Ở mức ý nghĩa 1% hãy cho biết nhà sản xuất có tiến
hành cải tiến qui trình sản xuất hay không?

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 17 / 34


Bài tập

BT2. Một lô hàng các sản phẩm đóng gói có khối lượng 1(kg ). Nghi ngờ khối
lượng các sản phẩm không đúng, người ta chọn ra một mẫu 100 sản phẩm thì
thấy kết quả sau.

Khối lượng (kg ) 0.9 0.92 0.99 1.02 1.03 1.06


Số gói 8 32 40 5 13 2

Với mức ý nghĩa α = 0.05, hãy kết luận nghi ngờ trên.
BT3. Một nhà máy sản xuất sản phẩm với tỉ lệ sản phẩm loại một lúc đầu là
20%. Sau khi áp dụng phương pháp sản xuất mới, kiểm tra ngẫu nhiên 500 sản
phẩm thấy có 150 sản phẩm loại một. Cho kết luận về tác dụng của phương pháp
sản xuất mới với mức ý nghĩa 1%.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 18 / 34


Kiểm định hai trung bình

Nhận xét 2
Cho các mẫu độc lập: X1 , X2 , . . . , Xm là các biến ngẫu nhiên cùng phân phối
chuẩn với trung bình (µ1 ) và độ lệch chuẩn (σ1 ) và Y1 , Y2 , . . . , Yn là các biến
ngẫu nhiên cùng phân phối chuẩn với trung bình (µ2 ) và độ lệch r chuẩn (σ2 ). Khi
σ12 σ2
đó, kỳ vọng E(X − Y) = µ1 − µ2 và độ lệch chuẩn σX −Y = + 2.
m n

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 19 / 34


Kiểm định hai trung bình

Đặt giả thiết không H0 : µ1 − µ2 = ∆0 .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 20 / 34


Kiểm định hai trung bình

Đặt giả thiết không H0 : µ1 − µ2 = ∆0 .


Giá trị kiểm định thống kê:
x − y − ∆0
z= r .
σ12 σ22
+
m n
Giả thiết thay thế Miền bác bỏ kiểm định mức α.
(Giả thiết đối)
Ha : µ1 − µ2 > ∆0 z ≥ zα (kiểm định bên phải)
Ha : µ1 − µ2 < −∆0 z ≤ −zα (kiểm định bên trái)
Ha : µ1 − µ2 6= ∆0 |z| ≥ zα/2 (kiểm định hai bên)

trong đó, α được gọi là mức ý nghĩa.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 20 / 34


Kiểm định hai trung bình

Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 21 / 34


Kiểm định hai trung bình

Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = 0

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 21 / 34


Kiểm định hai trung bình

Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = 0 và đối thiết Ha : µ1 − µ2 6= 0.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 21 / 34


Kiểm định hai trung bình

Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = 0 và đối thiết Ha : µ1 − µ2 6= 0.


Tính giá trị kiểm định thống kê:

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 21 / 34


Kiểm định hai trung bình

Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = 0 và đối thiết Ha : µ1 − µ2 6= 0.


Tính giá trị kiểm định thống kê:
x − y − ∆0 29.8 − 37.4
z= r = r = −3.66
2 2
σ1 σ2 42 52
+ +
m n 20 25

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 21 / 34


Kiểm định hai trung bình

Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = 0 và đối thiết Ha : µ1 − µ2 6= 0.


Tính giá trị kiểm định thống kê:
x − y − ∆0 29.8 − 37.4
z= r = r = −3.66
2 2
σ1 σ2 42 52
+ +
m n 20 25
Với mức ý nghĩa α = 0.01, ta có zα/2 = z0.005 = 2.58.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 21 / 34


Kiểm định hai trung bình

Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = 0 và đối thiết Ha : µ1 − µ2 6= 0.


Tính giá trị kiểm định thống kê:
x − y − ∆0 29.8 − 37.4
z= r = r = −3.66
2 2
σ1 σ2 42 52
+ +
m n 20 25
Với mức ý nghĩa α = 0.01, ta có zα/2 = z0.005 = 2.58.
So sánh ta thấy |z| > zα/2 . Do đó, bác bỏ giả thiết H0 (không chấp nhận H0 ).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 21 / 34


Kiểm định hai trung bình

Ví dụ 6
Phân tích 20 mẫu thép cán nguội để xem độ cứng của thép, ta thu được độ cứng
trung bình x = 29.8(ksi) và σ1 = 4.0. Xét một mẫu khác có cỡ mẫu n = 25 và
y = 34.7(ksi), σ2 = 5.0. Giả sử hai mẫu này đều có phân phối chuẩn và người ta
cho rằng độ cứng trung bình µ1 , µ2 khác nhau. Hãy kiểm định điều đó với mức ý
nghĩa 1%.

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = 0 và đối thiết Ha : µ1 − µ2 6= 0.


Tính giá trị kiểm định thống kê:
x − y − ∆0 29.8 − 37.4
z= r = r = −3.66
2 2
σ1 σ2 42 52
+ +
m n 20 25
Với mức ý nghĩa α = 0.01, ta có zα/2 = z0.005 = 2.58.
So sánh ta thấy |z| > zα/2 . Do đó, bác bỏ giả thiết H0 (không chấp nhận H0 ).
Kết luận, độ cứng trung bình hai mẫu là khác nhau.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 21 / 34


Kiểm định hai trung bình

Đối với cỡ mẫu lớn (m, n ≥ 40).


Đặt giả thiết không H0 : µ1 − µ2 = ∆0 .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 22 / 34


Kiểm định hai trung bình

Đối với cỡ mẫu lớn (m, n ≥ 40).


Đặt giả thiết không H0 : µ1 − µ2 = ∆0 .
Giá trị kiểm định thống kê:
x − y − ∆0
z= r .
s12 s22
+
m n
Giả thiết thay thế Miền bác bỏ kiểm định mức α.
(Giả thiết đối)
Ha : µ1 − µ2 > ∆0 z ≥ zα (kiểm định bên phải)
Ha : µ1 − µ2 < −∆0 z ≤ −zα (kiểm định bên trái)
Ha : µ1 − µ2 6= ∆0 |z| ≥ zα/2 (kiểm định hai bên)

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 22 / 34


Kiểm định hai trung bình
Đối với cỡ mẫu nhỏ (m, n < 40).
Đặt giả thiết không H0 : µ1 − µ2 = ∆0 .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 23 / 34


Kiểm định hai trung bình
Đối với cỡ mẫu nhỏ (m, n < 40).
Đặt giả thiết không H0 : µ1 − µ2 = ∆0 .
Giá trị kiểm định thống kê:
x − y − ∆0
t= r .
s12 s22
+
m n
Giả thiết thay thế Miền bác bỏ kiểm định mức α.
(Giả thiết đối)
Ha : µ1 − µ2 > ∆0 t ≥ tα,v (kiểm định bên phải)
Ha : µ1 − µ2 < −∆0 t ≤ −tα,v (kiểm định bên trái)
Ha : µ1 − µ2 6= ∆0 |t| ≥ tα/2,v (kiểm định hai bên)

trong đó,
2
s12 s2

+ 2
m n
v=
s12 s22
+
m2 (m − 1) n2 (n − 1)
N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 23 / 34
Kiểm định hai trung bình

Ví dụ 7
Báo cáo dữ liệu tóm tắt dưới đây về lượng calo tiêu thụ khi hoạt động thể thao 30
phút đối với người 56(kg ).

Môn thể thao Cỡ mẫu Trung bình mẫu ĐLCM hiệu chỉnh
Bơi lội 92 320 80
Chạy 10km/h 110 290 60

Từ mẫu số liệu, với mức ý nghĩa 0.01 có kết luận được lượng calo tiêu thụ trung
bình của bơi lội hơn chạy bộ 10km/h là 5(kcal) không?

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 24 / 34


Kiểm định hai trung bình

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = ∆0 = 5

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 25 / 34


Kiểm định hai trung bình

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = ∆0 = 5 và đối thiết Ha : µ1 − µ2 > 5.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 25 / 34


Kiểm định hai trung bình

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = ∆0 = 5 và đối thiết Ha : µ1 − µ2 > 5.


Tính giá trị kiểm định thống kê:

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 25 / 34


Kiểm định hai trung bình

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = ∆0 = 5 và đối thiết Ha : µ1 − µ2 > 5.


Tính giá trị kiểm định thống kê:
x − y − ∆0 320 − 290 − 5
z= r = r = 2.47
2 2
s1 s2 802 602
+ +
m n 92 110

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 25 / 34


Kiểm định hai trung bình

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = ∆0 = 5 và đối thiết Ha : µ1 − µ2 > 5.


Tính giá trị kiểm định thống kê:
x − y − ∆0 320 − 290 − 5
z= r = r = 2.47
2 2
s1 s2 802 602
+ +
m n 92 110
Với mức ý nghĩa α = 0.01, ta có zα = z0.01 = 2.33.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 25 / 34


Kiểm định hai trung bình

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = ∆0 = 5 và đối thiết Ha : µ1 − µ2 > 5.


Tính giá trị kiểm định thống kê:
x − y − ∆0 320 − 290 − 5
z= r = r = 2.47
2 2
s1 s2 802 602
+ +
m n 92 110
Với mức ý nghĩa α = 0.01, ta có zα = z0.01 = 2.33.
So sánh ta thấy z > zα . Do đó, bác bỏ giả thiết H0 (không chấp nhận H0 ).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 25 / 34


Kiểm định hai trung bình

Giải. Đặt giả thiết không: H0 : µ1 − µ2 = ∆0 = 5 và đối thiết Ha : µ1 − µ2 > 5.


Tính giá trị kiểm định thống kê:
x − y − ∆0 320 − 290 − 5
z= r = r = 2.47
2 2
s1 s2 802 602
+ +
m n 92 110
Với mức ý nghĩa α = 0.01, ta có zα = z0.01 = 2.33.
So sánh ta thấy z > zα . Do đó, bác bỏ giả thiết H0 (không chấp nhận H0 ).
Kết luận, lượng calo tiêu thụ trung bình của bơi lội hơn chạy bộ 10km/h là
5(kcal).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 25 / 34


Kiểm định hai tỉ lệ

Xét X ∼ Bin(m, p1 ) và Y ∼ Bin(n, p2 ).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 26 / 34


Kiểm định hai tỉ lệ

Xét X ∼ Bin(m, p1 ) và Y ∼ Bin(n, p2 ).


Đặt giả thiết không H0 : p1 − p2 = ∆0 .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 26 / 34


Kiểm định hai tỉ lệ

Xét X ∼ Bin(m, p1 ) và Y ∼ Bin(n, p2 ).


Đặt giả thiết không H0 : p1 − p2 = ∆0 .
Giá trị kiểm định thống kê:
p1 − p2 − ∆0
z= .
p(1 − p)(1/m + 1/n)

X +Y
trong đó, p =
m+n
Giả thiết thay thế Miền bác bỏ kiểm định mức α.
(Giả thiết đối)
Ha : p1 − p2 > ∆0 z ≥ zα (kiểm định bên phải)
Ha : p1 − p2 < −∆0 z ≤ −zα (kiểm định bên trái)
Ha : p1 − p2 6= ∆0 |z| ≥ zα/2 (kiểm định hai bên)

trong đó, α được gọi là mức ý nghĩa.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 26 / 34


Kiểm định hai tỉ lệ

Ví dụ 8
Nghiên cứu về dự định đăng ký thi đại học về khối ngành kỹ thuật học sinh phổ
thông ở thành thị và nông thôn tại TPHCM với câu hỏi "em có đăng ký vào khối
ngành kỹ thuật hay không?". Ta thu được bảng số liệu sau.

Khu vực trả lời "có" "trả lời không" tổng cộng
Thành thị 240 300 540
Nông thôn 185 200 385

Với mức ý nghĩa 5% hãy so sánh tỉ lệ học sinh dự thi đại học khối nghành kỹ
thuật giữa thành thị và nông thôn có bằng nhau không?

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 27 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4
p1 = = ,
540 9

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37
p1 = = , p2 = = ,
540 9 380 76

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37

Tính giá trị kiểm định thống kê:

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37

Tính giá trị kiểm định thống kê:


p1 − p2 − ∆0 4/9 − 37/76
z= = = −1.09.
p(1 − p)(1/m + 1/n) 17/37(1 − 17/37)(1/540 + 1/385)

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37

Tính giá trị kiểm định thống kê:


p1 − p2 − ∆0 4/9 − 37/76
z= = = −1.09.
p(1 − p)(1/m + 1/n) 17/37(1 − 17/37)(1/540 + 1/385)

Với mức ý nghĩa α = 0.05, ta có zα/2 = z0.025 = 1.96.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37

Tính giá trị kiểm định thống kê:


p1 − p2 − ∆0 4/9 − 37/76
z= = = −1.09.
p(1 − p)(1/m + 1/n) 17/37(1 − 17/37)(1/540 + 1/385)

Với mức ý nghĩa α = 0.05, ta có zα/2 = z0.025 = 1.96.


So sánh ta thấy |z| < zα/2 . Do đó, không bác bỏ giả thiết H0 (chấp nhận H0 ).

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Kiểm định hai tỉ lệ

Giải. Gọi p1 , p2 lần lượt là tham số cho tỉ lệ học sinh dự thi đại học khối nghành
kỹ thuật giữa thành thị và nông thôn.
Đặt giả thiết không: H0 : p1 − p2 = ∆0 = 0 và đối thiết Ha : p1 − p2 6= 0.
Từ số liệu thống kê.
240 4 185 37 240 + 185 17
p1 = = , p2 = = ,p = = ,
540 9 380 76 540 + 385 37

Tính giá trị kiểm định thống kê:


p1 − p2 − ∆0 4/9 − 37/76
z= = = −1.09.
p(1 − p)(1/m + 1/n) 17/37(1 − 17/37)(1/540 + 1/385)

Với mức ý nghĩa α = 0.05, ta có zα/2 = z0.025 = 1.96.


So sánh ta thấy |z| < zα/2 . Do đó, không bác bỏ giả thiết H0 (chấp nhận H0 ).
Kết luận, với mức ý nghĩa α = 0.05, tỉ lệ học sinh dự thi đại học khối nghành kỹ
thuật giữa thành thị và nông thôn là bằng nhau.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 28 / 34


Bài tập

BT1. Một trại chăn nuôi chọn một giống gà để tiến hành nghiên cứu hiệu quả
của hai loại thức ăn A và B. Sau một thời gian nuôi thử nghiệm người ta chọn 50
con gà nuôi bằng thức ăn A thì thấy khối lượng trung bình là 2.2kg , độ lệch
chuẩn mẫu là 1.25kg . Chọn 40 con gà nuôi bằng thức ăn B thì thấy khối lượng
trung bình 1.2kg , độ lệch chuẩn mẫu 1.02kg . Hãy đánh giá hiệu quả của hai loại
thức ăn đó với mức ý nghĩa 1%.
BT2. Ban lãnh đạo một công ty cho rằng doanh số bán hàng tăng lên sau khi
thực hiện các biện pháp khuyến mãi. Chọn ngẫu nhiên 13 tuần trước đợt khuyến
mãi và 14 tuần sau đợt khuyến mãi. Doanh số trung bình và độ lệch chuẩn mẫu
trước đợt khuyến mãi là 1234 và 324 triệu đồng. Còn sau đợt khuyến mãi, các con
số này lần lượt là 1864 và 289 triệu đồng. Hãy kiểm định ý kiến trên với α = 0.05.
BT3. Để so sánh tỉ lệ trẻ em béo phì ở thành thị và vùng nông thôn người ta tiến
hành chọn ngẫu nhiên 200 em ở thành thị thấy có 20 em béo phì và chọn 220 em
ở nông thôn thấy có 5 em béo phì. Hãy kiểm định giả thiết cho rằng tỷ lệ béo phì
ở trẻ em thành thị và nông thôn là như nhau với mức ý nghĩa 1%.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 29 / 34


Kiểm định t cặp

Xét một dữ liệu gồm n cặp phân phối chuẩn độc lập

(X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn )

trong đó, E(Xi ) = µ1 , E(Yi ) = µ2 với mọi giá trị của i = 1; n.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 30 / 34


Kiểm định t cặp

Xét một dữ liệu gồm n cặp phân phối chuẩn độc lập

(X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn )

trong đó, E(Xi ) = µ1 , E(Yi ) = µ2 với mọi giá trị của i = 1; n.


Đặt D1 = X1 − Y1 , D2 = X2 − Y2 , . . . , Dn = Xn − Yn .. Giả sử Di có trung bình
µD và độ lệch chuẩn σD .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 30 / 34


Kiểm định t cặp

Đặt giả thiết không H0 : µD = ∆0 , trong đó D = X − Y

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 31 / 34


Kiểm định t cặp

Đặt giả thiết không H0 : µD = ∆0 , trong đó D = X − Y


Giá trị kiểm định thống kê:
d − ∆0
t= √ .
sD / n

Giả thiết thay thế Miền bác bỏ kiểm định mức α.


(Giả thiết đối)
Ha : µD > ∆0 t ≥ tα,n−1 (kiểm định bên phải)
Ha : µD < −∆0 t ≤ −tα,n−1 (kiểm định bên trái)
Ha : µD 6= ∆0 |t| ≥ tα/2,n−1 (kiểm định hai bên)

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 31 / 34


Kiểm định t cặp

Ví dụ 9
Đo chiều dài tay trái và tay phải của một số người được cho bởi bảng số liệu
Tay trái (cm) 60 61 61.5 62.8 63.2 63.3
Tay phải (cm) 61 63 62.1 61.9 61.1 62.1

Với mức ý nghĩa 1% hãy so sánh chiều dài trung bình của tay trái và tay phải.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 32 / 34


Tương quan và hồi qui tuyến tính

Định nghĩa 3
Cho X và Y là hai biến ngẫu nhiên nhận các giá trị tương ứng x1 , x2 , . . . , xn và
y1 , y2 , . . . , yn . Ta tìm mối quan hệ giữa X và Y bằng mô hình hồi qui tuyến tính.
Ta định nghĩa phương trình hồi qui tuyến tính là y = ax + b, trong đó.
n
P
(xi − x)(yi − y )
Sxy i=1
a= = n
Sxx P
(x − x)2
i=1


n
P n
P
yi − a xi
i=1 i=1
b = y − ax = .
n

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 33 / 34


Tương quan và hồi qui tuyến tính

Định nghĩa 4
Hệ số tương quan của n cặp (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) được cho bởi công thức

Sxy
r=p .
Sxx Syy

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 34 / 34


Tương quan và hồi qui tuyến tính

Định nghĩa 4
Hệ số tương quan của n cặp (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) được cho bởi công thức

Sxy
r=p .
Sxx Syy

Chú ý 2
(i) r ∈ [−1; 1].

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 34 / 34


Tương quan và hồi qui tuyến tính

Định nghĩa 4
Hệ số tương quan của n cặp (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) được cho bởi công thức

Sxy
r=p .
Sxx Syy

Chú ý 2
(i) r ∈ [−1; 1].
(ii) Nếu r = 0 thì hai biến ngẫu nhiên không có tương quan.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 34 / 34


Tương quan và hồi qui tuyến tính

Định nghĩa 4
Hệ số tương quan của n cặp (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) được cho bởi công thức

Sxy
r=p .
Sxx Syy

Chú ý 2
(i) r ∈ [−1; 1].
(ii) Nếu r = 0 thì hai biến ngẫu nhiên không có tương quan.
(iii) Mức độ phụ thuộc tuyến tính của hai biến ngẫu nhiên được cho bởi:
Yếu: |r | ≤ 0.5,
Vừa: 0.5 < |r | < 0.8,
Mạnh: |r | ≥ 0.8.

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 34 / 34


Tương quan và hồi qui tuyến tính

Ví dụ 10
Giả sử ta có bảng số liệu
X 28 37 44 36 47 35
Y 41 32 49 42 38 40

Lập phương trình hồi qui tuyến tính và tính hệ số tương quan giữa X và Y .

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 35 / 34


Bài tập

N. H. Hiếu Xác suất thống kê - Probability and statistics 12/10/2020 36 / 34

You might also like