Professional Documents
Culture Documents
Chapter 4
Chapter 4
1 Hiểu được cách đặt bài toán và các khái niệm: giả thuyết, đối thuyết,
sai lầm loại 1, sai lầm loại 2, mức ý nghĩa, nguyên lý xây dựng tiêu
chuẩn kiểm định.
2 Nhận biết được tình huống
so sánh trung bình một mẫu, hai mẫu;
so sánh tỉ lệ một mẫu, hai mẫu.
3 Sử dụng quy trình 6 bước để giải bài toán kiểm định trung bình, tỉ lệ
và diễn giải chính xác kết quả thu được.
Một chuỗi cửa hàng cà phê X sau khi ra mắt sản phẩm đầu tiên rất
thành công với 70% phản hồi tích cực từ tất cả khách hàng. Ông chủ
muốn tiếp tục cho ra mắt công thức pha chế tiếp theo và hy vọng
cũng nhận được sự thành công như lần trước.
Một chuỗi cửa hàng cà phê X sau khi ra mắt sản phẩm đầu tiên rất
thành công với 70% phản hồi tích cực từ tất cả khách hàng. Ông chủ
muốn tiếp tục cho ra mắt công thức pha chế tiếp theo và hy vọng
cũng nhận được sự thành công như lần trước.
Ông chủ đã ngầm khẳng định giả thuyết rằng 70% tất cả khách hàng
sẽ yêu thích sản phẩm mới này và tiến hành khảo sát để kiểm chứng.
Một chuỗi cửa hàng cà phê X sau khi ra mắt sản phẩm đầu tiên rất
thành công với 70% phản hồi tích cực từ tất cả khách hàng. Ông chủ
muốn tiếp tục cho ra mắt công thức pha chế tiếp theo và hy vọng
cũng nhận được sự thành công như lần trước.
Ông chủ đã ngầm khẳng định giả thuyết rằng 70% tất cả khách hàng
sẽ yêu thích sản phẩm mới này và tiến hành khảo sát để kiểm chứng.
Ông cho bán miễn phí trên 100 khách hàng bất kỳ và ghi nhận được
67 người cho kết quả tích cực. Với kết quả như trên, ông chủ hơi nghi
ngờ về giả thuyết của mình.
Một chuỗi cửa hàng cà phê X sau khi ra mắt sản phẩm đầu tiên rất
thành công với 70% phản hồi tích cực từ tất cả khách hàng. Ông chủ
muốn tiếp tục cho ra mắt công thức pha chế tiếp theo và hy vọng
cũng nhận được sự thành công như lần trước.
Ông chủ đã ngầm khẳng định giả thuyết rằng 70% tất cả khách hàng
sẽ yêu thích sản phẩm mới này và tiến hành khảo sát để kiểm chứng.
Ông cho bán miễn phí trên 100 khách hàng bất kỳ và ghi nhận được
67 người cho kết quả tích cực. Với kết quả như trên, ông chủ hơi nghi
ngờ về giả thuyết của mình.
Nếu kết quả càng xa con số 70%, sự nghi ngờ của ông chủ càng lớn
và đến một ngưỡng nào đó ông chủ sẽ phải bác bỏ giả thuyết của
mình. Liệu có cách nào để cụ thể hóa mối tương quan giữa kết quả
khảo sát và kết luận của ông chủ về giả thuyết hay không?
Giả thuyết thống kê là một phát biểu nào đó về tính chất của quần
thể.
Giả thuyết thống kê là một phát biểu nào đó về tính chất của quần
thể.
Bài toán kiểm định giả thuyết thống kê thường xuất hiện khi ta cần
phải đưa ra kết luận về hai giả thuyết trái ngược nhau thông qua việc
khảo sát.
Giả thuyết thống kê là một phát biểu nào đó về tính chất của quần
thể.
Bài toán kiểm định giả thuyết thống kê thường xuất hiện khi ta cần
phải đưa ra kết luận về hai giả thuyết trái ngược nhau thông qua việc
khảo sát.
Cụ thể, kiểm định giả thuyết thống kê là một quy trình để xác minh
xem có thể chấp nhận giả thuyết thống kê hay không dựa trên mẫu
số liệu quan sát được từ quần thể.
Với tình huống thực tế trên, ta có hai giả thuyết như sau:
Với tình huống thực tế trên, ta có hai giả thuyết như sau:
- Giả thuyết H0 : tỉ lệ khách hàng thích sản phẩm mới bằng 70%
(được giả sử là đúng)
Với tình huống thực tế trên, ta có hai giả thuyết như sau:
- Giả thuyết H0 : tỉ lệ khách hàng thích sản phẩm mới bằng 70%
(được giả sử là đúng)
- Đối thuyết H1 : tỉ lệ khách hàng thích sản phẩm mới không bằng
70% (được giả sử là sai)
Với tình huống thực tế trên, ta có hai giả thuyết như sau:
- Giả thuyết H0 : tỉ lệ khách hàng thích sản phẩm mới bằng 70%
(được giả sử là đúng)
- Đối thuyết H1 : tỉ lệ khách hàng thích sản phẩm mới không bằng
70% (được giả sử là sai)
Dựa trên mẫu số liệu thu được, ta cần phải lựa chọn một trong hai
quyết định:
Với tình huống thực tế trên, ta có hai giả thuyết như sau:
- Giả thuyết H0 : tỉ lệ khách hàng thích sản phẩm mới bằng 70%
(được giả sử là đúng)
- Đối thuyết H1 : tỉ lệ khách hàng thích sản phẩm mới không bằng
70% (được giả sử là sai)
Dựa trên mẫu số liệu thu được, ta cần phải lựa chọn một trong hai
quyết định:
- Bác bỏ giả thuyết H0 để ủng hộ đối thuyết H1 ;
Với tình huống thực tế trên, ta có hai giả thuyết như sau:
- Giả thuyết H0 : tỉ lệ khách hàng thích sản phẩm mới bằng 70%
(được giả sử là đúng)
- Đối thuyết H1 : tỉ lệ khách hàng thích sản phẩm mới không bằng
70% (được giả sử là sai)
Dựa trên mẫu số liệu thu được, ta cần phải lựa chọn một trong hai
quyết định:
- Bác bỏ giả thuyết H0 để ủng hộ đối thuyết H1 ;
- Không bác bỏ giả thuyết H0 để ủng hộ đối thuyết H1 . Tức là chấp
nhận H0 và không ủng hộ H1 .
Một miền S được gọi là miền tiêu chuẩn (hay còn gọi là miền bác bỏ)
cho bài toán kiểm định giả thuyết H0 với đối thuyết H1 nếu:
Một miền S được gọi là miền tiêu chuẩn (hay còn gọi là miền bác bỏ)
cho bài toán kiểm định giả thuyết H0 với đối thuyết H1 nếu:
kết quả khảo sát nằm trong miền S, ta sẽ bác bỏ H0 để ủng hộ H1 .
Một miền S được gọi là miền tiêu chuẩn (hay còn gọi là miền bác bỏ)
cho bài toán kiểm định giả thuyết H0 với đối thuyết H1 nếu:
kết quả khảo sát nằm trong miền S, ta sẽ bác bỏ H0 để ủng hộ H1 .
kết quả khảo sát nằm ngoài miền S, ta sẽ chấp nhận H0 và không ủng
hộ H1 .
Một miền S được gọi là miền tiêu chuẩn (hay còn gọi là miền bác bỏ)
cho bài toán kiểm định giả thuyết H0 với đối thuyết H1 nếu:
kết quả khảo sát nằm trong miền S, ta sẽ bác bỏ H0 để ủng hộ H1 .
kết quả khảo sát nằm ngoài miền S, ta sẽ chấp nhận H0 và không ủng
hộ H1 .
Ví dụ, trong tình huống thực tế trên, nếu kết quả khảo sát nằm trong
khoảng 65% đến 75% thì ta bác bỏ H0 , ngược lại ta sẽ chấp nhận H0 .
Một miền S được gọi là miền tiêu chuẩn (hay còn gọi là miền bác bỏ)
cho bài toán kiểm định giả thuyết H0 với đối thuyết H1 nếu:
kết quả khảo sát nằm trong miền S, ta sẽ bác bỏ H0 để ủng hộ H1 .
kết quả khảo sát nằm ngoài miền S, ta sẽ chấp nhận H0 và không ủng
hộ H1 .
Ví dụ, trong tình huống thực tế trên, nếu kết quả khảo sát nằm trong
khoảng 65% đến 75% thì ta bác bỏ H0 , ngược lại ta sẽ chấp nhận H0 .
Việc xác định miền tiêu chuẩn rất giống với quá trình tìm Khoảng tin
cậy và vì thế cũng sẽ tồn tại sự không chắc chắn. Do ta đưa ra quyết
định dựa trên một mẫu số liệu nên có thể mắc phải sai lầm.
Nhận xét
Nhận xét
Nếu ta luôn chấp nhận H0 thì không mắc phải sai lầm loại 1 nhưng sẽ
làm xác suất mắc sai lầm loại 2 đạt cao nhất.
Nhận xét
Nếu ta luôn chấp nhận H0 thì không mắc phải sai lầm loại 1 nhưng sẽ
làm xác suất mắc sai lầm loại 2 đạt cao nhất.
Ngược lại, nếu ta luôn bác bỏ H0 thì không mắc phải sai lầm loại 2
nhưng sẽ làm xác suất mắc sai lầm loại 1 đạt cao nhất.
Nhận xét
Nếu ta luôn chấp nhận H0 thì không mắc phải sai lầm loại 1 nhưng sẽ
làm xác suất mắc sai lầm loại 2 đạt cao nhất.
Ngược lại, nếu ta luôn bác bỏ H0 thì không mắc phải sai lầm loại 2
nhưng sẽ làm xác suất mắc sai lầm loại 1 đạt cao nhất.
Như vậy, không thể làm triệt tiêu đồng thời cả hai loại sai lầm!
Ta cần tìm miền S sao cho xác suất mắc hai loại sai lầm là nhỏ nhất.
Ta cần tìm miền S sao cho xác suất mắc hai loại sai lầm là nhỏ nhất.
Trong thực tế, người ta thường kiểm soát xác suất xảy ra sai lầm loại
1 theo ý muốn (thông qua cách thiết kế thí nghiệm, điều chỉnh các
thông số,...). Cụ thể, người ta sẽ khống chế xác suất mắc sai lầm loại
1 không vượt quá α ∈ (0, 1) và từ đó sẽ chọn miền tiêu chuẩn S sao
cho xác suất mắc sai lầm loại 2 nhỏ nhất.
Ta cần tìm miền S sao cho xác suất mắc hai loại sai lầm là nhỏ nhất.
Trong thực tế, người ta thường kiểm soát xác suất xảy ra sai lầm loại
1 theo ý muốn (thông qua cách thiết kế thí nghiệm, điều chỉnh các
thông số,...). Cụ thể, người ta sẽ khống chế xác suất mắc sai lầm loại
1 không vượt quá α ∈ (0, 1) và từ đó sẽ chọn miền tiêu chuẩn S sao
cho xác suất mắc sai lầm loại 2 nhỏ nhất.
Khi đó, α được gọi là mức ý nghĩa của bài toán kiểm định.
Ta cần tìm miền S sao cho xác suất mắc hai loại sai lầm là nhỏ nhất.
Trong thực tế, người ta thường kiểm soát xác suất xảy ra sai lầm loại
1 theo ý muốn (thông qua cách thiết kế thí nghiệm, điều chỉnh các
thông số,...). Cụ thể, người ta sẽ khống chế xác suất mắc sai lầm loại
1 không vượt quá α ∈ (0, 1) và từ đó sẽ chọn miền tiêu chuẩn S sao
cho xác suất mắc sai lầm loại 2 nhỏ nhất.
Khi đó, α được gọi là mức ý nghĩa của bài toán kiểm định.
Ta thường chọn mức ý nghĩa α = 0, 05 = 5%.
Giả sử θ là một tham số chưa biết của quần thể (Ví dụ: giá trị trung bình,
tỉ lệ,...)
Giả sử θ là một tham số chưa biết của quần thể (Ví dụ: giá trị trung bình,
tỉ lệ,...)
Giả thuyết H0 : θ = θ0 .
Giả sử θ là một tham số chưa biết của quần thể (Ví dụ: giá trị trung bình,
tỉ lệ,...)
Giả thuyết H0 : θ = θ0 .
Đối thuyết
Giả sử θ là một tham số chưa biết của quần thể (Ví dụ: giá trị trung bình,
tỉ lệ,...)
Giả thuyết H0 : θ = θ0 .
Đối thuyết
1 H1 : θ ̸= θ0 Kiểm định hai phía
Giả sử θ là một tham số chưa biết của quần thể (Ví dụ: giá trị trung bình,
tỉ lệ,...)
Giả thuyết H0 : θ = θ0 .
Đối thuyết
1 ̸ θ0 Kiểm định hai phía
H1 : θ =
2 H1 : θ > θ0 Kiểm định một phía
Giả sử θ là một tham số chưa biết của quần thể (Ví dụ: giá trị trung bình,
tỉ lệ,...)
Giả thuyết H0 : θ = θ0 .
Đối thuyết
1 H1 : θ ̸= θ0 Kiểm định hai phía
2 H1 : θ > θ0 Kiểm định một phía
3 H1 : θ < θ0 Kiểm định một phía
Thống kê năm 2015 ta có năng suất lúa trung bình của tỉnh Thái
Bình là 66 tạ/ha.
Khảo sát ngẫu nhiên 10 thửa ruộng ở huyện Đông Hưng thấy năng
suất trung bình của 10 thửa ruộng này là 68 tạ/ha.
Biết rằng năng suất của mỗi thửa ruộng có phân phối chuẩn với độ
lệch chuẩn σ = 4 tạ/ha.
Hãy kiểm định xem năng suất lúa ở Đông Hưng có cao hơn năng suất
trung bình của tỉnh Thái Bình được hay không, cho mức ý nghĩa
α = 5%?
Một nhà máy sản xuất mì chính ghi trọng lượng của mỗi gói mì chính trên
bao bì là 2kg. Để kiểm tra thông tin này, người ta lấy mẫu ngẫu nhiên
gồm 100 gói thì thấy trọng lượng trung bình của 100 gói này là 2002g và
độ lệch mẫu s = 5g. Với mức ý nghĩa α = 0, 05, hãy cho biết trọng lượng
các gói mì chính liệu có đúng như ghi trên bao bì hay không?
Giả sử quần thể X có phân phối chuẩn N (µ, σ 2 ) với σ 2 chưa biết. Mẫu số
liệu mà ta thu được có cỡ nhỏ (n ≤ 30).
Giả sử quần thể X có phân phối chuẩn N (µ, σ 2 ) với σ 2 chưa biết. Mẫu số
liệu mà ta thu được có cỡ nhỏ (n ≤ 30).
Giả thuyết H0 : µ = µ0 .
Giả sử quần thể X có phân phối chuẩn N (µ, σ 2 ) với σ 2 chưa biết. Mẫu số
liệu mà ta thu được có cỡ nhỏ (n ≤ 30).
Giả thuyết H0 : µ = µ0 .
x − µ0
Thống kê kiểm định: T0 = √
s/ n
Giả sử quần thể X có phân phối chuẩn N (µ, σ 2 ) với σ 2 chưa biết. Mẫu số
liệu mà ta thu được có cỡ nhỏ (n ≤ 30).
Giả thuyết H0 : µ = µ0 .
x − µ0
Thống kê kiểm định: T0 = √
s/ n
Đối thuyết Tiêu chuẩn bác bỏ H0 Miền tiêu chuẩn S
ở mức ý nghĩa α
H1 : µ ̸= µ0 |T0 | > tα/2;n−1 (−∞; −tα/2;n−1 ) ∪ (tα/2;n−1 ; +∞)
H1 : µ > µ0 T0 > tα;n−1 (tα;n−1 ; +∞)
H1 : µ < µ0 T0 < −tα;n−1 (−∞; −tα;n−1 )
Thống kê được năng suất lúa trung bình của tỉnh Thái Bình năm
2015 là 66 tạ/ha.
Khảo sát ngẫu nhiên 10 thửa ruộng ở huyện Đông Hưng thấy năng
suất trung bình của 10 thửa ruộng này là 68 tạ/ha và độ lệch mẫu
s = 4 tạ/ha.
Biết rằng năng suất của mỗi thửa ruộng có phân phối chuẩn.
Hãy kiểm định xem năng suất lúa ở Đông Hưng có cao hơn năng suất
trung bình của tỉnh Thái Bình được hay không, cho mức ý nghĩa
α = 5%?
Trở lại tình huống thực tế ở phần 4.1, ta có hai giả thuyết như sau:
Giả thuyết H0 : tỉ lệ khách hàng thích sản phẩm mới bằng 70%.
Đối thuyết H1 : tỉ lệ khách hàng thích sản phẩm mới không bằng 70%.
Những năm trước nhà máy áp dụng công nghệ A sản xuất thì có tỷ lệ
phế phẩm là 6%.
Năm nay nhà máy nhập công nghệ B để sản xuất, hy vọng sẽ giảm
được tỷ lệ phế phẩm.
Lấy ngẫu nhiên 100 sản phẩm để kiểm tra thì thấy có 5 phế phẩm.
Với mức ý nghĩa 5%, có thể cho rằng tỷ lệ phế phẩm của công nghệ
B nhỏ hơn công nghệ A hay không.
Để so sánh điểm thi môn Toán của học sinh hai trường A và B, người
ta khảo sát kết quả thi hết môn của một số học sinh của hai trường
và thu được kết quả như sau:
Trường A: nX = 64, x̄ = 7, 32.
Trường B: nY = 68, ȳ = 7, 66.
Biết rằng điểm thi môn Toán của học sinh của hai trường là biến
ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn tương ứng là
σX = 1, 09; σY = 1, 12.
Với mức ý nghĩa 1% có thể cho rằng kết quả thi của trường B cao
hơn trường A hay không?
H0 : µX = µY , với H1 : µX < µY
H0 : µX = µY , với H1 : µX < µY
H0 : µX = µY , với H1 : µX < µY
H0 : µX = µY , với H1 : µX < µY
H0 : µX = µY , với H1 : µX < µY
H0 : µX = µY , với H1 : µX < µY
Điều tra thu nhập (đơn vị tính $) trong một tháng của công nhân ở hai
nhà máy sản xuất thiết bị điện tử A và B ta thu được số liệu sau:
Nhà máy A: 91, 50; 94, 18; 92, 18; 95, 39; 91, 79.
Nhà máy B: 90, 46; 93, 21; 97, 19; 97, 04; 91, 07; 92, 75.
Với mức ý nghĩa 5%, có thể cho rằng thu nhập trung bình của công nhân
trong hai nhà máy trên là như nhau hay không, biết rằng thu nhập trong
hai nhà máy có phân phối chuẩn.
Để so sánh chất lượng của một loại sản phẩm do hai công ty X và Y sản
xuất, người ta lấy hai mẫu dữ liệu sau:
Để so sánh chất lượng của một loại sản phẩm do hai công ty X và Y sản
xuất, người ta lấy hai mẫu dữ liệu sau:
Trong 30 sản phẩm do công ty X sản xuất thấy có 12 sản phẩm đạt
loại A.
Trong 40 sản phẩm do công ty Y sản xuất thấy có 14 sản phẩm đạt
loại A.
Để so sánh chất lượng của một loại sản phẩm do hai công ty X và Y sản
xuất, người ta lấy hai mẫu dữ liệu sau:
Trong 30 sản phẩm do công ty X sản xuất thấy có 12 sản phẩm đạt
loại A.
Trong 40 sản phẩm do công ty Y sản xuất thấy có 14 sản phẩm đạt
loại A.
? Hỏi chất lượng loại sản phẩm này của hai công ty có như nhau không?
Dựa trên hai mẫu số liệu quan sát được từ hai quần thể X và Y , ta muốn
so sánh pX , pY là hai tỉ lệ của số phần tử có cùng tính chất A nào đó của
hai quần thể.
Dựa trên hai mẫu số liệu quan sát được từ hai quần thể X và Y , ta muốn
so sánh pX , pY là hai tỉ lệ của số phần tử có cùng tính chất A nào đó của
hai quần thể.
Dựa trên hai mẫu số liệu quan sát được từ hai quần thể X và Y , ta muốn
so sánh pX , pY là hai tỉ lệ của số phần tử có cùng tính chất A nào đó của
hai quần thể.
nX , nY là kích thước hai mẫu quan sát được từ hai quần thể X , Y
tương ứng.
nX , nY là kích thước hai mẫu quan sát được từ hai quần thể X , Y
tương ứng.
kX , kY là số phần tử có cùng tính chất A trong hai mẫu tương ứng.
nX , nY là kích thước hai mẫu quan sát được từ hai quần thể X , Y
tương ứng.
kX , kY là số phần tử có cùng tính chất A trong hai mẫu tương ứng.
fX , fY là tần suất các phần tử có cùng tính chất A trong hai mẫu
tương ứng.
nX , nY là kích thước hai mẫu quan sát được từ hai quần thể X , Y
tương ứng.
kX , kY là số phần tử có cùng tính chất A trong hai mẫu tương ứng.
fX , fY là tần suất các phần tử có cùng tính chất A trong hai mẫu
tương ứng.
fX − fY kX + kY
Thống kê kiểm định: Z0 = r với f = n + n .
X Y
f (1 − f ) nnXX+n
nY
Y
nX , nY là kích thước hai mẫu quan sát được từ hai quần thể X , Y
tương ứng.
kX , kY là số phần tử có cùng tính chất A trong hai mẫu tương ứng.
fX , fY là tần suất các phần tử có cùng tính chất A trong hai mẫu
tương ứng.
fX − fY kX + kY
Thống kê kiểm định: Z0 = r với f = n + n .
X Y
f (1 − f ) nnXX+n
nY
Y
Điều tra hiện tượng học sinh bỏ học ở hai vùng nông thôn A và B ta thu
được số liệu sau:
Vùng A: Điều tra 1900 em có 175 em bỏ học.
Vùng B: Điều tra 2600 em có 325 em bỏ học.
Điều tra hiện tượng học sinh bỏ học ở hai vùng nông thôn A và B ta thu
được số liệu sau:
Vùng A: Điều tra 1900 em có 175 em bỏ học.
Vùng B: Điều tra 2600 em có 325 em bỏ học.
Có ý kiến cho rằng tình trạng học sinh bỏ học ở vùng A là ít phổ biến hơn
vùng B. Với mức ý nghĩa 5%, hãy cho biết ý kiến đó đúng hay sai?