Bài 2. Thống kê mô tả Bài 3. Phân phối Mẫu Bài 4. Ước lượng điểm Bài 5. Ước lượng khoảng Bài 6. Kiểm định giả thuyết một tham số Bài 7. Suy diễn trên hai mẫu Bài 8. Phân tích phương sai Bài 9. Kiểm định phi tham số Bài 10. Giới thiệu thống kê Bayes THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 1 BÀI 6. KIỂM ĐỊNH GIẢ THUYẾT 1 THAM SỐ 6.1. Khái niệm cơ bản 6.2. Thủ tục kiểm định 6.3. Kiểm định Trung bình tổng thể • Chưa biết và biết phương sai 6.4. Kiểm định Tỉ lệ tổng thể • Mẫu lớn và mẫu nhỏ 6.5. Kiểm định phương sai tổng thể
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 2
6.1. Khái niệm cơ bản Kiểm định giả thuyết (hypothesis testing): – Kiểm tra tính chất của một mệnh đề (giả thuyết), thường là tính Đúng / sai. – Dựa trên thông tin từ mẫu Mệnh đề thống kê Kiểm định giả thuyết thống kê Kiểm định tham số (parametrical testing) Kiểm định phi tham số (non-parametrical testing) Chương này xét bài toán kiểm định tham số
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 3
Giả thuyết và Cặp giả thuyết Giả thuyết (hypothesis) về tham số Cặp giả thuyết đơn: Các cặp giả thuyết gộp
Tổng quát
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 4
Ví dụ Ví dụ 6.1: Viết cặp giả thuyết với các câu hỏi sau (a) Giá trung bình bằng 6 hay bằng 9? (b) Thu nhập trung bình có bằng 2500 USD hay không? (c) Năm ngoái giá trung bình là 100, năm nay giá cả có tăng không? (d) Tỉ lệ sản phẩm hỏng có ít hơn 10%? (e) Độ biến động của giá cổ phiếu có trên 25 USD2?
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 5
Các loại sai lầm Trên tiêu chí lấy là giả thuyết gốc
Tham số Hành động đúng; sai sai, đúng
Nhận Không sai lầm Sai lầm loại 2
Bác bỏ Nhận điều đúng Nhận điều sai Xác suất = Xác suất Bác bỏ Sai lầm loại 1 Không sai lầm Nhận Bác bỏ điều đúng Bác bỏ điều sai Xác suất Xác suất
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 6
Ý tưởng kiểm định Giảm xác suất mắc sai lầm loại này sẽ làm tăng xác suất mắc sai lầm loại kia Sai lầm loại 2 nguy hiểm hơn Cố định xác suất mắc sai lầm loại 1 là , chọn tiêu chí kiểm định để nhỏ nhất gọi là mức ý nghĩa (significant level) gọi là lực kiểm định (power of the test) Từ đó xác định một miền để bác bỏ H0, gọi là miền bác bỏ (reject region), kí hiệu là
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 7
Ví dụ Ví dụ 6.2. Giá cả , , tham số chỉ có hai trường hợp có thể: {4, 10}. Dự báo trung bình là một trong hai số trên, dự báo sai thì bị phạt $. Xác định các xác suất mắc sai lầm, và kì vọng số phạt (a) Mẫu , tiêu chuẩn là giá trị biến, ngưỡng (b) Mẫu , tiêu chuẩn là giá trị biến, ngưỡng 7 (c) Mẫu , tiêu chuẩn là hàm tổng với ngưỡng 16 (d) Mẫu , tiêu chuẩn là hàm TB với ngưỡng 8 (e) Tổng quát hóa với hàm trung bình
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 8
Ví dụ (a) Miền bác bỏ khi : Xác suất mắc sai lầm • Loại 1: • Loại 2:
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 9
Ví dụ (a) Miền bác bỏ khi : Xác suất mắc sai lầm • Loại 1: • Loại 2:
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 10
Ví dụ (tiếp) Tổng quát , đã biết, kiểm định về
Hàm quyết định: Trung bình mẫu, ngưỡng là
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 11
Ví dụ Ví dụ 6.3. Biết Kiểm định Mức ý nghĩa cố định, xác định miền bác bỏ và lực kiểm định với các trường hợp sau: (a) Với , tiêu chuẩn là giá trị của (b) Với , tiêu chuẩn là tổng hai giá trị của mẫu (c) Với , tiêu chuẩn là trung bình mẫu (d) Với , tiểu chuẩn là (e) Với bất kì, tiêu chuẩn là trung bình mẫu
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 12
Ví dụ: Tổng quát
hay Tiêu chuẩn: trung bình mẫu, mức ý nghĩa
Nếu thì bác bỏ , nhận
Nếu thì chưa có cơ sở bác bỏ là giá trị thống kê, là giá trị tới hạn
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 13
Tiêu chuẩn tốt nhất Cặp giả thuyết đơn:
Mẫu , hàm mật độ
Mức ý nghĩa cho trước cố định Tiêu chuẩn tốt nhất: nhỏ nhất Đánh giá qua hàm hợp lý ứng với hai trường hợp ; Tỉ số dùng để đánh giá tiêu chuẩn
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 14
Mức xác suất () Bên cạnh tiếp cận miền bác bỏ, có cách tiếp cận khác Mức ý nghĩa là xác suất mắc sai lầm loại 1 cho phép khi bác bỏ Tìm được 1 mức sao cho: – Nếu thì bác bỏ – Nếu thì chưa có cơ sở bác bỏ Mức xác suất là của kiểm định Ví dụ:
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 15
Thủ tục kiểm định Với cách tiếp cận dùng miền bác bỏ B1. Cặp giả thuyết H0 và H1, B2. Tính thống kê quan sát trên mẫu B3. Tra giá trị tới hạn theo , xác định miền bác bỏ B4. Nếu Giá trị quan sát thuộc miền bác bỏ: bác bỏ H0 (H0 sai, H1 đúng) Nếu không thì chưa bác bỏ H0 (H0 đúng, H1 sai) B5. Kết luận về câu hỏi
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 16
Thủ tục kiểm định Với cách tiếp cận dùng P-value B1. Cặp giả thuyết H0, H1, B2. Tính thống kê quan sát trên mẫu B3. Tính P-value trên thống kê quan sát B4. So sánh: • Nếu P-value thì bác bỏ H0 • Nếu P-value thì chưa bác bỏ H0 B5. Kết luận
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 17
6.2. KIỂM ĐỊNH VỀ KHI Trường hợp biết σ2: Cặp giả thuyết Với mức ý nghĩa Tiêu chuẩn kiểm định: Miền bác bỏ : Với mẫu cụ thể, giá trị quan sát: Nếu thì bác bỏ
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 18
6.2.1. Kiểm định khi biết Đổi tiêu chuẩn kiểm định Cặp giả thuyết Tiêu chuẩn kiểm định:
Miền bác bỏ : Nếu thì bác bỏ
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 19
Ví dụ Ví dụ 4.4. Biết năng suất/ngày của máy là phân phối chuẩn với phương sai là 25. Trước đây năng suất trung bình là 100. Sau khi cải tiến kỹ thuật, khảo sát 16 ngày thấy năng suất trung bình là 102,6. (a) Với mức ý nghĩa 5% có thể cho rằng năng suất trung bình đã tăng hay không? (b) Kết quả có thay đổi không nếu mức ý nghĩa là 1% (c) Tính của kiểm định
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 20
Kiểm định khi biết Tiêu chuẩn Cặp GT MBB H0:
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 21
Ví dụ Ví dụ 4.4. (Tiếp) (d) Kiểm định giả thuyết năng suất trung bình sau khi cải tiến kỹ thuật là 101, và tìm của kiểm định (e) Có thể cho rằng năng suất trung bình sau khi cải tiến ít hơn 105 hay không? của kiểm định bằng bao nhiêu? (f) Nếu trung bình thực sau khi cải tiến là 102, tìm lực kiểm định khi kiểm định giả thuyết trung bình lớn hơn 100, với mức ý nghĩa 5%.
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 22
6.2.2. Kiểm định khi chưa biết Tiêu chuẩn Cặp GT MBB H0:
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 23
Ví dụ Ví dụ 4.5 X Mean 13.3 Mẫu của 10 sản phẩm có trọng Standard Error 0.517 Median 13.5 lượng (g) như sau Mode 15 10, 12, 14, 15, 13, 15, 14, 13, 15, 12 Standard Deviation 1.636 Giả sử trọng lượng phân phối Sample Variance 2.678 chuẩn, mức ý nghĩa 5%, kiểm Sum 133 định các giả thuyết sau, và ước Count 10 lượng P-value (a) Trọng lượng TB trên 12 (g) (b) Trọng lượng TB là 14 (g)
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 24
Ví dụ > x <-c(10, 12, 14, 15, 13, 15, 14, 13, 15, 12) > t.test(x, mu = 12, alternative = "greater")
One Sample t-test
data: x t = 2.5122, df = 9, p-value = 0.0166 alternative hypothesis: true mean is greater than 12 95 percent confidence interval: 12.35141 Inf sample estimates: mean of x 13.3
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 25
Ví dụ > x <-c(10, 12, 14, 15, 13, 15, 14, 13, 15, 12) > t.test(x, mu = 14, alternative = "two.sided")
One Sample t-test
data: x t = -1.3527, df = 9, p-value = 0.2091 alternative hypothesis: true mean is not equal to 14 95 percent confidence interval: 12.1294 14.4706 sample estimates: mean of x 13.3
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 26
6.3. KIỂM ĐỊNH KHI , giả thuyết so sánh với giá trị Chia hai trường hợp: Khi biết , dùng , và quy luật Khi không biết , dùng , và quy luật
Chỉ đưa bảng quyết định với trường hợp dùng ,
trường hợp dùng thì thay bởi
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 27
Kiểm định khi chưa biết Tiêu chuẩn Cặp GT
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 28
Ví dụ Ví dụ 4.6 X Mean 13.3 Mẫu của 10 sản phẩm có trọng Standard Error 0.517 Median 13.5 lượng (g) như sau Mode 15 10, 12, 14, 15, 13, 15, 14, 13, 15, 12 Standard Deviation 1.636 Giả sử trọng lượng phân phối Sample Variance 2.678 chuẩn, mức ý nghĩa 5%, kiểm Sum 133 định các giả thuyết sau, và ước Count 10 lượng P-value (a) Phương sai là trên 2 (g2) (b) Độ phân tán chưa đến 3 (g)
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 29
6.4. KIỂM ĐỊNH Tiêu chuẩn Cặp GT
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 30
Ví dụ Ví dụ 4.7. Một loại quả sẽ được coi là bình thường nếu tỉ lệ hỏng sau một tháng bảo quản là không quá 5%. Kiểm tra ngẫu nhiên 200 quả thấy 13 quả bị hỏng. Với mức ý nghĩa 5% thì loại quả này có được coi là bình thường không? Ví dụ 4.8. Số liệu khai sinh năm 1976 ở một khu vực Trung Quốc thấy trong 1200 trẻ mới sinh có 657 con trai, 543 con gái; với mức ý nghĩa 5% có thể coi tỉ lệ về giới của trẻ là bất bình thường không, biết rằng trong tự nhiên, tỉ lệ sinh nữ/nam là 49/51.
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 31
Ví dụ Ví dụ 6.9. Thu nhập phân phối chuẩn, có số liệu
Số người 12 24 35 11 8 Kiểm định với , và ước lượng (a) Thu nhập trung bình có trên 23 triệu không? (b) Thu nhập trung bình chưa đến 26 triệu? (c) Độ dao động của thu nhập chưa đến 3.2 triệu? (d) Tỉ lệ người có thu nhập từ 24 triệu trở xuống là 30%? (e) Trên 15% có thu nhập từ 26 triệu trở lên?
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 32