You are on page 1of 32

NỘI DUNG HỌC PHẦN

 Bài 1. Khái niệm cơ bản


 Bài 2. Thống kê mô tả
 Bài 3. Phân phối Mẫu
 Bài 4. Ước lượng điểm
 Bài 5. Ước lượng khoảng
 Bài 6. Kiểm định giả thuyết một tham số
 Bài 7. Suy diễn trên hai mẫu
 Bài 8. Phân tích phương sai
 Bài 9. Kiểm định phi tham số
 Bài 10. Giới thiệu thống kê Bayes
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 1
BÀI 6. KIỂM ĐỊNH GIẢ THUYẾT 1 THAM SỐ
 6.1. Khái niệm cơ bản
 6.2. Thủ tục kiểm định
 6.3. Kiểm định Trung bình tổng thể
• Chưa biết và biết phương sai
 6.4. Kiểm định Tỉ lệ tổng thể
• Mẫu lớn và mẫu nhỏ
 6.5. Kiểm định phương sai tổng thể

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 2


6.1. Khái niệm cơ bản
Kiểm định giả thuyết (hypothesis testing):
– Kiểm tra tính chất của một mệnh đề (giả thuyết), thường là
tính Đúng / sai.
– Dựa trên thông tin từ mẫu
Mệnh đề thống kê  Kiểm định giả thuyết thống kê
Kiểm định tham số (parametrical testing)
Kiểm định phi tham số (non-parametrical testing)
Chương này xét bài toán kiểm định tham số

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 3


Giả thuyết và Cặp giả thuyết
 Giả thuyết (hypothesis) về tham số
 Cặp giả thuyết đơn:
 Các cặp giả thuyết gộp

 Tổng quát

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 4


Ví dụ
Ví dụ 6.1: Viết cặp giả thuyết với các câu hỏi sau
 (a) Giá trung bình bằng 6 hay bằng 9?
 (b) Thu nhập trung bình có bằng 2500 USD hay không?
 (c) Năm ngoái giá trung bình là 100, năm nay giá cả có
tăng không?
 (d) Tỉ lệ sản phẩm hỏng có ít hơn 10%?
 (e) Độ biến động của giá cổ phiếu có trên 25 USD2?

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 5


Các loại sai lầm
 Trên tiêu chí lấy là giả thuyết gốc

Tham số
Hành động đúng; sai sai, đúng

Nhận Không sai lầm Sai lầm loại 2


Bác bỏ Nhận điều đúng Nhận điều sai
Xác suất = Xác suất
Bác bỏ Sai lầm loại 1 Không sai lầm
Nhận Bác bỏ điều đúng Bác bỏ điều sai
Xác suất Xác suất

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 6


Ý tưởng kiểm định
 Giảm xác suất mắc sai lầm loại này sẽ làm tăng xác
suất mắc sai lầm loại kia
 Sai lầm loại 2 nguy hiểm hơn
 Cố định xác suất mắc sai lầm loại 1 là , chọn tiêu chí
kiểm định để nhỏ nhất
 gọi là mức ý nghĩa (significant level)
 gọi là lực kiểm định (power of the test)
 Từ đó xác định một miền để bác bỏ H0, gọi là miền
bác bỏ (reject region), kí hiệu là

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 7


Ví dụ
Ví dụ 6.2. Giá cả , , tham số chỉ có hai trường hợp có
thể: {4, 10}. Dự báo trung bình là một trong hai số trên,
dự báo sai thì bị phạt $.
Xác định các xác suất mắc sai lầm, và kì vọng số phạt
(a) Mẫu , tiêu chuẩn là giá trị biến, ngưỡng
(b) Mẫu , tiêu chuẩn là giá trị biến, ngưỡng 7
(c) Mẫu , tiêu chuẩn là hàm tổng với ngưỡng 16
(d) Mẫu , tiêu chuẩn là hàm TB với ngưỡng 8
(e) Tổng quát hóa với hàm trung bình

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 8


Ví dụ
 (a) Miền bác bỏ khi :
 Xác suất mắc sai lầm
• Loại 1:
• Loại 2:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 9


Ví dụ
 (a) Miền bác bỏ khi :
 Xác suất mắc sai lầm
• Loại 1:
• Loại 2:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 10


Ví dụ (tiếp) Tổng quát
 , đã biết, kiểm định về

 Hàm quyết định: Trung bình mẫu, ngưỡng là

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 11


Ví dụ
Ví dụ 6.3. Biết
Kiểm định
Mức ý nghĩa cố định, xác định miền bác bỏ và lực
kiểm định với các trường hợp sau:
(a) Với , tiêu chuẩn là giá trị của
(b) Với , tiêu chuẩn là tổng hai giá trị của mẫu
(c) Với , tiêu chuẩn là trung bình mẫu
(d) Với , tiểu chuẩn là
(e) Với bất kì, tiêu chuẩn là trung bình mẫu

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 12


Ví dụ: Tổng quát

 hay
 Tiêu chuẩn: trung bình mẫu, mức ý nghĩa

 Nếu thì bác bỏ , nhận


 Nếu thì chưa có cơ sở bác bỏ
 là giá trị thống kê, là giá trị tới hạn

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 13


Tiêu chuẩn tốt nhất
Cặp giả thuyết đơn:

Mẫu , hàm mật độ


Mức ý nghĩa cho trước cố định
Tiêu chuẩn tốt nhất: nhỏ nhất
Đánh giá qua hàm hợp lý ứng với hai trường hợp
;
Tỉ số dùng để đánh giá tiêu chuẩn

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 14


Mức xác suất ()
Bên cạnh tiếp cận miền bác bỏ, có cách tiếp cận khác
Mức ý nghĩa là xác suất mắc sai lầm loại 1 cho phép
khi bác bỏ
Tìm được 1 mức sao cho:
– Nếu thì bác bỏ
– Nếu thì chưa có cơ sở bác bỏ
Mức xác suất là của kiểm định
Ví dụ:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 15


Thủ tục kiểm định
Với cách tiếp cận dùng miền bác bỏ
 B1. Cặp giả thuyết H0 và H1,
 B2. Tính thống kê quan sát trên mẫu
 B3. Tra giá trị tới hạn theo , xác định miền bác bỏ
 B4. Nếu Giá trị quan sát thuộc miền bác bỏ: bác bỏ H0
(H0 sai, H1 đúng)
Nếu không thì chưa bác bỏ H0 (H0 đúng, H1 sai)
 B5. Kết luận về câu hỏi

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 16


Thủ tục kiểm định
 Với cách tiếp cận dùng P-value
 B1. Cặp giả thuyết H0, H1,
 B2. Tính thống kê quan sát trên mẫu
 B3. Tính P-value trên thống kê quan sát
 B4. So sánh:
• Nếu P-value thì bác bỏ H0
• Nếu P-value thì chưa bác bỏ H0
 B5. Kết luận

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 17


6.2. KIỂM ĐỊNH VỀ KHI
Trường hợp biết σ2:
Cặp giả thuyết
Với mức ý nghĩa
Tiêu chuẩn kiểm định:
Miền bác bỏ :
Với mẫu cụ thể, giá trị quan sát:
Nếu thì bác bỏ

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 18


6.2.1. Kiểm định khi biết
 Đổi tiêu chuẩn kiểm định
 Cặp giả thuyết
 Tiêu chuẩn kiểm định:

 Miền bác bỏ :
 Nếu thì bác bỏ

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 19


Ví dụ
Ví dụ 4.4. Biết năng suất/ngày của máy là phân phối
chuẩn với phương sai là 25. Trước đây năng suất trung
bình là 100. Sau khi cải tiến kỹ thuật, khảo sát 16 ngày
thấy năng suất trung bình là 102,6.
 (a) Với mức ý nghĩa 5% có thể cho rằng năng suất
trung bình đã tăng hay không?
 (b) Kết quả có thay đổi không nếu mức ý nghĩa là 1%
 (c) Tính của kiểm định

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 20


Kiểm định khi biết
Tiêu chuẩn Cặp GT MBB H0:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 21


Ví dụ
Ví dụ 4.4. (Tiếp)
 (d) Kiểm định giả thuyết năng suất trung bình sau khi
cải tiến kỹ thuật là 101, và tìm của kiểm định
 (e) Có thể cho rằng năng suất trung bình sau khi cải
tiến ít hơn 105 hay không? của kiểm định bằng bao
nhiêu?
 (f) Nếu trung bình thực sau khi cải tiến là 102, tìm lực
kiểm định khi kiểm định giả thuyết trung bình lớn
hơn 100, với mức ý nghĩa 5%.

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 22


6.2.2. Kiểm định khi chưa biết
Tiêu chuẩn Cặp GT MBB H0:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 23


Ví dụ
 Ví dụ 4.5 X
Mean 13.3
 Mẫu của 10 sản phẩm có trọng Standard Error 0.517
Median 13.5
lượng (g) như sau Mode 15
10, 12, 14, 15, 13, 15, 14, 13, 15, 12 Standard
Deviation 1.636
 Giả sử trọng lượng phân phối Sample
Variance 2.678
chuẩn, mức ý nghĩa 5%, kiểm Sum 133
định các giả thuyết sau, và ước Count 10
lượng P-value
 (a) Trọng lượng TB trên 12 (g)
 (b) Trọng lượng TB là 14 (g)

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 24


Ví dụ
> x <-c(10, 12, 14, 15, 13, 15, 14, 13, 15, 12)
> t.test(x, mu = 12, alternative = "greater")

One Sample t-test


data: x
t = 2.5122, df = 9, p-value = 0.0166
alternative hypothesis: true mean is greater
than 12
95 percent confidence interval:
12.35141 Inf
sample estimates: mean of x 13.3

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 25


Ví dụ
> x <-c(10, 12, 14, 15, 13, 15, 14, 13, 15, 12)
> t.test(x, mu = 14, alternative = "two.sided")

One Sample t-test


data: x
t = -1.3527, df = 9, p-value = 0.2091
alternative hypothesis: true mean is not equal
to 14 95 percent confidence interval:
12.1294 14.4706
sample estimates:
mean of x 13.3

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 26


6.3. KIỂM ĐỊNH KHI
 , giả thuyết so sánh với giá trị
 Chia hai trường hợp:
 Khi biết , dùng , và quy luật
 Khi không biết , dùng , và quy luật

 Chỉ đưa bảng quyết định với trường hợp dùng ,


trường hợp dùng thì thay bởi

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 27


Kiểm định khi chưa biết
Tiêu chuẩn Cặp GT

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 28


Ví dụ
 Ví dụ 4.6 X
Mean 13.3
 Mẫu của 10 sản phẩm có trọng Standard Error 0.517
Median 13.5
lượng (g) như sau Mode 15
10, 12, 14, 15, 13, 15, 14, 13, 15, 12 Standard
Deviation 1.636
 Giả sử trọng lượng phân phối Sample
Variance 2.678
chuẩn, mức ý nghĩa 5%, kiểm Sum 133
định các giả thuyết sau, và ước Count 10
lượng P-value
 (a) Phương sai là trên 2 (g2)
 (b) Độ phân tán chưa đến 3 (g)

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 29


6.4. KIỂM ĐỊNH
Tiêu chuẩn Cặp GT

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 30


Ví dụ
Ví dụ 4.7. Một loại quả sẽ được coi là bình thường nếu
tỉ lệ hỏng sau một tháng bảo quản là không quá 5%.
Kiểm tra ngẫu nhiên 200 quả thấy 13 quả bị hỏng.
Với mức ý nghĩa 5% thì loại quả này có được coi là
bình thường không?
Ví dụ 4.8. Số liệu khai sinh năm 1976 ở một khu vực
Trung Quốc thấy trong 1200 trẻ mới sinh có 657 con
trai, 543 con gái; với mức ý nghĩa 5% có thể coi tỉ lệ
về giới của trẻ là bất bình thường không, biết rằng
trong tự nhiên, tỉ lệ sinh nữ/nam là 49/51.

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 31


Ví dụ
Ví dụ 6.9. Thu nhập phân phối chuẩn, có số liệu

Thu nhập (tr) 20 - 22 22 - 24 24 - 26 26 - 28 28 - 30


Số người 12 24 35 11 8
Kiểm định với , và ước lượng
(a) Thu nhập trung bình có trên 23 triệu không?
(b) Thu nhập trung bình chưa đến 26 triệu?
(c) Độ dao động của thu nhập chưa đến 3.2 triệu?
(d) Tỉ lệ người có thu nhập từ 24 triệu trở xuống là 30%?
(e) Trên 15% có thu nhập từ 26 triệu trở lên?

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 32

You might also like