You are on page 1of 13

Chương 5: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

5.1. Các khái niệm về kiểm định giả thuyết thống kê


5.1.1. Đặt v.đề: Đứng trước một v.đề hay một hiện tượng nào đó, dựa vào
những thông tin nhất định, người ta đưa ra hai nhận định khác nhau về v.đề hay
hiện tượng nói trên. Y.cầu đặt ra là chúng ta phải đánh giá lựa chọn xem nhận
định nào là phù hợp hơn, xác đáng hơn.
- Các nhận định được nêu ra gọi là các giả thuyết thống kê
- Việc đánh giá nói trên gọi là kiểm định giả thuyết thống kê.
5.1.2. Giải quyết v.đề: - Cơ sở để g.quyết v.đề này là lập luận thường gặp sau đây
trong t.kê thường gọi là nguyên lý biến cố hiếm: Giả sử A là một biến cố hiếm
trong phép thử (tức là biến cố có xác suất rất bé- thông thường mức xác suất
không quá 5% được coi là rất bé). Khi đó nếu ta chỉ tiến hành một lần thử thôi để
quan sát biến cố A thì nói chung ta sẽ thấy A không xuất hiện.
- Đưa ra biến q/s hoặc t/c cần q/s l.quan đến v.đề đang xét. Lập mẫu lấy thông
tin.
- Chọn một trong hai nhận định đưa ra, gọi nó là giả thuyết – ký hiệu là H0 (Null
Hypothesis); nhận định còn lại gọi là đối thuyết- ký hiệu là H1 (Altenative
Hypothesis). Nếu nhận H0 thì có nghĩa là bác H1 và ngược lại: nếu bác H0 thì có
nghĩa là nhận H1.
- Với mẫu q.sát, trên cơ sở H0 đúng, x.dựng một biên cố W có x.suất rất bé, tức
là: 𝑃𝑃 𝑊𝑊 𝐻𝐻0 ≤ 𝛼𝛼 ( rất bé ).
( Như vậy nếu H0 đúng thì W là một biến cố hiếm. )
- Lập mẫu cụ thể và q.sát biến cố W: Nếu W xảy ra thì bác H0, nhận H1. Nếu W
không xảy ra thì ta tạm nhận H0 và bác H1
• W gọi là miền bác bỏ giả thuyết H0 hay miền tiêu chuẩn.
• 𝛼𝛼 được gọi là mức ý nghĩa của việc kiểm định.
5.1.3. Sai lầm loại 1 và sai lầm loại 2
- Sai lầm loại 1: Bác H0 mà thực tế H0 đúng. 𝑃𝑃 𝑊𝑊 𝐻𝐻0 là xác suất sai lầm loại 1.
� 𝐻𝐻1 là xác suất sai lầm loại 2.
- Sai lầm loại 2: Nhận H0 mà thực tế H0 sai. 𝑃𝑃 𝑊𝑊
Mức ý nghĩa 𝛼𝛼 chính là mức khống chế x.suất sai lầm loại 1.
Cả hai loại sai lầm đều có hậu quả không hay và thực tế thì sai lầm loại 2 thường
nghiêm trọng hơn. Xét m.hình kiểm tra:
(Người có hàng)
sp KTCLSP sp Khách hàng

sl1 sl2
(𝐻𝐻0 : 𝑠𝑠𝑠𝑠 đạ𝑡𝑡 𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐)
Mặt khác không thể cực tiểu hóa cả hai loại sai lầm.
𝑃𝑃 𝑊𝑊 𝐻𝐻0 ≤ 𝛼𝛼
Vậy ta có bài toán tối ưu sau đây: � � 𝐻𝐻1 → 𝑚𝑚𝑚𝑚𝑚𝑚
𝑃𝑃 𝑊𝑊
5.2. Một số bài toán kiểm định giả thuyết đơn giản
5.2.1. Bài toán KĐGTvề giá trị trung bình
a/ Đặt b.toán: Giả sử biến q.sát X có t.bình μ = 𝐸𝐸𝐸𝐸 chưa biết, nhưng dựa vào
những t.tin nhất định, người ta đưa ra hai nhận định khác nhau: “μ = 𝜇𝜇0 ” và:
“μ < 𝜇𝜇0 ” (hoặc: “μ > 𝜇𝜇0 ” hoặc: “μ ≠ 𝜇𝜇0 ”) . Hãy kiểm định với mức ý nghĩa 𝛼𝛼.
b/ Giải quyết bài toán: Chọn giả thuyết H0: μ = 𝜇𝜇0 .
Khi đó đối thuyết H1: μ < 𝜇𝜇0 / μ > 𝜇𝜇0 / μ ≠ 𝜇𝜇0
- Với mẫu cỡ n về X, x.dựng miền bác H0 như sau:
1. Nếu biết 𝜎𝜎 2 và nếu X có phân phối chuẩn, thì tiêu chuẩn bác H0 là:
� −𝝁𝝁𝟎𝟎 𝒏𝒏
𝑿𝑿
• 𝑻𝑻𝟏𝟏 = ≤ −𝒖𝒖(𝜶𝜶), khi H1: μ < 𝜇𝜇0 (K.đ phía trái)
𝝈𝝈
� −𝝁𝝁𝟎𝟎 𝒏𝒏
𝑿𝑿
• 𝑻𝑻𝟏𝟏 = ≥ 𝒖𝒖(𝜶𝜶), khi H1: μ > 𝜇𝜇0 (K.đ phía phải)
𝝈𝝈
� −𝝁𝝁𝟎𝟎 𝒏𝒏
𝑿𝑿 𝜶𝜶
• 𝑻𝑻𝟏𝟏 =
𝝈𝝈
≥ 𝒖𝒖( ), khi H1: μ ≠ 𝜇𝜇0 (K.đ hai phía)
𝟐𝟐
2. Nếu chưa biết 𝜎𝜎 2 và n khá lớn (𝑛𝑛 ≥ 30), thì:
� −𝝁𝝁𝟎𝟎 𝒏𝒏−𝟏𝟏
𝑿𝑿
• 𝑻𝑻𝟐𝟐 = ≤ −𝒖𝒖(𝜶𝜶), khi H1: μ < 𝜇𝜇0 (phía trái)
𝑺𝑺(𝑿𝑿)
� −𝝁𝝁𝟎𝟎 𝒏𝒏−𝟏𝟏
𝑿𝑿
• 𝑻𝑻𝟐𝟐 = ≥ 𝒖𝒖(𝜶𝜶), khi H1: μ > 𝜇𝜇0 (phía phải)
𝑺𝑺(𝑿𝑿)
� −𝝁𝝁𝟎𝟎 𝒏𝒏−𝟏𝟏
𝑿𝑿 𝜶𝜶
• 𝑻𝑻𝟐𝟐 = ≥ 𝒖𝒖( ), khi H1: μ ≠ 𝜇𝜇0 (hai phía)
𝑺𝑺 𝑿𝑿 𝟐𝟐
3. Nếu chưa biết phương sai 𝜎𝜎 2 và n khá bé (𝑛𝑛 < 30), thì:
� −𝝁𝝁𝟎𝟎 𝒏𝒏−𝟏𝟏
𝑿𝑿
• 𝑻𝑻𝟐𝟐 = ≤ −𝒕𝒕𝒏𝒏−𝟏𝟏 (𝜶𝜶 ), khi H1: μ < 𝜇𝜇0 (phía trái)
𝑺𝑺(𝑿𝑿)
� −𝝁𝝁𝟎𝟎 𝒏𝒏−𝟏𝟏
𝑿𝑿
• 𝑻𝑻𝟐𝟐 = ≥ 𝒕𝒕𝒏𝒏−𝟏𝟏 (𝜶𝜶 ), khi H1: μ > 𝜇𝜇0 (phía phải)
𝑺𝑺(𝑿𝑿)
� −𝝁𝝁𝟎𝟎 𝒏𝒏−𝟏𝟏
𝑿𝑿 𝜶𝜶
• 𝑻𝑻𝟐𝟐 = ≥ 𝒕𝒕𝒏𝒏−𝟏𝟏 ( ), khi H1: μ ≠ 𝜇𝜇0 (hai phía)
𝑺𝑺(𝑿𝑿) 𝟐𝟐
d. Các bước thực hiện: Gọi tên biến X sao cho 𝜇𝜇 = 𝐸𝐸𝐸𝐸 là g.trị t.bình trong
b.toán, x.định H0, H1 và trường hợp của b.toán. Chỉ ra W. Tra bảng tìm các g.trị
tới hạn. Tính 𝑻𝑻𝟏𝟏 hoặc 𝑻𝑻𝟐𝟐 tương ứng rồi so sánh với g.trị tra bảng: Nếu W xảy ra
thì bác H0, nhận H1. Nếu W không xảy ra thì nhận H0, bác H1.
Vd 1. Người ta định mức t.gian t.bình để một c.nhân h.thành c.việc A là 18 phút.
Qua theo dõi t.gian X (phút) h.thành việc A của một số c.nhân, có các khoảng
tgian h.thành: [15 – 16), [16 – 17), [17 – 18), [18 – 19), [19 – 20), [20 – 21), với số
c.nhân tương ứng là: 6, 15, 50, 54, 20, 5. Với mức ý nghĩa 5%, dựa vào đ.tra nói
trên, hãy x.minh xem định mức nói trên có gây khó khăn cho các c.nhân hay
không.
5.2.2. Bài toán kiểm định giả thuyết về tỷ lệ
a/ Đặt b.toán: Giả sử p = P(A) là tỷ lệ t/c A trong tổng thể Ω, tỷ lệ này chưa biết,
nhưng dựa vào những thông tin nhất định, người ta đưa ra hai nhận định khác
nhau: “p = 𝑝𝑝0 ” và: “p < 𝑝𝑝0 ” (hoặc: “p > 𝑝𝑝0 ” hoặc: “p ≠ 𝑝𝑝0 ”). Hãy kiểm định
với mức ý nghĩa 𝛼𝛼.
b/ G.quyết b.toán: Chọn H0: p = 𝑝𝑝0 , đối thuyết H1: p < 𝑝𝑝0 / p > 𝑝𝑝0 / p ≠ 𝑝𝑝0
- Bài toán này yêu cầu kích thước mẫu khá lớn. Với mẫu ngẫu nhiên kích thước n
để q.sát t/c A, ta có tần suất mẫu về A là: f = f(A), từ đó xây dựng miền bác bỏ
giả thuyết H0 như sau:
𝑓𝑓−𝑝𝑝0 𝑛𝑛
• 𝑇𝑇 = ≤ −𝑢𝑢(𝛼𝛼), khi H1: p < 𝑝𝑝0 (phía trái)
𝑝𝑝0 (1−𝑝𝑝0 )
𝑓𝑓−𝑝𝑝0 𝑛𝑛
•𝑇𝑇 = ≥ 𝑢𝑢(𝛼𝛼), khi H1: p > 𝑝𝑝0 (phía phải)
𝑝𝑝0 (1−𝑝𝑝0 )
𝑓𝑓−𝑝𝑝0 𝑛𝑛 𝛼𝛼
• 𝑇𝑇 = ≥ 𝑢𝑢( ), khi H1: p ≠ 𝑝𝑝0 (hai phía)
𝑝𝑝0 (1−𝑝𝑝0 ) 2
Vd 2: Một c.ty y/c các p/x của mình phải có tỷ lệ s.phẩm đạt tiêu chuẩn x.khẩu
tới 60%. K.tra n.nhiên 2000 sp của p/x A trong c.ty, thấy có 1180 sp đạt tiêu
chuẩn x.khẩu. Với mức ý nghĩa 5%, dựa vào đ.tra này, hãy x.minh xem p/x A đã
đạt được y/c của c.ty hay chưa.
5.2.3. Bài toán kiểm định giả thuyết về ph.sai
a. Đặt b.toán: Biến q.sát X có phương sai 𝜎𝜎 2 chưa biết. Dựa vào những t.tin nhất
định, người ta có 2 nhận định: 𝜎𝜎 2 = 𝜎𝜎 20 , 𝜎𝜎 2 < 𝜎𝜎 20 / 𝜎𝜎 2 > 𝜎𝜎 20 /𝜎𝜎 2 ≠ 𝜎𝜎 20. Với mức
ý nghĩa 𝛼𝛼, hãy xác minh nhận định nào là phù hợp.
b. Giải quyết b.toán: Chọn giả thuyết 𝐻𝐻0 : 𝜎𝜎 2 = 𝜎𝜎 20; đối thuyết 𝐻𝐻1 : 𝜎𝜎 2 <
𝜎𝜎 20 / 𝜎𝜎 2 > 𝜎𝜎 20 /𝜎𝜎 2 ≠ 𝜎𝜎 20. Từ mẫu n.nhiên k.thước n về X, trên cơ sở 𝐻𝐻0 đúng,
tiêu chuẩn bác bỏ 𝐻𝐻0 là như sau:
b1. Khi t.bình 𝜇𝜇 = 𝐸𝐸𝐸𝐸 đã biết, tiêu chuẩn bác H0 là:
•𝜒𝜒 2 ≤ 𝜒𝜒 𝑛𝑛2 (1 − 𝛼𝛼), nếu 𝐻𝐻1 : 𝜎𝜎 2 < 𝜎𝜎 20 (phía trái)
•𝜒𝜒 2 ≥ 𝜒𝜒 𝑛𝑛2 (𝛼𝛼), nếu 𝐻𝐻1 : 𝜎𝜎 2 > 𝜎𝜎 20 (phía phải)
𝛼𝛼
• 𝜒𝜒 2 ≥ 𝜒𝜒 𝑛𝑛2 ( ), nếu 𝐻𝐻1 : 𝜎𝜎 2 ≠ 𝜎𝜎 20 (hai phía)
2
1 𝑛𝑛
Trong đó: 𝜒𝜒 2 = 2 . ∑𝑖𝑖=1 𝑋𝑋𝑖𝑖 − 𝜇𝜇 2 .
𝜎𝜎0
b2. Khi t.bình 𝜇𝜇 = 𝐸𝐸𝐸𝐸 chưa biết, tiêu chuẩn bác H0 là:
2
•𝜒𝜒 2 ≤ 𝜒𝜒 𝑛𝑛−1 (1 − 𝛼𝛼), nếu 𝐻𝐻1 : 𝜎𝜎 2 < 𝜎𝜎 20 (phía trái)
2
•𝜒𝜒 2 ≥ 𝜒𝜒 𝑛𝑛−1 (𝛼𝛼), nếu 𝐻𝐻1 : 𝜎𝜎 2 > 𝜎𝜎 20 (phía phải)
2
• 𝜒𝜒 2 ≥ 𝜒𝜒 𝑛𝑛−1 (𝛼𝛼/2), nếu 𝐻𝐻1 : 𝜎𝜎 2 ≠ 𝜎𝜎 20 (hai phía)
𝑛𝑛
Với: 𝜒𝜒 2 = 𝜎𝜎2 . 𝑆𝑆 2 𝑋𝑋 ; 𝜒𝜒 𝑘𝑘2 (𝜆𝜆) là giá trị tới hạn mức 𝜆𝜆 của phân phối chi – squared.
0
Vd 3: Một dây chuyền được thiết kế với độ lệch chuẩn đ.kính s.phẩm là 0,2 cm.
Chọn 45 sp của dây chuyền thấy độ lệch mẫu của đ.kính là 0,25 cm. Với mức ý
nghĩa 5%, hãy x.minh xem độ lệch chuẩn của đ.kính sp đã thay đổi so với thiết
kế không.
5.2.4. Bài toán so sánh hai giá trị trung bình
a/ Đặt b.toán: Giả sử X và Y là hai biến q.sát độc lập nhau, với các g.trị t.bình
𝜇𝜇1 = 𝐸𝐸𝐸𝐸, 𝜇𝜇2 = 𝐸𝐸𝐸𝐸 chưa biết. Dựa vào những thông tin nhất định, người ta đưa
ra hai nhận định khác nhau: “𝜇𝜇1 = 𝜇𝜇2 ” và: ““𝜇𝜇1 < 𝜇𝜇2 ” (hoặc: ““𝜇𝜇1 > 𝜇𝜇2 ”,
hoặc: ““𝜇𝜇1 ≠ 𝜇𝜇2 ”). Cần x.minh xem nhận định nào là phù hợp.
b/ G.quyết b.toán: Chọn H0: “𝝁𝝁𝟏𝟏 = 𝝁𝝁𝟐𝟐 ”; H1 là nhận định còn lại.
Ký hiệu: 𝜎𝜎 21 = 𝐷𝐷𝐷𝐷, 𝜎𝜎 22 = 𝐷𝐷𝐷𝐷. Từ mẫu ngẫu nhiên k.thước n về biến q.sát X và mẫu
ngẫu nhiên kích thước m về biến q.sát Y, với mức ý nghĩa 𝛼𝛼, có các trường hợp sau:
1. Biết 𝜎𝜎 21 , 𝜎𝜎 22 và X, Y có p.phối chuẩn hoặc n, m khá lớn, tiêu chuẩn bác H0 là:
•𝑇𝑇1 ≤ −𝑢𝑢(𝛼𝛼), nếu H1: 𝜇𝜇1 < 𝜇𝜇2 .
•𝑇𝑇1 ≥ 𝑢𝑢(𝛼𝛼), nếu H1: 𝜇𝜇1 > 𝜇𝜇2 .
𝛼𝛼
• 𝑇𝑇1 ≥ 𝑢𝑢( ), nếu H1: 𝜇𝜇1 ≠ 𝜇𝜇2 .
2
2. Khi chưa biết 𝜎𝜎 21 , 𝜎𝜎 22 và cỡ mẫu n, m khá lớn thì tiêu chuẩn bác H0 là:
•𝑇𝑇2 ≤ −𝑢𝑢(𝛼𝛼), nếu H1: 𝜇𝜇1 < 𝜇𝜇2 .
•𝑇𝑇2 ≥ 𝑢𝑢(𝛼𝛼), nếu H1: 𝜇𝜇1 > 𝜇𝜇2 .
𝛼𝛼
• 𝑇𝑇2 ≥ 𝑢𝑢( ), nếu H1: 𝜇𝜇1 ≠ 𝜇𝜇2 .
2
3. Khi hai phương sai bằng nhau nhưng chưa biết và X,Y có p.phối chuẩn , với n, m
bé ( n < 30 hoặc m < 30 ) thì tiêu chuẩn bác H0 là:
•𝑻𝑻𝟑𝟑 ≤ −𝒕𝒕𝒏𝒏+𝒎𝒎−𝟐𝟐 (𝜶𝜶, nếu H1: 𝜇𝜇1 < 𝜇𝜇2
•𝑻𝑻𝟑𝟑 ≥ 𝒕𝒕𝒏𝒏+𝒎𝒎−𝟐𝟐 (𝜶𝜶), nếu H1: 𝜇𝜇1 > 𝜇𝜇2 .
𝜶𝜶
• 𝑻𝑻𝟑𝟑 ≥ 𝒕𝒕𝒏𝒏+𝒎𝒎−𝟐𝟐 ( ), nếu H1: 𝜇𝜇1 ≠ 𝜇𝜇2 .
𝟐𝟐
� 𝑌𝑌�
𝑋𝑋− � 𝑌𝑌�
𝑋𝑋− � −𝒀𝒀
𝑿𝑿 �
Với: 𝑇𝑇1 = ; 𝑇𝑇2 = ; 𝑻𝑻𝟑𝟑 =
𝜎𝜎2
1+𝜎𝜎2
2 𝑆𝑆2 2
1(𝑋𝑋)+𝑆𝑆2(𝑌𝑌) 𝒏𝒏.𝑺𝑺𝟐𝟐 𝟐𝟐
𝟏𝟏 𝑿𝑿 +𝒎𝒎.𝑺𝑺𝟐𝟐(𝒀𝒀).𝒏𝒏+𝒎𝒎
𝑛𝑛 𝑚𝑚 𝑛𝑛−1 𝑚𝑚−1
𝒏𝒏+𝒎𝒎−𝟐𝟐 𝒏𝒏.𝒎𝒎
Vd 3: Người ta muốn tìm hiểu mức thu nhập hàng tháng X(triệu đồng) của một
hộ g.đình ở đ/p A và mức thu nhập hàng tháng Y (triệu đồng) của một hộ g.đình
ở đ/p B. Đ.tra ngẫu nhiên 200 hộ g.đình ở đ/p A, biết được mức thu nhập b.quân
của các hộ này là 1,55 triệu đồng, với độ lệch mẫu trên đó là 0,30 triệu đồng.
Đ.tra ngẫu nhiên 250 hộ g.đình ở đ/p B, biết được mức thu nhập b.quân của các
hộ này là 1,48 triệu đồng, với độ lệch mẫu trên đó là 0,35 triệu đồng. Với mức ý
nghĩa 5%, dựa vào đ.tra này, có thể cho rằng mức thu nhập b.quân của một hộ
g.đình ở A cao hơn ở B hay không?
Vd 4: G.đốc tài chính của một hãng muốn so sánh chi phí tiếp khách X và Y (đơn
vị tính: USD) giữa hai b.phận: Bán hàng và S.xuất. Qua đ.tra ngẫu nhiên 20 biên
nhận chi phí của các nơi khác nhau,có k.quả sau:
B.phận B.hàng: 𝑋𝑋� = 45,2 𝑈𝑈𝑈𝑈𝑈𝑈; 𝑆𝑆 𝑋𝑋 = 9,4 𝑈𝑈𝑈𝑈𝑈𝑈
B.phận S.xuất: 𝑌𝑌� = 40,5 𝑈𝑈𝑈𝑈𝑈𝑈; 𝑆𝑆 𝑌𝑌 = 8,5 𝑈𝑈𝑈𝑈𝑈𝑈.
G.thiết các mức chi phí tiếp khách của hai b.phận này có p.phối chuẩn cùng độ
lệch chuẩn. Với mức ý nghĩa 2%, dựa vào đ.tra trên, hãy x.minh xem có sự khác
nhau về mức chi phí tiếp khách b.quân giữa hai bộ phận này hay không.
5.2.5. Bài toán so sánh hai tỷ lệ
a/ Đặt bài toán: Giả sử 𝑝𝑝1 là tỷ lệ t.chất A trong tổng thể Ω1 , 𝑝𝑝2 là tỷ lệ t.chất B
trong tổng thể Ω2 chưa biết. Dựa vào những thông tin nhất định, người ta đưa ra
hai nhận định khác nhau: “𝑝𝑝1 = 𝑝𝑝2 ” và: ““𝑝𝑝1 < 𝑝𝑝2 ” (hoặc: ““𝑝𝑝1 > 𝑝𝑝2 ”, hoặc:
““𝑝𝑝1 ≠ 𝑝𝑝2 ”). Cần xác minh xem nhận định nào là phù hợp.
b/ G.quyết b.toán: Chọn H0: 𝑝𝑝1 = 𝑝𝑝2 ; 𝐻𝐻1 là nhận định còn lại.
Từ mẫu k.thước n (khá lớn) q.sát t/c A: số p.tử có t/c A là 𝑘𝑘1 . Từ mẫu k.thước m
𝑘𝑘 𝑘𝑘 𝑘𝑘 +𝑘𝑘
(khá lớn) q.sát t/c B: số p.tử có t/c B là 𝑘𝑘2 . Đặt: 𝑓𝑓1 = 1 , 𝑓𝑓2 = 2 , 𝑓𝑓 = 1 2 . Với
𝑛𝑛 𝑚𝑚 𝑛𝑛+𝑚𝑚
mức ý nghĩa 𝛼𝛼, tiêu chuẩn bác bác bỏ H0 là:
𝑓𝑓1 −𝑓𝑓2
•𝑇𝑇 = ≤ −𝑢𝑢(𝛼𝛼), khi đối thuyết 𝐻𝐻1 : 𝑝𝑝1 < 𝑝𝑝2 .
𝑛𝑛+𝑚𝑚
𝑓𝑓 (1−𝑓𝑓) 𝑛𝑛.𝑚𝑚
𝑓𝑓1 −𝑓𝑓2
•𝑇𝑇 = ≥ 𝑢𝑢(𝛼𝛼), khi đối thuyết 𝐻𝐻1 : 𝑝𝑝1 > 𝑝𝑝2 .
𝑛𝑛+𝑚𝑚
𝑓𝑓 (1−𝑓𝑓) 𝑛𝑛.𝑚𝑚
𝑓𝑓1 −𝑓𝑓2 𝛼𝛼
• 𝑇𝑇 = ≥ 𝑢𝑢( ), khi đối thuyết 𝐻𝐻1 : 𝑝𝑝1 ≠ 𝑝𝑝2 .
𝑛𝑛+𝑚𝑚 2
𝑓𝑓 (1−𝑓𝑓)
𝑛𝑛.𝑚𝑚
Vd 5: K.tra 900 sp A do hãng B s/x, thấy có 540 sp đạt t/c x.khẩu. K.tra 1000 sp A
do hãng C s/x, thấy có 629 sp đạt t/c x.khẩu. Với mức ý nghĩa 5%, dựa vào đ.tra,
có thể cho rằng tỷ lệ sp A đạt t/c x.khẩu ở hai hãng này khác nhau hay không?
5.3. Kiểm định phi tham số : Là kiểm định giả thuyết không liên quan đến tham
số của biến quan sát
5.3.1. K.định về tính độc lập
a. Đặt b.toán: G.sử A và B là hai biến q.sát định tính. Qua đ.tra, A có k thuộc tính:
A1, A2,..., Ak; B có m thuộc tính: B1, B2,..., Bm.
Với mức ý nghĩa 𝛼𝛼, hãy x.minh xem A và B có đ.lập hay không.
b. G.quyết b.toán: Chọn 𝐻𝐻0 : A và B độc lập nhau; 𝐻𝐻1 :A và B không độc lập. Kí
hiệu nij là số phần tử có biểu hiện 𝐴𝐴𝑖𝑖 , 𝐵𝐵𝑗𝑗 ,
𝒎𝒎 𝒌𝒌 𝒌𝒌 𝒎𝒎 𝒌𝒌 𝒎𝒎
𝒏𝒏𝒊𝒊• = � 𝒏𝒏𝒊𝒊𝒊𝒊 ; 𝒏𝒏•𝒋𝒋 = � 𝒏𝒏𝒊𝒊𝒊𝒊 ; 𝒏𝒏 = � � 𝒏𝒏𝒊𝒊𝒊𝒊 = � 𝒏𝒏𝒊𝒊• = � 𝒏𝒏•𝒋𝒋
𝒋𝒋=𝟏𝟏 𝒊𝒊=𝟏𝟏 𝒊𝒊=𝟏𝟏 𝒋𝒋=𝟏𝟏 𝒊𝒊=𝟏𝟏 𝒋𝒋=𝟏𝟏
Tiêu chuẩn bác bỏ 𝐻𝐻0 là: 𝝌𝝌𝟐𝟐 > 𝝌𝝌𝟐𝟐𝒌𝒌−𝟏𝟏 . 𝒎𝒎−𝟏𝟏 (𝜶𝜶),
với: 𝜒𝜒 2𝑘𝑘−1 .(𝑚𝑚−1) (𝛼𝛼) là trị tới hạn mức 𝛼𝛼 của p.phối khi- bình phương, với (k – 1).
𝒌𝒌 ∑𝒎𝒎 𝒏𝒏𝟐𝟐𝒊𝒊𝒊𝒊
(m – 1) bậc tự do, tra từ bảng phụ lục III, 𝝌𝝌𝟐𝟐 = 𝒏𝒏. ∑𝒊𝒊=𝟏𝟏 𝒋𝒋=𝟏𝟏 − 𝟏𝟏
𝒏𝒏𝒊𝒊• .𝒏𝒏•𝒋𝒋

B B1 Bj .... Bm ∑
Trong A
thực hành, A1 𝑛𝑛11 ..... 𝑛𝑛1𝑗𝑗 ..... 𝑛𝑛1𝑚𝑚 𝑛𝑛1•
có thể lập ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
bảng tính 𝜒𝜒 2 . Ai 𝑛𝑛𝑖𝑖𝑖 ..... 𝑛𝑛𝑖𝑖𝑖𝑖 ..... 𝑛𝑛𝑖𝑖𝑖𝑖 𝑛𝑛𝑖𝑖•
⋮ ⋮ ..... ⋮ ..... ⋮ ⋮
Ak 𝑛𝑛𝑘𝑘𝑘 ..... 𝑛𝑛𝑘𝑘𝑘𝑘 ..... 𝑛𝑛𝑘𝑘𝑘𝑘 𝑛𝑛𝑘𝑘•
∑ 𝑛𝑛•1 ..... 𝑛𝑛•𝑗𝑗 ..... 𝑛𝑛•𝑚𝑚 n
2
𝑛𝑛𝑖𝑖𝑖𝑖
Trong mỗi ô tần số nij , kẻ thêm ô phụ để ghi giá trị: . Khi đó:
𝑛𝑛𝑖𝑖• .𝑛𝑛•𝑗𝑗
𝜒𝜒 2 = 𝑛𝑛. (𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝑐𝑐𝑐𝑐𝑐 ô 𝑝𝑝𝑝𝑝 − 1)
Vd 1: Để x.minh xem sự ủng hộ của người dân trong nước về một sắc thuế mới
có p.thuộc vào mức t.nhập của họ hay không, đ.tra 1000 c. dân, có số liệu: Trong
số t.nhập thấp: 182 ủng hộ, 154 không ủng hộ. Trong số t.nhập t.bình: 213 ủng
hộ, 138 không ủng hộ. Trong số t.nhập cao: 203 ủng hộ, 110 không ủng hộ. Với
mức ý nghĩa 5%, dựa vào đ. tra, hãy cho k.luận về việc này.
5.3.2. K.định giả thuyết về luật p.phối (Tiêu chuẩn phù hợp).
a. Đặt b.toán: Căn cứ vào một số thông tin nhất định, người ta cho rằng biến
q.sát X có p.phối với hàm p.phối F(x) đã x.định. Từ n q.sát về X, với mức ý nghĩa
𝛼𝛼, hãy x.minh hàm p.phối của X là F(x) có phù hợp hay không.
b. G.quyết b.toán: Đây là bài toán kiểm định: G.thuyết 𝐻𝐻0 : 𝑋𝑋 có hàm phân phối
𝐹𝐹 𝑥𝑥 , Đ.thuyết 𝐻𝐻1 : 𝐹𝐹 𝑥𝑥 không là hàm phân phối của X
Tiến hành các bước sau:
- Chia không gian g.trị của X thành k khoảng rời nhau: 𝑆𝑆1 , 𝑆𝑆2 , … , 𝑆𝑆𝑘𝑘 .
- Đếm số 𝑛𝑛𝑗𝑗 là số q.sát rơi vào 𝑆𝑆𝑗𝑗 , 𝑗𝑗 = 1,2, … , 𝑘𝑘: ∑kj=1 nj = n.
- Vì biết F(x), nên tính được: 𝑝𝑝𝑗𝑗 = 𝑃𝑃 𝑋𝑋 ∈ 𝑆𝑆𝑗𝑗 , 𝑗𝑗 = 1,2, … , 𝑘𝑘.
2
𝑛𝑛𝑗𝑗 −𝑛𝑛𝑝𝑝𝑗𝑗
- Tính: 𝜒𝜒 2 = ∑𝑘𝑘𝑗𝑗=1 . Tiêu chuẩn bác 𝐻𝐻0 : 𝑾𝑾 = {𝝌𝝌𝟐𝟐 > 𝝌𝝌𝟐𝟐𝒌𝒌−𝟏𝟏 𝜶𝜶 }.
𝑛𝑛𝑝𝑝𝑗𝑗
Chú ý: 1. Tiêu chuẩn phù hợp được s.dụng tốt khi n đủ lớn và các tần số 𝑛𝑛𝑗𝑗 ≥ 5,
𝑗𝑗 = 1,2, … , 𝑘𝑘. Do đó khi chia khoảng, nếu có khoảng nào có tần số 𝑛𝑛𝑗𝑗 < 5 thì
ghép nó vào khoảng bên cạnh (trái hoặc phải).
2. Nếu hàm p.phối F còn phụ thuộc tham 𝜃𝜃 = 𝜃𝜃1 , 𝜃𝜃2 , … , 𝜃𝜃𝑟𝑟 gồm r tham số chưa
biết: 𝐹𝐹 = 𝐹𝐹 𝑥𝑥, 𝜃𝜃 , thì các x.suất 𝑝𝑝𝑗𝑗 = 𝑝𝑝𝑗𝑗 𝜃𝜃 phụ thuộc 𝜃𝜃. Do đó trước khi s.dụng
t.chuẩn này, cần ư.lượng 𝜃𝜃, tức là thay 𝜃𝜃 bởi một ư.lượng điểm 𝜃𝜃̂0 của nó. Chẳng
hạn: thay 𝜃𝜃 = 𝜇𝜇, 𝜎𝜎 2 bởi 𝑋𝑋, � 𝑆𝑆 ′ 2 𝑋𝑋 , …
Khi đó miền bác bỏ g.thuyết 𝐻𝐻0 : 𝑾𝑾 = {𝝌𝝌𝟐𝟐 > 𝝌𝝌𝟐𝟐𝒌𝒌−𝟏𝟏−𝒓𝒓 𝜶𝜶 }.
Vd 2: Tìm hiểu số chi tiết bị hỏng X trong một tháng của một hệ thống máy, theo
dõi 50 tháng liền, thu được số liệu sau:
X 0 1 2 3 4 6 8
Số tháng 𝑛𝑛𝑖𝑖 10 4 12 8 7 6 3

Với mức ý nghĩa 5%, có thể cho rằng x tuân theo p.phối Poisson hay không?
Vd 3: Chỉ số X(g) của một loại s.phẩm có k.quả đ.tra sau:
Lớp X [18-20] (20-22] (22-24] (24-26] (26-28] (28-30]
Số sphẩm 3 4 14 33 27 19
Với mức ý nghĩa 5%, có thể cho rằng X tuân theo luật p.phối chuẩn hay không?
Tài liệu tham khảo:

[1]. Nguyễn Đình Cử, Trương Diêu. Bài tập xác suất và Thống kê Toán học, Đại học Kinh
tế Quốc dân, 1992.
[2]. Lê Sĩ Đồng. Xác suất – Thống kê và ứng dụng, Nhà xuất bản Giáo dục Việt nam
2012.
[3]. Đào Hữu Hồ. Xác suất thống kê, Nhà xuất bản Đại học Quốc gia Hà Nội, 2006.
[4]. Nguyễn Viết Phú, Nguyễn Duy Tiến. Cơ sở lý thuyết xác suất, Nhà xuất bản Đại học
và Trung học chuyên nghiệp. Hà Nội 1983.
[5]. Đặng Hùng Thắng. Thống kê và ứng dụng, Nhà xuất bản Giáo dục, 1999.
[6]. Nguyễn Cao Văn, Trần Thái Ninh. Lý thuyết xác suất và Thống kê toán, NXB Khoa
học Kỹ thuật, 1996.
[7]. Lý Hoàng Tú, Trần Tuấn Điệp. Lý thuyết xác suất và Thống kê toán học, NXB Đại học
và THCN, 1976.
[8]. S.P Gordon, Contemporary Statistics, Mc Graw – Hill, Inc. 1994.

You might also like