Professional Documents
Culture Documents
MỤC TIÊU
Sau bài giảng, sinh viên có thể:
1. Hiểu được ý nghĩa của: kiểm định giả thuyết, giả thuyết H0,
giả thuyết H1, giá trị p, sai lầm loại 1, sai lầm loại 2.
2. Chọn được đúng các kiểm định thống kê: t, chi bình
phương.
3. Tính được các kiểm định thống kê: t, chi bình phương.
4. Biết cách biện luận kết quả của kiểm định giả thuyết.
1
Chương 8
Thống kê
bình của người VN là 160cm
KHÁI NIỆM
• Giả thuyết là một phát biểu về một
tham số của quần thể
Thống kê Thống kê • Mục đính của kiểm định giả thuyết
mô tả phân tích là đưa ra quyết định giả thuyết nào
trong 2 giả thuyết bổ sung là đúng
bằng cách kiểm tra một mẫu được
chọn từ quần thể đó.
Kiểm • Hai giả thuyết bổ sung trong một
Ước
lượng
định giả kiểm định là giả thuyết không (H0)
thuyết và giả thuyết thay thế (H1).
bởi vì có 1 số giả thuyết nghiên cứu luôn tồn tại dấu “=”
Hiệu quả của thuốc mới A có như là thuốc cũ B đang xài hay ko (gt nc là dấu = )
*mù quáng ghi: thuốc A ko có hiệu quả như thuốc B (ko phù hợp đặc điểm luôn luôn có dấu = )
=> Hiệu quả của thuốc A và B là như nhau
• So sánh hiệu quả điều trị của thuốc A và thuốc B. Quan sát
thấy, tỷ lệ khỏi bệnh khi dùng thuốc A là p1. Tỷ lệ khỏi bệnh
khi dùng thuốc B là p2. Hỏi hiệu quả điều trị của 2 thuốc khác
nhau không?
Nhà nghiên cứu muốn chứng minh H1: Hiệu quả của thuốc A khác
thuốc B
Nhưng lại kiểm tra tính hợp lý của H0: Hiệu quả của 2 thuốc là như
nhau
● Giả định này chỉ được giữ lại cho tới khi có bằng chứng hợp lý
cho thấy người đó có tội.
● Tới lúc này, ta mới có quyền bác bỏ giả định vô tội lúc đầu và
tuyên người đó có tội.
3
Chương 8
Không thể loại bỏ H0 không có nghĩa H0 đúng. Chỉ là, mẫu nghiên cứu không đủ bằng chứng để hỗ trợ H1.
Trong mỗi bộ dữ liệu với mỗi giả thuyết Ho cụ thể ta đặt ra,
chúng ta sẽ tính dc giá trị p (ký hiệu ng ta qui ước)
GIÁ TRỊ p
- Là xác suất xảy ra sự kiện mà ta đã thấy trong nghiên
cứu nếu ta giả định giả thuyết H0 thật sự đúng.
- Với mỗi kiểm định ta sẽ có riêng 1 giá trị p
- So sánh giá trị p với ngưỡng ý nghĩa α để quyết định bác
bỏ hay không bác bỏ giả thuyết H0.
- Lưu ý: coi chừng diễn giải sai giá trị p.
4
Chương 8
KIỂM ĐỊNH
p<α Baùc boû HO Chaáp nhaän H1
H1 : Taêng Chol. taêng nguy cô BMV Ho: tăng Chol. ko tăng nguy cơ BMV
giả sử Ho là dúng thì khả
Neáu taêng Chol. khoâng taêng nguy cô BMV,
năng để thấy sự tăng nguy
cơ là ít hơn 5% khaû naêng ñeå thaáy ñöôïc söï taêng nguy cô laø ít
hôn 5%
Coù ít hôn 5% ñeå giaûi thích taêng Chol. taêng
nguy cô BMV laø do cô hoäi ??
10
5
Chương 8
KIỂM ĐỊNH
= 0,05
HO ñuùng
Vuøng baùc boû
p
Vuøng chaáp nhaän
2
p<α
tC = 3,84
t = 22,67 11
KIỂM ĐỊNH
p>α Khoâng theå baùc boû HO
6
Chương 8
13
1 - β = Söùc maïnh
= Khaû naêng phaùt hieän söï khaùc bieät,
neáu thaät söï coù söï khaùc bieät
7
Chương 8
SỨC MẠNH
β = 0,20 = Coù 20% cô hoäi sai do khoâng baùc boû Ho khi H0 sai
1 - β = 0,80
= Coù 80% cô hoäi (khaû naêng)
phaùt hieän moät söï khaùc bieät mong muoán,
neáu thaät söï coù söï khaùc bieät
Vd: hiệu quả điều trị thuốc A với B có khác nhau hay ko?
- Giả sử trên thực tế thuốc A tốt hơn B (nếu đó là sự thật)
- Khi chúng tôi tiến hành nghiên cứu => tĩnh cỡ mẫu, tôi mong rằng cỡ
15
mẫu có Power 80% => 80% phát hiện ra sự khác biệt hiệu quả đt giữa
A và B
Cho nên Power càng lớn => sai lầm loại II giảm
16
8
Chương 8
KIỂM ĐỊNH t
- So sánh 2 số trung bình.
- Điều kiện: 2 mẫu khảo sát phải thỏa 2 điều kiện sau
• Có phân phối chuẩn
• Đồng nhất với nhau
- Các dạng bài:
• So sánh 2 số trung bình ở 2 mẫu độc lập
• So sánh 1 số trung bình quan sát với 1 số trung bình lý thuyết
• So sánh 2 số trung bình bắt cặp
17
KIỂM ĐỊNH t
SO SÁNH 2 SỐ TB Ở 2 MẪU ĐỘC LẬP
Ví dụ: có 2 nhóm => kiểm định t
Điểm trung bình chất lượng cuộc sống trước chấn thương
(QoL) của nam và nữ có khác nhau không?
• Giả thuyết: Giả sử: điểm tb chất lượng cs trc khi chấn thươn của
Ho: QoL nam = QoL nữ nam và nữ ko khác nhau (2 điểm số này là bằng nhau)
18
9
Chương 8
Group Statistics
Std. Error
sex N Mean Std. Deviation Mean
General quality male
of 1089 60.5730 7.80945 .23665
life before injuryfemale 603 60.1028 7.42131 .30222
đánh giá mẫu độ lệch chuẩn
này rất lớn
19
10
Chương 8
KIỂM ĐỊNH t
SO SÁNH 2 SỐ TB Ở 2 MẪU ĐỘC LẬP
• Trường hợp 1: n1 ≥ 30 và n2 ≥ 30
21
KIỂM ĐỊNH t
SO SÁNH 2 SỐ TB Ở 2 MẪU ĐỘC LẬP
• Trường hợp 2: n1 < 30 hoặc n2 < 30
22
11
Chương 8
23
One-Sample Statistics
Std. Error
N Mean Std. Deviation Mean
General quality of
1692 60.4054 7.67448 .18657
life before injury
24
12
Chương 8
Test Value = 50
95% Confidence
Interval of the
Mean Difference
biến định lượng t df Sig. (2-tailed) Difference Lower Upper
General quality of
55.771 1691 .000 10.4054 10.0395 10.7714
life before injury
khi giá trị p rất rất nhỏ thì ghi p < 0,01
t= (60.4054-50)/0.18657=55.771
• Trung bình là 60.4054 (se. 0.1866), khác biệt có ý nghĩa thống kê với trung bình
quần thể (50) , p<0,001.
• Khác 10.4054 điểm và tin cậy đến 95% là sự khác biệt nằm trong khoảng (10.0395
đến 10.7714)
25
KIỂM ĐỊNH t
SO SÁNH 1 SỐ TB QUAN SÁT VỚI 1 TB LÝ THUYẾT
26
13
Chương 8
KIỂM ĐỊNH t
SO SÁNH 2 SỐ TRUNG BÌNH BẮT CẶP
Ví dụ:
Điểm trung bình chất lượng cuộc sống sau chấn thương
có thay đổi so với trước chấn thương hay không?
• Giả thuyết:
Ho: QoL sau = QoL trước
Ha: QoL sau ≠ QoL trước
• Chọn kiểm định t cho ss 2 TB bắt cặp
vd 1: mời vào nghiên cứu và tiến hành cân 10 ng này => tính đc tb cân nặng trc khi dùng thuốc. Sau đó uống thuốc giảm cân
=> sau 1 tháng mời tới rồi tiến hành cân => cân nặng tb sau đung thuốc => 2 số tb nhưng có 1 nhóm
vd 2 (nghiên cứu bệnh chứng bắt cặp): khảo sát hút thuốc và UT phổi, chọn ra nhóm bn UT phổi và ko UT phổi (nhóm chứng)
27
- chọn match case, chọn 20 ng UT phổi, vd chọn ng nữ 60t UT phổi tương tự ngoài cđ cũng chọn nữ 60t ko UT phổi
- tương tự ng đàn ông 70t UT trong bv UB thì ngoài cđ cũng chọn đàn ông 60t ko bệnh
=> có 2 nhóm nhưng chúng ta vẫn gọi là cặp => sd tk liên quan đến bắt cặp
vd 3: khảo sát điểm số GP Y1 với điểm số thống kê có sự khác biệt ko?
- 1 nhóm sv nhưng có trung bình 2 điểm số GP và TK
Std. Error
Mean N Std. Deviation Mean
Pair General quality of
60.4054 1692 7.67448 .18657
1 life before injury
general quality of
54.6820 1692 9.98209 .24267
life after injury
N Correlation Sig.
Pair General quality of life
1 before injury & general 1692 .787 .000
quality of life after injury
28
14
Chương 8
Paired Differences
95% Confidence
trung bình Interval of the
hiệu số Difference
Std. Error
Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed)
Pair General quality of life
rất rất nhỏ
1 before injury - general5.7234 6.16665 .14992 5.4294 6.0174 38.177 1691 .000
quality of life after injury
độ lệch chuẩn > trung bình
(có thể ko bình thường)
• Trung bình điểm QoL sau chấn thương giảm 5,7 điểm so với trước chấn
thương (từ 60,4 xuống 54,7) với khoảng tin cậy 95% là 5,4 đến 6,0.
KIỂM ĐỊNH t
SO SÁNH 2 SỐ TRUNG BÌNH BẮT CẶP
30
15
Chương 8
31
Xác định p
Bước 1: Xác định vị trí của t trên bảng t, dựa vào giá trị của t và độ tự do
Bước 2: Đối chiếu giá trị t lên hàng α vị trí của p
0.05 > 0.02 > p
16
Chương 8
33
34
17
Chương 8
35
18
Chương 8
Test Statistics
Injury to head
or spine
Chi-Squarea .241
df 1
Asymp. Sig. .623
a. 0 cells (.0%) have expected frequencies less than
5. The minimum expected cell frequency is 633.8.
Tỷ lệ chấn thương ở đầu/cột sống xấp xỉ 36% trong nghiên cứu năm 2001.
Tỷ lệ này cũng tương tự như tỷ lệ báo cáo chấn thương giao thông quốc
gia năm 1997 là 37% (2 = 0.24, p = 0.623).
37
19
Chương 8
Was victim a
pedestrian?
No Yes Total
Injury to head Not injured at these sites Count 861 94 955
or spine % within Was victim
63.4% 56.0% 62.6%
a pedestrian?
Injured Count 496 74 570
% within Was victim
36.6% 44.0% 37.4%
a pedestrian?
Total Count 1357 168 1525
% within Was victim
100.0% 100.0% 100.0%
a pedestrian?
20
Chương 8
41
2 n(ad bc) 2
=
(a b)(c d )(a c)(b d )
42
21
Chương 8
43
2 = 9.835 2
Using the Table…
Độ tự do = p
5–1=4
9.825
= 0.05
22
Chương 8
SO SÁNH NHIỀU TỶ LỆ
Kết quả điều trị của 3 phương pháp
KẾT QUẢ PHƯƠNG PHÁP TỔNG
A B C
Khỏi bệnh a b c a+b+c
Thất bại d e f d+e+f
Tổng a+ d b+e c+f n
Bảng tần số lý thuyết kết quả điều trị của 3 phương pháp
KẾT QUẢ PHƯƠNG PHÁP
A B C
Khỏi bệnh a' b’ c’
Thất bại d’ e’ f’
a’ = (a + b + c) x (a+ d)/n
Tổng quát, TSLT = (tổng hàng tương ứng x tổng cột tương ứng)/Tổng số
45
SO SÁNH NHIỀU TỶ LỆ
2
=
(Q i Li )2
Li
2
=
(a a' )2 (b b' )2 (c c' )2 (d d ' )2 (e e' )2 ( f f ' )2
a'
+
b'
+
c'
+
d'
+
e'
+
f'
46
23
Chương 8
47
24