You are on page 1of 50

Bài 3 : Kiểm định

• Kiểm định giả thuyết


• Tương quan 2 biến định tính (Kiểm định 2)
• So sánh trung bình 2 mẫu độc lập
• Paired Sample t-test
• One way ANOVA

1
Bài 3 : Kiểm định
• Kiểm định giả thuyết
– Ho : không khác biệt, không quan hệ
– Ha : khác biệt, có quan hệ
Mức ý nghĩa  = 0.05

• Ví dụ : nam và nữ có kỳ vọng môn thống kê khác


nhau ?
– Ho : Nam và Nữ không khác nhau về mong muốn kết quả
môn Thống kê
– Ha : ngược lại

2
Khả năng sai lầm khi kiểm định
• Sai lầm loại I : Giả thiết Ho là đúng, nhưng
qua kiểm định ta bác bỏ Ho

• Mức ý nghĩa  : giới hạn lớn nhất mắc phải


khi bác bỏ Ho
– Ví dụ =0.05 hay 5% : khi bác bỏ Ho ta có thể
phạm sai lầm lớn nhất là 5%, hay độ tin cậy của
phép kiểm là 95%

3
Kiểm định Chi square ( ) 2

2 cho biết 2 biến định tính (nominal) có liên hệ


với nhau hay không

– Ví dụ : “Cách đọc tờ báo” và “trình độ học vấn”


– Anh chị hãy cho một ví dụ .

2 cũng áp dụng được với biến rời rạc có thứ tự


(ordinate)
2 không cho biết độ mạnh của mối liên hệ
4
Kiểm định Chi square tính tay
(O  E )2
r c
Công thức tính 2 = 
ij ij

Ei 1 j 1 ij

– Trong đó Oij là số quan sát ở hàng i, cột j


– Eij là giá trị lý thuyết ở hàng i, cột j
Eij = Ri x C j
Ri : tổng số quan sát dòng thứ i
n Cj : tổng số quan sát cột thứ j
c : số cột của bảng.
r : số hàng của bảng.

5
Các giá trị quan sát Oij

Male Female
Just pass 6 36 42
Pass comf 19 75 94
credit 19 30 49
don’t know 0 12 12
44 153 197
6
Hãy tính các giá trị lý thuyết Eij và 2ij

Male Female
Just pass
Pass comf
credit
don’t know

7
• So với giá trị tra bảng : 2(r-1)(c-1). = 7.815

• Quyết định : 2 tính được là 12.897 > 7.815 


bác bỏ H0

8
Mức ý nghĩa  (sign)

Độ
tự
do
df

9
Các bước thực hiện 2 trên SPSS
1. Phát biểu các giả thuyết :
– H0 : không có mối liên hệ
– Ha : hai biến có liên hệ với nhau
Và mức ý nghĩa =0.05

Giải thích  :
 là giới hạn tối đa cho phép phạm sai lầm loại I, tức là
bác bỏ Ho trong khi Ho đúng
Như vậy nếu =0.05 (5%) thì độ tin cậy của kiểm định là
95%

10
2. Thực hiện phép kiểm Chi-Square :
– Analyze\Descriptive Statistics\Crosstabs
• Sex  Column (biến độc lập)
• Expect1  Rows (biến phụ thuộc)
(có thể chọn ngược lại)
• Cells : hiển thị % column, Expected
• Statistics : Chi Square

11
Chi-Square Tests

Asymp. Sig. Exact Sig. Exact Sig.


Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 14.998b 1 .000
Continuity Correctiona 13.901 1 .000
Likelihood Ratio 13.188 1 .000
Fisher's Exact Test .000 .000
Linear-by-Linear
14.985 1 .000
Association
N of Valid Cases 1207
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is
16.58.
12
13
14
Output của phép kiểm Chi-Square :
Expected performance in statistics exam * sex of respondent Crosstabulation

sex of respondent
male female Total
Expected performance just pass Count 6 36 42
in statistics exam Expected Count 9.4 32.6 42.0
% within sex of
13.6% 23.5% 21.3%
respondent
pass comfortably Count 19 75 94
Expected Count 21.0 73.0 94.0
% within sex of
43.2% 49.0% 47.7%
respondent
credit or above Count 19 30 49
Expected Count 10.9 38.1 49.0
% within sex of
43.2% 19.6% 24.9%
respondent
don't know Count 0 12 12
Expected Count 2.7 9.3 12.0
% within sex of
.0% 7.8% 6.1%
respondent
Total Count 44 153 197
Expected Count 44.0 153.0 197.0
% within sex of 15
100.0% 100.0% 100.0%
respondent
Chi-Square Tests

Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 12.899a 3 .005
Likelihood Ratio 14.744 3 .002
Linear-by-Linear
1.579 1 .209
Association
N of Valid Cases 197
a. 1 cells (12.5%) have expected count less than 5. The
minimum expected count is 2.68.

16
3. Đọc kết quả :
• Dựa vào bảng :
– ở mức thấp : nam 13.6%, nữ 23.5%
– ở mức cao : nam 43.5%, nữ 19.6%
– Nhận xét : Nam có mong muốn cao hơn nữ
• Chi square = 12.899, df=3  sign=0.005 < 0.05
  Bác bỏ Ho
Nhớ : sign < 0.05  bác bỏ Ho
Kết luận : nam có mong muốn cao hơn nữ
(2=12,899, df=3, p=0.005)

17
4. Kiểm tra lại 2 điều kiện phép kiểm
1. Số ô có giá trị kỳ vọng < 5 chiếm tỉ lệ <20%
2. Ô có giá trị kỳ vọng nhỏ nhất >= 1
Chi-Square Tests

Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 12.899a 3 .005
Likelihood Ratio 14.744 3 .002
Linear-by-Linear
1.579 1 .209
Association
N of Valid Cases 197
a. 1 cells (12.5%) have expected count less than 5. The
minimum expected count is 2.68.
18
Bài tập
• Câu hỏi : nếu các điều kiện của phép kiểm
chi-square không thỏa ?
• Bài tập :
1. Nam, Nữ (sex) chơi thể thao (parsport) giống
nhau hay khác nhau ?
2. Anh/chị làm thử đề thi dethi3.doc trong
D:\thongke\dethi (file dữ liệu chdage.sav)

19
Bài tập
• Lowbw.sav
1. Hút thuốc và Nhẹ cân?
– 1. Phát biểu Ho và Ha
– 2. Chọn kiểm định
– 3. Nhận xét
– 4. Kiểm lại điều kiện; đọc kết quả kiểm định
(nhecan=1 nếu bwt<2500)
2. Race và smoke?
20
Independent sample t test
• Khi nào chọn phép kiểm này :
– So sánh 2 giá trị trung bình của 2 mẫu độc lập
– Ví dụ :
1. So sánh huyết áp trung bình của một nhóm dùng thuốc A và một
nhóm dùng thuốc B ?
2. So sánh chiều cao nam thanh niên ở HCM và nam thanh niên ở
Cà mau ?
3. So sánh tình trạng béo phì (gầy, tbinh, béo) của nam và nữ ?
4. So sánh huyết áp trước và sau khi điều trị ?
5. So sánh nhịp trong 3 nhóm sử dụng 3 loại thuốc A, B, C ?

21
Independent sample t test
1. Phát biểu :
– Ho : 2 trung bình không khác biệt
– Ha : 2 trung bình khác biệt
– Mức ý nghĩa =0.05

22
• So sánh 2 trung bình: x1  x2 x1  x2
t 
– Phương sai đồng nhất se s p 1 / n1  1 / n2
• df = n1 + n2 - 2
– Phương sai không đồng
nhất x1  x2 x1  x2
t 
 2

se s12 s22

 s12 s22 
n  n   
  1 2  n1 n2
d. f .   4 4 
 s s 
1
 2 2
 n1 (n1  1) n2 (n2  1) 
2
 

23
24
2. Chọn phép kiểm so sánh 2 trung bình –
Independent sample t test
• Hướng dẫn :
– Analyze\Compare means\Independent sample t-
test
– Test variable : biến định lượng : pulse
– Grouping variable : biến định tính : sex
• Group 1 : 0
• Group 2 :1
25
3. Đọc kết quả :
– Dựa vào Levene’s test để kiểm định phương sai
bằng nhau giữa 2 nhóm
• Nếu Sig > 0.05 : Equal variances assumed
 đọc t ở hàng trên. Independent Samples

Levene's Test for


Equality of Variances

F Sig. t df
dom hand reaction time Equal variances
2.215 .138 -.522 1
assumed
Equal variances 26
-.586 87.2
not assumed
• Đọc kết quả :
– Nếu t có sig <0.05 bác bỏ Ho

Independent Samples Test

ne's Test for


y of Variances t-test for Equality of Means
95% Confidence
Interval of the
Mean Std. Error Difference
Sig. t df Sig. (2-tailed) Difference Difference Lower Upper
15 .138 -.522 197 .602 -.31 .592 -1.476 .859

-.586 87.298 .559 -.31 .527 -1.356 .738

27
4. Kiểm tra điều kiện
– Biến định lượng có phân phối chuẩn ?
– Hướng dẫn :
• Analyse  Descriptive Statistics  Explore

28
• Kết luận phân phối chuẩn nếu
– Abs(Skewness)/S.E of Skewness < 2
– Abs(Kurtosis)/S.E of Kurtosis <2

29
Histogram Histogram
For SEX= female For SEX= male
50 16

14
40
12

30 10

20
6
Frequency

Frequency
4
10 Std. Dev = 3.64 Std. Dev = 2.94
Mean = 16.8 2 Mean = 16.4

0 N = 154.00 0 N = 45.00

8.0 10.0 12.0 14.0 16.0 18.0 20.0 22.0 24.0 12.0 14.0 16.0 18.0 20.0 22.0 24.0

dom hand reaction time dom hand reaction time

30
Bài tập :
• So sánh trung bình pulse của Nam và Nữ
1. Giả thuyết :
• Ho : trung bình như nhau
• Ha : trung bình khác nhau
Mức ý nghĩa =0.05
2. Chọn phép kiểm : independent sample t-test

31
32
3. Đọc kết quả :
Independent Samples Test

Levene's Test for


Equality of Variances t-test for Equality of Means
95% Confidence
Interval of the
Mean Std. Error Difference
F Sig. t df Sig. (2-tailed) Difference Difference Lower Upper
height in cm Equal variances
.250 .617 14.584 198 .000 15.98 1.096 13.817 18.138
assumed
Equal variances
13.701 65.719 .000 15.98 1.166 13.649 18.306
not assumed

• Levenve test : F=0.250, sign=0.617>0.05  phương sai


như nhau
 t=14.584, df = 198, sign =0.001 <0.05
 Kết luận : trung bình khác nhau với mức ý nghĩa 0.001
33
• 4. Điều kiện :
– Phân phối chuẩn : 210

• Tỉ số skewness/SE of
Skewness < 2 200

• Tỉ số kurtosis/SE of 190

kurtosis < 2 110


180

170

height in cm 160 31

150

140
N= 45 155

male female

34
sex of respondent
Bài tập independent sample t-test
Lowbw.sav 2. So sánh trọng
1.So sánh trọng lượng lượng sơ sinh ở bà
sơ sinh ở nhóm hút mẹ da trắng và bà
thuốc và nhóm không mẹ da đen (chỉ xét
hút thuốc những bà mẹ không
hút thuốc và không
cao huyết áp)

35
So sánh trung bình mẫu cặp
• Khi nào dùng ?
– Ví dụ :
• So sánh hemoglobin trong phần mẫu máu cất trong tối
và phần mẫu máu phơi sáng
• So sánh huyết áp trước và sau điều trị

36
So sánh mạch khi tập (pulsexer)và khi tập nặng
(pulsevig)
1. Phát biểu các giả thuyết
2. Chọn phép kiểm : paired sample t test
3. Đọc kết quả :
Trung bình khi tập :97.9667, SD=12.3111
Paired Samples Statistics
Trung bình khi tập nặng : 127.2807, SD 13.2807 Std. Error
Mean N Std. Deviation Mean
Pair pulse rate after exercise 97.7667 30 12.31115 2.24770
1 Pulse rate after
127.3667 30 13.28074 2.42472
vigorous exercise

37
• t =-31.039, df =29, sign=0.001 < 0.05
 hai trung bình khác nhau với p=0.001

Paired Samples Test

Paired Differences
95% Confidence
Interval of the
Std. Error Difference
Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed)
Pair pulse rate after
1 exercise - Pulse rate -29.6000 5.22329 .95364 -31.5504 -27.6496 -31.039 29 .000
after vigorous exercise

38
• Điều kiện : phân phối chuẩn của hiệu
• Tính hiệu số : hieu = pulsevig - pulsexer
• Analyse  descritive statistics  frquencies : Tỉ số
skewness/SE
CHENH
10
of skewness =0.184/0.427<2 Statistics

CHENH
• Tỉ số kurtosis/SE of kurtosis = 1.216/0.833<Valid
2 N 30
8 Missing 172
Mean 29.6000
Std. Error of Mean .95364
6
Median 29.5000
Mode 24.00
4 Std. Deviation 5.22329
Variance 27.28276
Skewness
Frequency

2 .184
Std. Dev = 5.22
Mean = 29.6
Std. Error of Skewness .427
0 N = 30.00 Kurtosis -1.216
20.0 22.5 25.0 27.5 30.0 32.5 35.0 37.5 40.0 Std. Error of Kurtosis .833
Range 18.00
CHENH
Minimum 21.00
Maximum 39.00
39
Bài tập paired sample test
QUEST92.sav
•So sánh phản xạ tay thuận (react) và tay không
thuận (reactnon) của nữ (sex=1)
•So sánh nhịp khi tập (pulse) và sau khi tập
(pulsexer) của nữ ?

40
Bài tập
• So sánh chiều cao, trọng lượng trung bình
của nam và nữ ? ( biến height, biến weight
vào biến sex )
• So chiều cao trung bình của nam với giá trị
chiều cao trung bình thanh niên việt nam 165
cm ?

41
Bài tập
• Mở file LOWBW.SAV
1. Vẽ biểu đồ hộp so sánh trung bình trọng lượng trẻ
sơ sinh trong trường hợp hút/không hút thuốc.
2. Hai trung bình trọng lượng ở 2 nhóm sơ sinh này
khác biệt có YNTK không ?
3. Xét bà mẹ không hút thuốc. Trọng lượng sơ sinh
của da đen và da khác (other)?
4. Xét bà mẹ không hút thuốc. Trọng lượng sơ sinh
của 3 màu da
42
1. Tỉ lệ sinh con nhẹ cân khác nhau giữa hút và
không hút? Kiểm định?
2. Tỉ lệ hút thuốc có khác nhau giữa các màu da?
3. Chỉ xét bà mẹ không hút, tỉ lệ sinh con nhẹ cân có
khác nhau giữa các màu da
4. Chỉ xét bà mẹ không hút, tỉ lệ sinh con nhẹ cân có
khác nhau giữa black và other
Smoke=0 & race ~=1
Smoke= 0 & (race=2 |race=3)

43
Lowbw.sav
1. So sánh trọng lượng sơ sinh ở nhóm hút và
không hút?
2. Xét bà mẹ không hút, trọng lượng sơ sinh
trung bình da trắng và da đen?
3. Tuổi trung bình sinh con ở bà mẹ da trắng và
da đen?

44
• Lowbw.sav: Tuổi trung bình các bà mẹ khác
nhau ở các màu da không?
• Quest92.sav: Chỉ xét Nam (sex=0), nhịp tim
(pulse) trung bình có khác nhau giữa 4 nhóm
tham gia thể thao mức độ khác nhau
(parsport)?

45
46
47
Chọn kiểm định
D:\Thongke\DeThi

Định tính Định lượng

Định tính 2 [97] t-test (2) [99]


ANOVA (>2) [102]
Định lượng Paired t-test [101]
Hồi qui [103]
48
Chọn kiểm định
Phụ thuộc
Định tính Định lượng

Độc Định tính 2 [97] T-test [99]


lập ANOVA [102]

Định lượng Hồi qui Logistic Paired t test [101]


Survival Hồi qui [103]
ROC Hồi qui đa biến
Repeated
Measurement 49
50

You might also like