Professional Documents
Culture Documents
Spss b3
Spss b3
1
Bài 3 : Kiểm định
• Kiểm định giả thuyết
– Ho : không khác biệt, không quan hệ
– Ha : khác biệt, có quan hệ
Mức ý nghĩa = 0.05
2
Khả năng sai lầm khi kiểm định
• Sai lầm loại I : Giả thiết Ho là đúng, nhưng
qua kiểm định ta bác bỏ Ho
3
Kiểm định Chi square ( ) 2
5
Các giá trị quan sát Oij
Male Female
Just pass 6 36 42
Pass comf 19 75 94
credit 19 30 49
don’t know 0 12 12
44 153 197
6
Hãy tính các giá trị lý thuyết Eij và 2ij
Male Female
Just pass
Pass comf
credit
don’t know
7
• So với giá trị tra bảng : 2(r-1)(c-1). = 7.815
8
Mức ý nghĩa (sign)
Độ
tự
do
df
9
Các bước thực hiện 2 trên SPSS
1. Phát biểu các giả thuyết :
– H0 : không có mối liên hệ
– Ha : hai biến có liên hệ với nhau
Và mức ý nghĩa =0.05
Giải thích :
là giới hạn tối đa cho phép phạm sai lầm loại I, tức là
bác bỏ Ho trong khi Ho đúng
Như vậy nếu =0.05 (5%) thì độ tin cậy của kiểm định là
95%
10
2. Thực hiện phép kiểm Chi-Square :
– Analyze\Descriptive Statistics\Crosstabs
• Sex Column (biến độc lập)
• Expect1 Rows (biến phụ thuộc)
(có thể chọn ngược lại)
• Cells : hiển thị % column, Expected
• Statistics : Chi Square
11
Chi-Square Tests
sex of respondent
male female Total
Expected performance just pass Count 6 36 42
in statistics exam Expected Count 9.4 32.6 42.0
% within sex of
13.6% 23.5% 21.3%
respondent
pass comfortably Count 19 75 94
Expected Count 21.0 73.0 94.0
% within sex of
43.2% 49.0% 47.7%
respondent
credit or above Count 19 30 49
Expected Count 10.9 38.1 49.0
% within sex of
43.2% 19.6% 24.9%
respondent
don't know Count 0 12 12
Expected Count 2.7 9.3 12.0
% within sex of
.0% 7.8% 6.1%
respondent
Total Count 44 153 197
Expected Count 44.0 153.0 197.0
% within sex of 15
100.0% 100.0% 100.0%
respondent
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 12.899a 3 .005
Likelihood Ratio 14.744 3 .002
Linear-by-Linear
1.579 1 .209
Association
N of Valid Cases 197
a. 1 cells (12.5%) have expected count less than 5. The
minimum expected count is 2.68.
16
3. Đọc kết quả :
• Dựa vào bảng :
– ở mức thấp : nam 13.6%, nữ 23.5%
– ở mức cao : nam 43.5%, nữ 19.6%
– Nhận xét : Nam có mong muốn cao hơn nữ
• Chi square = 12.899, df=3 sign=0.005 < 0.05
Bác bỏ Ho
Nhớ : sign < 0.05 bác bỏ Ho
Kết luận : nam có mong muốn cao hơn nữ
(2=12,899, df=3, p=0.005)
17
4. Kiểm tra lại 2 điều kiện phép kiểm
1. Số ô có giá trị kỳ vọng < 5 chiếm tỉ lệ <20%
2. Ô có giá trị kỳ vọng nhỏ nhất >= 1
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 12.899a 3 .005
Likelihood Ratio 14.744 3 .002
Linear-by-Linear
1.579 1 .209
Association
N of Valid Cases 197
a. 1 cells (12.5%) have expected count less than 5. The
minimum expected count is 2.68.
18
Bài tập
• Câu hỏi : nếu các điều kiện của phép kiểm
chi-square không thỏa ?
• Bài tập :
1. Nam, Nữ (sex) chơi thể thao (parsport) giống
nhau hay khác nhau ?
2. Anh/chị làm thử đề thi dethi3.doc trong
D:\thongke\dethi (file dữ liệu chdage.sav)
19
Bài tập
• Lowbw.sav
1. Hút thuốc và Nhẹ cân?
– 1. Phát biểu Ho và Ha
– 2. Chọn kiểm định
– 3. Nhận xét
– 4. Kiểm lại điều kiện; đọc kết quả kiểm định
(nhecan=1 nếu bwt<2500)
2. Race và smoke?
20
Independent sample t test
• Khi nào chọn phép kiểm này :
– So sánh 2 giá trị trung bình của 2 mẫu độc lập
– Ví dụ :
1. So sánh huyết áp trung bình của một nhóm dùng thuốc A và một
nhóm dùng thuốc B ?
2. So sánh chiều cao nam thanh niên ở HCM và nam thanh niên ở
Cà mau ?
3. So sánh tình trạng béo phì (gầy, tbinh, béo) của nam và nữ ?
4. So sánh huyết áp trước và sau khi điều trị ?
5. So sánh nhịp trong 3 nhóm sử dụng 3 loại thuốc A, B, C ?
21
Independent sample t test
1. Phát biểu :
– Ho : 2 trung bình không khác biệt
– Ha : 2 trung bình khác biệt
– Mức ý nghĩa =0.05
22
• So sánh 2 trung bình: x1 x2 x1 x2
t
– Phương sai đồng nhất se s p 1 / n1 1 / n2
• df = n1 + n2 - 2
– Phương sai không đồng
nhất x1 x2 x1 x2
t
2
se s12 s22
s12 s22
n n
1 2 n1 n2
d. f . 4 4
s s
1
2 2
n1 (n1 1) n2 (n2 1)
2
23
24
2. Chọn phép kiểm so sánh 2 trung bình –
Independent sample t test
• Hướng dẫn :
– Analyze\Compare means\Independent sample t-
test
– Test variable : biến định lượng : pulse
– Grouping variable : biến định tính : sex
• Group 1 : 0
• Group 2 :1
25
3. Đọc kết quả :
– Dựa vào Levene’s test để kiểm định phương sai
bằng nhau giữa 2 nhóm
• Nếu Sig > 0.05 : Equal variances assumed
đọc t ở hàng trên. Independent Samples
F Sig. t df
dom hand reaction time Equal variances
2.215 .138 -.522 1
assumed
Equal variances 26
-.586 87.2
not assumed
• Đọc kết quả :
– Nếu t có sig <0.05 bác bỏ Ho
27
4. Kiểm tra điều kiện
– Biến định lượng có phân phối chuẩn ?
– Hướng dẫn :
• Analyse Descriptive Statistics Explore
28
• Kết luận phân phối chuẩn nếu
– Abs(Skewness)/S.E of Skewness < 2
– Abs(Kurtosis)/S.E of Kurtosis <2
29
Histogram Histogram
For SEX= female For SEX= male
50 16
14
40
12
30 10
20
6
Frequency
Frequency
4
10 Std. Dev = 3.64 Std. Dev = 2.94
Mean = 16.8 2 Mean = 16.4
0 N = 154.00 0 N = 45.00
8.0 10.0 12.0 14.0 16.0 18.0 20.0 22.0 24.0 12.0 14.0 16.0 18.0 20.0 22.0 24.0
30
Bài tập :
• So sánh trung bình pulse của Nam và Nữ
1. Giả thuyết :
• Ho : trung bình như nhau
• Ha : trung bình khác nhau
Mức ý nghĩa =0.05
2. Chọn phép kiểm : independent sample t-test
31
32
3. Đọc kết quả :
Independent Samples Test
• Tỉ số skewness/SE of
Skewness < 2 200
• Tỉ số kurtosis/SE of 190
170
height in cm 160 31
150
140
N= 45 155
male female
34
sex of respondent
Bài tập independent sample t-test
Lowbw.sav 2. So sánh trọng
1.So sánh trọng lượng lượng sơ sinh ở bà
sơ sinh ở nhóm hút mẹ da trắng và bà
thuốc và nhóm không mẹ da đen (chỉ xét
hút thuốc những bà mẹ không
hút thuốc và không
cao huyết áp)
35
So sánh trung bình mẫu cặp
• Khi nào dùng ?
– Ví dụ :
• So sánh hemoglobin trong phần mẫu máu cất trong tối
và phần mẫu máu phơi sáng
• So sánh huyết áp trước và sau điều trị
36
So sánh mạch khi tập (pulsexer)và khi tập nặng
(pulsevig)
1. Phát biểu các giả thuyết
2. Chọn phép kiểm : paired sample t test
3. Đọc kết quả :
Trung bình khi tập :97.9667, SD=12.3111
Paired Samples Statistics
Trung bình khi tập nặng : 127.2807, SD 13.2807 Std. Error
Mean N Std. Deviation Mean
Pair pulse rate after exercise 97.7667 30 12.31115 2.24770
1 Pulse rate after
127.3667 30 13.28074 2.42472
vigorous exercise
37
• t =-31.039, df =29, sign=0.001 < 0.05
hai trung bình khác nhau với p=0.001
Paired Differences
95% Confidence
Interval of the
Std. Error Difference
Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed)
Pair pulse rate after
1 exercise - Pulse rate -29.6000 5.22329 .95364 -31.5504 -27.6496 -31.039 29 .000
after vigorous exercise
38
• Điều kiện : phân phối chuẩn của hiệu
• Tính hiệu số : hieu = pulsevig - pulsexer
• Analyse descritive statistics frquencies : Tỉ số
skewness/SE
CHENH
10
of skewness =0.184/0.427<2 Statistics
CHENH
• Tỉ số kurtosis/SE of kurtosis = 1.216/0.833<Valid
2 N 30
8 Missing 172
Mean 29.6000
Std. Error of Mean .95364
6
Median 29.5000
Mode 24.00
4 Std. Deviation 5.22329
Variance 27.28276
Skewness
Frequency
2 .184
Std. Dev = 5.22
Mean = 29.6
Std. Error of Skewness .427
0 N = 30.00 Kurtosis -1.216
20.0 22.5 25.0 27.5 30.0 32.5 35.0 37.5 40.0 Std. Error of Kurtosis .833
Range 18.00
CHENH
Minimum 21.00
Maximum 39.00
39
Bài tập paired sample test
QUEST92.sav
•So sánh phản xạ tay thuận (react) và tay không
thuận (reactnon) của nữ (sex=1)
•So sánh nhịp khi tập (pulse) và sau khi tập
(pulsexer) của nữ ?
40
Bài tập
• So sánh chiều cao, trọng lượng trung bình
của nam và nữ ? ( biến height, biến weight
vào biến sex )
• So chiều cao trung bình của nam với giá trị
chiều cao trung bình thanh niên việt nam 165
cm ?
41
Bài tập
• Mở file LOWBW.SAV
1. Vẽ biểu đồ hộp so sánh trung bình trọng lượng trẻ
sơ sinh trong trường hợp hút/không hút thuốc.
2. Hai trung bình trọng lượng ở 2 nhóm sơ sinh này
khác biệt có YNTK không ?
3. Xét bà mẹ không hút thuốc. Trọng lượng sơ sinh
của da đen và da khác (other)?
4. Xét bà mẹ không hút thuốc. Trọng lượng sơ sinh
của 3 màu da
42
1. Tỉ lệ sinh con nhẹ cân khác nhau giữa hút và
không hút? Kiểm định?
2. Tỉ lệ hút thuốc có khác nhau giữa các màu da?
3. Chỉ xét bà mẹ không hút, tỉ lệ sinh con nhẹ cân có
khác nhau giữa các màu da
4. Chỉ xét bà mẹ không hút, tỉ lệ sinh con nhẹ cân có
khác nhau giữa black và other
Smoke=0 & race ~=1
Smoke= 0 & (race=2 |race=3)
43
Lowbw.sav
1. So sánh trọng lượng sơ sinh ở nhóm hút và
không hút?
2. Xét bà mẹ không hút, trọng lượng sơ sinh
trung bình da trắng và da đen?
3. Tuổi trung bình sinh con ở bà mẹ da trắng và
da đen?
44
• Lowbw.sav: Tuổi trung bình các bà mẹ khác
nhau ở các màu da không?
• Quest92.sav: Chỉ xét Nam (sex=0), nhịp tim
(pulse) trung bình có khác nhau giữa 4 nhóm
tham gia thể thao mức độ khác nhau
(parsport)?
45
46
47
Chọn kiểm định
D:\Thongke\DeThi