You are on page 1of 35

Xử lý số liệu thống kê bằng SPSS

• Mục tiêu : Học viên có khả năng sử dụng


SPSS để xử lý dữ liệu thống kê y học
• Nội dung :
1. Nhập dữ liệu, mã hoá và tính toán, lọc dữ liệu
2. Trình bày dữ liệu
3. Kiểm định Chi Square
4. So sánh trung bình hai mẫu độc lập
5. So sánh trung bình mẫu cặp
6. One way ANOVA
7. Tương quan và hồi qui tuyến tính
1
8. Hồi qui đa biến
9. Hồi qui logistic
10. Nhiễu và tương tác
11. Đường cong ROC
12. Đường cong sống sót
13. Các kiểm định phi tham số
14. Độ tin cậy trong đo lường

2
15. Phân tích nhân tố EFA
16. Import số liệu
17. Tạo file lưu quá trình xử lý
18. Ước lượng cỡ mẫu

3
Bài 1
• Khởi động SPSS 20
• Mở file *.sav
• Phân biệt các loại dữ liệu – Data types
• Tạo file dữ liệu - Variables
• Mã hóa - Recode
• Tạo biến mới - Compute
• Lọc – Select cases

4
Khởi động SPSS
• Khởi động : Start  Programs  IBM SPSS
Statistics 20
• http://thongkeyhoc.com/course/?
Content=ChiTietTin&menu=&idTin=18353
• Mở file có sẵn :
– File  Open  Data
– Chọn D:\SpssData\Quest92.sav
– Hay link http://thongkeyhoc.com/course/?
Content=ChiTietTin&idTin=18353

5
Các màn hình làm việc
• Màn hình Data view : nhập sửa số liệu
• Màn hình Variable view : định nghĩa biến

6
Màn hình Data view

Nút Value labels : hiện 0,1


hoặc hiện male/female

7
Màn hình Data view (tiếp)
• Màn hình Data View cho phép nhập/sửa
dữ liệu
• Di chuyển đến record thứ n :
– Menu Data Go to case …
– Nhập giá trị n, OK

8
Màn hình variable view

9
Màn hình Variable view (tiếp)
• Có thể xem lại thông tin về một biến :
– Menu Utilities  Variables

10
Variable
1. Name : không có khoảng trắng, không dấu
2. Type : (kiểu) : numeric, string, date…
3. Width : độ rộng
4. Decimal : số số lẻ
5. Label : tên biến đầy đủ
6. Values : nhãn, ví dụ 0 : Nữ, 1:Nam
7. Missing : giá trị đặc biệt dành cho dữ liệu trống
8. Measure : bản chất đại lượng (scale, ordinal,
nominal)

11
12
Kiểu dữ liệu của biến
• Kiểu biến :
– Định lượng :  scale
• Height
• weight
– Bán định lượng:  ordinal
• Mức độ hồi phục : 0, 1, 2, 3
• Trình độ học vấn : phổ thông, đại học, sau đại học
– Định tính:  nominal
• Sex : male/female
• bệnh/không bệnh
13
Kiểu dữ liệu trong SPSS (type)
• Number :
– Scale : định lượng
– Ordinal : bán định lượng
– Nominal : định tính
• String : tên bệnh nhân
– Nominal
• Date
• …
14
Bài tập
• Định nghĩa các biến (tập tin số liệu mới)
– Mã số bệnh án
– Họ tên bệnh nhân
– Tuổi
– Chiều cao
– Giới
– Huyết áp
– Nhịp tim
– Ngày nhập viện
– Ngày xuất viện
15
16
Mã hóa - Recode
• Mã hóa :
– Chuyển biến định lượng thành biến định tính
– Giảm số phân loại của biến định tính
• Ví dụ : mã hóa age thành agegrp :
• Dưới 18 : 0 thiếu niên
• Từ 18 – 35 : 1 thanh niên
• Từ 36 đến 55 : 2 trung niên
• Trên 55 : 3 lão niên

17
• Mã hóa age thành nhóm tuổi (nhom)

• <=19  0 trẻ
• >=20 đến <=35  1 trung bình
• >35  2 lớn

18
Mã hóa (tiếp)
• Thao tác :
– Menu Transform\Recode\into different variable
– Chọn biến age, click 
– Đặt tên biến mới : agegrp, click Change
– Chọn Old and new values

19
Mã hóa (tiếp)
• Chọn Range phù hợp, nhập New value

Từ 17 đến 35

Dưới 17

Trên 45

Nếu mã hóa
thành chuỗi kí tự
20
Bài tập recode
• Mã hoá biến pulse thành loainhip
– < 60  0 : chậm
– 60 – 80  1 : trung bình
– >80  2 : nhanh

21
• Caothap
(sex=0)*((height>=165 & height<=175)*1+(height>175)*2)+
(sex=1)*((height>=160 & height<=165)*1+(height>165)*2)

22
Compute
• Compute dùng để tạo một biến mới bằng
cách tính một biểu thức
• Ví dụ : bmi = weight / height2

• Hướng dẫn :
– Menu Transform  Compute
– Gõ tên biến mới : bmi
– Tạo biểu thức :
weight * 10000/(height**2)
23
Compute
• Compute dùng để tạo một biến mới bằng
cách tính một biểu thức
• Ví dụ : a1=1, a2=0.98
– Đối với nam : bmi = weight *a1/ height2
– Đối với nữ : bmi = weight*a2/height2
– weight * 10000 / (height * height)*( 1*(sex=0) +
0.98*(sex=1) )
• bmi = (weight / height2)*(sex*a2+(1-sex)*a1)
• bmi = (weight / height2)*(sex*0.98+(1-sex))
24
Bài tập dùng compute thay cho
recode
• Tạo biến nhip bằng compute như sau :
• loainhip2
– <60 : 0
– 60-80 : 1
– >80 : 2
( pulse < 60)* 0 + (pulse >= 60 & pulse <=80 )*1 + ( pulse
> 80)*2

Target Variable : nhip


Numeric expression :
(pulse<60)*0 + (pulse>=60 & pulse<=80)*1+(pulse>80)*2

25
• Mã hoá chiều cao (height) thành ccao
– đ/v Nữ :
• Dưới 160 cm : 0 thấp
• Từ 160 – 165 : 1 trung bình
• Từ 166 trở lên : 2 cao
– đ/v Nam :
• Dưới 165 cm : 0 thấp
• Từ 165 – 182 : 1 trung bình
• Từ 183 trở lên : 2 cao
(sex=0)*((height>=165 & height<=182)+(height>=183)*2)
+(sex=1)*((height>=159 & height<=165)+(height>=166)*2)
26
Bài tập compute
• Tính bmi2 theo công thức sau :
– Nếu là Nam : bmi2=(weight/height2)*1.00
– Nếu là Nữ : bmi2=(weight/height2)*0.85
• Tạo thêm biến
– t0 là ngày giờ uống thuốc
• Date : dd-mmm-yyyy hh:mm
• Nhập : 3-3-18 08:20
– t1 là ngày giờ phát hiện kết quả
– Tính thời gian giữa 2 thời điểm

27
28
Phép toán so sánh :
<,>,<=,>=,=,<>
Các hàm : abs(x),
rnd(x)
Phép toán số học :
+, - , * , /, lũy thừa

Các phép toán luận lý :


AND, OR, NOT và ( )

29
Select cases
• Chọn dữ liệu từ mẫu ban đầu
• Ví dụ : phân tích các trường hợp nữ
– Data  Select cases
– nhắp nút if

30
• Các dòng không thỏa điều kiện if bị gạch
chéo

31
Bài tập select cases
• Chọn nữ từ 160 cm trở lên
sex = 1 & height >= 160
• Chọn nữ thấp hơn 160 cm hay cao hơn
170 cm
sex = 1 & ( height < 160 | height > 170 )
• Chọn nữ từ 160 cm trở lên và nam từ 175
cm trở lên
(sex = 1 & height >=160) | (sex = 0 & height >=175)
(sex = 1 and height >=160) or (sex = 0 and height >=175)

32
Chọn mẫu con ngẫu nhiên
• Ví dụ chọn 50%

33
Phân loại BMI
Theo WHO: bmi  loaibmi
•<18.5 :  0 (gầy)
•>=18.5 - <25 :  1 (bình thường)
•>=25 – <=30 :  2 (dư cân)
•>30  3 (béo phì)

(bmi<18.5)*0 + (bmi>=18.5 & bmi<25)*1 +


(bmi>=25 & bmi<=30)*2 + (bmi>30)*3
34
Lowbw.sav:
1.Mã hóa age thành nhomtuoi
<18  1 trẻ
18 – 40  2 trung bình
>40  3 lớn
2. Mã hóa bwt thành nhecan
bwt < 2500  1 Yes
bwt >= 2500  0 No
35

You might also like