Professional Documents
Culture Documents
ISMS Regression VIE PDF
ISMS Regression VIE PDF
Copyright – Bản quyền thuộc về tác giả và thongke.info. Khi sử dụng một
phần hoặc toàn bộ bài giảng đề nghị mọi người trích dẫn: tên tác giả và
thongke.info. Ví dụ: Nguyễn Thị Linh – Thongke.info.
Nội dung
Điểm TB về
kiến thức 7.49 ± 5.77 7.56 ± 6.33 7.50± 5.97 6.55 ±
HIV± SD 1.25*** ± 2.32 1.18*** ± 1.85 1.23*** ± 1.18 2.02
Một số bằng chứng cho thấy dự án NAM đã có tác động tích cực vào hành vi sử
dụng BCS với PNMD của nam TNDP.Tỉ lệ luôn luôn sử dụng BCS trong vòng 6
tháng qua của trong nhóm có tiếp cận với dự án NAM là 59% trong khi đó tỉ lệ này
ở nhóm không tiếp cận với dự án chỉ là 35%.
Hồi quy logic giữa sử dụng bao cao su với PNMD và tiếp cân với dự án NAM
Biến độc lâp Sử dụng BCS với PNMD tất cả các lần
N=82 (So với không phải tất cả các lần)
OR (tỉ suất chênh) 95% CI
Tiếp cận với dự án NAM
Không tiếp cận (TC) - -
Tiếp cận 3.55 (0.89, 14.11)
Tỉnh/TP
Hai Phong (TC) - -
Ho Chi Minh 0.06*** (0.01, 0.28)
Phân loại TNDP
Các nhóm khác (TC) - -
Nhóm A 0.19* (0.04, 0.94)
Sử dụng ma túy
Không sử dụng (TC) -
Sử dụng ma túy nhưng 0.74 (0.16, 3.41)
không chích
Tiêm chích 0.13* (0.02, 0.91)
*P < .05 **P<.01 ***P<.001
Mối quan hệ giữa tiếp cận dự án và sử dụng BCS trong phân tích đa biến không
còn ý nghĩa thống kê (P > 0.005). Kết quả này khác so với các phân tích đôi biến,
bởi vì mô hình đa biến kiểm soát các yếu tố nhiễu tiềm tàng
Xây dựng mô hình hồi quy: đa biến, logic
Hồi quy đa biến
Y = Biến phụ thuộc, liên tục
X1, X2,… Tất cả các biến độc lập là liên tục
hoặc
X1, X2, … Các biến độc lập bao gồm cả
biến liên tục và biến nhị phân (dummy).
X1, X2, … Tất cả các biến độc lập là biến
nhị phân (dummy).
Hồi quy Logic
Y: Biến phụ thuộc là biến nhị phân (biến
đầu ra).
X1, X2,… Tất cả các biến độc lập là biến
liên tục hoặc
X1, X2, … Các biến độc lập bao gồm cả
biến liên tục và biến nhị phân (dummy).
X1, X2, … Tất cả các biến độc lập là biến
nhị phân (dummy).
Ví dụ.
Hồi quy đa biến (Multiple Regression)
◦ Số lần khám thai = b0 + b1(tuổi) + b2(dân tộc)+
b3(học vấn) + b4(tình trạng hôn nhân).
Hồi quy Logic (Logistic Regression)
◦ Hành vi nạo phá thai = b0 + b1(tuổi) + b2(dân
tộc)+ b3(học vấn) + b4(tình trạng hôn nhân)+b5
(Nghề nghiệp) +b6 (tuổi quan hệ tình dục lần
đầu).
Các bước xây dựng mô hình hồi quy
1) Xác định mô hình
◦ Chuyển câu hỏi nghiên cứu thành phương trình
hồi quy.
◦ Xác định các biến độc lập (biến dự đoán).
2) Đánh giá các yếu tố nguy cơ ảnh hưởng tới hiệu
lực của kiểm định thống kê (valid inference)
◦ Cỡ mẫu: đủ mẫu để đảm bảo 20 mẫu/biến độc lập.
◦ Phân phối chuẩn của biến số.
◦ Đảm bảo các biến độc lập – không tương quan.
◦ Kiểm tra và loại trừ outliers.
Các bước xây dựng mô hình hồi quy
3) Xây dựng mô hình (fitting models)
Fitting full model (dựa trên học thuyết – theory).
Fitting từng model bằng cách thêm biến, đánh giá
model fit dựa trên các tiêu chí thống kê, lựa chọn
model tốt nhất – good fit (thăm dò – explotary).
Tự động, ví dụ Stepwise regression.
4) chạy mô hình hồi quy và trình bày kết quả
Xây dựng các mô hình- Chọn các biến trong
mô hình như thế nào?
Cố gắng đưa tất cả các biến có liên quan quan trọng vào
mô hình hồi quy (nếu không thì tham số ước tính có thể bị
sai số). Trong nghiên cứu bán thử nghiệm, chúng ta cố
gắng đưa tất cả các biến nhiễu không kiểm soát được quan
trọng vào mô hình.
Đảm bảo sự cân bằng giữa mô hình ít tham số“Parsimony”
và “Good fit” (có thể làm tăng lên bằng cách thêm các
tham số).
Không nên sử dụng quá nhiều biến độc lập cho một số hạn
đinh đối tượng nghiên cứu. Một nguyên tắc là mỗi biến
độc lập được đưa vào mô hình phải có ít nhất 20 đối tượng
quan sát (Tốt nhất là 40-50 đối tượng cho 1 biến độc lập,
nhất là khi xây dựng luận thuyết).
Các nguyên tắc để thiết kế mô hình hồi quy đa
biến tốt.
Sử dụng các biến độc lập không có mối tương quan lẫn
nhau (Tránh Multicolinearity). Biến độc lập phải tương đối
‘độc lập’.
Không đưa các biến độc lập giống nhau (thừa) vào cùng
một mô hình. Ví dụ: không sử dụng 2 biến (X1) cấp học
trong kỳ thi cuối cùng và (X2) xếp hạng trong kỳ thi cuối
cùng trong cùng một mô hình để dự đoán về một số các
thay đổi kết quả của học sinh- vì 2 biến này đều dựa trên
các khái niệm và thống kê gần như nhau (redundant).
RECODE q7 (SYSMIS=SYSMIS) (0 thru 5 = 1) (6 thru 9 = 2) (10 thru 12= 3) (13 thru 15=4) (99=SYSMIS) INTO educat.
VARIABLE LABEL educat 'educat - Education completed, categorized'.
VALUE LABEL educat
1 'Primary/Under primary School'
2 'Secondary School'
3 'High/vocational school'
4 'College/University and above'.
EXECUTE.
FREQUENCIES educat.
****Tạo các biến dummy
compute edu2=9.
if (educat=2) edu2=1.
if (educat=1 or educat=3 or educat=4) edu2=0.
VARIABLE LABELS edu2 "Edu2-Secondary school".
value labels edu2 1"Secondary school" 0 "Other".
missing values edu2 (9).
Compute edu3=9..
if (educat=3) edu3=1.
if (educat=1 or educat=2 or educat=4) edu3=0.
VARIABLE LABELS edu3 "Edu3-High school".
value labels edu3 1"High school" 0 "Other".
missing values edu3 (9).
Compute edu4=9.
if (educat=4) edu4=1.
if (educat=1 or educat=2 or educat=3) edu4=0.
VARIABLE LABELS edu4 "Edu4-College/higher".
value labels edu4 1"college/higher" 0 "Other".
missing values edu4 (9).
***************Marital status
compute mar2=9.
if (q5recode=2) mar2=1.
if (q5recode=1 or q5recode=3) mar2=0.
VARIABLE LABELS mar2 "Mar2-divorced/widowed".
value labels mar2 1"widowed/divorced" 0"Other".
missing values mar2(9).
execute.
***********Occupation
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Q83_Re
/METHOD=ENTER Q2 ethnicre edu2 edu3 edu4 mar1 mar2 occunew.
Fitting từng model bằng cách thêm biến, đánh giá
model fit dựa trên các tiêu chí thống kê.
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Q83_Re
/METHOD=ENTER Q2 ethnicre occunew.
*******5 independents vars
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Q83_Re
/METHOD=ENTER Q2 ethnicre edu2 edu3 edu4 occunew mar1 mar2.
Sự thay đổi R2 sau khi thêm biến nghề nghiệp
và học vấn.
Stepwise.
*******Backward
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA COLLIN TOL CHANGE
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Q83_Re
/METHOD=BACKWARD Q2 ethnicre mar1 mar2 occunew edu2 edu3
edu4.
******Forward
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA COLLIN TOL CHANGE
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Q83_Re
/METHOD=FORWARD Q2 ethnicre mar1 mar2 ethnicre mar1 mar2
occunew edu2 edu3 edu4.
Ví dụ.
Hồi quy Logic (Logistic Regression)
compute agefirstsex3=9.
if (agefirstsex_cat= 3) agefirstsex3=1.
if (agefirstsex_cat=1) or (agefirstsex_cat=2) agefirstsex3=0.
VARIABLE LABELS agefirstsex3 ">24 had first intercourse".
value labels agefirstsex3 1 "had first sex at >24" 0"Other".
missing values agefirstsex3 (9).
Fitting full model.
Đã từng nạo thai = a + b1(tuổi) + b2(dân tộc) + b3(hôn
nhân) + b4(nghề nghiệp) + b5(học cấp 2) + b6(học cấp 3)
+ b7(trên cấp 3) + b8(tuổi lần đầu có sex)