You are on page 1of 8

BÀI TẬP NHÓM TRÊN LỚP - LOGIT MODEL

Nhóm 4
Nguyễn Thành Quang
Đỗ Thị Minh Thư
Phạm Nhựt Hào
Lê Ngọc Toàn
Trần Nguyễn Nhật Tiến
Dữ liệu “titanic.csv” mô tả tình trạng của các nạn nhân trong vụ tai nạn đắm tàu Titanic, với các thông
tin như sau:
Survived: The survived indicator
Pclass: passenger class
Name: passenger’s Name
Sex: passenger’s gender
Age: passengers’s age
Siblings: number of siblings aboard
Parents.Children.Aboard: number of parents and children aboard
fare: the fare paid in british pound
Sử dụng dữ liệu trên để trả lời các câu hỏi sau:
1. Tạo bảng tỷ lệ phần trăm các thuộc tính của biến “Survived” theo biến “Pclass”.
2. Vẽ biểu đồ cột thể hiện tỷ lệ phần trăm các thuộc tính của biến “Survived” theo biến “Pclass”.

3. Ước lượng mô hình xác suất tuyến tính với biến phụ thuộc là “Survived”, và biến độc lập là
các biến còn lại trong dữ liệu. Nhận xét quan hệ giữa các biến trong mô hình.
Nhận xét: Các biến có ý nghĩa thống kê: Class1, Class2, Sexmale, Age,
Siblings.Spouses.Aboard vì nó có giá trị P nhỏ hơn 0.05.
Nếu chúng ta giữ nguyên tất cả các biến khác:
- Hành khách ở Class1 thì khả năng sống sót sẽ tăng với tỷ lệ sấp xỉ 0.36
- Hành khách ở Class2 thì khả năng sống sót sẽ tăng với tỷ lệ sấp xỉ 0.18
- Giới tính nam thì khả năng sống sót sẽ giảm vì có thể nhượng phao cho nữ với tỷ lệ 0.5
- Tuổi tăng thêm 1 thì khả năng sống sót sẽ giảm với tỷ lệ 0.006 vì có thể sức yếu hay
nhượng phao cho người trẻ.
- Anh chị em, vợ chồng ở nước ngoài tăng thêm 1 thì khả năng sống sót giảm 0.05

4. Tạo biến mới chứa thông tin dự báo xác suất sống sót của tất cả hành khách, từ mô hình xác
suất tuyến tính.
5. Sử dụng R và SPSS để ước lượng mô hình logit với biến phụ thuộc là “Survived”, và biến độc
lập là các biến còn lại trong dữ liệu. Nhận xét quan hệ giữa các biến trong mô hình.
Nhận xét:
Nếu các biến còn lại giữ nguyên không đổi:
- Hành khách ở Class1 thì khả năng sống sót sẽ tăng với tỷ lệ sấp xỉ 2.35
- Hành khách ở Class2 thì khả năng sống sót sẽ tăng với tỷ lệ sấp xỉ 1.19
- Giới tính nam thì khả năng sống sót sẽ giảm vì có thể nhường phao cho nữ với tỷ lệ 2.76
- Tuổi tăng thêm 1 thì khả năng sống sót sẽ giảm với tỷ lệ 0.04 vì có thể sức yếu hay nhượng
phao cho người trẻ.
- Anh chị em, vợ chồng ở nước ngoài tăng thêm 1 thì khả năng sống sót giảm 0.4
6. Từ kết quả mô hình trên, tính xác suất sống sót của hành khách có Pclass = 1, Sex = male,
Age = 50, Siblings = 2, Parents.Children.Aboard = 1, và fare = 110.

7. Tính tác động biên (marginal effects) tại giá trị trung bình của các biến độc lập của mô hình
trên.

8. Tạo biến mới chứa thông tin dự báo xác suất sống sót của tất cả hành khách, từ mô hình logit.
9. Xuất bảng kết quả mô hình xác suất tuyến tính và mô hình logit. Bình luận kết quả của hai mô
hình.

10. Linear Logit Model


Probability
Model

(Intercept) 0.79 *** 1.76 ***

(0.04) (0.28)

Age -0.01 *** -0.04 ***

(0.00) (0.01)

Siblings.Spouses.Aboard -0.05 *** -0.40 ***

(0.01) (0.11)

Parents.Children.Aboard -0.02 -0.11

(0.02) (0.12)

Fare 0.00 0.00


(0.00) (0.00)

First Class 0.36 *** 2.35 ***

(0.04) (0.30)

Second Class 0.18 *** 1.19 ***

(0.03) (0.23)

Male -0.51 *** -2.76 ***

(0.03) (0.20)

N 887 887

R2 0.40

AIC 808.41 796.93

BIC 851.50 835.23

Pseudo R2 0.49

*** p < 0.001; ** p < 0.01; * p < 0.05.

Bình luận:
Mô hình logit và xác suất tuyến tình nói chung cho các kết quả tương đối khác nhau về các tỷ
lệ sống sót, tỷ lệ của mô hình logit có phần lớn hơn LPM. Nhưng cả 2 mô hình đều lọc ra các
biến không phù hợp .Ta thấy mô hình logit phù hợp hơn trong tình huống này.
10. *Ước lượng mô hình probit với biến phụ thuộc là “Survived”, và biến độc lập là các biến còn
lại trong dữ liệu. Nhận xét quan hệ giữa các biến trong mô hình.
Nhận xét:
Nếu các biến khác còn lại vẫn giữ nguyên không đỏi:
- Hành khách ở Class1 thì khả năng sống sót sẽ tăng với tỷ lệ sấp xỉ 1.32
- Hành khách ở Class2 thì khả năng sống sót sẽ tăng với tỷ lệ sấp xỉ 0.66
- Giới tính nam thì khả năng sống sót sẽ giảm vì có thể nhượng phao cho nữ với tỷ lệ 1.63
- Tuổi tăng thêm 1 thì khả năng sống sót sẽ giảm với tỷ lệ 0.02 vì có thể sức yếu hay nhượng
phao cho người trẻ.
- Anh chị em, vợ chồng ở nước ngoài tăng thêm 1 thì khả năng sống sót giảm 0.23
11. *Tạo biến mới chứa thông tin dự báo xác suất sống sót của tất cả hành khách, từ mô hình
probit.

You might also like