You are on page 1of 3

ĐỀ KIỂM TRA GIỮA KỲ

PHÂN TÍCH THỐNG KÊ


Thời gian: 90 phút
Ngày: 20-10-2022..................................................................................................................................
Lớp: D20HTT01...................................................................................................................................
Họ tên: Nguyễn Thị Tuệ Giang...........................................................................................................
Mã số SV: 2024801040027...................................................................................................................

Câu 1 (6 đểm): Cho tập dữ liệu Luong_Dev. Dữ liệu về Số nă m kinh nghiệm, Điểm thi
nă ng khiếu, Bằ ng cấ p chuyên mô n và lương hà ng nă m ($1000) củ a mẫ u gồ m 20 lậ p
trình viên đượ c trình bà y như sau:

Phân tích mô hình quy đơn biến (hoặc đa biến) từ dữ liệu Luong_Dev
a. Tính hệ số tương quan giữa X={Exper, Score, Degr} và Y= {Salary} ?
b. Tìm các phương trình hồi quy, giả sử trục y đại diện cho Salary và x đại diện cho Exper,
Score, Degr.
c. Nếu sử dụng đúng 2 biến dự đoán để dự đoán, phương trình hồi quy 2 biến dự đoán (predictor)
nào ở trên là tốt nhất? Tại sao?
Phương trình hồi quy 2 biến dự đoán (predictor) tốt nhất là ở vị trí Exper=0,000 và Salary =
0.000 .Vì ở vị trí này Exper = Salary và khi viết ra phương trình hồi quy thì ta được: Salary = 0.000 –
0.000*Exper = 0.000 (Với mọi giá trị của Exper)
d. Phương trình hồi quy nào trong số các phương trình hồi quy trên là tốt nhất để dự đoán mức
lương? Tại sao? Phương trình hồi quy tốt nhất để dự đoán mức lương là : Salary = 25.702 –
2.106*Exper
e. Một nhân viên với năng lực là { Exper=5, Score=70, Degr=1}. Mức lương dự đoán tốt nhất cho
nhân viên này dự đoán là bao nhiêu? Mức lương dự đoán tốt nhất cho nhân viên này dự đoán là :
Salary = 25.702 – 2.106*5 = 15.172
08:50

1.a

1.b
Câu 3 (4 đểm): Cho tập dữ liệu titanic mô tả về các nạn nhân trong thảm kịch chìm tàu titanic.
Phân tích hồi quy logistic khảo sát dự đoán khả năng sống sót- survived của nạn nhân theo các
biến "pclass", "sex", "age", "embarked". Xây dựng mô hình hồi quy logistic với các biến đã mô
tả.

You might also like