You are on page 1of 2

ĐỀ KIỂM TRA GIỮA KỲ

PHÂN TÍCH THỐNG KÊ


Thời gian: 90 phút
Ngày:......................................................................................................................................................
Lớp:........................................................................................................................................................
Họ tên:...................................................................................................................................................
Mã số SV:..............................................................................................................................................

Câu 1 (6 đểm): Cho tập dữ liệu Luong_Dev. Dữ liệu về Số nă m kinh nghiệm, Điểm thi
nă ng khiếu, Bằ ng cấ p chuyên mô n và lương hà ng nă m ($1000) củ a mẫ u gồ m 20 lậ p
trình viên đượ c trình bà y như sau:

Phân tích mô hình quy đơn biến (hoặc đa biến) từ dữ liệu Luong_Dev
a. Tính hệ số tương quan giữa X={Exper, Score, Degr} và Y= {Salary} ?
b. Tìm các phương trình hồi quy, giả sử trục y đại diện cho Salary và x đại diện cho Exper,
Score, Degr.
c. Nếu sử dụng đúng 2 biến dự đoán để dự đoán, phương trình hồi quy 2 biến dự đoán (predictor)
nào ở trên là tốt nhất? Tại sao?
d. Phương trình hồi quy nào trong số các phương trình hồi quy trên là tốt nhất để dự đoán mức
lương? Tại sao?
c. Một nhân viên với năng lực là { Exper=5, Score=70, Degr=1}. Mức lương dự đoán tốt nhất
cho nhân viên này dự đoán là bao nhiêu?

Câu 3 (4 đểm): Cho tập dữ liệu titanic mô tả về các nạn nhân trong thảm kịch chìm tàu titanic.
Phân tích hồi quy logistic khảo sát dự đoán khả năng sống sót- survived của nạn nhân theo các
biến "pclass", "sex", "age", "embarked". Xây dựng mô hình hồi quy logistic với các biến đã mô
tả.

You might also like