Professional Documents
Culture Documents
Thành viên:
Bài làm
1. Hồi quy colgpa theo sat, tothrs, verbmath (Mô hình 1). Trình bày bảng kết quả
hồi quy, viết hàm hồi quy mẫu và diễn giải tác động nhân quả của biến sat lên
colgpa
*dulieu sử dụng các quan sát từ 401 đến 600 lấy từ tập gpa2
Mô hình 1:
lm(formula = colgpa ~ sat + tothrs + verbmath, data = dulieu)
Residuals:
Coefficients:
---
Signif. codes:
Ý nghĩa: Trong điều kiện tothrs, verbmath và các yếu tố khác không đổi, khi sat
tăng 1 điểm thì colgpa được ước lượng tăng 0.0024 điểm.
2. Sử dụng phần mềm R, tìm khoảng tin cậy cho hệ số của các biến trong Mô
hình 1, với độ tin cậy 95%, 99%. Giải thích kết quả thu được.
Với độ tin cậy 95%, ta thu được bảng sau từ phần mềm R:
2.5 % 97.5 %
β sat ∈ (0.0019;0.0029) → Với độ tin cậy 95%, khoảng tin cậy của hệ số hồi quy
β tothrs ∈ (-0.0006;0.0036) → Với độ tin cậy 95%, khoảng tin cậy của hệ số hồi quy
β verbmath ∈ (-0.5074;0.5383) → Với độ tin cậy 95%, khoảng tin cậy của hệ số hồi
Với độ tin cậy 99%, ta thu được bảng sau từ phần mềm R:
0.5 % 99.5 %
β sat ∈(0.0017;0.0031) → Với độ tin cậy 99%, khoảng tin cậy của hệ số hồi quy
3. Thu phần dư khi hồi quy Mô hình 1, đặt tên là phandu. Vẽ biểu đồ histogram
cho biến phandu và nhận xét hình dạng phân phối này có giống phân phối chuẩn
hay không? Thực hiện 1 kiểm định để kiểm tra xem biến phandu có phân phối
chuẩn hay không, kết luận với mức ý nghĩa 5%.
Nhận xét:
Với biểu đồ Histogram cho biến phandu như trên, ta thấy được hình dạng phân phối
này không đối xứng, do đó ta kết luận rằng biểu đồ Histogram của phandu không
giống phân phối chuẩn.
Kiểm định với phần mềm R:
data: phandu
Với mức ý nghĩa 5%, p-value = 1.198* 10−5 < α Bác bỏ H 0 → Biến phandu
không có phân phối chuẩn.
4. Dựa vào bảng kết quả hồi quy hãy cho biết trong các biến độc lập trên, biến
nào có ý nghĩa thống kê, biến nào không có ý nghĩa thống kê với mức ý nghĩa
5%. Trình bày rõ giả thuyết kiểm định và kết quả tương ứng.
sat
{ H 0 : β sat =0
H a : β sat ≠0
^
β sat −0 0.00 24−0
t= = =8
^
se ( β sat ) 0.0003
n−k−1
t α/ 2 = t 196
0.0 2 5= 1.960
|t |> t 196
0.02 5: Bác bỏ
H 0 → Biến sat có ý nghĩa thống kê → Điểm tổng hợp SAT có ảnh
tothrs
{ H 0 : β tothrs =0
H a : β tothrs ≠ 0
^
β tothrs −0 0.00 15−0
t= = = 1.3636
^
se ( β tothrs ) 0.00 11
n−k−1 196
t α / 2 = t 0.0 2 5= 1.960
|t |< t 196
0.0 2 5: Chưa đủ điều kiện bác bỏ H0 → Biến tothrs không có ý nghĩa thống kê
→ Tổng số giờ học kì học mùa thu không ảnh hưởng đến GPA sau kì học mùa thu.
verbmath
{ H 0 : β verbmath =0
H a : β verbmath ≠ 0
^
β verbmath −0 0.0 154−0
t= = = 0.0581
^
se ( β verbmath ) 0. 2651
n−k−1
t α/ 2 = t 196
0.0 2 5= 1.960
|t |< t 196
0.02 5: Chưa đủ điều kiện bác bỏ H 0 → Biến verbmath không có ý nghĩa thống kê
→ Điểm ngôn ngữ/toán SAT không ảnh hưởng đến GPA sau kì học mùa thu.
5. Có ý kiến cho rằng khi sat tăng 100 điểm thì colgpa trung bình tăng 0,15 điểm
(các yếu tố khác không đổi). Bạn có đồng ý hay không với mức ý nghĩa 1%?
{ H 0 : β sat =0 . 0015
H a : β sat ≠0 . 0015
^
β sat −0 .0015 0.00 24−0 .0015
t= = =3
se ( β^
sat )
0.0003
n−k−1
t α/ 2 = t 196
0.005= 2.576
|t |> t 196
0.005: Bác bỏ
H 0 → Không đồng ý với ý kiến trên
5. Hồi quy colgpa theo sat, tothrs, verbmath, hsize, hsrank, hsperc (Mô hình 2).
Trình bày bảng kết quả hồi quy, viết hàm hồi quy mẫu. Từ kết quả này và kết
quả hồi quy ở câu 1, hãy cho biết biến hsize, hsrank, hsperc có ý nghĩa thống kê
đồng thời hay không với mức ý nghĩa 5% (Tự tính toán). Kiểm tra lại kết quả
trên bằng việc sử dụng 1 kiểm định thích hợp trên phần mềm R.
*dulieu sử dụng các quan sát từ 401 đến 600 lấy từ tập gpa2
Mô hình 2:
Residuals:
Coefficients:
---
Signif. codes:
0.0011hsrank – 0.0114hsperc
(0.001) (0.0039)
N=200, R2=0.4364
Hàm hồi quy mẫu của Mô hình 1:
^
col gpa = 0.1316 + 0.0024 sat + 0.0015 tothrs + 0.0154 verbmath
(0.3422) (0.0003) ( 0.0011) (0.2651)
N=200, R2=0.3211
F 0.05(3;193) = 2.6
Kết luận: Biến hsize, hsrank, hsperc có ý nghĩa thống kê đồng thời với mức ý nghĩa
5%.
Hypothesis:
hsize = 0
hsrank = 0
hsperc = 0
1 196 51.386
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Kết luận: Biến hsize, hsrank, hsperc có ý nghĩa thống kê đồng thời với mức ý
nghĩa 5%.
7. Kiểm định sự phù hợp của Mô hình 1 và Mô hình 2 với mức ý nghĩa 5% bằng
cả 2 phương pháp p_value và giá trị tới hạn.
R 2 /k 0 .3211/3
F= = =30.9008
( 1−R ) /(n−k−1) (1−0 . 3211)/(200−3−1)
2
F 0.05(6;196) = 2.6
F 0.05(6;193) = 2.1