You are on page 1of 11

Nhóm 3

Thành viên:

Tên MSSV ĐÁNH GIÁ MỨC ĐỘ


ĐÓNG GÓP

Lê Thảo Lam 31201022342 10/10

Hoàng Phương Liễu 31201022362 10/10

Đặng Thị Thu Hà 31201022180 10/10

Nguyễn Thị Minh Chi 31201022099 10/10

Bài làm

1. Hồi quy colgpa theo sat, tothrs, verbmath (Mô hình 1). Trình bày bảng kết quả
hồi quy, viết hàm hồi quy mẫu và diễn giải tác động nhân quả của biến sat lên
colgpa

*dulieu sử dụng các quan sát từ 401 đến 600 lấy từ tập gpa2

Mô hình 1:
lm(formula = colgpa ~ sat + tothrs + verbmath, data = dulieu)

Residuals:

Min 1Q Median 3Q Max

-2.28402 -0.30708 0.06908 0.34400 1.21786

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 0.1316339 0.3422265 0.385 0.701

Sat 0.0023941 0.0002539 9.429 <2e-16 ***

Tothrs 0.0014777 0.0010566 1.399 0.164

verbmath 0.0154300 0.2651100 0.058 0.954

---

Signif. codes:

0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.512 on 196 degrees of freedom

Multiple R-squared: 0.3211, Adjusted R-squared: 0.3107

F-statistic: 30.9 on 3 and 196 DF, p-value: < 2.2e-16

 Hàm hồi quy mẫu của Mô hình 1:


^
col gpa = 0.1316 + 0.0024 sat + 0.0015 tothrs + 0.0154 verbmath

(0.3422)     (0.0003)    ( 0.0011)           (0.2651)

 Ý nghĩa: Trong điều kiện tothrs, verbmath và các yếu tố khác không đổi, khi sat
tăng 1 điểm thì colgpa được ước lượng tăng 0.0024 điểm.

2. Sử dụng phần mềm R, tìm khoảng tin cậy cho hệ số của các biến trong Mô
hình 1, với độ tin cậy 95%, 99%. Giải thích kết quả thu được.

 Với độ tin cậy 95%, ta thu được bảng sau từ phần mềm R:
2.5 % 97.5 %

(Intercept) -0.543285001 0.806552813

Sat 0.001893322 0.002894824

Tothrs -0.000606098 0.003561439

Verbmath -0.507404263 0.538264269

β sat ∈ (0.0019;0.0029) → Với độ tin cậy 95%, khoảng tin cậy của hệ số hồi quy

của biến sat là: (0.0019;0.0029).

β tothrs ∈ (-0.0006;0.0036) → Với độ tin cậy 95%, khoảng tin cậy của hệ số hồi quy

của biến tothrs là: (-0.0006;0.0036).

β verbmath ∈ (-0.5074;0.5383) → Với độ tin cậy 95%, khoảng tin cậy của hệ số hồi

quy của biến verbmath là: (-0.5074;0.5383).

 Với độ tin cậy 99%, ta thu được bảng sau từ phần mềm R:

0.5 % 99.5 %

(Intercept) -0.758546849 1.021814660

Sat 0.001733610 0.003054536

Tothrs -0.001270705 0.004226046


verbmath -0.674159511 0.705019518

β sat ∈(0.0017;0.0031) → Với độ tin cậy 99%, khoảng tin cậy của hệ số hồi quy

của biến sat là: (0.0017;0.0031).


β tothrs ∈ (-0.0013;0.0042) → Với độ tin cậy 99%, khoảng tin cậy của hệ số hồi

quy của biến tothrs là: (-0.0013;0.0042).


β verbmath ∈ (-0.6742;0.705) → Với độ tin cậy 99%, khoảng tin cậy của hệ số hồi

quy của biến verbmath là: (-0.6742;0.705).

3. Thu phần dư khi hồi quy Mô hình 1, đặt tên là phandu. Vẽ biểu đồ histogram
cho biến phandu và nhận xét hình dạng phân phối này có giống phân phối chuẩn
hay không? Thực hiện 1 kiểm định để kiểm tra xem biến phandu có phân phối
chuẩn hay không, kết luận với mức ý nghĩa 5%.

 Nhận xét:

Với biểu đồ Histogram cho biến phandu như trên, ta thấy được hình dạng phân phối
này không đối xứng, do đó ta kết luận rằng biểu đồ Histogram của phandu không
giống phân phối chuẩn.
 Kiểm định với phần mềm R:

H 0: Biến phandu tuân theo phân phối chuẩn

H a : Biến phandu không tuân theo phân phối chuẩn

Jarque Bera Test

data: phandu

X-squared = 22.664, df = 2, p-value = 1.198e-05

Với mức ý nghĩa 5%, p-value = 1.198* 10−5 < α  Bác bỏ H 0 → Biến phandu
không có phân phối chuẩn.

4. Dựa vào bảng kết quả hồi quy hãy cho biết trong các biến độc lập trên, biến
nào có ý nghĩa thống kê, biến nào không có ý nghĩa thống kê với mức ý nghĩa
5%. Trình bày rõ giả thuyết kiểm định và kết quả tương ứng.

 sat

{ H 0 : β sat =0
H a : β sat ≠0

^
β sat −0 0.00 24−0
t= = =8
^
se ( β sat ) 0.0003

n−k−1
t α/ 2 = t 196
0.0 2 5= 1.960

|t |> t 196
0.02 5: Bác bỏ
H 0 → Biến sat có ý nghĩa thống kê → Điểm tổng hợp SAT có ảnh

hưởng đến GPA sau kì học mùa thu.

 tothrs
{ H 0 : β tothrs =0
H a : β tothrs ≠ 0

^
β tothrs −0 0.00 15−0
t= = = 1.3636
^
se ( β tothrs ) 0.00 11

n−k−1 196
t α / 2 = t 0.0 2 5= 1.960

|t |< t 196
0.0 2 5: Chưa đủ điều kiện bác bỏ H0 → Biến tothrs không có ý nghĩa thống kê

→ Tổng số giờ học kì học mùa thu không ảnh hưởng đến GPA sau kì học mùa thu.

 verbmath

{ H 0 : β verbmath =0
H a : β verbmath ≠ 0

^
β verbmath −0 0.0 154−0
t= = = 0.0581
^
se ( β verbmath ) 0. 2651

n−k−1
t α/ 2 = t 196
0.0 2 5= 1.960

|t |< t 196
0.02 5: Chưa đủ điều kiện bác bỏ H 0 → Biến verbmath không có ý nghĩa thống kê

→ Điểm ngôn ngữ/toán SAT không ảnh hưởng đến GPA sau kì học mùa thu.

5. Có ý kiến cho rằng khi sat tăng 100 điểm thì colgpa trung bình tăng 0,15 điểm

(các yếu tố khác không đổi). Bạn có đồng ý hay không với mức ý nghĩa 1%?

Tăng 100 điểm → β sat =0 .15

Tăng 1 điểm → β sat =0 .0015

{ H 0 : β sat =0 . 0015
H a : β sat ≠0 . 0015

^
β sat −0 .0015 0.00 24−0 .0015
t= = =3
se ( β^
sat )
0.0003
n−k−1
t α/ 2 = t 196
0.005= 2.576

|t |> t 196
0.005: Bác bỏ
H 0 → Không đồng ý với ý kiến trên

5. Hồi quy colgpa theo sat, tothrs, verbmath, hsize, hsrank, hsperc (Mô hình 2).
Trình bày bảng kết quả hồi quy, viết hàm hồi quy mẫu. Từ kết quả này và kết
quả hồi quy ở câu 1, hãy cho biết biến hsize, hsrank, hsperc có ý nghĩa thống kê
đồng thời hay không với mức ý nghĩa 5% (Tự tính toán). Kiểm tra lại kết quả
trên bằng việc sử dụng 1 kiểm định thích hợp trên phần mềm R.

*dulieu sử dụng các quan sát từ 401 đến 600 lấy từ tập gpa2

Mô hình 2:

lm(formula = colgpa ~ sat + tothrs + verbmath + hsize + hsrank + hsperc, data =


dulieu)

Residuals:

Min 1Q Median 3Q Max


-2.10509 -0.23524 0.02781 0.34031 1.09327

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 1.3364644 0.3851567 3.470 0.000642 ***

Sat 0.0017088 0.0002640 6.472 7.81e-10 ***

Tothrs 0.0009615 0.0009771 0.984 0.326344

verbmath -0.1811786 0.2456508 -0.738 0.461686

-0.0022946 0.0298954 -0.077 0.938897

-0.0011473 0.0010018 -1.145 0.253503

-0.0113813 0.0038503 -2.956 0.003506 **

---

Signif. codes:

0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.4701 on 193 degrees of freedom

Multiple R-squared: 0.4364, Adjusted R-squared: 0.4189

F-statistic: 24.91 on 6 and 193 DF, p-value: < 2.2e-16

 Hàm hồi quy mẫu của Mô hình 2:


^
col gpa= 1.3365 + 0.0017sat + 0.001tothrs – 0.1812verbmath – 0.0023hsize –

(0.3852) (0.0003) (0.001) (0.2457) (0.0299)

0.0011hsrank – 0.0114hsperc

(0.001) (0.0039)

N=200, R2=0.4364
Hàm hồi quy mẫu của Mô hình 1:
^
col gpa = 0.1316 + 0.0024 sat + 0.0015 tothrs + 0.0154 verbmath
(0.3422)     (0.0003)    ( 0.0011)           (0.2651)

N=200, R2=0.3211

 Với mức ý nghĩa 5%, cần kiểm định:

{ H 0 : β hsize =β hs rank=β hsperc =0


H a : H 0 sai

(R2ur −R2r )/q


(0.4364−0.3211)/ 3
F= 2 = =13.16116631
(1−R )/(n−k−1) (1−0.4364)/ 193
ur

F 0.05(3;193) = 2.6

F > F 0.05(3;193) → Bác bỏ H 0

Kết luận: Biến hsize, hsrank, hsperc có ý nghĩa thống kê đồng thời với mức ý nghĩa
5%.

 Kiểm tra lại bằng phần mềm R:

Linear hypothesis test

Hypothesis:

hsize = 0

hsrank = 0

hsperc = 0

Model 1: restricted model


Model 2: colgpa ~ sat + tothrs + verbmath + hsize + +hsrank + hsperc

Res.Df RSS Df Sum of Sq F Pr(>F)

1 196 51.386

2 193 42.655 3 8.7316 13.169 7.363e-08 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Với mức ý nghĩa 5%, p-value = 7.363*10−8 < α → Bác bỏ H 0

Kết luận: Biến hsize, hsrank, hsperc có ý nghĩa thống kê đồng thời với mức ý
nghĩa 5%.

7. Kiểm định sự phù hợp của Mô hình 1 và Mô hình 2 với mức ý nghĩa 5% bằng
cả 2 phương pháp p_value và giá trị tới hạn.

 Kiểm định Mô hình 1:

 Phương pháp giá trị tới hạn:

{ H 0 : β sat =β tothrs= β verbmath=0


H a : H 0 sai

R 2 /k 0 .3211/3
F= = =30.9008
( 1−R ) /(n−k−1) (1−0 . 3211)/(200−3−1)
2

F 0.05(6;196) = 2.6

F > F 0.05(6;196) → Bác bỏ H 0 → Mô hình có ý nghĩa toàn bộ.

 Phương pháp P - value:

P - value: < 2.2e-16 < 5% → Bác bỏ H 0 → Mô hình có ý nghĩa toàn bộ.

 Kiểm định Mô hình 2:

 Phương pháp giá trị tới hạn:

{ H 0 : B sat =B tothrs =B verbmath=Bhsize =Bhsrank =Bhsperc =0


H a : H 0 sai
2
R /k 0. 4364/6
F= =
( 1−R ) /(n−k−1)
2 ¿¿

F 0.05(6;193) = 2.1

F > F 0.05(6;193) → Bác bỏ H 0 → Mô hình có ý nghĩa toàn bộ.

 Phương pháp P - value:

P - value: < 2.2e-16 < 5% → Bác bỏ H 0 → Mô hình có ý nghĩa toàn bộ.

You might also like