You are on page 1of 51

2014

BÁ O CÁ O KINH TẾ LƯỢ NG

Tên thành viên nhóm:


Nguyễn Hoàng Mai: 1214160072 (20%)
Nguyễn Thị Nga: 1211160079 (20%)
Vũ Nhật Minh: 1214160075 (20%)
Vũ Hồng Minh: 1211160074 (20%)
Nguyễn Thị Ngân: 1212160080 (20%)
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Bảng thành tích đóng góp:

Họ và Tên Mã số sinh viên Phần trăm đóng góp

1. Nguyễn Hoàng Mai 1214160072 20%

2. Nguyễn Thị Nga 1211160079 20%

3. Vũ Nhật Minh 1214160075 20%

4. Vũ Hồng Minh 1211160074 20%

5. Nguyễn Thị Ngân 1212160080 20%

1|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Lời mở đầu


Trong cuộc sống hiện đại ngày nay, ngành kinh tế là một trong những ngành học có ý

nghĩa quyết định đến sự phát triển của xã hội nói chung và sự tăng trưởng của các quốc gia

nói riêng. Nhắc đến ngành học kinh tế, không thể không nhắc đến môn học Kinh tế lượng. Có

thể nói, kinh tế lượng chính là môn học không thể bỏ qua nhất trong tất cả các môn học của

chương trình đào tạo nhân lực phục vụ cho ngành kinh tế. Đặc thù của môn học này chính là

sự đòi hỏi phải phân tích định lượng các hiện tượng kinh tế, kiểm định sự phù hợp và độ tin

cậy của các giả thuyết trong quá trình hoạch định chính sách vĩ mô cũng như ra các quyết

định tác nghiệp, việc dự báo và dự đoán có độ tin cậy cao… Tất cả những đặc thù quan trọng

đó đã làm cho kinh tế lượng ngày càng phát triển, ngày càng gần gũi hơn với các bạn sinh

viên ngành kinh tế chính bởi yếu tố cần thiết và thực tế của nó. Nghiên cứu môn học này, các

bạn sinh viên sẽ có những cái nhìn toàn diện, thu thập được những kiến thức cơ bản và cụ thể

về việc phân tích những số liệu về các nhân tố ảnh hưởng đến vấn đề nào đó, từ đó vạch ra

những định hướng đúng đắn, xác thực hơn, để hoặc là tiếp tục phát triển vấn đề, hoặc là có

những phương pháp cần thiết để giải quyết vấn đề theo hướng phù hợp với thực tiễn và tính

chất của nó.

Sau một thời gian được học tập những kiến thức cơ bản về môn Kinh tế lượng dưới sự

chỉ dẫn tận tình của cô giáo Đinh Thị Thanh Bình, nhóm chúng em đã phần nào tiếp nhận

được lượng kiến thức mà môn học muốn truyền tải, từ đó áp dụng vào để thực hiện phân tích

và hoàn thành bản báo cáo cuối kỳ gồm hai bảng số liệu 15 và 39 này. Chúng em đã rất cố

gắng và dành nhiều công sức cho bản báo cáo này, tuy nhiên, do kiến thức của bản thân vẫn

còn non nớt và chưa thực sự có nhiều kinh nghiệm, nên chắc chắn chúng em vẫn còn gặp

nhiều sai sót trong quá trình phân tích. Chúng em rất mong nhận được ý kiến đóng góp của cô

và các bạn.

Chúng em xin chân thành cảm ơn!

2|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Mục lục Trang


A. Bảng số liệu số 15
I. Mô tả thống kê số liệu:........................................................................................6
1. Tổng quan:.......................................................................................................6
1.1. Sử dụng lệnh des để mô tả chung cho các biến:.........................................6
1.2. Sử dụng lệnh sum để tiếp tục mô tả các biến:.............................................7
2. Mô tả chi tiết các biến trong mô hình:............................................................8
2.1. Crime:.............................................................................................................8
2.2. Enroll:.........................................................................................................9
2.3. Priv:..........................................................................................................10
2.4. Police:.......................................................................................................11
2.5. Lenroll:.....................................................................................................12
2.6. Lpolice:.....................................................................................................13
II. Mô hình hồi quy và phân tích hồi quy............................................................14
1. Phân tích mối quan hệ tương quan giữa các biến:......................................14
2. Chạy mô hình hồi quy và phân tích kết quả:................................................16
3. Một số kiểm định F:.......................................................................................18
3.1. Kiểm định giả thuyết về hệ số hồi quy:.....................................................18
3.2. Kiểm định sự phù hợp của mô hình:.........................................................19
3.3. Kiểm định đa ràng buộc tuyến tính:.........................................................19
III. Kiếm định và sửa chữa một số khuyết tật của mô hình................................21
1. Vấn đề đa cộng tuyến:....................................................................................21
1.1. Bản chất:...................................................................................................21
1.2. Nguyên nhân:............................................................................................21
1.3. Cách phát hiện đa công tuyến:.................................................................22
1.4. Cách khắc phục:.......................................................................................22
2. Vấn đề về phương sai sai số thay đổi:...........................................................23
2.1. Bản chất:...................................................................................................23
2.2. Nguyên nhân:............................................................................................23
2.3. Cách phát hiện dấu hiệu của phương sai sai số thay đồi:........................23
3. Kiểm định vấn đề về phân phối chuẩn của sai số:.............................................25
3|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

4. Kết luận rút ra:...............................................................................................27


B. Bảng số liệu 39
I. Mô tả số liệu thống kê:......................................................................................29
1. Tổng quan.......................................................................................................29
1.1. Sử dụng lệnh des để mô tả chung cho các biến:.......................................29
1.2. Sử dụng lệnh sum để tiếp tục mô tả các biến:...........................................31
2. Mô tả chi tiết các biến trong mô hình:..........................................................32
2.1. ColGPA:....................................................................................................32
2.2. Hs GPA.....................................................................................................32
2.3. ACT:..........................................................................................................33
2.4. PC:............................................................................................................34
2.5. Bgfriend:...................................................................................................34
2.6. Skipped:.....................................................................................................35
2.7. Voluntr:.....................................................................................................35
II. Phân tích mô hình hồi quy:..............................................................................36
1. Phân tích mối quan hệ tương quan giữa các biến:......................................37
2. Chạy mô hình hồi quy và phân tích kết quả:................................................38
3. Một số kiểm định F:.......................................................................................40
3.1. Kiểm định đa ràng buộc tuyến tính:.........................................................40
3.2. Kiểm định sự phù hợp của mô hình:.........................................................41
III. Kiếm định và sửa chữa một số khuyết tật của mô hình................................42
1. Vấn đề đa cộng tuyến:....................................................................................42
1.1. Bản chất:...................................................................................................42
1.2. Nguyên nhân:............................................................................................42
1.3. Cách phát hiện đa công tuyến:.................................................................42
2.Vấn đề về phương sai sai số thay đổi:.................................................................43
2.1. Bản chất:...................................................................................................43
2.2. Nguyên nhân:............................................................................................43
2.3. Cách phát hiện dấu hiệu của phương sai sai số thay đồi:........................43
3. Kiểm định vấn đề về phân phối chuẩn của sai số:.............................................45
4. Kết luận rút ra:...............................................................................................47
Lời kết- Tài liệu tham khảo

4|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

5|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

A. BẢNG SỐ LIỆU SỐ 15


(CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN TỔNG SỐ LƯỢNG VỤ ÁN XẢY RA
TRONG KÝ TÚC XÁ)
Tên bảng số liệu: Campus.
Sau khi nhóm chúng em bàn bạc và suy luận chủ quan về sự ảnh hưởng của các biến,

chúng em đã đi đến kết luận về nội dung của bảng số liệu này, đó là nghiên cứu về: sự ảnh

hưởng của các nhân tố đến tổng số lượng vụ án xảy ra ở ký túc xá.

Cuộc sống ngày cảng phát triển, và đi cùng với sự phát triển chung của nhân loại, thì

dường như càng ngày con người càng sống cách xa nhau hơn, những vụ án xảy ra ngày cảng

nhiều hơn trên thế giới. Không chỉ ngày càng tăng thêm nhanh về số lượng, mà những hành vi

gây tội còn được diễn ra với phạm vi đa dạng và khó xác định vị trí hơn. Thậm chí, một trong

những địa điểm mà tội phạm dùng đề gây án lại chính là những khu ký túc xá của các trường

học. Như chúng ta đã biết, trường học cần phải là nơi có sự an toàn tuyệt đối với môi trường

vô hại hoàn toàn, thì mới có thể bảo vệ cho thế hệ tương lai một cách tốt nhất và đào tạo ra

lớp trí thức phục vụ cho sự phát triển của đất nước. Vậy nên, việc nghiên cứu về các nhân tố

ảnh hưởng đển tổng số lượng vụ án xảy ra ở ký túc xá là một điều hết sức quan trọng, để từ đó

tìm ra biện pháp khắc phục, giải quyết vấn đề theo hướng tích cực, và góp phần vạch ra

phương pháp làm giảm tổng số vụ án xảy ra ở ký túc xá.

Xét trong phạm vi một trường học, có rất nhiều yếu tố đề một vụ án có thể xảy ra.

Những yếu tố đó có thể là tổng số sinh viên trong ký túc xá, việc ký túc xá là của trường công

hay trường tư và tổng số cảnh sát được thuê để điều tra vụ án ký túc xá… Để tìm hiểu rõ hơn

về vấn đề này, chúng ta cần phải nhìn dưới góc nhìn của Kinh tế lượng, phân tích và kiểm

định các giả thuyết nhất định. Chúng em xin phân tích bảng số liệu số 15, để chúng em nói

riêng và các bạn sinh viên nói chung có cách hiểu tổng quan hơn về vấn đề này.

6|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

I. Mô tả thống kê số liệu:

1. Tổng quan:
Sau quá trình phân tích chủ quan về số liệu, đọc và hiểu ý nghĩa các biến được cho
trong bảng số liệu số 15, chúng em đã quyết định chạy mô hình hồi quy gồm các biến như
sau:
- Biến phụ thuộc: crime
- Biến độc lập (bao gồm có 5 biến):
 X1: enroll
 X2: priv
 X3: police
 X4: lenroll
 X5: lpolice

I.1. Sử dụng lệnh des để mô tả chung cho các biến:
Dưới đây là kết quả thu được của nhóm khi tiến hành mô tả thống kê biến phụ thuộc
và các biến độc lập bằng lệnh des với cấu trúc câu lệnh là:
“des crime enroll priv police lenroll lpolice”
 Sau khi chạy câu lệnh trong Stata chúng ta thu được kết quả sau:
. des crime enroll priv police lenroll lpolice

storage display value


variable name type format label variable label

---------------------------------------------------------------------

---------------------------------------------------------------

crime int %9.0g total campus crimes

enroll float %9.0g total enrollment

priv byte %9.0g =1 if private college

police byte %9.0g employed officers

lenroll float %9.0g log(enroll)

lpolice float %9.0g log(police)

Dựa vào kết quả thu được ta có bảng tổng hợp như sau:

Tên biến Định dạng hiển thị Đơn vị tính Ý nghĩa biến

7|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Tổng số vụ án xảy ra trong ký túc xá


Crime %9.0g Vụ án
của trường, tính theo đơn vị số vụ án

Tổng số sinh viên trong ký túc xá theo


Enroll %9.0g Sinh viên
ghi chép của Nhà trường

= 0 nếu trường đó không phải là

Priv %9.0g - trường Tư.

= 1 nếu trường đó là trường Tư.

Tổng số cảnh sát được thuê để điều tra


Police %9.0g Cảnh sát
vụ án ký túc xá của trường.

Logarit tự nhiên của giá trị tổng số


Lenroll %9.0g -
sinh viên ở trong ký túc xá của trường.

Logarit tự nhiên của giá trị tổng số


Lpolice %9.0g - cảnh sát được thuê để điều tra vụ án
ký túc xá của trường.

I.2. Sử dụng lệnh sum để tiếp tục mô tả các biến:
Tiếp tục sử dụng lện sum để mô tả số liệu. Lệnh sum cho biết số lượng quan sát
(Obs). Giá trị trung bình (Mean), độ lệch chuẩn (Std. dev) cũng như giá trị lớn nhất (Max)
và giá trị nhỏ nhất( Min ) của các biến.
Cấu trúc câu lệnh như sau:
“sum enroll priv police crime lcrime lenroll lpolice”
Sau khi chạy câu lệnh này trong Stata ta thu được kết quả:
sum crime enroll priv police lenroll lpolice

Variable | Obs Mean Std. Dev. Min Max

-------------+--------------------------------------------------------

crime | 97 394.4536 460.7839 1 2052

enroll | 97 16076.35 12298.99 1799 56350

priv | 97 .1237113 .3309624 0 1

police | 97 20.49485 15.63058 1 74

lenroll | 97 9.378556 .8317719 7.494986 10.93934

-------------+--------------------------------------------------------

8|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

lpolice | 97 2.730898 .8056453 0 4.304065

.
Sau khi đọc hiểu bảng trên ta có kết quả số liệu trong bảng sau:

Số quan Giá trị trung Độ lệch Giá trị nhỏ Giá trị lớn
Biến
sát bình chuẩn nhất nhất

Crime 97 394.4536 460.7839 1 2052

Enroll 97 16076.35 12298.99 1799 56350

Priv 97 0.1237113 0.3309624 0 1

Police 97 20.49485 15.63058 1 74

Lenroll 97 9.378556 0.8317719 7.494986 10.93934

Lpolice 97 2.730898 0.8056453 0 4.304065

2. Mô tả chi tiết các biến trong mô hình:


Để mô tả chi tiết từng biến một trong mô hình ta sửa dụng lệnh tab

2.1. Crime:
 Cấu trúc lệnh: “tab crime”
 Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:

. tab crime

total |

campus |

crimes | Freq. Percent Cum.

------------+-----------------------------------

1 | 2 2.06 2.06

15 | 1 1.03 3.09

17 | 1 1.03 4.12

25 | 1 1.03 5.15

38 | 1 1.03 6.19

42 | 1 1.03 7.22

9|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

43 | 2 2.06 9.28

44 | 1 1.03 10.31

47 | 1 1.03 11.34

50 | 1 1.03 12.37

53 | 1 1.03 13.40

54 | 1 1.03 14.43

55 | 1 1.03 15.46

56 | 1 1.03 16.49

58 | 1 1.03 17.53

62 | 1 1.03 18.56

64 | 1 1.03 19.59

65 | 1 1.03 20.62

67 | 1 1.03 21.65

72 | 1 1.03 22.68

82 | 1 1.03 23.71

83 | 1 1.03 24.74

85 | 1 1.03 25.77

89 | 1 1.03 26.80

90 | 2 2.06 28.87

103 | 1 1.03 29.90

106 | 1 1.03 30.93

--more—

Số lượng vụ án xảy ra tại KTX giao động từ 0 đến 414 trong đó phổ biến nhất là 170
vụ với mức tỉ lệ 3.09%. Tần số của các vụ án không hoặc ít lặp lại.

2.2. Enroll:
Cấu trúc lệnh: “tab enroll”
 Ta thu được kết qủa sau đây:
tab enroll

total |

enrollment | Freq. Percent Cum.

------------+-----------------------------------

1799 | 1 1.03 1.03

1859 | 1 1.03 2.06

2123 | 1 1.03 3.09


10 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

2167 | 1 1.03 4.12

2446 | 1 1.03 5.15

2746 | 1 1.03 6.19

3176 | 1 1.03 7.22

3256 | 1 1.03 8.25

3290 | 1 1.03 9.28

3712 | 1 1.03 10.31

3850 | 1 1.03 11.34

4100 | 1 1.03 12.37

4481 | 1 1.03 13.40

4720 | 1 1.03 14.43

5034 | 1 1.03 15.46

5112 | 1 1.03 16.49

5141 | 1 1.03 17.53

5363 | 1 1.03 18.56

5488 | 1 1.03 19.59

5601 | 1 1.03 20.62

5803 | 1 1.03 21.65

5861 | 1 1.03 22.68

6209 | 1 1.03 23.71

6271 | 1 1.03 24.74

6485 | 1 1.03 25.77


6555 | 1 1.03 26.80

6921 | 1 1.03 27.84

7116 | 1 1.03 28.87

--more--

Số lượng sinh viên trong ký túc xa trải đều từ 1799 sinh viên đến 56350 không có mức
tỷ lệ nào cao hơn mà đồng đều ở mức 1.03%.

2.3. Priv:
Cấu trúc lệnh: “tab priv”
 Ta thu được kết quả sau:
tab priv

=1 if |

private |
11 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

college | Freq. Percent Cum.

------------+-----------------------------------

0 | 85 87.63 87.63

1 | 12 12.37 100.00

------------+-----------------------------------

Total | 97 100.00

Có tổng số 12 ký túc xá được quan sát là ký túc xá trường tư chiếm 12.37%.
Có tổng số 85 ký túc xá được quan sát là ký túc xá không phải của trường tư, chiếm
87.63%.

2.4. Police:
Cấu trúc lệnh: “tab police”
 Ta thu được kết quả như sau:
tab police

employed |

officers | Freq. Percent Cum.

------------+-----------------------------------

1 | 1 1.03 1.03

2 | 1 1.03 2.06

3 | 1 1.03 3.09

4 | 1 1.03 4.12

5 | 5 5.15 9.28

6 | 3 3.09 12.37
7 | 6 6.19 18.56

8 | 5 5.15 23.71

9 | 6 6.19 29.90

10 | 3 3.09 32.99

11 | 3 3.09 36.08

12 | 5 5.15 41.24

13 | 1 1.03 42.27

14 | 5 5.15 47.42

15 | 2 2.06 49.48

16 | 3 3.09 52.58

17 | 2 2.06 54.64

18 | 1 1.03 55.67

19 | 3 3.09 58.76
12 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

20 | 2 2.06 60.82

21 | 3 3.09 63.92

22 | 1 1.03 64.95

24 | 3 3.09 68.04

25 | 3 3.09 71.13

26 | 3 3.09 74.23

27 | 3 3.09 77.32

28 | 1 1.03 78.35

30 | 1 1.03 79.38

--more--

Số lượng cảnh sát được thuê để điều tra vụ án dao động từ 1 đến 74 với mức phổ biến
nhất là 7 và 9 sĩ quan với mức tỉ lệ là 6.19%.

2.5. Lenroll:
Cấu trúc lệnh: “tab lenroll”
 Ta thu được kết quả như sau:
. tab lenroll

log(enroll) | Freq. Percent Cum.

------------+-----------------------------------

7.494986 | 1 1.03 1.03

7.527794 | 1 1.03 2.06

7.660585 | 1 1.03 3.09


7.681099 | 1 1.03 4.12

7.802209 | 1 1.03 5.15

7.917901 | 1 1.03 6.19

8.063377 | 1 1.03 7.22

8.088255 | 1 1.03 8.25

8.098643 | 1 1.03 9.28

8.219326 | 1 1.03 10.31

8.255829 | 1 1.03 11.34

8.318742 | 1 1.03 12.37

8.407601 | 1 1.03 13.40

8.459564 | 1 1.03 14.43

8.523971 | 1 1.03 15.46

8.539346 | 1 1.03 16.49


13 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

8.545003 | 1 1.03 17.53

8.587278 | 1 1.03 18.56

8.610319 | 1 1.03 19.59

8.6307 | 1 1.03 20.62

8.66613 | 1 1.03 21.65

8.676076 | 1 1.03 22.68

8.733755 | 1 1.03 23.71

8.743691 | 1 1.03 24.74

8.777247 | 1 1.03 25.77

8.787983 | 1 1.03 26.80

8.842316 | 1 1.03 27.84

8.870101 | 1 1.03 28.87

8.950274 | 1 1.03 29.90

--more—

Giá trị logarit tự nhiên của biến enroll giao động từ 7.494986 đến 10.93934 trong đó
mỗi mức giá trị đều chiếm 1.03%

2.6. Lpolice:
Cấu trúc lệnh: “tab lpolice”
 Ta thu được kết quả như sau:
tab lpolice

log(police) | Freq. Percent Cum.


------------+-----------------------------------

0 | 1 1.03 1.03

.6931472 | 1 1.03 2.06

1.098612 | 1 1.03 3.09

1.386294 | 1 1.03 4.12

1.609438 | 5 5.15 9.28

1.791759 | 3 3.09 12.37

1.94591 | 6 6.19 18.56

2.079442 | 5 5.15 23.71

2.197225 | 6 6.19 29.90

2.302585 | 3 3.09 32.99

2.397895 | 3 3.09 36.08

2.484907 | 5 5.15 41.24


14 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

2.564949 | 1 1.03 42.27

2.639057 | 5 5.15 47.42

2.70805 | 2 2.06 49.48

2.772589 | 3 3.09 52.58

2.833213 | 2 2.06 54.64

2.890372 | 1 1.03 55.67

2.944439 | 3 3.09 58.76

2.995732 | 2 2.06 60.82

3.044523 | 3 3.09 63.92

3.091043 | 1 1.03 64.95

3.178054 | 3 3.09 68.04

3.218876 | 3 3.09 71.13

3.258096 | 3 3.09 74.23

3.295837 | 3 3.09 77.32

3.332205 | 1 1.03 78.35

3.401197 | 1 1.03 79.38

3.433987 | 1 1.03 80.41

--more—

Giá trị logarit tự nhiên dao động từ 0 đến 4.304065 trong đó giá trị 1.94591 và giá trị
2.197225 xuất hiện thường xuyên nhất với mức 6.19%.

II. Mô hình hồi quy và phân tích hồi quy


 Hàm hồi quy tổng thể (PRF) và hàm hồi quy mẫu (SRF):
Chọn biến phụ thuộc Y là crime, các biến độc lập X1, X2, X3, X4, X5, lần lượt là enroll.
priv, police, lenroll, lpolice.
Như vậy ta có hàm hồi qui tổng thể PRF biểu diễn mối quan hệ phụ thuộc giữa Y và
các biến X như sau:
Crime = β0 + β1 * enroll + β2 * priv + β3 * police + β4* lenroll + β5* lpolice + ui
 Hàm hồi quy mẫu SRF là:
Crime = ^
^ β 0+ ^
β 1 * enroll + ^
β 2* priv + ^
β 3* police + ^
β 4 * lenroll + ^
β 5* lpolice

1. Phân tích mối quan hệ tương quan giữa các biến:
Trước khi phân tích bất kỳ một bảng số liệu kinh tế lượng nào, chúng ta đều cần phải
phân tích mối quan hệ tương quan giữa các biến, để xác định hệ số tương quan giữa chúng, và

15 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

quan trọng hơn, là để xem xét xem các biến trong mô hình có xảy ra hiện tượng đa cộng tuyến
hay không (Nếu R2 >= 0.8 thì xảy ra hiện tượng đa cộng tuyến).
Ta sử dụng lệnh Corr trong Stata với cấu trúc lệnh như sau:
“corr crime enroll priv police lenroll lpolice”
Được kết quả là bảng số liệu tương quan như sau:
corr crime enroll priv police lenroll lpolice

(obs=97)

| crime enroll priv police lenroll lpolice

-------------+------------------------------------------------------

crime | 1.0000

enroll | 0.8360 1.0000

priv | -0.2226 -0.3038 1.0000

police | 0.7233 0.7151 -0.2838 1.0000

lenroll | 0.7195 0.9099 -0.3588 0.6485 1.0000

lpolice | 0.6537 0.6940 -0.3568 0.9005 0.6924 1.0000

.
Từ bảng trên ta có thể thấy được hệ số tương quan của các biến như sau:
- Hệ số tương quan giữa crime và enroll là: 0.8360
- Hệ số tương quan giữa crime và priv là: - 0.2226
- Hệ số tương quan giữa crime và police là: 0.7233
- Hệ số tương quan giữa crime và lenroll là: 0.7195
- Hệ số tương quan giữa crime và lpolice là: 0.6537
Sau khi rút ra được các hệ số tương quan như trên, nhìn vào ta có thể nhận xét, trong
tất cả các nhân tố được nghiên cứu, thì biến enroll có mối tương quan mạnh nhất đến biến
crime (hệ số tương quan của biến này cao nhất, là 0.8360), hay nói cách khác, tổng số vụ sinh
viên trong ký túc xá của trường có mối ảnh hưởng mạnh nhất đến tổng số lượng vụ án xảy ra
trong ký túc xá của Nhà trường. Hệ số tương quan của biến enroll này mang dấu dương, cũng
chứng tỏ được mối quan hệ cùng chiều giữa biến enroll với biến crime, thể hiện nếu như tổng
số sinh viên trong ký túc xác của trường tăng, thì cũng sẽ dẫn tới tổng số lượng vụ án xảy ra
trong ký túc xá của trường cũng tăng theo. Ngược lại, biến priv có mối tương quan ít nhất đến
biến crime (hệ số tương quan của biến này nhỏ nhất là - 0.2226), hay nói cách khác, yếu tố
“trường Dân lập” có ảnh hưởng ít nhất đến tổng số vụ án xảy ra trong ký túc xá nhà trường.
Hệ số tương quan giữa biến priv và biến crime mang dấu âm chứng tỏ chúng có quan hệ

16 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

ngược chiều (nghịch) với nhau. Nếu trường được nghiên cứu là trường Dân lập thì tổng số vụ
án xảy ra trong ký túc xá Nhà trường sẽ thấp hơn so với trường không phải là trường Dân lập.
Dấu của hệ số tương quan cũng tương tự với các nhân tố khác, nếu mang dấu âm là
ngược chiều, còn mang dấu dương là thuận chiều. Các biến có quan hệ thuận chiều ở đây là:
enroll, police, lcrime, lpolice. Biến có quan hệ ngược chiều ở bảng số liệu này chỉ gồm 1
biến: priv
Ngoài ra, sau khi đọc các số liệu của bảng hệ số tương quan chúng ta cũng nhận thấy
rằng, mối quan hệ tương quan giữa các biến độc lập hầu hết không vượt quá giá trị 0.8. Tuy
nhiên, có hai biến độc lập có hệ số tương quan rất cao, đó là lpolice và police (hệ số tương
quan của hai biến này là 0.9005>0.8) và lenroll với enroll (hệ số tương quan của hai biến này
là 0.9099>0.8). Do vậy ta dự đoán mô hình có xảy ra hiện tượng đa cộng tuyến.

2. Chạy mô hình hồi quy và phân tích kết quả:


 Bước đầu tiên ta sử dụng lệnh reg để chạy mô hình hồi quy với cấu trúc câu
lệnh là: “reg crime enroll priv police lenroll lpolice”, thu được kết quả là bảng:
reg crime enroll priv police lenroll lpolice

Source | SS df MS Number of obs = 97

-------------+------------------------------ F( 5, 91) = 52.60

Model | 15143382 5 3028676.39 Prob > F = 0.0000

Residual | 5239508.09 91 57577.012 R-squared = 0.7429

-------------+------------------------------ Adj R-squared = 0.7288

Total | 20382890 96 212321.771 Root MSE = 239.95

------------------------------------------------------------------------------

crime | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

enroll | .0315662 .0053609 5.89 0.000 .0209175 .042215

priv | 38.41752 80.93085 0.47 0.636 -122.3417 199.1767

police | 9.733369 3.946817 2.47 0.016 1.893502 17.57324

lenroll | -106.5999 76.66161 -1.39 0.168 -258.8788 45.67894

lpolice | -48.7223 76.75522 -0.63 0.527 -201.1871 103.7425

_cons | 815.5561 619.467 1.32 0.191 -414.9391 2046.051

Sau khi chạy Stata được toàn bộ dữ liệu như trình bày ở trên, chúng ta tiến hành đọc
và phân tích số liệu. Trước hết, chúng ta thành lập được một bảng số liệu như sau:

17 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Tên biến Hệ số hồi quy Hệ số t P-value Khoảng tin cậy

Hệ số tự do 815.5561 1.32 0.191 [-414.9391; 2046.051]

Enroll 0.0315662 5.89 0.000 [0.0209175; 0.042215]

Priv 38.41752 0.47 0.636 [-122.3417; 199.1767]

Police 9.733369 2.47 0.016 [1.893502; 17.57324]

Lenroll -106.5999 -1.39 0.168 [-258.8788; 45.67894]

Lpolice -48.7223 -0.63 0.527 [-201.1871; 103.7425]

 Phương trình hồi quy mẫu của mô hình là:


Crime = 815.5561+ 0.0315662 * enroll + 9.733369 * police - 106.5999 * lenroll -
48.7223 * lpolice + ui.
 Phân tích kết quả hồi quy:
- Số quan sát Obs = 97.
- Tổng bình phương sai số tổng cộng SST = 20382890.
- Tổng bình phương sai số được giải thích SSE = 15143382.
- Tổng bình phương các phần dư SSR = 5239508.09.
- Bậc tự do của phần được giải thích Dfm= 5.
- Bậc tự do của phần dư Dfr = 91.
Hệ số xác định R2(R-squared) = 0.7429 thể hiện mức độ phù hợp của hàm hồi quy
mẫu là tương đối lớn. Bên cạnh đó, giá trị 0.7429 còn thể hiện tỷ lệ phần trăm biến động tổng
số vụ án xảy ra trong ký túc xá nhà trường được giải thích bởi các biến độc lập gồm: “Tổng số
sinh viên trong ký túc xá Nhà trường”, “có phải Trường tư hay không”, “tổng số cảnh sát
được thuê để điều tra vụ án”, “logarit tự nhiên giá trị của tổng số sinh viên trong trường”,
“logarit tự nhiên giá trị của tổng số cảnh sát được thuê” là 74,29%.
Hệ số xác định điều chỉnh R2 = 0.7288. Hệ số này có ý nghĩa: trong trường hợp nếu ta
đưa thêm biến vào mô hình, hệ số xác định điều chỉnh mà tăng thì việc đưa biến ấy có ý
nghĩa, và ngược lại.
Ý nghĩa các hệ số hồi quy trong mô hình:
 ^β = 815.5561 có ý nghĩa là: khi giá trị của các biến độc lập bằng 0 trong điều
0

kiện các yếu tố khác không đổi thì tổng số vụ án xảy ra trong ký túc xá là 815.5561.

18 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

 ^
β 1 = 0.0315662 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu
tăng thêm một sinh viên trong ký túc xá thì tổng số vụ án trung bình xảy ra trong ký túc xá
tăng thêm 0.0315662 vụ.
 ^
β 2 = 38.41752 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu
trường được nghiên cứu là trường tư thì tổng số vụ án trung bình xảy ra trong ký túc xá tăng
thêm 38.41752 vụ.
 ^
β 3 = 9.733369 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu
tăng thêm một cảnh sát được thuê để điều tra vụ án thì tổng số vụ án trung bình xảy ra trong
ký túc xá tăng thêm là 9.733369 (điều này có thể hiểu là: khi tăng lượng cảnh sát điều tra, thì
có nhiều vụ án được phá hơn, dẫn đến tìm ra nhiều vụ án xảy ra hơn (vì vụ án chỉ được tính
khi được điều tra của Cảnh sát) nên biến độc lập cảnh sát tỷ lệ thuận với biến phụ thuộc là phù
hợp với thực tế).
 ^β 4 = -106.5999 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu

lượng sinh viên trong ký túc xá tăng thêm 1% thì tổng số vụ án trung bình xảy ra trong ký túc
xá giảm đi là 1.065999 vụ.
 ^
β 5 = -48.7223 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu
lượng cảnh sát được thuê để điều tra các vụ án trong ký túc xá tăng thêm 1% thì tổng số vụ án
trung bình xảy ra trong ký túc xá giảm đi là 0.487223 vụ.
- Tuy nhiên, ta chỉ biết chắc chắn biến độc lập có thực sự ảnh hưởng đến biến
phụ thuộc với ý nghĩa hệ số hồi quy như ta đã phân tích ở trên hay không sau khi kiểm định
hệ số hồi quy cho mô hình.

3. Một số kiểm định F:

3.1. Kiểm định giả thuyết về hệ số hồi quy:
- Mục đích: kiểm định ảnh hưởng của từng biến độc lập lên giá trị trung bình
của biến phụ thuộc crime.
Có cặp giả thuyết thống kê:

{
H 0 : β i=0
H 1 : β i ≠ 0 với i =
1,5

Nếu giá trị P-value nhỏ hơn mức ý nghĩa α =0.05 thì bác bỏ Ho, chấp nhận H1, tức là
biến độc lập đó có ý nghĩa thống kê đối với crime.
- Theo bảng chạy hồi qui ở mục 2, ta thấy:
o Biến enroll: P-value = 0.000 < 0.05, loại bỏ H 0 vậy nên biến enroll có ý nghĩa
thống kê đối với crime.

19 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

o Biến priv: P-value = 0.636 > 0.05, chấp nhận H 0 vậy nên biến priv không có ý
nghĩa thống kê đối với crime.
o Biến police: P-value = 0.016 < 0.05, bác bỏ H0 vậy nên biến police có ý nghĩa
thống kê đối với crime.
o Biến lenroll: P-value = 0.168 > 0.05, chấp nhận H0 vậy nên biến lenroll không
có ý nghĩa thống kê đối với crime.
o Biến lpolice: P-value = 0.527 > 0.05, chấp nhận H0 vậy nên biến lpolice không
có ý nghĩa thống kê đối với biến crime.
→ Các biến priv, lenroll, lpolice không thực sự ảnh hưởng đến crime.

3.2. Kiểm định sự phù hợp của mô hình:


- Mục đích: xem xét trường hợp các tham số của biến độc lập β i đồng thời bằng 0 có
thể xảy ra hay không.
Có cặp giả thuyết thống kê:

{ H o : β1= β2= β3 =β 4=β 5=0


H 1 :∃ β i ≠ 0
Nếu giá trị Prob > F nhỏ hơn α với mức ý nghĩa α =0.05 thì bác bỏ Ho, chấp nhận H1
tức là hàm hồi quy mẫu phù hợp.
Cấu trúc câu lệnh như sau: “test enroll priv police lenroll lpolice”
Ta thu được kết quả sau sau khi chạy lệnh trong Stata:
test enroll priv police lenroll lpolice

( 1) enroll = 0

( 2) priv = 0

( 3) police = 0

( 4) lenroll = 0

( 5) lpolice = 0

F( 5, 91) = 52.60

Prob > F = 0.0000

Như vậy, Prob > F = 0.0000 nhỏ hơn α = 0.05, vì thế bác bỏ Ho.
→ Hệ số hồi qui của các biến độc lập không đồng thời bằng 0, mô hình hồi quy phù
hợp.

3.3. Kiểm định đa ràng buộc tuyến tính:


 Giả sử 2 yếu tố là enroll và priv đều cùng không ảnh hưởng tới crime:

20 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Cặp giả thuyết cần kiểm định:

{HHo:1 : βTồntại
1 = β =0
2
≠0
Sử dụng lệnh test trong stata để kiểm định, cấu trúc lệnh: “test enroll priv”:
Ta thu được kết quả sau:
test enroll priv

( 1) enroll = 0

( 2) priv = 0

F( 2, 91) = 17.68

Prob > F = 0.0000

Vì giá trị P-value = 0.0000 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 2 yếu tố enroll và priv ảnh hưởng đến biến phụ thuộc
crime.
 Giả sử 3 yếu tố là enroll, priv và police đều cùng không ảnh hưởng tới crime:
Cặp giả thuyết cần kiểm định:

{ Ho : β 1=β 2=β 3=0


H 1:Tồn tại β i ≠ 0
Sử dụng lệnh test trong Stata để kiểm định, cấu trúc câu lệnh như sau:
“test enroll priv police”
Ta thu được kết quả sau:
test enroll priv police

( 1) enroll = 0

( 2) priv = 0

( 3) police = 0

F( 3, 91) = 21.10

Prob > F = 0.0000

Vì giá trị P-value = 0.0000 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 3 yếu tố enroll, priv và police ảnh hưởng đến biến phụ
thuộc crime.
 Giả sử 3 yếu tố là police, lenroll và lpolice đều cùng không ảnh hưởng tới biến
crime:
21 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Cặp giả thuyết cần kiểm định:

{ Ho:=β 3=β 4 =β5 =0


H 1 :Tồntại β i ≠ 0
Sử dụng lệnh test trong stata để kiểm định với cấu trúc lệnh như sau:
“test police lenroll lpolice”
Ta thu được kết quả như sau:
test police lenroll lpolice

( 1) police = 0

( 2) lenroll = 0

( 3) lpolice = 0

F( 3, 91) = 5.06

Prob > F = 0.0027

Vì giá trị P-value = 0.0027 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 3 yếu tố police, lenroll và lpolice ảnh hưởng đến biến phụ
thuộc crime.
III. Kiếm định và sửa chữa một số khuyết tật của mô hình

1. Vấn đề đa cộng tuyến:

1.1. Bản chất:


Mô hình tốt là mô hình phải đạt được các tính chất BLUE (tuyến tính, không chệch,
hiệu quả nhất). Tuy nhiên trên thực tế do xây dựng sai mô hình hoặc do bản chất của dữ liệu,
dẫn tới mô hình không đạt được đầy đủ các tính chất trên. Một trong những vấn đề ảnh hưởng
đến mô hình mà ta gọi là vi phạm các giả định, đó là đa cộng tuyến.
Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các biến độc
lập Xi trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau.

1.2. Nguyên nhân:


Có 3 nguyên nhân gây ra vấn đề đa cộng tuyến:
o Đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa
cộng tuyến hoàn hảo ít khi xảy ra.
o Đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội
mà các biến độc lập đã có sẵn mối quan hệ cộng tuyến với nhau
o Đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn, hay số
liệu điều tra không ngẫu nhiên.

22 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

1.3. Cách phát hiện đa công tuyến:


Dùng lệnh corr [indep] để kiểm định đa cộng tuyến. Nếu giữa 2 biến có giá trị
corr > 0.8 thì mô hình có khả năng xảy ra đa cộng tuyến.
Sử dụng phần mềm stata và lệnh corr, ta thu được kết quả như sau:
. corr crime enroll priv police lenroll lpolice

(obs=97)

| crime enroll priv police lenroll lpolice

-------------+------------------------------------------------------

crime | 1.0000

enroll | 0.8360 1.0000

priv | -0.2226 -0.3038 1.0000

police | 0.7233 0.7151 -0.2838 1.0000

lenroll | 0.7195 0.9099 -0.3588 0.6485 1.0000

lpolice | 0.6537 0.6940 -0.3568 0.9005 0.6924 1.0000

Từ bảng số liệu trên, ta thấy:


 corr (enroll, lenroll) = 0.9099 > 0.8
 corr (police, lpolice)= 0.9005 > 0.8

→ Do đó có xảy ra vấn đề đa cộng tuyến.

1.4.Cách khắc phục:


 Bỏ một số biến cộng tuyến ra khỏi mô hình: lenroll và lpolice ta có kết quả
lệnh corr như sau:

. corr crime enroll priv police

(obs=97)

| crime enroll priv police

-------------+------------------------------------

crime | 1.0000

enroll | 0.8360 1.0000

priv | -0.2226 -0.3038 1.0000

police | 0.7233 0.7151 -0.2838 1.0000

Phương pháp này tuy khắc phục được sự đa cộng tuyến nhưng lại vô tình làm mất đi
các biến có ý nghĩa trong nghiên cứu . Việc loại bỏ biến ra khỏi mô hình phải được cân nhắc
cẩn thận giữa sai lệch khi bỏ biến cộng tuyến với việc tăng phương sai của các ước lượng hệ
số khi biến đó ở trong mô hình.
 Tăng kích cỡ mẫu:
23 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến cùng các
biến trong mẫu ban đầu mà cộng tuyến có thể không nghiêm trọng nữa. Điều này thực hiện
được khi chi phí cho việc lấy mẫu khác có thể chấp nhận được trong thực tế. Đối với nghiên
cứu này, cần phải điều tra thêm những khu ký túc xá khác để làm cho hiện tượng đa cộng
tuyến giảm xuống có thể giảm tính nghiêm trọng của đa cộng tuyến.

2. Vấn đề về phương sai sai số thay đổi:

2.1. Bản chất:


Một vấn đề khác mà mô hình cũng có thể gặp phải, đó là phương sai của sai số thay
đổi. Hậu quả của phương sai sai số thay đổi là các ước lượng bình phương nhỏ nhất vẫn là
không chệch nhưng không còn hiệu quả nữa, cùng với đó ước lượng của các phương sai sẽ bị
chệch, như vậy làm mất hiệu lực của kiểm định. Điều này làm cho mô hình kém hiệu quả hơn.
Phương sai của mỗi một ngẫu nhiên Ui, trong điều kiện giá trị đã cho của biến giải
thích Xi là không đổi, nghĩa là:
2
Var (U i/ X i)=E [U i – E ( U i )] = E(U i )2= σ 2; i = 1,2,3…n
Khi giả thiết đó bị vi phạm thì mô hình mắc lỗi phương sai sai số thay đổi. Tên gọi của
lỗi này là Heteroskedasticity.

2.2. Nguyên nhân:


Có 5 nguyên nhân gây ra hiện tượng phương sai sai số thay đổi:
o Do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không
gian được điều tra trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế
theo thời gian được điều tra qua các giai đoạn có mức biến động khác nhau thì phương sai sai
số có thể không đồng đều.
o Do định dạng không đúng dạng hàm của mô hình.
o Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn
xuất hiện các quan sát ngoại lai.
o Do kỹ thuật thu thập, bảo quản và xử lý số liệu đượccải tiếnnên sai số có xu
hướng giảm.
o Học được các sai lầm trong quá khứ, nhờ thế cải tiến trong hiện tại.

2.3. Cách phát hiện dấu hiệu của phương sai sai số thay đồi:
 Cách 1: Xem xét đồ thị của phần dư:

Trong cách này ta sẽ sử dụng đồ thị của sai số của hồi qui e (phần dư) với giá trị dự
đoán Yi (biểu diễn sự tương quan giữa e và Yi).

24 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Từ cơ sở dữ liệu đã cho và phần mềm stata, sử dụng lệnh rvfplot, yline (0) ta xây dựng
được Đồ thị sau:

Dựa vào lí thuyết kinh tế lượng đã được học và đồ thị vừa xây dựng được, ta thấy các
giá trị trên đồ thị phân bố không đồng đều, các giá trị tuy có xoay xung quanh giá trị trung
bình bằng 0 (đường ngang màu đỏ), tuy nhiên tỉ lệ rời xa giá trị trung bình bằng 0 còn khá
lớn. Vì thế, ta có thể dự đoán được mô hình có hiện tượng phương sai sai số thay đổi.

 Cách 2: Dùng kiểm định White:

Cặp giả thuyết: { H 0 : môhình có PSSS không đổi


H 1 :mô hìnhcó PSSS thay đổi
Nếu giá trị Prob > chi2 và <0.05, chúng ta bác bỏ giả thiết H0 và chấp nhận giả thiết
H1, có nghĩa là mô hình có hiện tượng phương sai sai số thay đổi.
Sử dụng phần mềm stata, ta thu được bảng kết quả như sau:
. imtest, white

White's test for Ho: homoskedasticity

against Ha: unrestricted heteroskedasticity

chi2(19) = 33.19

Prob > chi2 = 0.0229

Cameron & Trivedi's decomposition of IM-test

---------------------------------------------------

Source | chi2 df p

---------------------+-----------------------------

25 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Heteroskedasticity | 33.19 19 0.0229

Skewness | 3.63 5 0.6037

Kurtosis | 1.95 1 0.1631

---------------------+-----------------------------

Total | 38.76 25 0.0389

---------------------------------------------------

Từ bảng trên, kết quả kiểm định bằng lệnh imtest, white cho thấy Prob > chi2 =
0.0229< 0.05 => Bác bỏ giả thiết H0, H1 đúng hay mô hình có phương sai sai số thay đổi (với
mức ý nghĩa 5%).
 Cách 3: Dùng kiểm định Breusch – Pagan:

Cặp giả thuyết: { H 0 : mô hình có PSSS không đ ố i


H 1 :mô hìnhcó PSSS thay đ ố i
Sử dụng phần mềm stata và lệnh hettest, ta thu được kết quả như sau:
. hettest

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Ho: Constant variance

Variables: fitted values of crime

chi2(1) = 72.08

Prob > chi2 = 0.0000

Từ kết quả thu được, ta thấy Prob > chi2 = 0.0000 < 0.05 => Bác bỏ giả thiết H 0 hay
mô hình có phương sai sai số thay đổi (với mức ý nghĩa 5%)

KẾT LUẬN: Với kết quả của các kiểm định trên ta có thể kết luận được rằng có xảy ra
hiện tượng phương sai sai số thay đổi.

3. Kiểm định vấn đề về phân phối chuẩn của sai số:


Bước 1: Dự đoán
- Tạo biến phần dư của mô hình, sử dụng lệnh : predict r, resid ( với r là biến thể
hiện giá trị của phần dư residual)
- Sử dụng lệnh : kdensity r, normal

26 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Kernel density estimate

.003
.002
Density
.001
0

-1000 -500 0 500 1000


Residuals

Kernel density estimate


Normal density
kernel = epanechnikov, bandwidth = 41.5518

 Có thể mô hình phân phối chuẩn.


Bước 2: Kiểm định
 Sử dụng lệnh “sktest r” để kiểm định, ta có bảng kết quả sau:

sktest r

Skewness/Kurtosis tests for Normality

------- joint ------

Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2

-------------+---------------------------------------------------------------

r | 97 0.0000 0.0000 29.67 0.0000

P value = 0, bác bỏ H0, u không phân phối chuẩn, không có cách sửa chữa ngoài việc
tăng mẫu hoặc thay bằng mẫu có giá trị lớn hơn. Stata không thể sửa chữa, mẫu càng nhiều,
khả năng phân phối chuẩn càng lớn.

27 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

4. Kết luận rút ra:


Như vậy, chúng ta có thể thấy rằng, việc nghiên cứu các nhân tố ảnh hưởng đến tổng
số vụ án trong ký túc xá bằng phương pháp phân tích số liệu của Kinh tế lượng là một điều
hết sức cần thiết. Có những biến ban đầu theo cảm nhận chủ quan, chúng ta thấy rõ ràng nó có
sức ảnh hưởng rất lớn đến biến phụ thuộc mà chúng ta nghiên cứu, nhưng qua quá trình phân
tích, tìm hiểu, chạy số liệu hồi quy với Stata, chúng ta mới nhận thấy rằng trên thực tế nó
chẳng có ảnh hưởng (hoặc ảnh hưởng rất nhỏ), cũng có những biến ban đầu tưởng chừng
chẳng liên quan đến biến phụ thuộc, nhưng sau khi nghien cứu thì chúng ta lại nhận ra sự cần
thiết của nó đối với mô hình.
Qua sự phân tích, tìm hiểu này, chúng ta đã rút ra được những biến độc lập nào trực
tiếp ảnh hưởng lớn đến tổng số các vụ án xảy ra trong ký túc xá, từ đó có thể xây dựng kế
hoạch, hướng đi phù hợp để hạn chế và làm giảm các vụ án xảy ra. Ví dụ, tổng số lượng sinh
viên trong ký túc xá có ảnh hưởng lớn đến số vụ án gây ra, thì chúng ta khắc phục bằng cách
chia nhỏ các khu ký túc xá để quản lý nghiêm túc và dễ dàng hơn. Đối với những nhân tố
không có ảnh hưởng nhiều đến tổng số vụ án xảy ra tại ký túc xá, thì chúng ta không cần mất
công nghiên cứu quá nhiều về nó.
Có thể nói, Kinh tế lượng đã giúp một phần không nhỏ trong quá trình xây dựng, triển
khai các kế hoạch thực tiễn để giải quyết các vấn đề thực tiển, mà một ví dụ cụ thể chính là
vấn đề mà chúng ta vừa nghiên cứu căn bản qua bảng số liệu số 15

28 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

B. BẢNG SỐ LIỆU SỐ 39


(CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN ĐIỂM GPA CỦA SINH VIÊN TRƯỜNG
ĐẠI HỌC MICHIGAN STATE UNIVERSITY TẠI MỸ)
Tên bảng số liệu: GPA1_DTA.
Như chúng ta đã biết và đặc biệt đối với các bạn sinh viên, GPA là một trong những thước

đo trình độ và năng lực của một cá nhân trong quá trình học tập và rèn luyện tại trường trung

học và giảng đường đại học. Được tính bởi điểm trung bình chung các môn học hay học phần

tích lũy, GPA là kết quả học tập của cá nhân , dựa theo các thang điểm khác nhau của mỗi

trường trung học và hệ cao đẳng đại học. Nghiên cứu, xem xét sự ảnh hưởng của các yếu tố

khác nhau lên điểm trung bình GPA góp phần đẩy mạnh cải cách và hoàn thiện giáo dục và

hạn chế những ảnh hưởng tiêu cực từ môi trường xung quanh và bản thân mỗi cá nhân.

Trong bài báo cáo này, chúng em xin được sử dụng bộ số liệu thống kê điểm GPA của

sinh viên và một số thông số liên quan tại trường đại học bang Michigan, Hoa Kỳ để xem xét

xem, liệu điểm GPA của sinh viên phụ thuộc vào những yếu tố nào và mức độ ảnh hưởng của

các yếu tố đó ra sao. Mong rằng nhờ có ứng dụng Stata – công cụ đo lường đặc trưng của kinh

tế lượng, bản báo cáo sẽ rút ra được nhiều điều thú vị và bổ ích.

29 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

I. Mô tả số liệu thống kê:

1. Tổng quan
Trong đề tài này chúng em nêu ra và phân tích các yếu tố ảnh hưởng đến điểm
trung bình (GPA) tại Đại học bang Michigan (MSU). Theo đó có rất nhiều yếu tố ảnh
hưởng đến điểm GPA của sinh viên như điểm GPA trung học, điểm ACT v.v…

1.1. Sử dụng lệnh des để mô tả chung cho các biến:
Sử dụng lệnh des để mô tả các biến trong bảng dữ liệu ta thu được kết quả:
. des

Contains data from C:\Users\Sovietskiy Soyuz\Desktop\file data\39_GPA1.DTA

obs: 141

vars: 29 8 Jul 1998 11:14

size: 5,781

--------------------------------------------------------------------------

-------------------------------------------------------------------

storage display value

variable name type format label variable label

--------------------------------------------------------------------------

-------------------------------------------------------------------

age byte %9.0g in years

soph byte %9.0g =1 if sophomore


junior byte %9.0g =1 if junior

senior byte %9.0g =1 if senior

senior5 byte %9.0g =1 if fifth year senior

male byte %9.0g =1 if male

campus byte %9.0g =1 if live on campus

business byte %9.0g =1 if business major

engineer byte %9.0g =1 if engineering major

colGPA float %9.0g MSU GPA

hsGPA float %9.0g high school GPA

ACT byte %9.0g 'achievement' score

job19 byte %9.0g =1 if job <= 19 hours

job20 byte %9.0g =1 if job >= 20 hours

30 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

drive byte %9.0g =1 if drive to campus

bike byte %9.0g =1 if bicycle to campus

walk byte %9.0g =1 if walk to campus

voluntr byte %9.0g =1 if do volunteer work

PC byte %9.0g =1 of pers computer at sch

greek byte %9.0g =1 if fraternity or sorority

car byte %9.0g =1 if own car

siblings byte %9.0g =1 if have siblings

bgfriend byte %9.0g =1 if boy- or girlfriend

--more--

Sau khi cân nhắc kĩ lưỡng chúng em quyết định chọn biến colGPA làm biến phụ thuộc
và các biến: ACT, hsGPA, PC, bgfriend, skipped, voluntr làm biến độc lập. Tiến hành mô tả
biến độc lập và biến phụ thuộc bằng lệnh des ta thu được kết quả như sau:
. des colGPA hsGPA ACT PC bgfriend skipped voluntr

storage display value

variable name type format label variable label

---------------------------------------------------------------------

------------------------------------------------------------------------

colGPA float %9.0g MSU GPA

hsGPA float %9.0g high school GPA

ACT byte %9.0g 'achievement' score


PC byte %9.0g =1 of pers computer at

sch

bgfriend byte %9.0g =1 if boy- or

girlfriend

skipped float %9.0g avg lectures missed per

week

voluntr byte %9.0g =1 if do volunteer work

Theo bảng trên ta có thể hiểu được ý nghĩa của các biến như sau:
o colGPA: điểm GPA tại MSU.
o hsGPA: điểm GPA tại trường trung học.
o ACT: điểm trong kì thi ACT.
o PC: biến giả cho biết có sở hữu máy vi tính hay không.
o bgfriend: biến giả có bạn trai/bạn gái hay không.

31 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

o skipped: số buổi nghỉ học trung bình một tuần


o voluntr: biến giả cho biết có tham gia tình nguyện hay không.

1.2. Sử dụng lệnh sum để tiếp tục mô tả các biến:

Tiếp tục sử dụng lện sum để mô tả số liệu. Lệnh sum cho biết số lượng quan sát
(Obs). Giá trị trung bình (Mean), độ lệch chuẩn (Std. dev) cũng như giá trị lớn nhất (Max)
và giá trị nhỏ nhất( Min ) của các biến.
sum colGPA hsGPA ACT PC bgfriend skipped voluntr

Variable | Obs Mean Std. Dev. Min Max

-------------+--------------------------------------------------------

colGPA | 141 3.056738 .3723103 2.2 4

hsGPA | 141 3.402128 .3199259 2.4 4

ACT | 141 24.15603 2.844252 16 33

PC | 141 .3971631 .4910547 0 1

bgfriend | 141 .4751773 .5011638 0 1

-------------+--------------------------------------------------------

skipped | 141 1.076241 1.088882 0 5

voluntr | 141 .2198582 .4156269 0 1

Sau khi phân tích kết quả ta được bảng sau:

Số quan Trung Độ lệch Giá trị nhỏ Giá trị lớn


Biến
sát bình chuẩn nhất nhất

colGPA 141 3.056738 0.3723103 2.2 4

hsGPA 141 3.402128 0.3199259 2.4 4

ACT 141 24.15603 2.844252 16 33

PC 141 0.3971631 0.4910547 0 1

Bgfrien
141 0.4751773 0.511638 0 1
d

Skipped 141 1.076241 1.088882 0 5

voluntr 141 0.2198582 0.4156269 0 1

32 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

2. Mô tả chi tiết các biến trong mô hình:

2.1. ColGPA:
 Tiếp tục sử dụng lênh tab để mô tả chi tiết các biến ta thu được:
tab colGPA

MSU GPA | Freq. Percent Cum.

------------+-----------------------------------

2.2 | 1 0.71 0.71

2.3 | 1 0.71 1.42

2.4 | 2 1.42 2.84

2.5 | 7 4.96 7.80

2.6 | 7 4.96 12.77

2.7 | 10 7.09 19.86

2.8 | 15 10.64 30.50

2.9 | 16 11.35 41.84

3 | 24 17.02 58.87

3.1 | 6 4.26 63.12

3.2 | 10 7.09 70.21

3.3 | 8 5.67 75.89

3.4 | 10 7.09 82.98

3.5 | 9 6.38 89.36

3.6 | 5 3.55 92.91

3.7 | 3 2.13 95.04

3.8 | 4 2.84 97.87

3.9 | 2 1.42 99.29

4 | 1 0.71 100.00

------------+-----------------------------------

Total | 141 100.00

Điểm trung bình trải dài từ 2.2 đến 4 trong đó mức 3.0 là phổ biến nhất với 24 lần xuất
hiện, chiếm 17.02%.

2.2. Hs GPA
Cấu trúc câu lệnh: “tab hsGPA”:
 Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab hsGPA

33 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

high school |

GPA | Freq. Percent Cum.

------------+-----------------------------------

2.4 | 1 0.71 0.71

2.5 | 1 0.71 1.42

2.7 | 1 0.71 2.13

2.8 | 1 0.71 2.84

2.9 | 4 2.84 5.67

3 | 18 12.77 18.44

3.1 | 6 4.26 22.70

3.2 | 11 7.80 30.50

3.3 | 17 12.06 42.55

3.4 | 13 9.22 51.77

3.5 | 19 13.48 65.25

3.6 | 17 12.06 77.30

3.7 | 13 9.22 86.52

3.8 | 9 6.38 92.91

3.9 | 4 2.84 95.74

4 | 6 4.26 100.00

------------+-----------------------------------

Total | 141 100.00

Điểm GPA trung học đạt từ 2.4 đến 4.0 trong đó mức GPA 3.5 là phổ biến nhất với 19
lần xuất hiện chiếm 13.48%.

2.3. ACT:
Cấu trúc câu lệnh: “tab ACT”:
 Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab ACT

'achievemen |

t' score | Freq. Percent Cum.

------------+-----------------------------------

16 | 2 1.42 1.42

19 | 6 4.26 5.67

20 | 2 1.42 7.09

21 | 13 9.22 16.31

34 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

22 | 13 9.22 25.53

23 | 23 16.31 41.84

24 | 25 17.73 59.57

25 | 11 7.80 67.38

26 | 18 12.77 80.14

27 | 13 9.22 89.36

28 | 6 4.26 93.62

29 | 4 2.84 96.45

30 | 3 2.13 98.58

31 | 1 0.71 99.29

33 | 1 0.71 100.00

------------+-----------------------------------

Total | 141 100.00

Mức điểm ACT giao động từ 16 đến 33 trong đó mức 24 là phổ biến nhất với 17.73%.

2.4. PC:
Cấu trúc câu lệnh: “tab PC”
. tab PC

=1 of pers |

computer at |

sch | Freq. Percent Cum.

------------+-----------------------------------

0 | 85 60.28 60.28

1 | 56 39.72 100.00

------------+-----------------------------------

Total | 141 100.00

Trong số 141 sinh viên được hỏi có 85 sinh viên không sở hữu máy tính (60.28%) và
56 sinh viên có sở hữu máy tính (39,72%).

2.5. Bgfriend:
Cấu trúc câu lệnh: “tab bgfriend”:
 Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab bgfriend

=1 if boy- |

35 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

or |

girlfriend | Freq. Percent Cum.

------------+-----------------------------------

0 | 74 52.48 52.48

1 | 67 47.52 100.00

------------+-----------------------------------

Total | 141 100.00

Trong số 141 người được hỏi có 67 người có bạn trai/bạn gái chiếm 47.52%.

2.6. Skipped:
Cấu trúc câu lệnh: “tab skipped”
 Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab skipped

avg |

lectures |

missed per |

week | Freq. Percent Cum.

------------+-----------------------------------

0 | 44 31.21 31.21

.25 | 1 0.71 31.91

.5 | 9 6.38 38.30

1 | 48 34.04 72.34

2 | 25 17.73 90.07

3 | 9 6.38 96.45

4 | 3 2.13 98.58

5 | 2 1.42 100.00

------------+-----------------------------------

Total | 141 100.00

Trong số 141 người được điều tra có 48 người bỏ học trung bình một buổi trong tuần
chiếm 34.04%.

2.7. Voluntr:
Cấu trúc câu lệnh: “tab voluntr”
 Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab voluntr

36 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

=1 if do |

volunteer |

work | Freq. Percent Cum.

------------+-----------------------------------

0 | 110 78.01 78.01

1 | 31 21.99 100.00

------------+-----------------------------------

Total | 141 100.00

Trong số 141 sinh viên được hỏi có 110 sinh viên không tham gia hoạt động tình
nguyện (78.01%) và 31 sinh viên tham gia (21.99%).

II. Phân tích mô hình hồi quy:


 Hàm hồi quy tổng thể (PRF) và hàm hồi quy mẫu (SRF):
Chúng ta có biến phụ thuộc Y và những biến độc lập X lần lượt như sau:
 Biến Y ( biến phụ thuộc):
Y( colGPA ): Điểm GPA bậc đại học tại MSU
 Biến X ( biến độc lập ):
- X1 (hsGPA) : Điểm GPA tại trường trung học
- X2 (ACT) : Điểm trong kì thi ACT
- X3 (PC) : Có hay không có máy tính cá nhân tại trường ( biến giả, = 1 nếu có; =
0 nếu không có)
- X4 (bgfriend) : Có hay không có bạn trai hoặc bạn gái ( biến giả,= 1 nếu có ; = 0
nếu không có)
- X5 (skipped) : Số buổi nghỉ học trung bình một tuần( đv: buổi/tuần)
- X6 (voluntr) : Có tham gia tình nguyện hay không ( biến giả; =1 nếu có tham gia;
= 0 nếu không tham gia ).
 Như vậy ta có hàm hồi qui tổng thể PRF biểu diễn mối quan hệ phụ thuộc giữa Y
và các biến X như sau:
ColGPA = β0 + β1 * hsGPA+ β2 * ACT + β3 * PC + β4* bgfriend + β5* skipped + β 6 *
voluntr + ui
 Hàm hồi quy mẫu SRF là:
ColGPA = ^
^ β 0+ ^
β 1 * hsGPA + ^
β 2* ACT + ^
β 3* PC + ^
β 4 * bgfriend + ^
β 5* skipped
+^
β 6 * voluntr

37 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

1. Phân tích mối quan hệ tương quan giữa các biến:
Trước khi phân tích bất kỳ một bảng số liệu kinh tế lượng nào, chúng ta đều cần phải
phân tích mối quan hệ tương quan giữa các biến, để xác định hệ số tương quan giữa chúng, và
quan trọng hơn, là để xem xét xem các biến trong mô hình có xảy ra hiện tượng đa cộng tuyến
hay không (Nếu R2 >= 0.8 thì xảy ra hiện tượng đa cộng tuyến).
Ta sử dụng lệnh Corr trong Stata với cấu trúc lệnh như sau:
“corr colGPA hsGPA ACT voluntr PC bgfriend skipped”
. corr colGPA hsGPA ACT voluntr PC bgfriend skipped

(obs=141)

| colGPA hsGPA ACT voluntr PC bgfriend skipped

-------------+---------------------------------------------------------------

colGPA | 1.0000

hsGPA | 0.4146 1.0000

ACT | 0.2068 0.3458 1.0000

voluntr | -0.0166 0.0448 0.0312 1.0000

PC | 0.2236 0.0355 0.0371 0.0591 1.0000

bgfriend | 0.0956 -0.0375 0.0278 0.0778 -0.0177 1.0000

skipped | -0.2618 -0.0897 0.1155 -0.1517 -0.2073 -0.0047 1.0000

Từ bảng kết quả ở trên có thể thấy:


 Hệ số tương quan giữa colGPAvà hsGPA là 0.4146
 Hệ số tương quan giữa colGPAvà ACT là 0.2068
 Hệ số tương quan giữa colGPAvà voluntr là – 0,0166
 Hệ số tương quan giữa colGPAvà PC là 0,2236
 Hệ số tương quan giữa colGPAvà bgfriend là 0.0956
 Hệ số tương quan giữa colGPAvà skipped là - 0.2618
Từ số liệu của bảng tương quan ta có thể thấy rằng, trong các nhân tố chọn chủ quan
có ảnh hưởng tới điểm trung bình bậc đại học ở MSU, thì nhân tố ảnh hưởng lớn nhất đó là
điểm GPA bậc trung học của các sinh viên ở MSU (corr = 0,4146). Hệ số tương quan mang
dấu dương thể hiện mối tương quan cùng chiều của các biến “ACT”; “hsGPA”; “PC” và
“bgfriend” với biến phụ thuộc. Ngược lại, tương quan âm giữa “ colGPA” với “skipped” cho
thấy nếu sinh viên bỏ học lỡ các tiết học càng nhiều thì điểm trung bình GPA sẽ càng thấp.
Dấu của hệ số tương quan cũng tương tự với các nhân tố khác, nếu mang dấu âm là
ngược chiều, còn mang dấu dương là thuận chiều. Các biến có quan hệ thuận chiều ở đây là:

38 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

hsGPA, ACT, PC, bgfriend. Biến có quan hệ ngược chiều ở bảng số liệu này chỉ gồm 2 biến:
voluntr và skipped
Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên dự đoán sẽ không xảy
ra hiện tượng đa cộng tuyến.

2. Chạy mô hình hồi quy và phân tích kết quả:


 Bước đầu tiên ta sử dụng lệnh reg để chạy mô hình hồi quy với cấu trúc câu lệnh
là: “reg colGPA hsGPA ACT PC bgfriend skipped voluntr”, ta thu được kết quả
là bảng:
. reg colGPA hsGPA ACT PC bgfriend skipped voluntr

Source | SS df MS Number of obs = 141

-------------+------------------------------ F( 6, 134) = 8.62

Model | 5.40458682 6 .900764469 Prob > F = 0.0000

Residual | 14.0015126 134 .1044889 R-squared = 0.2785

-------------+------------------------------ Adj R-squared = 0.2462

Total | 19.4060994 140 .138614996 Root MSE = .32325

------------------------------------------------------------------------------

colGPA | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hsGPA | .4220895 .092043 4.59 0.000 .2400444 .6041345

ACT | .01307 .0104019 1.26 0.211 -.0075031 .0336431

PC | .1280678 .0570175 2.25 0.026 .0152971 .2408385

bgfriend | .0856602 .0547883 1.56 0.120 -.0227016 .194022

skipped | -.0747544 .0263763 -2.83 0.005 -.1269221 -.0225867

voluntr | -.0788779 .0668163 -1.18 0.240 -.2110289 .0532731

_cons | 1.311245 .3271558 4.01 0.000 .6641874 1.958302

-----------------------------------------------------------------------------
Sau khi chạy Stata được toàn bộ dữ liệu như trình bày ở trên, chúng ta tiến hành đọc
và phân tích số liệu. Trước hết, chúng ta thành lập được một bảng số liệu như sau:

Tên biến Hệ số hồi quy P-value Khoảng tin cậy

Hệ số tự do 1.311245 0,000 [0.6641874;1.958302]

39 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

hsGPA 0.4220895 0,000 [0.2400444; 0.6041345]

ACT 0.01307 0,211 [- 0.0075031; 0.0336431]

PC 0.1280678 0,026 [0.0152971;0.2408385]

bgfriend 0.0856602 0,120 [-0.0227016; 0.194022]

skipped -0.0747544 0,005 [-0.1269221; - 0.0225867]

voluntr -0 .0788779 0,240 [-0.2110289; 0.0532731]

Từ bảng số liệu “ Các yếu tố ảnh hưởng tới điểm GPA bậc đại học của sinh viên tại
MSU “ ta rút ra được một số kết luận như sau:
- Có 3 biến ACT, bgfriend, voluntr có (P-value> |t|) > 0.05 nên chúng không có ý
nghĩa thống kê và ngược lại đối với các biến còn lại.
- Các hệ số hồi quy :

^
β 0= 1,311245 ^
β 4 = 0,0856602
^
β = 0,4220895 ^
β = - 0,0747544
1 5

^
β 2= 0,01307 ^
β 6 = - 0,0788779
^
β 3 = 0,1280678

 Phương trình hồi quy tuyến tính mẫu cần tìm là:
Y^i = 1,311245+ 0, 4220895 * hsGPA + 0,01307*ACT + 0,1280678 * PC +
0,0856602 * bgfriend - 0,747544 * skipped - 0,0788779 * voluntr
 Phân tích kết quả hồi quy:
- Số quan sát Obs = 141
- Tổng bình phương sai số tổng cộng SST = 19.4060994
- Tổng bình phương sai số được giải thích SSE = 5.40458682
- Tổng bình phương các phần dư SSR = 14.0015126
- Bậc tự do của phần được giải thích Dfm= 6
- Bậc tự do của phần dư Dfr = 134
Hệ số xác định R2 = 0. 2785 thể hiện mức độ phù hợp của hàm hồi quy mẫu là tương
đối lớn. Điều này có nghĩa là các biến độc lập giải thích được 27,85 % giá trị biến phụ thuộc.
 Hệ số xác định điều chỉnh R2 = 0.2462
 Ý nghĩa các hệ số hồi quy trong mô hình:
40 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Với điều kiện các yêu tố khác không đổi thì ý nghĩa các biến ảnh hưởng tới Điểm
GPA tại MSU như sau:
 ^
β = 1,311245 có ý nghĩa là: khi giá trị của các biến độc lập bằng 0 trong điều kiện
0

các yếu tố khác không đổi thì điểm GPA trung bình khi học tại đại học MSU của
sinh viên là 1,311245
 ^
β 1= 0,4220895 có ý nghĩa là: Điểm GPA trung bình thời trung học cứ cao thêm 1
điểm thì Điểm GPA trung bình khi học tại đại học MSU của sinh viên cao thêm
0,422 điểm trong điều kiện các yếu tố khác không đổi
 ^
β 2= 0,01307 có ý nghĩa là: Điểm trong kì thi ACT tăng 1 điểm thì điểm PPA
trung bình tại đại học MSU của sinh viên cao thêm 0,013 điểm trong điều kiện
các yếu tố khác không đổi (mặc dù kiểm định p value cho thấy biến này không có
ý nghĩa thống kê tuy nhiên vẫn có ý nghĩa về mặt thông tin).
 ^
β 3 = 0,1280678 có ý nghĩa là: Sinh viên có máy tính cá nhân tại trường có điểm
GPA trung bình cao hơn sinh viên không có máy tính 0,128 điểm tại MSU trong
điều kiện các yếu tố khác không đổi.
 ^
β 4 = 0,0856602 có ý nghĩa là: Sinh viên có bạn trai hoặc bạn gái sẽ có thể có
điểm trung bình GPA cao hơn sinh viên không có bạn trai hoặc bạn gái 0,08567
điểm trong điều kiện các yếu tố khác không đổi (mặc dù tại kiểm định mẫu này
không mang ý nghĩa thống kê tuy nhiên vẫn có ý nghĩa về mặt thông tin).
 ^
β 5 = - 0,0747544 có ý nghĩa là: Sinh viên có số buổi nghỉ học trung bình trên tuần
tăng thêm 1 đơn vị thì điểm GPA trung bình giảm 0,0747 điểm trong điều kiện
các yếu tố khác không đổi.
 ^
β 6 = - 0,0788779 có ý nghĩa là: Sinh viên có tham gia hoạt động tình nguyện sẽ
có điểm GPA trung bình thấp hơn sinh viên không tham gia là 0,0789 điểm trong
điều kiện các yếu tố khác không đổi (mặc dù kiểm định tại mẫu này cho thấy biến
này không mang ý nghĩa thống kê tuy nhiên vẫn có ý nghĩa về mặt thông tin).

3. Một số kiểm định F:

III.1. Kiểm định đa ràng buộc tuyến tính:


 Thực hiện kiểm định này, ta sẽ xem xét xem việc có thể bỏ 3 biến X 2 (ACT); biến X 4
(bgfriend); biến X6 (voluntr) hay không.
Y^i = 1,311245+ 0, 4220895 X 1 + 0,1280678 X 3 - 0,747544 X 5
 Ta có giả thuyết:

{ H 0 : β 2=β 4=β 6=0


H 1 : H 0 sai

41 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

 Chạy mô hình hồi quy mẫu với 3 biến X1, X3, X5 với lệnh reg [biến phụ thuộc] [biến
độc lập] ta có bảng kết quả sau:
. reg colGPA hsGPA PC skipped

Source | SS df MS Number of obs = 141

-------------+------------------------------ F( 3, 137) = 15.25

Model | 4.85887844 3 1.61962615 Prob > F = 0.0000

Residual | 14.547221 137 .106184095 R-squared = 0.2504

-------------+------------------------------ Adj R-squared = 0.2340

Total | 19.4060994 140 .138614996 Root MSE = .32586

------------------------------------------------------------------------------

colGPA | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

hsGPA | .4554308 .0864439 5.27 0.000 .2844938 .6263677

PC | .1288832 .0573378 2.25 0.026 .0155016 .2422647

skipped | -.0654738 .0259459 -2.52 0.013 -.1167801 -.0141675

_cons | 1.526582 .2999221 5.09 0.000 .9335066 2.119657

------------------------------------------------------------------------------

Bảng 4. Mô hình hồi quy với 3 biến X1, X3, X5


Từ bảng 3 và 4, Ta có:
R2ur = 0,2785; R2r = 0,2504
( R¿¿ ur 2−R2r ) (0,2785−0,2504)
q 3
 F= 2
¿ = = 1,7396
(1−R ur ) (1−0,2785)
(n−k −1) (141−6−1)
Tra bảng phân phối Fisher, ta có: C 3,134
0,05 = 2,66

Mà F = 1,7396 < 2,66 => Chấp nhận H0.

Kết luận: Như vậy cho thấy, ta có thể bỏ 3 biến X 2 (ACT); biến X 4 (bgfriend); biến X6
(voluntr) ra khỏi mô hình hồi quy xem xét ảnh hưởng tới điểm GPA trung bình của sinh viên
tại đại học MSU.

III.2. Kiểm định sự phù hợp của mô hình:

{
2
H 0 : R =0
 Ta xác định giả thuyết:
H 1 : R2 ≠ 0

42 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

R2 0,2785
k 6
 Ta có: F = (1−R2 ) = (1−0,2785) = 8,62
(n−k−1) (141−6−1)
Tra bảng phân phối Fisher , ta có : C 6,134
0,05 = 2, 16

Mà F = 8,62 > 2,16=> Bác bỏ H0.


Kết luận: Các biến độc lập ảnh hưởng tới biến phụ thuộc nên hàm hồi quy mẫu đã giải
thích được sự dao động của biến phụ thuộc nên SRF này là phù hợp.
III. Kiếm định và sửa chữa một số khuyết tật của mô hình

1. Vấn đề đa cộng tuyến:

1.1. Bản chất:


Đa cộng tuyến là một lỗi của mô hình phân tích hồi quy, xảy ra khi giữa các
biến độc lập Xi trong mô hình hồi quy đa biến có tương quan tuyến tính với nhau.

1.2. Nguyên nhân:


Có 3 nguyên nhân gây ra vấn đề đa cộng tuyến:
o Đa cộng tuyến hoàn hảo xảy ra khi đặt mô hình sai, trên thực tế hiện tượng đa cộng
tuyến hoàn hảo ít khi xảy ra.
o Đa cộng tuyến không hoàn hảo xảy ra do bản chất hiện tượng kinh tế xã hội mà các
biến độc lập đã có sẵn mối quan hệ cộng tuyến với nhau
o Đa cộng tuyến không hoàn hảo xảy ra do số liệu điều tra không đủ lớn, hay số liệu
điều tra không ngẫu nhiên.

1.3. Cách phát hiện đa công tuyến:


Dùng lệnh corr [indep] để kiểm định đa cộng tuyến. Nếu giữa 2 biến có giá trị
corr > 0.8 thì mô hình có khả năng xảy ra đa cộng tuyến.
Sử dụng phần mềm stata và lệnh corr, ta thu được kết quả như sau:
. corr colGPA hsGPA ACT PC bgfriend skipped voluntr

(obs=141)

| colGPA hsGPA ACT PC bgfriend skipped

voluntr

-------------

+---------------------------------------------------------------

colGPA | 1.0000

hsGPA | 0.4146 1.0000

43 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

ACT | 0.2068 0.3458 1.0000

PC | 0.2236 0.0355 0.0371 1.0000

bgfriend | 0.0956 -0.0375 0.0278 -0.0177 1.0000

skipped | -0.2618 -0.0897 0.1155 -0.2073 -0.0047 1.0000

voluntr | -0.0166 0.0448 0.0312 0.0591 0.0778 -0.1517

1.0000

Từ bảng số liệu trên, ta thấy mô hình không mắc đa cộng tuyến

2.Vấn đề về phương sai sai số thay đổi:

2.1. Bản chất:


Phương sai của mỗi một ngẫu nhiên Ui, trong điều kiện giá trị đã cho của biến
giải thích Xi là không đổi, nghĩa là:
Var (U i/ X i)=E [U i – E ( U i )] 2 = E(U i )2= σ 2; i = 1,2,3…n
Khi giả thiết đó bị vi phạm thì mô hình mắc lỗi phương sai sai số thay đổi. Tên
gọi của lỗi này là Heteroskedasticity.

2.2. Nguyên nhân:


Có 5 nguyên nhân gây ra hiện tượng phương sai sai số thay đổi:
o Do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không gian
được điều tra trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế
theo thời gian được điều tra qua các giai đoạn có mức biến động khác nhau thì phương
sai sai số có thể không đồng đều.
o Do định dạng không đúng dạng hàm của mô hình.
o Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện
các quan sát ngoại lai.
o Do kỹ thuật thu thập, bảo quản và xử lý số liệu đượccải tiếnnên sai số có xu hướng
giảm.
o Học được các sai lầm trong quá khứ, nhờ thế cải tiến trong hiện tại.

2.3. Cách phát hiện dấu hiệu của phương sai sai số thay đồi:
 Cách 1: Xem xét đồ thị của phần dư:

Trong cách này ta sẽ sử dụng đồ thị của sai số của hồi qui e (phần dư) với giá
trị dự đoán Yi (biểu diễn sự tương quan giữa e và Yi).
Từ cơ sở dữ liệu đã cho và phần mềm stata, sử dụng lệnh: rvfplot, yline (0) ta
xây dựng được Đồ thị sau:

44 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

1
.5
Residuals
0
-.5
-1

2.5 3 3.5
Fitted values

Dựa vào lí thuyết kinh tế lượng đã được học và đồ thị vừa xây dựng được, ta thấy các
giá trị trên đồ thị phân bố không đồng đều, các giá trị có xoay xung quanh giá trị trung
bình bằng 0 (đường ngang màu đỏ), tỉ lệ rời xa giá trị trung bình bằng 0 tương đối lớn.
Vì thế, ta có thể dự đoán được mô hình có thể có hiện tượng phương sai sai số thay
đổi.

 Cách 2: Dùng kiểm định White:

Cặp giả thuyết: { H 0 : môhình có PSSS không đổi


H 1 :mô hìnhcó PSSS thay đổi
Nếu giá trị Prob > chi2 và <0.05, chúng ta bác bỏ giả thiết H0 và chấp nhận giả
thiết H1, có nghĩa là mô hình có hiện tượng phương sai sai số thay đổi.
Sử dụng phần mềm stata, ta thu được bảng kết quả như sau:
. imtest, white

White's test for Ho: homoskedasticity

against Ha: unrestricted heteroskedasticity

chi2(24) = 28.40

Prob > chi2 = 0.2436

Cameron & Trivedi's decomposition of IM-test


45 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

---------------------------------------------------

Source | chi2 df p

---------------------+-----------------------------

Heteroskedasticity | 28.40 24 0.2436

Skewness | 3.71 6 0.7158

Kurtosis | 5.76 1 0.0164

---------------------+-----------------------------

Total | 37.87 31 0.1846

Từ bảng trên, kết quả kiểm định bằng lệnh imtest, white cho thấy Prob > chi2
= 0.2436> 0.05 => Không có cơ sở để bác bỏ giả thiết H 0 hay mô hình có phương sai
sai số không đổi (với mức ý nghĩa 5%).
Cách 3: Dùng kiểm định Breusch – Pagan:

Cặp giả thuyết: {


H 0 : mô hình có PSSS không đ ố i
H 1 :mô hìnhcó PSSS thay đ ố i
Sử dụng phần mềm stata và lệnh hettest, ta thu được kết quả như sau:
. hettest

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Ho: Constant variance

Variables: fitted values of colGPA

chi2(1) = 3.46

Prob > chi2 = 0.0628

Từ kết quả thu được, ta thấy Prob > chi2 = 0.0628 > 0.05 => Không
có cơ sở để bác bỏ giả thiết H0 hay mô hình có phương sai sai số không đổi (với mức ý
nghĩa 5%).
KẾT LUẬN: Với kết quả của các kiểm định trên ta có thể kết luận được rằng không
xảy ra hiện tượng phương sai sai số thay đổi.

3. Kiểm định vấn đề về phân phối chuẩn của sai số:


Bước 1: Dự đoán
- Tạo biến phần dư của mô hình, sử dụng lệnh : predict r, resid ( với r là biến thể
hiện giá trị của phần dư residual)
- Sử dụng lệnh : kdensity r, normal

46 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

 Có thể mô hình đang dùng bị chệch so với phân phối chuẩn.


Bước 2: Kiểm định
 Sử dụng lệnh “sktest r” để kiểm định, ta có bảng kết quả sau:
. sktest r

Skewness/Kurtosis tests for Normality

------- joint ------

Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2

-------------+---------------------------------------------------------------

r | 141 0.9922 0.0482 3.97 0.1372

Từ kết quả trên ta thấy rằng giá trị (Prob>chi2) = 0,1372 > 0,05 nên mô hình có
phân phối chuẩn của sai số u nên bước sửa chữa được loại bỏ.

47 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

4. Kết luận rút ra:


Việc lựa chọn các biến phù hợp có ảnh hưởng tới điểm GPA của sinh viên tại MSU
dựa trên kiến thức suy luận xã hội chủ quan được đưa vào mô hình chạy hồi quy dưới dạng
các biến độc lập mang tính suy luận logic. Ban đầu khi chưa sử dụng kiểm định với mô hình
chạy hồi quy của Stata, ta cho rằng các biến “ voluntr”, “ ACT ” và “bgfriend” hoàn toàn có
thể có tác động tới điểm GPA của sinh viên MSU. Nhận định được đặt ra rằng: khi thời gian
đi tình nguyện tăng lên thì sinh viên có thể dành ít thời gian cho việc học hơn hay không ?,
điểm ACT có tương tự như điểm hsGPA có mối quan hệ thuận chiều với nhau và với điểm
trung bình GPA đại học hay không ?, và liệu việc có bạn trai và bạn gái trong thời gian học
đại học có thực sự ảnh hưởng tới hiệu quả và thời gian học tập của sinh viên hay không ? . Tất
cả đều là những suy xét mang tính chủ quan nhưng hợp lí với lập luận có thể chấp nhận. Tuy
nhiên, sau khi ứng dụng Stata với các số liệu cụ thể với một mẫu cụ thể và phương pháp kiểm
định mức ý nghĩa, chúng ta đã có các cơ sở mang tính khoa học và đáng tin cậy rằng : với
mẫu số liệu đã cho, những biến trên không có ý nghĩa thống kê khi đem xem xét ảnh hưởng
tới điểm trung bình trung GPA của sinh viên tại MSU mặc dù về mặt tư duy xã hội chủ quan
thig việc chúng có ảnh hưởng đến biễn phụ thuộc là hoàn toàn hợp lý. Từ đó, chúng ta có thể
vận dụng vào cải tiến giáo dục để phát triển toàn diện cho sinh viên, đồng thời đánh giá đúng
năng lực của sinh viên trong quá trình chọn lọc và đổi mới hoạt động cộng đồng và xã hội.
Mô hình kinh tế lượng đem lại những thông tin bổ ích và khách quan, có ý nghĩa áp dụng thực
tế rất cao cũng như có thể hạn chế được những nhận định chủ quan của xã hội.

48 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Lời kết
Bài báo cáo trên được hoàn thành trên cơ sở sự đóng góp của các thành viên với vốn

kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Kinh tế lượng. Đây cũng là một

cơ hội thực hành khiến chúng em có thể hiểu rõ hơn về các phân tích và kiểm định đặc trưng

có liên quan, áp dụng kiến thức trên giảng đường để tự tìm hiểu và rút ra được nhưng kết luận

bổ ích về những hiện tượng trong những mối tương quan khác nhau và sự ảnh hưởng lẫn

nhau giữa các hiện tượng kinh tế xã hội thiết thực, logic và khoa học.

Qua đây, nhóm 10 chúng em cũng xin chân thành cám ơn sự chỉ dạy của cô Đinh Thị

Thanh Bình. Vì vốn kiến thức và kĩ năng còn nhiều hạn chế nên mong rằng cô và các bạn sẽ

góp ý để chúng em có thể hoàn thiện hơn, áp dụng tốt hơn trong các công việc về sau.

Chúng em xin chân thành cảm ơn và hi vọng cô sẽ đánh giá cao bản báo cáo này !./

49 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT

Tài liệu tham khảo


1. PGS.TS. Nguyễn Quang Dong, Giáo trình Bài giảng kinh tế lượng, NXB Giao
thông vận tải, 1998.
2. PGS.TS. Nguyễn Quang Dong, Bài tập Kinh tế lượng, NXB Khoa học kỹ thuật,
1998.
3. Một số tài liệu trên internet.

50 | P a g e
Báo cáo kinh tế lượng năm 2014

You might also like