Professional Documents
Culture Documents
Họ và Tên Mã số sinh viên Phần trăm đóng góp
1|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
nghĩa quyết định đến sự phát triển của xã hội nói chung và sự tăng trưởng của các quốc gia
nói riêng. Nhắc đến ngành học kinh tế, không thể không nhắc đến môn học Kinh tế lượng. Có
thể nói, kinh tế lượng chính là môn học không thể bỏ qua nhất trong tất cả các môn học của
chương trình đào tạo nhân lực phục vụ cho ngành kinh tế. Đặc thù của môn học này chính là
sự đòi hỏi phải phân tích định lượng các hiện tượng kinh tế, kiểm định sự phù hợp và độ tin
cậy của các giả thuyết trong quá trình hoạch định chính sách vĩ mô cũng như ra các quyết
định tác nghiệp, việc dự báo và dự đoán có độ tin cậy cao… Tất cả những đặc thù quan trọng
đó đã làm cho kinh tế lượng ngày càng phát triển, ngày càng gần gũi hơn với các bạn sinh
viên ngành kinh tế chính bởi yếu tố cần thiết và thực tế của nó. Nghiên cứu môn học này, các
bạn sinh viên sẽ có những cái nhìn toàn diện, thu thập được những kiến thức cơ bản và cụ thể
về việc phân tích những số liệu về các nhân tố ảnh hưởng đến vấn đề nào đó, từ đó vạch ra
những định hướng đúng đắn, xác thực hơn, để hoặc là tiếp tục phát triển vấn đề, hoặc là có
những phương pháp cần thiết để giải quyết vấn đề theo hướng phù hợp với thực tiễn và tính
Sau một thời gian được học tập những kiến thức cơ bản về môn Kinh tế lượng dưới sự
chỉ dẫn tận tình của cô giáo Đinh Thị Thanh Bình, nhóm chúng em đã phần nào tiếp nhận
được lượng kiến thức mà môn học muốn truyền tải, từ đó áp dụng vào để thực hiện phân tích
và hoàn thành bản báo cáo cuối kỳ gồm hai bảng số liệu 15 và 39 này. Chúng em đã rất cố
gắng và dành nhiều công sức cho bản báo cáo này, tuy nhiên, do kiến thức của bản thân vẫn
còn non nớt và chưa thực sự có nhiều kinh nghiệm, nên chắc chắn chúng em vẫn còn gặp
nhiều sai sót trong quá trình phân tích. Chúng em rất mong nhận được ý kiến đóng góp của cô
2|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
4|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
5|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
chúng em đã đi đến kết luận về nội dung của bảng số liệu này, đó là nghiên cứu về: sự ảnh
hưởng của các nhân tố đến tổng số lượng vụ án xảy ra ở ký túc xá.
Cuộc sống ngày cảng phát triển, và đi cùng với sự phát triển chung của nhân loại, thì
dường như càng ngày con người càng sống cách xa nhau hơn, những vụ án xảy ra ngày cảng
nhiều hơn trên thế giới. Không chỉ ngày càng tăng thêm nhanh về số lượng, mà những hành vi
gây tội còn được diễn ra với phạm vi đa dạng và khó xác định vị trí hơn. Thậm chí, một trong
những địa điểm mà tội phạm dùng đề gây án lại chính là những khu ký túc xá của các trường
học. Như chúng ta đã biết, trường học cần phải là nơi có sự an toàn tuyệt đối với môi trường
vô hại hoàn toàn, thì mới có thể bảo vệ cho thế hệ tương lai một cách tốt nhất và đào tạo ra
lớp trí thức phục vụ cho sự phát triển của đất nước. Vậy nên, việc nghiên cứu về các nhân tố
ảnh hưởng đển tổng số lượng vụ án xảy ra ở ký túc xá là một điều hết sức quan trọng, để từ đó
tìm ra biện pháp khắc phục, giải quyết vấn đề theo hướng tích cực, và góp phần vạch ra
phương pháp làm giảm tổng số vụ án xảy ra ở ký túc xá.
Xét trong phạm vi một trường học, có rất nhiều yếu tố đề một vụ án có thể xảy ra.
Những yếu tố đó có thể là tổng số sinh viên trong ký túc xá, việc ký túc xá là của trường công
hay trường tư và tổng số cảnh sát được thuê để điều tra vụ án ký túc xá… Để tìm hiểu rõ hơn
về vấn đề này, chúng ta cần phải nhìn dưới góc nhìn của Kinh tế lượng, phân tích và kiểm
định các giả thuyết nhất định. Chúng em xin phân tích bảng số liệu số 15, để chúng em nói
riêng và các bạn sinh viên nói chung có cách hiểu tổng quan hơn về vấn đề này.
6|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
1. Tổng quan:
Sau quá trình phân tích chủ quan về số liệu, đọc và hiểu ý nghĩa các biến được cho
trong bảng số liệu số 15, chúng em đã quyết định chạy mô hình hồi quy gồm các biến như
sau:
- Biến phụ thuộc: crime
- Biến độc lập (bao gồm có 5 biến):
X1: enroll
X2: priv
X3: police
X4: lenroll
X5: lpolice
I.1. Sử dụng lệnh des để mô tả chung cho các biến:
Dưới đây là kết quả thu được của nhóm khi tiến hành mô tả thống kê biến phụ thuộc
và các biến độc lập bằng lệnh des với cấu trúc câu lệnh là:
“des crime enroll priv police lenroll lpolice”
Sau khi chạy câu lệnh trong Stata chúng ta thu được kết quả sau:
. des crime enroll priv police lenroll lpolice
---------------------------------------------------------------------
---------------------------------------------------------------
Dựa vào kết quả thu được ta có bảng tổng hợp như sau:
Tên biến Định dạng hiển thị Đơn vị tính Ý nghĩa biến
7|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
I.2. Sử dụng lệnh sum để tiếp tục mô tả các biến:
Tiếp tục sử dụng lện sum để mô tả số liệu. Lệnh sum cho biết số lượng quan sát
(Obs). Giá trị trung bình (Mean), độ lệch chuẩn (Std. dev) cũng như giá trị lớn nhất (Max)
và giá trị nhỏ nhất( Min ) của các biến.
Cấu trúc câu lệnh như sau:
“sum enroll priv police crime lcrime lenroll lpolice”
Sau khi chạy câu lệnh này trong Stata ta thu được kết quả:
sum crime enroll priv police lenroll lpolice
-------------+--------------------------------------------------------
-------------+--------------------------------------------------------
8|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
.
Sau khi đọc hiểu bảng trên ta có kết quả số liệu trong bảng sau:
Số quan Giá trị trung Độ lệch Giá trị nhỏ Giá trị lớn
Biến
sát bình chuẩn nhất nhất
2.1. Crime:
Cấu trúc lệnh: “tab crime”
Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab crime
total |
campus |
------------+-----------------------------------
1 | 2 2.06 2.06
15 | 1 1.03 3.09
17 | 1 1.03 4.12
25 | 1 1.03 5.15
38 | 1 1.03 6.19
42 | 1 1.03 7.22
9|Page
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
43 | 2 2.06 9.28
44 | 1 1.03 10.31
47 | 1 1.03 11.34
50 | 1 1.03 12.37
53 | 1 1.03 13.40
54 | 1 1.03 14.43
55 | 1 1.03 15.46
56 | 1 1.03 16.49
58 | 1 1.03 17.53
62 | 1 1.03 18.56
64 | 1 1.03 19.59
65 | 1 1.03 20.62
67 | 1 1.03 21.65
72 | 1 1.03 22.68
82 | 1 1.03 23.71
83 | 1 1.03 24.74
85 | 1 1.03 25.77
89 | 1 1.03 26.80
90 | 2 2.06 28.87
--more—
Số lượng vụ án xảy ra tại KTX giao động từ 0 đến 414 trong đó phổ biến nhất là 170
vụ với mức tỉ lệ 3.09%. Tần số của các vụ án không hoặc ít lặp lại.
2.2. Enroll:
Cấu trúc lệnh: “tab enroll”
Ta thu được kết qủa sau đây:
tab enroll
total |
------------+-----------------------------------
--more--
Số lượng sinh viên trong ký túc xa trải đều từ 1799 sinh viên đến 56350 không có mức
tỷ lệ nào cao hơn mà đồng đều ở mức 1.03%.
2.3. Priv:
Cấu trúc lệnh: “tab priv”
Ta thu được kết quả sau:
tab priv
=1 if |
private |
11 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
------------+-----------------------------------
0 | 85 87.63 87.63
1 | 12 12.37 100.00
------------+-----------------------------------
Total | 97 100.00
Có tổng số 12 ký túc xá được quan sát là ký túc xá trường tư chiếm 12.37%.
Có tổng số 85 ký túc xá được quan sát là ký túc xá không phải của trường tư, chiếm
87.63%.
2.4. Police:
Cấu trúc lệnh: “tab police”
Ta thu được kết quả như sau:
tab police
employed |
------------+-----------------------------------
1 | 1 1.03 1.03
2 | 1 1.03 2.06
3 | 1 1.03 3.09
4 | 1 1.03 4.12
5 | 5 5.15 9.28
6 | 3 3.09 12.37
7 | 6 6.19 18.56
8 | 5 5.15 23.71
9 | 6 6.19 29.90
10 | 3 3.09 32.99
11 | 3 3.09 36.08
12 | 5 5.15 41.24
13 | 1 1.03 42.27
14 | 5 5.15 47.42
15 | 2 2.06 49.48
16 | 3 3.09 52.58
17 | 2 2.06 54.64
18 | 1 1.03 55.67
19 | 3 3.09 58.76
12 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
20 | 2 2.06 60.82
21 | 3 3.09 63.92
22 | 1 1.03 64.95
24 | 3 3.09 68.04
25 | 3 3.09 71.13
26 | 3 3.09 74.23
27 | 3 3.09 77.32
28 | 1 1.03 78.35
30 | 1 1.03 79.38
--more--
Số lượng cảnh sát được thuê để điều tra vụ án dao động từ 1 đến 74 với mức phổ biến
nhất là 7 và 9 sĩ quan với mức tỉ lệ là 6.19%.
2.5. Lenroll:
Cấu trúc lệnh: “tab lenroll”
Ta thu được kết quả như sau:
. tab lenroll
------------+-----------------------------------
--more—
Giá trị logarit tự nhiên của biến enroll giao động từ 7.494986 đến 10.93934 trong đó
mỗi mức giá trị đều chiếm 1.03%
2.6. Lpolice:
Cấu trúc lệnh: “tab lpolice”
Ta thu được kết quả như sau:
tab lpolice
0 | 1 1.03 1.03
--more—
Giá trị logarit tự nhiên dao động từ 0 đến 4.304065 trong đó giá trị 1.94591 và giá trị
2.197225 xuất hiện thường xuyên nhất với mức 6.19%.
1. Phân tích mối quan hệ tương quan giữa các biến:
Trước khi phân tích bất kỳ một bảng số liệu kinh tế lượng nào, chúng ta đều cần phải
phân tích mối quan hệ tương quan giữa các biến, để xác định hệ số tương quan giữa chúng, và
15 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
quan trọng hơn, là để xem xét xem các biến trong mô hình có xảy ra hiện tượng đa cộng tuyến
hay không (Nếu R2 >= 0.8 thì xảy ra hiện tượng đa cộng tuyến).
Ta sử dụng lệnh Corr trong Stata với cấu trúc lệnh như sau:
“corr crime enroll priv police lenroll lpolice”
Được kết quả là bảng số liệu tương quan như sau:
corr crime enroll priv police lenroll lpolice
(obs=97)
-------------+------------------------------------------------------
crime | 1.0000
.
Từ bảng trên ta có thể thấy được hệ số tương quan của các biến như sau:
- Hệ số tương quan giữa crime và enroll là: 0.8360
- Hệ số tương quan giữa crime và priv là: - 0.2226
- Hệ số tương quan giữa crime và police là: 0.7233
- Hệ số tương quan giữa crime và lenroll là: 0.7195
- Hệ số tương quan giữa crime và lpolice là: 0.6537
Sau khi rút ra được các hệ số tương quan như trên, nhìn vào ta có thể nhận xét, trong
tất cả các nhân tố được nghiên cứu, thì biến enroll có mối tương quan mạnh nhất đến biến
crime (hệ số tương quan của biến này cao nhất, là 0.8360), hay nói cách khác, tổng số vụ sinh
viên trong ký túc xá của trường có mối ảnh hưởng mạnh nhất đến tổng số lượng vụ án xảy ra
trong ký túc xá của Nhà trường. Hệ số tương quan của biến enroll này mang dấu dương, cũng
chứng tỏ được mối quan hệ cùng chiều giữa biến enroll với biến crime, thể hiện nếu như tổng
số sinh viên trong ký túc xác của trường tăng, thì cũng sẽ dẫn tới tổng số lượng vụ án xảy ra
trong ký túc xá của trường cũng tăng theo. Ngược lại, biến priv có mối tương quan ít nhất đến
biến crime (hệ số tương quan của biến này nhỏ nhất là - 0.2226), hay nói cách khác, yếu tố
“trường Dân lập” có ảnh hưởng ít nhất đến tổng số vụ án xảy ra trong ký túc xá nhà trường.
Hệ số tương quan giữa biến priv và biến crime mang dấu âm chứng tỏ chúng có quan hệ
16 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
ngược chiều (nghịch) với nhau. Nếu trường được nghiên cứu là trường Dân lập thì tổng số vụ
án xảy ra trong ký túc xá Nhà trường sẽ thấp hơn so với trường không phải là trường Dân lập.
Dấu của hệ số tương quan cũng tương tự với các nhân tố khác, nếu mang dấu âm là
ngược chiều, còn mang dấu dương là thuận chiều. Các biến có quan hệ thuận chiều ở đây là:
enroll, police, lcrime, lpolice. Biến có quan hệ ngược chiều ở bảng số liệu này chỉ gồm 1
biến: priv
Ngoài ra, sau khi đọc các số liệu của bảng hệ số tương quan chúng ta cũng nhận thấy
rằng, mối quan hệ tương quan giữa các biến độc lập hầu hết không vượt quá giá trị 0.8. Tuy
nhiên, có hai biến độc lập có hệ số tương quan rất cao, đó là lpolice và police (hệ số tương
quan của hai biến này là 0.9005>0.8) và lenroll với enroll (hệ số tương quan của hai biến này
là 0.9099>0.8). Do vậy ta dự đoán mô hình có xảy ra hiện tượng đa cộng tuyến.
------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
Sau khi chạy Stata được toàn bộ dữ liệu như trình bày ở trên, chúng ta tiến hành đọc
và phân tích số liệu. Trước hết, chúng ta thành lập được một bảng số liệu như sau:
17 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
Tên biến Hệ số hồi quy Hệ số t P-value Khoảng tin cậy
kiện các yếu tố khác không đổi thì tổng số vụ án xảy ra trong ký túc xá là 815.5561.
18 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
^
β 1 = 0.0315662 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu
tăng thêm một sinh viên trong ký túc xá thì tổng số vụ án trung bình xảy ra trong ký túc xá
tăng thêm 0.0315662 vụ.
^
β 2 = 38.41752 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu
trường được nghiên cứu là trường tư thì tổng số vụ án trung bình xảy ra trong ký túc xá tăng
thêm 38.41752 vụ.
^
β 3 = 9.733369 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu
tăng thêm một cảnh sát được thuê để điều tra vụ án thì tổng số vụ án trung bình xảy ra trong
ký túc xá tăng thêm là 9.733369 (điều này có thể hiểu là: khi tăng lượng cảnh sát điều tra, thì
có nhiều vụ án được phá hơn, dẫn đến tìm ra nhiều vụ án xảy ra hơn (vì vụ án chỉ được tính
khi được điều tra của Cảnh sát) nên biến độc lập cảnh sát tỷ lệ thuận với biến phụ thuộc là phù
hợp với thực tế).
^β 4 = -106.5999 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu
lượng sinh viên trong ký túc xá tăng thêm 1% thì tổng số vụ án trung bình xảy ra trong ký túc
xá giảm đi là 1.065999 vụ.
^
β 5 = -48.7223 có ý nghĩa là: trong điều kiện các yếu tố khác không đổi, nếu
lượng cảnh sát được thuê để điều tra các vụ án trong ký túc xá tăng thêm 1% thì tổng số vụ án
trung bình xảy ra trong ký túc xá giảm đi là 0.487223 vụ.
- Tuy nhiên, ta chỉ biết chắc chắn biến độc lập có thực sự ảnh hưởng đến biến
phụ thuộc với ý nghĩa hệ số hồi quy như ta đã phân tích ở trên hay không sau khi kiểm định
hệ số hồi quy cho mô hình.
3.1. Kiểm định giả thuyết về hệ số hồi quy:
- Mục đích: kiểm định ảnh hưởng của từng biến độc lập lên giá trị trung bình
của biến phụ thuộc crime.
Có cặp giả thuyết thống kê:
{
H 0 : β i=0
H 1 : β i ≠ 0 với i =
1,5
Nếu giá trị P-value nhỏ hơn mức ý nghĩa α =0.05 thì bác bỏ Ho, chấp nhận H1, tức là
biến độc lập đó có ý nghĩa thống kê đối với crime.
- Theo bảng chạy hồi qui ở mục 2, ta thấy:
o Biến enroll: P-value = 0.000 < 0.05, loại bỏ H 0 vậy nên biến enroll có ý nghĩa
thống kê đối với crime.
19 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
o Biến priv: P-value = 0.636 > 0.05, chấp nhận H 0 vậy nên biến priv không có ý
nghĩa thống kê đối với crime.
o Biến police: P-value = 0.016 < 0.05, bác bỏ H0 vậy nên biến police có ý nghĩa
thống kê đối với crime.
o Biến lenroll: P-value = 0.168 > 0.05, chấp nhận H0 vậy nên biến lenroll không
có ý nghĩa thống kê đối với crime.
o Biến lpolice: P-value = 0.527 > 0.05, chấp nhận H0 vậy nên biến lpolice không
có ý nghĩa thống kê đối với biến crime.
→ Các biến priv, lenroll, lpolice không thực sự ảnh hưởng đến crime.
( 1) enroll = 0
( 2) priv = 0
( 3) police = 0
( 4) lenroll = 0
( 5) lpolice = 0
F( 5, 91) = 52.60
Như vậy, Prob > F = 0.0000 nhỏ hơn α = 0.05, vì thế bác bỏ Ho.
→ Hệ số hồi qui của các biến độc lập không đồng thời bằng 0, mô hình hồi quy phù
hợp.
20 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
{HHo:1 : βTồntại
1 = β =0
2
≠0
Sử dụng lệnh test trong stata để kiểm định, cấu trúc lệnh: “test enroll priv”:
Ta thu được kết quả sau:
test enroll priv
( 1) enroll = 0
( 2) priv = 0
F( 2, 91) = 17.68
Vì giá trị P-value = 0.0000 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 2 yếu tố enroll và priv ảnh hưởng đến biến phụ thuộc
crime.
Giả sử 3 yếu tố là enroll, priv và police đều cùng không ảnh hưởng tới crime:
Cặp giả thuyết cần kiểm định:
( 1) enroll = 0
( 2) priv = 0
( 3) police = 0
F( 3, 91) = 21.10
Vì giá trị P-value = 0.0000 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 3 yếu tố enroll, priv và police ảnh hưởng đến biến phụ
thuộc crime.
Giả sử 3 yếu tố là police, lenroll và lpolice đều cùng không ảnh hưởng tới biến
crime:
21 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
( 1) police = 0
( 2) lenroll = 0
( 3) lpolice = 0
F( 3, 91) = 5.06
Vì giá trị P-value = 0.0027 < 0.05 nên bác bỏ H0, chấp nhận H1
Kết luận: Có ít nhất 1 trong 3 yếu tố police, lenroll và lpolice ảnh hưởng đến biến phụ
thuộc crime.
III. Kiếm định và sửa chữa một số khuyết tật của mô hình
22 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
(obs=97)
-------------+------------------------------------------------------
crime | 1.0000
(obs=97)
-------------+------------------------------------
crime | 1.0000
Phương pháp này tuy khắc phục được sự đa cộng tuyến nhưng lại vô tình làm mất đi
các biến có ý nghĩa trong nghiên cứu . Việc loại bỏ biến ra khỏi mô hình phải được cân nhắc
cẩn thận giữa sai lệch khi bỏ biến cộng tuyến với việc tăng phương sai của các ước lượng hệ
số khi biến đó ở trong mô hình.
Tăng kích cỡ mẫu:
23 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
Vì đa cộng tuyến là đặc trưng của mẫu nên có thể có mẫu khác liên quan đến cùng các
biến trong mẫu ban đầu mà cộng tuyến có thể không nghiêm trọng nữa. Điều này thực hiện
được khi chi phí cho việc lấy mẫu khác có thể chấp nhận được trong thực tế. Đối với nghiên
cứu này, cần phải điều tra thêm những khu ký túc xá khác để làm cho hiện tượng đa cộng
tuyến giảm xuống có thể giảm tính nghiêm trọng của đa cộng tuyến.
2.3. Cách phát hiện dấu hiệu của phương sai sai số thay đồi:
Cách 1: Xem xét đồ thị của phần dư:
Trong cách này ta sẽ sử dụng đồ thị của sai số của hồi qui e (phần dư) với giá trị dự
đoán Yi (biểu diễn sự tương quan giữa e và Yi).
24 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
Từ cơ sở dữ liệu đã cho và phần mềm stata, sử dụng lệnh rvfplot, yline (0) ta xây dựng
được Đồ thị sau:
Dựa vào lí thuyết kinh tế lượng đã được học và đồ thị vừa xây dựng được, ta thấy các
giá trị trên đồ thị phân bố không đồng đều, các giá trị tuy có xoay xung quanh giá trị trung
bình bằng 0 (đường ngang màu đỏ), tuy nhiên tỉ lệ rời xa giá trị trung bình bằng 0 còn khá
lớn. Vì thế, ta có thể dự đoán được mô hình có hiện tượng phương sai sai số thay đổi.
chi2(19) = 33.19
---------------------------------------------------
Source | chi2 df p
---------------------+-----------------------------
25 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
---------------------+-----------------------------
---------------------------------------------------
Từ bảng trên, kết quả kiểm định bằng lệnh imtest, white cho thấy Prob > chi2 =
0.0229< 0.05 => Bác bỏ giả thiết H0, H1 đúng hay mô hình có phương sai sai số thay đổi (với
mức ý nghĩa 5%).
Cách 3: Dùng kiểm định Breusch – Pagan:
chi2(1) = 72.08
Từ kết quả thu được, ta thấy Prob > chi2 = 0.0000 < 0.05 => Bác bỏ giả thiết H 0 hay
mô hình có phương sai sai số thay đổi (với mức ý nghĩa 5%)
KẾT LUẬN: Với kết quả của các kiểm định trên ta có thể kết luận được rằng có xảy ra
hiện tượng phương sai sai số thay đổi.
26 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
.003
.002
Density
.001
0
sktest r
-------------+---------------------------------------------------------------
P value = 0, bác bỏ H0, u không phân phối chuẩn, không có cách sửa chữa ngoài việc
tăng mẫu hoặc thay bằng mẫu có giá trị lớn hơn. Stata không thể sửa chữa, mẫu càng nhiều,
khả năng phân phối chuẩn càng lớn.
27 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
28 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
đo trình độ và năng lực của một cá nhân trong quá trình học tập và rèn luyện tại trường trung
học và giảng đường đại học. Được tính bởi điểm trung bình chung các môn học hay học phần
tích lũy, GPA là kết quả học tập của cá nhân , dựa theo các thang điểm khác nhau của mỗi
trường trung học và hệ cao đẳng đại học. Nghiên cứu, xem xét sự ảnh hưởng của các yếu tố
khác nhau lên điểm trung bình GPA góp phần đẩy mạnh cải cách và hoàn thiện giáo dục và
hạn chế những ảnh hưởng tiêu cực từ môi trường xung quanh và bản thân mỗi cá nhân.
Trong bài báo cáo này, chúng em xin được sử dụng bộ số liệu thống kê điểm GPA của
sinh viên và một số thông số liên quan tại trường đại học bang Michigan, Hoa Kỳ để xem xét
xem, liệu điểm GPA của sinh viên phụ thuộc vào những yếu tố nào và mức độ ảnh hưởng của
các yếu tố đó ra sao. Mong rằng nhờ có ứng dụng Stata – công cụ đo lường đặc trưng của kinh
tế lượng, bản báo cáo sẽ rút ra được nhiều điều thú vị và bổ ích.
29 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
1. Tổng quan
Trong đề tài này chúng em nêu ra và phân tích các yếu tố ảnh hưởng đến điểm
trung bình (GPA) tại Đại học bang Michigan (MSU). Theo đó có rất nhiều yếu tố ảnh
hưởng đến điểm GPA của sinh viên như điểm GPA trung học, điểm ACT v.v…
1.1. Sử dụng lệnh des để mô tả chung cho các biến:
Sử dụng lệnh des để mô tả các biến trong bảng dữ liệu ta thu được kết quả:
. des
obs: 141
size: 5,781
--------------------------------------------------------------------------
-------------------------------------------------------------------
--------------------------------------------------------------------------
-------------------------------------------------------------------
30 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
--more--
Sau khi cân nhắc kĩ lưỡng chúng em quyết định chọn biến colGPA làm biến phụ thuộc
và các biến: ACT, hsGPA, PC, bgfriend, skipped, voluntr làm biến độc lập. Tiến hành mô tả
biến độc lập và biến phụ thuộc bằng lệnh des ta thu được kết quả như sau:
. des colGPA hsGPA ACT PC bgfriend skipped voluntr
---------------------------------------------------------------------
------------------------------------------------------------------------
sch
girlfriend
week
Theo bảng trên ta có thể hiểu được ý nghĩa của các biến như sau:
o colGPA: điểm GPA tại MSU.
o hsGPA: điểm GPA tại trường trung học.
o ACT: điểm trong kì thi ACT.
o PC: biến giả cho biết có sở hữu máy vi tính hay không.
o bgfriend: biến giả có bạn trai/bạn gái hay không.
31 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
1.2. Sử dụng lệnh sum để tiếp tục mô tả các biến:
Tiếp tục sử dụng lện sum để mô tả số liệu. Lệnh sum cho biết số lượng quan sát
(Obs). Giá trị trung bình (Mean), độ lệch chuẩn (Std. dev) cũng như giá trị lớn nhất (Max)
và giá trị nhỏ nhất( Min ) của các biến.
sum colGPA hsGPA ACT PC bgfriend skipped voluntr
-------------+--------------------------------------------------------
-------------+--------------------------------------------------------
Bgfrien
141 0.4751773 0.511638 0 1
d
32 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
2.1. ColGPA:
Tiếp tục sử dụng lênh tab để mô tả chi tiết các biến ta thu được:
tab colGPA
------------+-----------------------------------
3 | 24 17.02 58.87
4 | 1 0.71 100.00
------------+-----------------------------------
Điểm trung bình trải dài từ 2.2 đến 4 trong đó mức 3.0 là phổ biến nhất với 24 lần xuất
hiện, chiếm 17.02%.
2.2. Hs GPA
Cấu trúc câu lệnh: “tab hsGPA”:
Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab hsGPA
33 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
high school |
------------+-----------------------------------
3 | 18 12.77 18.44
4 | 6 4.26 100.00
------------+-----------------------------------
Điểm GPA trung học đạt từ 2.4 đến 4.0 trong đó mức GPA 3.5 là phổ biến nhất với 19
lần xuất hiện chiếm 13.48%.
2.3. ACT:
Cấu trúc câu lệnh: “tab ACT”:
Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab ACT
'achievemen |
------------+-----------------------------------
16 | 2 1.42 1.42
19 | 6 4.26 5.67
20 | 2 1.42 7.09
21 | 13 9.22 16.31
34 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
22 | 13 9.22 25.53
23 | 23 16.31 41.84
24 | 25 17.73 59.57
25 | 11 7.80 67.38
26 | 18 12.77 80.14
27 | 13 9.22 89.36
28 | 6 4.26 93.62
29 | 4 2.84 96.45
30 | 3 2.13 98.58
31 | 1 0.71 99.29
33 | 1 0.71 100.00
------------+-----------------------------------
Mức điểm ACT giao động từ 16 đến 33 trong đó mức 24 là phổ biến nhất với 17.73%.
2.4. PC:
Cấu trúc câu lệnh: “tab PC”
. tab PC
=1 of pers |
computer at |
------------+-----------------------------------
0 | 85 60.28 60.28
1 | 56 39.72 100.00
------------+-----------------------------------
Trong số 141 sinh viên được hỏi có 85 sinh viên không sở hữu máy tính (60.28%) và
56 sinh viên có sở hữu máy tính (39,72%).
2.5. Bgfriend:
Cấu trúc câu lệnh: “tab bgfriend”:
Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab bgfriend
=1 if boy- |
35 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
or |
------------+-----------------------------------
0 | 74 52.48 52.48
1 | 67 47.52 100.00
------------+-----------------------------------
Trong số 141 người được hỏi có 67 người có bạn trai/bạn gái chiếm 47.52%.
2.6. Skipped:
Cấu trúc câu lệnh: “tab skipped”
Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab skipped
avg |
lectures |
missed per |
------------+-----------------------------------
0 | 44 31.21 31.21
.5 | 9 6.38 38.30
1 | 48 34.04 72.34
2 | 25 17.73 90.07
3 | 9 6.38 96.45
4 | 3 2.13 98.58
5 | 2 1.42 100.00
------------+-----------------------------------
Trong số 141 người được điều tra có 48 người bỏ học trung bình một buổi trong tuần
chiếm 34.04%.
2.7. Voluntr:
Cấu trúc câu lệnh: “tab voluntr”
Ta có kết quả sau khi chạy lệnh trên vào Stata như sau:
. tab voluntr
36 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
=1 if do |
volunteer |
------------+-----------------------------------
1 | 31 21.99 100.00
------------+-----------------------------------
Trong số 141 sinh viên được hỏi có 110 sinh viên không tham gia hoạt động tình
nguyện (78.01%) và 31 sinh viên tham gia (21.99%).
37 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
1. Phân tích mối quan hệ tương quan giữa các biến:
Trước khi phân tích bất kỳ một bảng số liệu kinh tế lượng nào, chúng ta đều cần phải
phân tích mối quan hệ tương quan giữa các biến, để xác định hệ số tương quan giữa chúng, và
quan trọng hơn, là để xem xét xem các biến trong mô hình có xảy ra hiện tượng đa cộng tuyến
hay không (Nếu R2 >= 0.8 thì xảy ra hiện tượng đa cộng tuyến).
Ta sử dụng lệnh Corr trong Stata với cấu trúc lệnh như sau:
“corr colGPA hsGPA ACT voluntr PC bgfriend skipped”
. corr colGPA hsGPA ACT voluntr PC bgfriend skipped
(obs=141)
-------------+---------------------------------------------------------------
colGPA | 1.0000
38 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
hsGPA, ACT, PC, bgfriend. Biến có quan hệ ngược chiều ở bảng số liệu này chỉ gồm 2 biến:
voluntr và skipped
Ngoài ra, vì giá trị tuyệt đối của các chỉ số đều nhỏ hơn 0.8 nên dự đoán sẽ không xảy
ra hiện tượng đa cộng tuyến.
------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
-----------------------------------------------------------------------------
Sau khi chạy Stata được toàn bộ dữ liệu như trình bày ở trên, chúng ta tiến hành đọc
và phân tích số liệu. Trước hết, chúng ta thành lập được một bảng số liệu như sau:
39 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
Từ bảng số liệu “ Các yếu tố ảnh hưởng tới điểm GPA bậc đại học của sinh viên tại
MSU “ ta rút ra được một số kết luận như sau:
- Có 3 biến ACT, bgfriend, voluntr có (P-value> |t|) > 0.05 nên chúng không có ý
nghĩa thống kê và ngược lại đối với các biến còn lại.
- Các hệ số hồi quy :
^
β 0= 1,311245 ^
β 4 = 0,0856602
^
β = 0,4220895 ^
β = - 0,0747544
1 5
^
β 2= 0,01307 ^
β 6 = - 0,0788779
^
β 3 = 0,1280678
Phương trình hồi quy tuyến tính mẫu cần tìm là:
Y^i = 1,311245+ 0, 4220895 * hsGPA + 0,01307*ACT + 0,1280678 * PC +
0,0856602 * bgfriend - 0,747544 * skipped - 0,0788779 * voluntr
Phân tích kết quả hồi quy:
- Số quan sát Obs = 141
- Tổng bình phương sai số tổng cộng SST = 19.4060994
- Tổng bình phương sai số được giải thích SSE = 5.40458682
- Tổng bình phương các phần dư SSR = 14.0015126
- Bậc tự do của phần được giải thích Dfm= 6
- Bậc tự do của phần dư Dfr = 134
Hệ số xác định R2 = 0. 2785 thể hiện mức độ phù hợp của hàm hồi quy mẫu là tương
đối lớn. Điều này có nghĩa là các biến độc lập giải thích được 27,85 % giá trị biến phụ thuộc.
Hệ số xác định điều chỉnh R2 = 0.2462
Ý nghĩa các hệ số hồi quy trong mô hình:
40 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
Với điều kiện các yêu tố khác không đổi thì ý nghĩa các biến ảnh hưởng tới Điểm
GPA tại MSU như sau:
^
β = 1,311245 có ý nghĩa là: khi giá trị của các biến độc lập bằng 0 trong điều kiện
0
các yếu tố khác không đổi thì điểm GPA trung bình khi học tại đại học MSU của
sinh viên là 1,311245
^
β 1= 0,4220895 có ý nghĩa là: Điểm GPA trung bình thời trung học cứ cao thêm 1
điểm thì Điểm GPA trung bình khi học tại đại học MSU của sinh viên cao thêm
0,422 điểm trong điều kiện các yếu tố khác không đổi
^
β 2= 0,01307 có ý nghĩa là: Điểm trong kì thi ACT tăng 1 điểm thì điểm PPA
trung bình tại đại học MSU của sinh viên cao thêm 0,013 điểm trong điều kiện
các yếu tố khác không đổi (mặc dù kiểm định p value cho thấy biến này không có
ý nghĩa thống kê tuy nhiên vẫn có ý nghĩa về mặt thông tin).
^
β 3 = 0,1280678 có ý nghĩa là: Sinh viên có máy tính cá nhân tại trường có điểm
GPA trung bình cao hơn sinh viên không có máy tính 0,128 điểm tại MSU trong
điều kiện các yếu tố khác không đổi.
^
β 4 = 0,0856602 có ý nghĩa là: Sinh viên có bạn trai hoặc bạn gái sẽ có thể có
điểm trung bình GPA cao hơn sinh viên không có bạn trai hoặc bạn gái 0,08567
điểm trong điều kiện các yếu tố khác không đổi (mặc dù tại kiểm định mẫu này
không mang ý nghĩa thống kê tuy nhiên vẫn có ý nghĩa về mặt thông tin).
^
β 5 = - 0,0747544 có ý nghĩa là: Sinh viên có số buổi nghỉ học trung bình trên tuần
tăng thêm 1 đơn vị thì điểm GPA trung bình giảm 0,0747 điểm trong điều kiện
các yếu tố khác không đổi.
^
β 6 = - 0,0788779 có ý nghĩa là: Sinh viên có tham gia hoạt động tình nguyện sẽ
có điểm GPA trung bình thấp hơn sinh viên không tham gia là 0,0789 điểm trong
điều kiện các yếu tố khác không đổi (mặc dù kiểm định tại mẫu này cho thấy biến
này không mang ý nghĩa thống kê tuy nhiên vẫn có ý nghĩa về mặt thông tin).
41 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
Chạy mô hình hồi quy mẫu với 3 biến X1, X3, X5 với lệnh reg [biến phụ thuộc] [biến
độc lập] ta có bảng kết quả sau:
. reg colGPA hsGPA PC skipped
------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
------------------------------------------------------------------------------
Kết luận: Như vậy cho thấy, ta có thể bỏ 3 biến X 2 (ACT); biến X 4 (bgfriend); biến X6
(voluntr) ra khỏi mô hình hồi quy xem xét ảnh hưởng tới điểm GPA trung bình của sinh viên
tại đại học MSU.
{
2
H 0 : R =0
Ta xác định giả thuyết:
H 1 : R2 ≠ 0
42 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
R2 0,2785
k 6
Ta có: F = (1−R2 ) = (1−0,2785) = 8,62
(n−k−1) (141−6−1)
Tra bảng phân phối Fisher , ta có : C 6,134
0,05 = 2, 16
(obs=141)
voluntr
-------------
+---------------------------------------------------------------
colGPA | 1.0000
43 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
1.0000
Từ bảng số liệu trên, ta thấy mô hình không mắc đa cộng tuyến
2.3. Cách phát hiện dấu hiệu của phương sai sai số thay đồi:
Cách 1: Xem xét đồ thị của phần dư:
Trong cách này ta sẽ sử dụng đồ thị của sai số của hồi qui e (phần dư) với giá
trị dự đoán Yi (biểu diễn sự tương quan giữa e và Yi).
Từ cơ sở dữ liệu đã cho và phần mềm stata, sử dụng lệnh: rvfplot, yline (0) ta
xây dựng được Đồ thị sau:
44 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
1
.5
Residuals
0
-.5
-1
2.5 3 3.5
Fitted values
Dựa vào lí thuyết kinh tế lượng đã được học và đồ thị vừa xây dựng được, ta thấy các
giá trị trên đồ thị phân bố không đồng đều, các giá trị có xoay xung quanh giá trị trung
bình bằng 0 (đường ngang màu đỏ), tỉ lệ rời xa giá trị trung bình bằng 0 tương đối lớn.
Vì thế, ta có thể dự đoán được mô hình có thể có hiện tượng phương sai sai số thay
đổi.
chi2(24) = 28.40
---------------------------------------------------
Source | chi2 df p
---------------------+-----------------------------
---------------------+-----------------------------
Từ bảng trên, kết quả kiểm định bằng lệnh imtest, white cho thấy Prob > chi2
= 0.2436> 0.05 => Không có cơ sở để bác bỏ giả thiết H 0 hay mô hình có phương sai
sai số không đổi (với mức ý nghĩa 5%).
Cách 3: Dùng kiểm định Breusch – Pagan:
chi2(1) = 3.46
Từ kết quả thu được, ta thấy Prob > chi2 = 0.0628 > 0.05 => Không
có cơ sở để bác bỏ giả thiết H0 hay mô hình có phương sai sai số không đổi (với mức ý
nghĩa 5%).
KẾT LUẬN: Với kết quả của các kiểm định trên ta có thể kết luận được rằng không
xảy ra hiện tượng phương sai sai số thay đổi.
46 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
-------------+---------------------------------------------------------------
Từ kết quả trên ta thấy rằng giá trị (Prob>chi2) = 0,1372 > 0,05 nên mô hình có
phân phối chuẩn của sai số u nên bước sửa chữa được loại bỏ.
47 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
48 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
Lời kết
Bài báo cáo trên được hoàn thành trên cơ sở sự đóng góp của các thành viên với vốn
kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Kinh tế lượng. Đây cũng là một
cơ hội thực hành khiến chúng em có thể hiểu rõ hơn về các phân tích và kiểm định đặc trưng
có liên quan, áp dụng kiến thức trên giảng đường để tự tìm hiểu và rút ra được nhưng kết luận
bổ ích về những hiện tượng trong những mối tương quan khác nhau và sự ảnh hưởng lẫn
nhau giữa các hiện tượng kinh tế xã hội thiết thực, logic và khoa học.
Qua đây, nhóm 10 chúng em cũng xin chân thành cám ơn sự chỉ dạy của cô Đinh Thị
Thanh Bình. Vì vốn kiến thức và kĩ năng còn nhiều hạn chế nên mong rằng cô và các bạn sẽ
góp ý để chúng em có thể hoàn thiện hơn, áp dụng tốt hơn trong các công việc về sau.
Chúng em xin chân thành cảm ơn và hi vọng cô sẽ đánh giá cao bản báo cáo này !./
49 | P a g e
Báo cáo kinh tế lượng năm 2014
Nhóm 10- Bảng số liệu số 15-39 Lớp KTE309(2-1314).25_LT
50 | P a g e
Báo cáo kinh tế lượng năm 2014