You are on page 1of 33

CHƯƠNG 0 : ÔN TẬ P XÁC SUẤT THỐNG KÊ

I. Các khái niệm cần phải biết


- Các đặc điểm của phân phối xác
- Phép thử, không gian mẫu, biến suất
cố - Giá trị kỳ vọng
- Biến ngẫu nhiên - Kỳ vọng có điều kiện
- Biến ngẫu nhiên rời rạc ( discrete - Từ tổng thể đến mẫu
- Biến ngẫu nhiên liên tục + TB mẫu

- Xác suất + Phương sai mẫu

+ Xác suất 1 biến cố : định nghĩa + Hiệp phương sai mẫu


cổ điển + Hệ số tương quan mẫu
+ Tấn suất tương đối - Một số phân phối xác suất cơ bản
- Phân phối xác suất của biến ngẫu + Phân phối chuẩn (normal
nhiên distribution)
+ Phân phối xác suất của 1 biến + Phân phối chuẩn hóa( standard
ngẫu nhiên rời rạc normal distribution)
+ Phân phối xác suất của 1 biến + Phân phối xác suất của trung
ngẫu nhiên liên tục bình mẫu
+ Hàm phân phối tích lũy của 1 + Định lý giới hạn trung tâm
biến ngẫu nhiên + Phân phối t
+ Hàm xác suất biên + Phân phối X2
+ Hàm xác suất điều kiện + Phân phối F
Trang 1/33
- Suy diễn thống kê + Mối quan hệ giữa hai phương

- Ước lượng các tham số pháp kiểm định

+ Ước lượng điểm + Kiểm định t, kiểm đinh F

+ Ước lượng khoảng - Phần mềm phân tích dữ liệu:


Stata(có tài liệ hướng dẫn),
- Tính chất của ước lượng điểm
Excel( có tài liệu hướng dẫn)
+ Tuyến tính
+ Không chệch
+ P/s nhỏ nhất
+ Hiệu quả
+ Ước lượng tuyến tính không
chệch hết
- Kiểm định giả thuyết
+ Giả thuyết không
+ Giả thuyết đối
+ Kiểm định dựa vào khoảng tin
cậy
 Vùng chấp nhận
 Vùng phê phán
 Vùng bác bỏ
 Giá trị phê phán
 Sai lầm loại 1
 Sai lầm loại 2
 Kiểm định 1 phía
 Kiểm định 2 phía
+ Mức ý nghĩa và giá trị xác suất
p – value

Trang 2/33
CHƯƠNG 1: NHẬ P MÔN KINH TẾ LƯỢNG
I. Bảnchất của kinh tế lượng và dữ liệu kinh tế
1. Kinh tế lượng là gì
- Kinh tế lượng sử dụng các phương pháp thống kê để phân tích dữ liệu kinh tế
- Phân tích dữ liệu phi thí nghiệm

a. Các mục tiêu đặc trưng


- Ước lượng các mối quan hệ giữa các biến kinh tế
- Kiểm định các lý thuyết và các giả thuyết kinh tế
- Dự báo các biến kinh tế
- Đánh giá thực thi các chính sách của chính phủ và doanh nghiệp

b. Ứng dụng kinh tế lượng


- Dự báo biến số quan trọng của kinh tế vĩ mô: lãi suất, tỷ lệ lạm phát, tổng sản
phẩm quốc nội
- Tác động của việc chi tiêu cho các dịch tranh cử kết quả bầu cử
- Giáo dục: Tác động chi tiêu trường học đến kết quả học tập của sinh viên
- Phương pháp KTL để dự báo các chuối thời gian kinh tế

c. Dữ liệu phi thí nghiệm


- Việc thu thập và phân tích dữ liệu phi thí nghiệm
- Dữ liệu phi thí nghiệm không được thu thập thông qua các thí nghiệm có thể
kiểm soát trên những cá nhân hoặc phân khúc nền kinh tế
- Dữ liệu quan sát nhà nghiên cứu là người thu thập dữ liệu một cách bị động
- Được sử dụng rộng rãi ở các ngành khoa học xã hội
- Dữ liệu thí nghiệm : rất khó thu thập trong khoa học xã hội
- Thí nghiệm về xã hội có kiểm soát giải quyết những vấn đề kinh tế thường
không thể, quá tốn kém hoặc vi phạm đạo đức

Trang 3/33
2. Phân tích kinh tế thực nghiệm
a. Phân tích thực nghiệm ( empirical analysis)
- Sử dụng dữ liệu để phân tích
- Kiểm định một lý thuyết kinh tế
- Ước lượng một mối quan hệ kinh tế
- Mối quan hệ có ý nghĩa quan trọng đối với các quyết định kinh doanh hoặc phân
tích chính sách

d. Các bước phân tích thực nghiệm


Bước 1: Xác định cẩn thận về vấn đề nghiên cứu
- Kiểm định lý thuyết kinh tế
- Kiểm định các tác động của một chính sách
Bước 2: Xác định mô hình kinh tế (economic model)
- Bao gồm phương trình toán học mô tả các mối quan hệ khác nhau
• Ví dụ :
- Kinh tế vi mô: quyết định chi tiêu của cá nhân phụ thuộc vào ràng buộc ngân
sách được mô tả bằng những mô hình toán học
- Vấn đề tối đa hóa lợi ích: các cá nhân đưa ra lựa chọn để tối đa hóa lợi ích của
họ trong điều kiện nguồn lực có hạn
- Phương trình hàm cầu : lượng cầu của mỗi hàng hóa phụ thuộc vào giá của
chính hàng hóa đó, giá của hàng hóa thay thế, thu nhập của người tiêu dùng
- Phân tích kinh tế lượng và nhu cầu tiêu dùng

• Ví dụ 1: Mô hình về lý thuyết tội phạm ( Becker, 1986)


- Lý thuyết nền về tối đá hóa lợi ích để mô tả sự tham gia của một cá nhân vào
quá trình phạm tội.

Trang 4/33
- Quyết định thực hiện hoạt động phạm pháp là một sự phân bổ nguồn lực sau khi
xem xét những lợi ích và chi phí của các hoạt động này.

Số giờ tiêu tốn y= f(x1,x2,x3,x4,x5,x6,x7)


Tuổi
cho hoạt động
phạm tội
Mức án
dự kiến
Số tiền nhận được của
Tiền lương Thu nhập Khả năng nếu bị
hoạt động phạm tội Khả năng
cho việc khác bị bắt bắt
bị kết án
làm hợp
nếu bị bắt
pháp

- Có các yếu tố khác ảnh hưởng đến quyết định tham gia vào quá trình phạm tội
- Yếu tố tiêu biểu của phân tích kinh tế chính thức
- Sử dụng lý thuyết kinh tế - hoặc suy luận cá nhân - để dự đoán tác động của mỗi
biến lên hoạt động tội phạm
- Đây là cơ sở cho một phân tích kinh tế lượng về hoạt động tội phạm cá nhân
- Khởi đầu cho phân tích thực nghiệm: mô hình kinh tế chính thức
- Trực giác
Bước 3: Chuyển mô hình kinh tế thành mô hình kinh tế lượng (econometric
model)
- Xác định dạng hàm f()
- Giải quyết với các biến không thể quan sát một cách hợp lý
• Ví dụ: Becker, 1986
- Nhiều yếu tố khác tác động đến hành vi tội phạm mà chúng ta không thể liệt kê
ra hết được
- Nhưng bằng cách nào đó chúng ta phải xem xét đến chúng
Đo lường hoạt Tiền lương cho
đọng động phạm Số lần bị bắt giữ trước
việc làm hợp Thu nhập khác đây
tội pháp Các yếu số tác động đến hoạt
động phạm tội nhưng không quan
sát được

Trang 5/33
Ví dụ : tính cách số tièn thi
được từ hoạt động phạm
Số lần bị Độ dài bản án nếu bị Tuổi
kết án kết tội

Crime = β0 + β1wagem + β2othinc + β3frequarr +


β4freqconv + β5 avgsen + β6age + u

- Chọn biến đưa vào mô hình: lý thuyết kinh tế và xem xét dữ liệu
- Thực tế, xử lý phần sai số hay nhiễu là phần quan trọng nhất của bất kỳ phân
tích kinh tế lượng nào
- Các hằng số β0; β1; :::β6 là các tham số của mô hình KTL, chúng mô tả chiều
hướng và mức độ của mối quan hệ giữa crime và các yếu tố được giải thích cho
crime
• Ví dụ 2. Mô hình đào tạo nghề và năng suất người lao động
Đo lường hoạt Số lần bị bắt giữ trước
động phạm tội Thu nhập khác đây
Các yếu số tác động đến tiền
lương không quan sát được

wage = β0 + β1educ + β2exper + β3training


+u Ví dụ : năng lưjc bẩm sinh,
chát lượng giáo dục, nền
1.4 tảng gia đình
Tiền lương Số tuần tham gia
Số năm đi học Số năm kinh
theo giờ đào tạo nghề
chính thức nghiệm

Kiểm định giả thuyết


- Tham số β3 cho biết tác động của việc đào tạo lên tiền lương
- Tác động này lớn ra sao? Tác động này có khác 0 hay không?

Trang 6/33
• #Slideneu

Bước 1: Nêu các giả thuyết, giả thiết


• Đưa các giả thuyết về mối liên hệ giữa các yếu tố
• Giả thuyết phù hợp mục đích nghiên cứu
• Còn gọi là xây dựng mô hình lý thuyết
Bước 2: Định dạng mô hình toán học, gồm
• Các biến số: lượng hóa, số hóa các yếu tố
• Các tham số, hệ số thể hiện mối liên hệ
• Các phương trình
Bước 3: Định dạng mô hình kinh tế lượng
• Thêm vào mô hình toán học yếu tố ngẫu nhiên,
thể hiện qua sai số ngẫu nhiên
Bước 4: Thu thập số liệu
• Để ước lượng các tham số cần số liệu mẫu
• Độ chính xác của số liệu ảnh hưởng đến kết quả
Bước 5: Ước lượng các tham số
Trang 7/33
• Sử dụng phân tích hồi quy, ước lượng tham số
Bước 6: Phân tích kết quả
• Phân tích về kinh tế: có phù hợp lý thuyết không?
• Phân tích về kỹ thuật: thống kê và toán học
• Nếu có sai lầm, quay lại các bước trên
Bước 7: Dự báo
• Mô hình phù hợp về lý thuyết và kỹ thuật, sử
dụng để dự báo
Bước 8: Kiểm tra, đề ra chính sách

3. Cấu trúc dữ liệu kinh tế


Các loại dữ liệu kinh tế
1. Dữ liệu chéo (cross–sectional data)
2. Dữ liệu chuỗi thời gian (time–series data)
3. Dữ liệu chéo gộp (pooled cross sectional)
4. Dữ liệu bảng (panel data)

3.1. Dữ liệu chéo ( cross – sectional data)


- Mẫu của các cá nhân, các hộ gia đình, các doanh nghiệp, hoặc các đối tượng
khác, được thu thập tại một thời điểm cụ thể hoặc trong một khoảng thời gian đã
cho
- Các quan sát có thể ít nhiều độc lập với nhau
- Giả định dữ liệu được thu thập bằng cách lẫy mẫu ngẫu nhiên (random
sampling) từ tổng thể cần nghiên cứu
- Đôi khi việc lấy mẫu ngẫu nhiên bị vi phạm, ví dụ: các đơn vị từ chối trả lời
trong các cuộc khảo sát, hay nếu việc lấy mẫu được phân theo cụm
- Kinh tế vi mô ứng dụng

Trang 8/33
• Ví dụ: Dữ liệu chéo về tiền lương và các đặc điểm cá nhân

- 526 cá nhân làm việc trong năm 1976


- wage: tiền lương tính bằng đô la trên giờ
- educ: số năm đi học
- exper: số năm kinh nghiệm tiềm năng
- female: biến giả về giới tính, biến nhị phân
- married: biến giả tình trạng hôn nhân
- Cột đầu tiên: số thứ tự quan sát được gán cho mỗi người trong mẫu, nó không
phải là một đặc điểm của cá nhân
- Thứ tự của dữ liệu không quan trọng, đặc điểm của dữ liệu chéo khi mẫu được
chọn ngẫu nhiên

3.2. Dữ liệu chuỗi thời gian


Dữ liệu chuỗi thời gian
- Các quan sát về một hoặc nhiều biến theo thời gian
- Ví dụ: giá cổ phiếu, cung tiền, chỉ số giá tiêu dùng tổng sản phẩm quốc nội,
doanh số bán ô t
- Thứ tự thời gian của các quan sát trong chuỗi thời gian chuyển tải những
thông tin tiềm ẩn quan trọng
- Các quan sát chuỗi thời gian thường gặp vấn đề về tương quan chuỗi
- Tần suất dữ liệu: hàng ngày, hàng tuần...
Trang 9/33
- Đặc điểm tiêu biểu của chuỗi thời gian: xu thế và thời vụ
- Kinh tế vĩ mô và tài chính ứng dụng
Tương quan chuỗi
- Đặc điểm quan trọng: các quan sát kinh tế hiếm khi được giả định là độc lập
theo thời gian ) khó phân tích hơn dữ liệu chéo
- Chuối thời gian có tương quan, tương quan mạnh, với những dữ liệu gần trong
quá khứ của chúng
- Ví dụ: GDP của quý trước, thông tin của quý này, khoảng biến thiên của GDP
quý này, GDP có xu hướng khá ổn định từ quý này sang quý tiếp theo
- Nhiều thủ tục quan trọng cần phải thực hiện cho chuỗi dữ liệu thời gian trước
khi áp dụng các mô hình kinh tế lượng thông thường.
Bảng 2 : Lương tối thiểu, thất nghiệp, dữ liệu liên quan của Puerto Rica
Tác động của lương tối thiểu Peurto Rico
Dữ liệu phải được lưu trữ theo thời gian

So sánh dữ liệu chéo và tương quan chuỗi


- Thứ tự thời gian của các quan sát dữ liệu chéo cần giữ nguyên do có sự liên
quan đến các thời gian khác
- Tương quan chuỗi: các dữ liệu không có tương tác về mặt thời gian, do đó
không cần xếp thứ tự các quan sats
3.3. Dữ liệu bảng
Các chuỗi thời gian ứng với mỗi đối tượng chéo trong tập dữ liệu
- Ví dụ: tiền lương, học vấn và lịch sử làm việc của môt tập hợp các cá nhân trong
khoảng thời gian mười năm
- Chiều thời gian và chiều dữ liệu chéo
Trang 10/33
- Yếu tố không quan sát được nhưng thay đổi theo thời gian
Bảng 3: Dữ liệu bảng hai năm về thống kê tội phạm thành phố

• Nhận xét:
- Dữ liệu chéo: ít gặp khó khăn về khái niệm và kỹ thuật nhất
- Chuỗi thời gian sử dụng rất nhiều các công cụ tương tự như phân tích dữ liệu
chéo, nhưng thường phức tạp hơn vì tính xu hướng, tính bền, tính động, tính
mùa vụ
- Dữ liệu bảng: một số vấn đề khó có thể trả lời thỏa đáng mà không có dữ liệu
bảng
Tính trễ trong hành vi hoặc kết quả của việc ra quyết định
4. Quan hệ nhân quả và các yếu tố khác không đổi
4.1. Tác động nhân quả
Định nghĩa về tác động nhân quả của x đến y
Cách thức biến y thay đổi khi biến x thay đổi “trong điều kiện các yếu tố khác
không đổi”
- Đa số các câu hỏi kinh tế là câu hỏi phân tích trong điều kiện các yếu tố khác
không đổi
- Điều quan trọng là xác định tác động nhân quả nào mà người ta quan tâm
- Cần thiết phải mô tả cách thiết kế một thí nghiệm để có thể suy diễn được về
quan hệ nhân quả mà câu hỏi nghiên cứu đặt ra
• Ví dụ: Phân tích nhu cầu người tiêu dùng
- Tác động của việc thay đổi giá của một mặt hàng lên lượng cầu của nó
- Giữ tất cả các yếu tố khác không đổi: thu nhập, giá cả của các hàng hóa khác, thị
hiếu cá nhân

Trang 11/33
- Nếu các yếu tố khác không được giữ cố định, thì chúng ta ta không thể biết tác
động nhân quả của sự thay đổi giá lên lượng cầu
• Ví dụ: Đo lường suất sinh lợi của giáo dục
- Nếu một người được chọn từ tổng thể và số năm đi học của người này tăng thêm
một, tiền lương của họ sẽ tăng bao nhiêu
- Giả thiết ngầm: tất các yếu tố khác tác động đến tiền lương như kinh nghiệm,
nền tảng gia đình, sự thông minh,... được giữ cố định
- Số năm đi học của một người có liên hệ với các yếu tố khác mà tác động đến
tiền lương (ví dụ: sự thông minh

Trang 12/33
CHƯƠNG II : MÔ HÌNH HỒI QUY ĐƠN
1. Định nghĩa mô hình hồi quy đơn
1.1. Giải thích biến y theo x
Phân tích KTL ứng dụng
- Cho y và x là hai biến đại diện cho tổng thể nào đó
- Giải thích biến y theo x
- Nghiên cứu sự thay đổi của y khi x thay đổi
Ví dụ
- Y là sản lượng đậu nành và x là lượng phân bón
- Y là tiền lương theo giờ và x là số năm đi học
Giải thích biến y theo x
Hệ số chặn
Hệ số góc
2.
1
Y = β0 + β1x + u

Thành phần sai số


ngầu nhiên ( dại diện
Biến phụ thuộc các yéu tố không
Biên được giải Số năm đi học quan sát được
thích chính thức Nhiều u luôn tồn tại
Biến được quy hồi

4.2. Diễn giải mô hình hồi quy

“Nghiên cứu sự thay đổi của y tương ứng với sự thay đổi trong x”
∆ y =β 1 ∆ x nếu ∆ u=0 2.2
∂y ∂u
= β 1 với điều kiện =0
∂x ∂x

Biến phụ thuộc thay đổi bao nhiêu


đơn vị nếu biến độc lập tăng thêm Việc giải thích chỉ đúng khi tất cá
một đơn vị các yếu tố giữ nguyên, khi biến độc
lập tăng 1 đơn vị

Trang 13/33
- Giải quyết về dạng hàm trong mối quan hệ giữa y và x
- Nếu các thành phần khác trong u được giữ cố định, thì x có tác động tuyến tính
lên y.
• Ví dụ: Phương trình tiền lương dạng đơn giản
Một mô hình thể hiện mối quan hệ giữa tiền lương của người lao động với trình độ
học vấn và các yếu tố không quan sát được
Wage = β0 + β1educ +
u
Kinh nghiệm tham
gia lực lượng lao
2. động, thâm niên
Đo sự thay đổi trong tiền lương theo giờ
4 chức vụ, đạo đức
khi thêm 1 năm đi học giữ nguyên các yếu
công việc, sự thông
tố khác cố
minh …..

- Tính chất tuyến tính, không phụ thuộc vào giá trị ban đầu của x, không đúng
trong thực thế
- Mối quan hệ giữa tiền lương – học vấn, suất dinh lợi theo giáo dục tăng dần :
nghĩa là năm đi học tiếp theo sẽ có tác động lớn hơn đến tiền lương so với năm
đi học trước đó
- Mô hình cho phép đo lường suất sinh lợi tăng dần
4.3. Quan hệ nhân quả
- Làm sao có thể kết luận được chính xác tác động của x lên y, trong điều kiện các
yếu tố khác không đổi
- Có thể ước lượng đáng tin cậy β0 β1 từ một mẫu ngẫu nhiên
- Ràng buộc rất chặt về mối quan hệ giữa các thành phần không quan sát được
trong u với các biến giải thích x
- Do u và x là các biến ngẫu nhiên, ràng buộc giữa các biến sẽ được phát biểu
theo công thức xác suất
Giả định về u
E(u) = 0
- Phân phối của các yếu tố chưa quan sát được trong tổng thể
- Trung bình của các yếu tố khác chưa đưa vào mô hình tiền lương bằng 0 trong
tổng thể tất cả những người làm việc
Mối liên hệ giữa u và x
Trang 14/33
- U và x là các biến ngẫu nhiên,phân phối có điều kiện của u và x
- Giả thiết trung bình có điều kiện bằng 0

Biến giải thích không hàm chứa


E(u|x) = 0 thông tincủa các yếu tố không quan
2.5 & 2.6 sát được

Ví dụ tiền lương
- Giả sử u chỉ bao gồm yếu tố năng lực bẩm sinh
- Mức trung bình năng lực bẩm sinh là như nhau không phụ thuộc vào số năm đi
học
- E(abil|8) là năng lưucj bẩm sinh trung bình của nhóm lao động có số năm đi học
là 8
- E(abil|8)=E(abil|16), phi thực tế
4.4. Hàm hồi quy tổng thể (PRF)
- Giả thiết trung bình có điều kiện bằng 0, hàm ý
E(y|x) = E(β0 + β1+u|x)
= β0 + β1x+ E(u|x)
= β0 + β1 x
- Đây là hàm hồi quy tổng thể (PRF)
- E(y|x) là một hàm tuyến tính theo x
- Tuyến tính có nghĩa là mỗi đơn vị tăng thêm của x đều làm thay đổi giá trị kỳ
vọng của y một lượng đúng bằng β1
• Ví dụ
- Giả sử xét đường cầu nước khoáng đóng chai tại một ốc đảo có 55 hộ gia đình
- Qua khảo sát ta có kết quả như sau:

Trang 15/33
- Tại mức giá bằng 2, có 5 người tiêu dùng sẵn lòng trả, với các lượng cầu tương
ứng lần lượt là 44,45,47 và 48’ E(Y|X = 2) = 46
- Các giá trị trung bình của Y cho từng X, được gọi là giá trị kỳ vọng có điều kiện

Trang 16/33
- Đường thẳng đi qua các E(Y/X) : đường hồi quy tổng thể
- Đường hồi quy thể hiện một xu hướng khi tăng giá thì lượng cầu giảm : quy
luật cầu
- Đường hồi quy tổng thể là đường thẳng cho biết giá trị trung bình của biến phụ
thuộc (lượng cầu nước đóng chai) theo từng giá trị tương ứng của biến độc lập
( giá nước đóng chai) trong toàn bộ tổng thể

- E(y|xi) – f(x) ( trong trường hợp này là có vẻ có dạng tuyết tính)


E(y|xi) = β0 + β1xi (1)
(1)Phương trình toán của đường hồi quy
- Trong đó, i là ký hiệu của hộ gia đình thứ i trong tổng thể
- (1) gọi là hàm quy hồi tổng thể dạng xác định

• VD:
- Khi x =4, thì y trung bình là 42
- Nhưng nếu ta lấy một hộ ngẫu nhiên trong 6 hộ ở mức giá này thì có thể lượng
cầu sẽ không bằng 42
- Có sự chênh lệch giữa giá trung bình và từng giá trị cá biệt mỗi nhóm
- Lượng cầu của một hôh ngẫu nhiên bằng lượng cầu trung bình của nhóm đó
cộng hoặc trừ một lượng sai số nào đó
5. Tìm các ước lượng bình phương nhỏ nhất
 Để ước lượng mô hình hồi quy, ta cần dữ liệu
 Một mẫu ngẫu nhiên gồm n quan sát
- (x1, y1)  quan sát thứ nhất
- (x2, y2)  quan sát thứ hai {(xi, ui) : i = 1,…, n}
- (x3, y3)  quan sát thứ ba
-:
- (xn, yn)  quan sát thứ n Giá trị của biến giải
Giá trị của biến phụ
thích ở quan sát thứ i thuộc ở quan sát thứ i
5.1. PRS và SRF
a. Hàm hồi quy tổng thể PRF
- Dạng xác định: E(y\x) = β0 + β1x
Trang 17/33
- Dạng ngẫu nhiên : y = β 0 + β1 x + u
= phần hệ thống + phần phi hệ thống
e. Hàm hồi quy mẫu (SRF)
- Dạng xác định : ^y = β^0+ ^
β 1x
- Dạng ngẫu nhiên : ^y = β^0+ ^β 1 x + u^

y = ^y + u^
- u: sai số ngẫu nhiên
- u^ : phần dư ,thắng dư
-^ β 0là ước lượng của β 0
-^ β 1 là ước lượng của β 1
Note: Ước lượng ( estimator) # Gt (estimate)
f. Giá trị ước lượng của y
- Với mọi ^β 0 và ^
β 1 giá trị ước lượng của y khi x = xi là:
β 1 xi (5)
yi= β^0+ ^
^
- Đây là giá trị dự đoán của y khi x= xi với hệ số chặn và hệ số góc cho trước
- Mỗi quan sát trong mấu đều có một giá trị ước lượng của y tương ứng
g. Phần dư
Phần dư của quan sát thứ i là chênh lệch giữa giá trị thực tế của yi và giá trị ước
lượng ^yi
ui= yi= yi− ^
^ yi− ^ β0 -^
β 1 xi
Có n phần dư như vậy
Ta sẽ chọn ^
β0 và ^
β1 sao cho tổng bình phương các giá trị phần dư đạt giá trị nhỏ nhất
n n

∑ ui^ 2=∑ ( ^yi− β^0 − ^β1 xi)2


i=1 i =1

6. Phương pháp OLS


6.1. Nội dung phương pháp OLS
Chọn ^
β 0 và ^ ^ 2 đạt giá trị nhỏ nhất
β 1 sao cho Σ ui
^2
∂ ui
=0 ;
∂^β0

Trang 18/33
^
β 0=¿ ¿
x́ là giá trị trung bình của x

x=
∑ xi
n
ý là giá trị trungbình của y

y=
∑ yi
n

^
β 0=¿ ¿

Chọn ^
β 0 và ^
β1

Càng phù hợp càng tốt : yi


^ càng gần với yi với mọi i
- Các phần dư hồi quy
2.21
u^i= y i− ^ y i− β^0 − ^
y i= ^ β1 x i

- Cực tiểu hóa tổng bình phương các phần dư hồi quy

Min ∑ u^ i2 → ^
β0 , ^
β1
i=1

- Ước lượng bình phương nhỏ nhất thông thường (OLS)

n 2.17 &
∑ ( x i−x́ )( y i− ý ) 2.19
β 1= i=1
^
n
,^
β 0= ý− β^1 x́
∑ ( x i− x́ )2
i=1

….
Đây là một đoạn bị missing cái gì đấy
Gọi là ước lượng bình phương nhỉ nhất OLS của ^
β0 và ^
β1

- Với mọi ^ β 1 giá trị ước lượng của y khi x = xi là


β 0 và ^
y i= β^0 + ^
^ β 1 xi
Trang 19/33
- Đây là giá trị dự đoán của y khi x = xi với hệ số chặn và hệ số góc cho trước
Đường hồi quy OLS
y i= β^0 + ^
^ β1 xi (9)
- Hàm hồi quy mẫu ( sample regression function, SRF)
- Phiên bản ước ước lượng của PRF : E(y|x) = β0 + β1x
- Hệ số chặn ^
β 0 là giá trị dự đoán của y khi x = 0, thường ít được quan tâm
- PRF cố định, nhưng chưa biết trong tổng thể
- SPF luôn tính toán được với dữ liệu khác nhau sẽ có hệ số góc và hệ số chặn
khác nhau theo (9)

* Ta có hàm hồi quy mẫu dạng xác định


y i= β^0 + ^
^ β 1 xi ( ^y = β^0 + β^1 x ¿

- Khi xi =0 thì ^
y 0= β^0
- Khi x tăng lên 1 đơn vị thì : (thêm) → ∆x = 1 → ∆ ^y =?
Hệ số góc
^ ∆ ^y
β 1=
∆ ^x
- Lượng thay đổi của ^y khi x tăng thêm 1 đơn vị
∆ ^y = ^
β1∆ x
- Với bất kỳ sự thay đổi nào của x, chúng ta đều có thể dự đoán được sự thay đổi
của y
• Ví dụ
Hàm hồi quy mẫu dạng xác định ( Đường hồi quy OLS ) là:
^y =−0.0949+0.5414 educ
Diễn giải:
+/ Khi educ = 0 thì tiền lương dự đoán là w^
age=−0.9049

+/ ^
β1=0.05414 → khi∆ educ=1thì tiền lương dự đoán tăng0.5414

Nội dung của phương pháp OLS : Chọn ^ β 0 và ^


β 1 sao cho tổng bình phương các phần
dư đạt giá trị nhỏ nhất :∑ u^i2 đạt giá trị min
+/ Phần dư của quan sát thứ i : u^i= y i−^y i
¿ y i− β^0− β^1 x
Trang 20/33
→ Có n quan sát → có n phần dư
+/ Tổng bình phương các phần dư
n n

∑ ui^ 2=∑ ( ^yi− β^0 − ^β1 xi)2


i=1 i =1

Đây là phần doc 1


Tính chất đại số của các thống kê OLS
n n

∑ u^ i=0 2.30∑ x i u^i=0 2.31 ý= β^ 0 + β^ 1 x́


i=1 i=1

Tương quan giữa phần


Tổng các phân tử bằng 0 dư và biến độc lập bằng Trung bình mẫu của y
0 và x nằm trên đường
Có n phần dư, giá trị trung bình mẫy của phần dư = 0 hồi quy mẫu SRF

Đo lường sự biến động


n n n
2
SST = ∑ ( y i− ý ) SSE = ∑ ( ^y i− ´^y )2 SSR = ∑ u^i2
i=1 i=1 i=1

Tổng bình phương toàn Tổng bình phương hồi


Tổng bình phương phần dư, cho
phần cho biết toàn bộ quy, cho biết biến thiên
biết phần biến thiên không được
biến thiên trong biến phụ được giái thích bởi hàm
giải thích bởi hàm hồi quy
thuộc hồi quy
- STT : total sum of Squares
- SSE : Explained Sum of Squares
- SSR : Residual Sum of Squares

Phân rã mức độ biến thiên


SST = SSE + SSR 2.36

Toàn bộ Phần biến Phần biến thiên


phần biến thiên được không được giải
thiên giải thích thích

Đo lường độ phù hợp R2

2.38
Trang 21/33
SSE SSR
R 2= =1−
SST SST
Tính chất: 0 ≤ R2≤ 1
R2 cho biết tỷ lệ phần biến thiên được
giải thích bằng hàm hồi quy
• Ví dụ : Lương của CEO và tỷ số lợi nhuận tiền vốn
^
salary=963.191+18.501roe • 2.3
n = 209, R2 = 0.0132
• Hồi quy chỉ giải thích 1.32% thay
đổi trong tiền lương của CEO

- 98,7% sự thay đổi về lưogn của các CEO này vẫn chưa được giải thích
- Nhiều yếu tố khác liên quan đến đặc điểm doanh nghiệp cũng như đặc điểm
CEO có tác động đến tiền lương
- Những yếu tố này nằm trong thành phần sai số
n

SSE = ∑ ( ^y i− ´^y )2= (n-1)var ( ^y )


i=1
n

SST = ∑ ( y i− ý )2=( n−1 ) var ( y )


i=1

SSN = (n-1) var ( u^ )


var ( ^y ) var ( u^ )
→ R2 = var ( y)
=1−
var ( y)
Cảnh báo :
R2 là hệ số xác định của mô hình
- Phân tích dữ liệu chéo, trường hợp hồi quy R2 thấp không phải hiếm
- R2 không có nghĩa là hồi quy OLS không dùng được
- Ví dụ: Bản chất mối quan hệ giữa salary và roe không phụ thuộc vào độ lớn của
R2
7.
7.1. Ảnh hưởng của việc thay đổi đơn vị tính
a. Biến phụ thuộc thay đổi đơn vị tính
Nếu biến phụ thuộc thay đổi đơn vị tính với hằng số c – mỗi giá trị trong mẫu đều
được nhân với c – thì các ước lượng OLS của hệ số chặn và hệ số góc đều được
nhân cho c

Trang 22/33
h. Biến độc lập thay đổi đơn vị tính
- Nếu biến độc lập được nhân với một hằng số c khác 0 thì hệ số góc OLS sẽ được
chia tương ứng với c
- Không ảnh hưởng đến hệ số chặn
i. R2
- R2 là bất biến đối với những thay đổi đơn vị tính của y hay x
• VD: Roe và tiền lương của Ceo
(ngàn đô) => đô la

Đây là trường hợp thay đổi đơn vị tính của biến phụ thuộc
Thay đổi cả hệ số chặn và hệ số góc
7.2. Kết hợp phi tuyến vào hồi quy đơn

Trang 23/33
 wage
VD 2.4
= βTiền lương và học vấn
0 + β1educ +

Tính theo 2.
giờ USD Số năm đi học
4
 Hàm hồi quy ước lượng
w
^ age=−0.09+0.5 educ 2.27

Hệ số chặn Nếu số năm đi học tăng 1


năm thì tiền lương tăng 0.54
 Diễn giải ý nghĩa nhân quả
USD/giờ

- Do bản chất tuyến tính của (2.27) : 0.54 xu là mức gia tăng cho cả những năm
học đầu tiên cũng như năm học thứ 20 , phi thực tế
Kết hợp phi tuyến tính : Dạng semi – log
• VD 2.10 Hồi quy log tiền lương theo số năm đi học
log ( wage )=β 0+ β1 educ +u
• 2.
4
Log tự nhiên của tiền lương

Diễn giải
Số năm đi học tăng thêm 1 năm thì tiền lương sẽ tăng thêm (β 1 * 100)%
%∆wage = (β1 * 100) %
BUỔI 6
NEU: Tnmu = 69.44 +1.95KN
^β 0=69.44 → Nếu KN = 0 thì Tnmu = 69.44
→ Mức lương TB cảu những người vừa mới tốt nghiệp là khoảng 69.44 triệu/năm
+ ^β 1=1.95 → cứ sau mỗi năm làm việc thì mức lương TB này gia tăng khoảng 1.95
triệu/năm
+ R2 = 1.6% = 0.016 → biến số năm KN chỉ giải thích được 1.6 % sự thay đổi của
mức lương
* Tiền lương
w
^ age = -0.90 + 0.54 educ

Trang 24/33
Với một người đi học 8 năm tiền lương dự đoán ( tiền lương trung bình) là wagemu
= -0.90 + 0.54*8 = 3.42$/h
+ ^β = 0.54, ngụ ý rằng khi số năm đi học tăng thêm 1 năm thì tiền lươngn tăng thêm
54 xu/h
+ R2 = 0.186 = 1.86% → biến edu giải thích khoảng 18.65 sự thay đổi trong wage

Đoạn trên cô đang giải thích sự khác biệt giữa giáo trình NEU với cô dạy
5. Giá trị kỳ vọng và phương sai ước lượng của OLS
Các hệ số hồi quy ước lượng được cho là các biến ngẫu nhiên vì chúng ta được tính
từ một mẫu ngẫu nhiên.
^
β 1=¿ ¿ ^β 0= ý − ^β1 v́

Câu hỏi là trung bình các tham số ước lượng bằng bao nhiêu và chúng biến thiên sao
trong mẫu lặp lại

* NEU
- Các ước lượng thu được từ các mẫu khác nhau của cùng 1 tổng thể có thể rất khác
nhau → do đó cùng có thể khác biệt với các hệ số hồi quy tổng thể
- Nếu đơn giản ước lượng các mô hình nói trên thì chưa có gì để đảm bảo βmu0 và
^β 1 là các ước lượng đáng tin cậy cho các hệ số hồi quy tổng thể ( β0 và β1)

=> Điều này dẫn chúng ta đến câu hỏi như sau
1. Khi nào thì ^β 0 và ^β 1 là các ước lượng đáng tin cậy cho các giá trị chưa biết β0 và
β1
2. Nếu các ước lượng ^β 0 và ^β 1 làđáng tin cậy thì mức độ chính xác của các ước lượng
này là thế nào?
=> Tính không chệch và sộ chính xác của ước lượng OLS

Trang 25/33
=> Một số giả thiết ( assumptions) chỉ ra rằng khi chúng được thỏa mãn thì các ước
lượng ^β 0 và ^β 1 thu được từ phương pháp OLS là các ước lượng không chệch cho
^β 0 và ^β 1

(SLR1 → SLR5) SLR : Simple linear regression

SLR1: Tuyến tính theo các tham số


Trong mô hình tổng thể, biến phụ thuộc, y liên hệ với biến độc lập x và sai số (hay
phần nhiễu), u, theo dạng
(11)
(y là 1 hàm tuyến tính theo x→ các tham số ^β 0 và ^β 1 tuyến tính)
Trong đó, ^β 0 và ^β 1 lần lượt là hệ số chặn và hệ số góc tổng thể
Sử dụng dữ liệu thực tế của y và x để ước lượng các tham số, đặc biệt là ^β 1 giả sử dữ
liệu sử dụng một mẫu ngẫu nhiên

SLR2: Mẫu ngẫu nhiên


Mẫu ngẫu nhiên kích thước n
(10) dưới dạng ngẫu nhiên

Trong đó, ui là sai số hay nhiễu của quan sát thứ i


Ui chưa các thành phần không quan sát được của quan sát thứ i tác động lên yi
Các ước lượng hệ số góc OLS và hệ số chặn không thể tích được trừ khi có vài sự
biến động trong mẫu của biến giải thích
 Mô hình ước lượng trên cơ sở mẫu NN kích thước n { (xi,yi); i= 1,2,…n}
 Khi đó mô hình có thể viết cho từng quan sát mẫu như sau: yi =
SLR3: Sự biến động trong mẫu của biến giải thích
Các gái trị cụ thể của x trong mẫu, ký hiệu là {xi, i= 1,..,n} không nhận cùng một giá
trị

Trang 26/33
SLR4: Kỳ vọng có điều kiện bằng 0
E(ui | xi) = 0 giá trị của biến độc lập không được chứa thông tin về giá trị
trung bình của các yếu tố không quan sát được
Khi giả thiết ….
Cov(x,y) = 0
Giải thiếu này cho rằng tại mỗi giá trị của x= xi bất kỳ thì TB và do đó tổng ảnh
hưởng của các yếu tố ngoài x tên y là bằng 0
VD: PT tiền lương : wage = ^β 0 + ^β 1 educ + u
→ E(ui|educi) = 0
Nó ngụ ý rằng tại mối số năm đi học bất kỳ tác động tổng hợp của các yếu tố như gia
cảnh, trí thông minh, số năm KN … lên đến tiền lương đều bằng nhau và bằng 0
→ abil E( ablil / educ =12) =0
E(abili /educi =16) = 0
Định lý 2.1 Tính không chênh lệch OLS

- Với mọi giá trị của β0 và β1


- ^β 0 là ước lượng không chệch của β0
- ^β 1 là ước lượng không chêch của ^β 1
Phụ thuộc vào mẫu, các giá trị ước lượng sẽ gần hơn hay xa hơn so với các giá trị
đúng của tổng thể
Chúng ta có thể kỳ vọng các giá trị ước lưognj, xét trung binhg, cách bao xa các giá
trị đúng của tổng thể (= độ biến thiên của mẫu)
Độ biến thiên cảu mẫu được đo bằng phương sai của các ước lượng
Var ( ^β 0 ¿ , var ( ^β 1)
Giả thiết SLR.5 ( Phươngn sai thuần nhất)

→ Phương sai của SSNN là bằng nhau tại mọi giá trị xi
→ Giả thiết này cho rằng tại mỗi giá trị của x thì SSNN u có phương sai

Trang 27/33
* SLR4 và SLR5 : var ( u|x) = σ2
E(u|x) = 0 liên quan đến giá trị kỳ vọng của u
Var( u|x) = σ2 liên quan đến phương sai u
Thiết lập tính không chêch của OLS mà không cần đến giả thiết SLR.5
SLR.5 không đóng vai trò trong việc chứng minh β0 và β1 không lệch
Hàm ý là phương pháp bình phương nhỏ nhất có tính hiệu quả
* Phương sai của SSNN u ( var(u))
Độ chính xác cảu ước lượng OLS
Var(u|x) =
Var(x) = E(X2) – [E(X)]2
Theo
SLR4: E(u|x) = E(u) = 0
→ var (u|x) = E(u2| x) = σ2
Var(u) = E(u2) – [E(u)]2 = E(u2)= σ2
+ σ2 được gọi là phương sai của ss hay ps của nhiễu
+ Căn bậc hai của p/s là độ lệch chuẩn của ss
+ σ càng lớn thì pp của phần không quan sát được tác động lên đến y có độ trải dài
càng rộng
* Phương sai sai số thay đổi
Var (u|x) = f(x)
- Var( u|x) phụ thuộc vào x, sai số được gọi là có phương sai thay đổi
- Vì var(u|x) = var(y|x) phương sai thay đổi cũng hiện diện khi var(y|x) là hàm số
của x
- Var(u|x) = var(y|x) = f(x)
Ví dụ:Phương sai thay đổi trong phương trình tiền lương
Để có ước lượng không chệch của tác động educ lên wage ( trong điều kiện các yếu
tố khác không đổi) ta phải giả định:
Wage = β0 + β1educ + u
E(wage|educ) = β0 + β1educ
E(u|educ) = 0 (17)
Trang 28/33
E(wage|educ) = β0 + β1educ (18)
- Var(u|educ) = σ2 không phụ thuộc vào mức học vấn (var( u|educi=12) = var(u|
educi = 18 = σ2 )
- Var( wage|educ) = σ2 (var(wage|educi =12) = var ( wage|educi =18) = σ2

- Tiền lương trung bình được phép tăng theo học vấn
- Độ biến động tiền lương quanh giá trị trung bình của nó đưuocj giả định là
không đổi xét theo tất cả các mức học vấn
- Điều này có vẻ không thực tế
- Người học vấn thấp rất thấp ít có cơ hội lựa chọn công việc hơn và thường phải
làm việc với tiền lương tối thiểu
- Người có học vấn cao hơn có nhiều cơ hội công việc với nhiều mức lương khác
nhau, độ biến động càng nhiều khi mức học vấn càng cao
- Khác với SLR.4, SLR.5 có thể xem xét thỏa mãn hay không, không thuộc về
vấn đề thực nghiệm

Trang 29/33
Trang 30/33
Trang 31/33
Trang 32/33
σ2 là phương sai của SSNN u → tổng thể
n-2 : bậc tự do

Trang 33/33

You might also like