You are on page 1of 14

THỰC HÀNH CƠ BẢN

• Mở file excel hprice1.xlsx và file HPRICE1_description để


điền tên biến vào file excel. Lưu lại với định dạng .csv, ta có
1 file tên hprice1.csv
• Giả sử file dữ liệu này đang nằm trong D:/Econ_data
Chỉ định thư mục chứa file dữ liệu cần sử dụng
• setwd("D:/Econ_data")
Mở file dữ liệu hprice1.csv, gán vào đối tượng tên là hprice (tên do
mình đặt)
• hprice<-read.csv("hprice1.csv", header=TRUE)
Hồi quy price theo bdrms, sqrft, lotsize, sử dụng dữ liệu từ đối tượng
hprice, gán kết quả hồi quy vào đối tượng hp1
• hq1<-lm(price~bdrms+sqrft+lotsize,data=hprice)
Xem kết quả hồi quy
• summary(hq1)
Tìm khoảng tin cậy cho các hệ số hồi quy
• confint(hq1, level=0.95)
Kiểm định giả thuyết
• library(car)
• linearHypothesis(hq1,c("bdrms=0","sqrft=0"))
Kiểm định Phương sai thay đổi (BP test)

• setwd("D:/data")
• hprice<-read.csv("hprice1.csv",header=TRUE)
• hq1<-lm(price~bdrms+sqrft+lotsize,data=hprice)
• library(lmtest)
• bptest(hq1)
Kiểm định Phương sai thay đổi
(BP test – tự code)
• hprice$phandusq<-residuals(hq1)*residuals(hq1)
• hq2<-lm(phandusq~bdrms+sqrft+lotsize,data=hprice)
• summary(hq2)
Kiểm định Phương sai thay đổi
(White test)
• Cách 1
bptest(hq1,~I(bdrms^2)+I(sqrft^2)+I(lotsize^2)+bdrms*sqrft+
bdrms*lotsize+sqrft*lotsize,data=hprice)
• Cách 2
bptest(hq1,~I(fitted(hq1))+I(fitted(hq1)^2),data=hprice)
Khắc phục PSTĐ

• Dùng sai số chuẩn cải thiện cho hq1


library(car)
coeftest(hq1,vcov=hccm)
Khắc phục PSTĐ

• Dùng WLS – giả sử trọng số là 1/lotsize


hq2<- lm(price~bdrms+sqrft+lotsize,weight=1/lotsize,data=hprice)
Kiểm định sai dạng hàm
(RESET test)
• Dùng lệnh resettest thuộc gói lmtest
library(lmtest)
resettest(hq1)
Phát hiện đa cộng tuyến bằng vif
• library(car)
• vif(hq1)
Kiểm định sai số có phân phối chuẩn hay
không
• Trong các giả thiết của mô hình hồi quy bội, giả thiết số 6 yêu cầu sai số u có
phân phối chuẩn. Để kiểm tra xem mô hình có thỏa giả thiết này hay không ta
có thể kiểm tra xem ước lượng của u là phần dư có phân phối chuẩn hay ^
𝑢
không (Normality test)
• Có nhiều kiểm định phân phối chuẩn (chỉ cần nhìn bảng kết quả thấy có chữ
Normality test là biết dùng để kiểm tra xem 1 biến có phân phối chuẩn hay
không)
• H0 : Biến đang kiểm tra có phân phối chuẩn
• Đọc kết quả bằng pvalue
• Trong slide tiếp theo cô giới thiệu 1 kiểm định về phân phối chuẩn là kiểm định
Jarque Bera
Kiểm định sai số có phân phối chuẩn hay
không
• library(fBasics)
• phandu<-residuals(hq1)
• jarqueberaTest(phandu) Ở câu lệnh này cô đang kiểm định xem
biến phandu (của kết quả hq1) có phân
• Bảng kết quả: phối chuẩn hay không

• Title: Thấy chữ Normality test là


 Jarque - Bera Normalality Test biết kiểm định xem 1 biến
nào đó (ở đây là biến
Test Results: phandu) có phân phối chuẩn
  STATISTIC: hay không
    X-squared: 32.2779
  P VALUE: Đọc kết quả ở đây. Nếu pvalue <alpha thì
    Asymptotic p Value: 9.794e-08 bác bỏ H0 và kết luận là biến phandu
không có phân phối chuẩn

You might also like