You are on page 1of 31

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Model Data Panel


Ani Katchova

© 2020 oleh Ani Katchova. Seluruh hak cipta.


Garis besar

• Pengaturan dan variasi data panel


• Penaksir OLS gabungan
• Penaksir perbedaan pertama
• Efek tetap (dalam) estimator
• Regresi variabel dummy dengan efek tetap
• Penaksir efek acak
• Uji Hausman untuk efek tetap versus efek acak

2
Data panel dan variasinya

• Variabel data panel:


• Memvariasikan regresi (pendapatan tahunan seseorang, pengeluaran
makanan bulanan)
• Regresor yang tidak berubah waktu = untuk semua (jenis kelamin, ras, pendidikan)
• Regresor invarian individu = untuk semua (tren waktu, tingkat
pengangguran AS)
• Variasi:
• adalah nilai individu, ?̅? adalah mean individu, dan ?̅? adalah mean keseluruhan
• Variasi keseluruhan (dari waktu ke waktu dan individu) − ?̅?
• Antar variasi (variasi antar individu) ?̅? − ?̅?
• Dalam variasi (variasi dalam individu dari waktu ke waktu) − ?̅?

3
Variasi data panel

Pengenal Waktu Variabel Individu Keseluruhan Keseluruhan Di antara Di dalam Di dalam Pertama

berarti berarti deviasi deviasi deviasi deviasi perbedaan


(diubah)
?̅? ?̅? − ?̅? ?̅? − ?̅? − ?̅? − ?̅? − ( −1)
+ ?̅?

1 2019 9 10 20 - 11 - 10 -1 19 .
1 2020 10 10 20 - 10 - 10 0 20 1
1 2021 11 10 20 -9 - 10 1 21 1
2 2019 20 20 20 0 0 0 20 .
2 2020 20 20 20 0 0 0 20 0
2 2021 20 20 20 0 0 0 20 0
3 2019 25 30 20 5 10 -5 15 .
3 2020 30 30 20 10 10 0 20 5
3 2021 35 30 20 15 10 5 25 5
4
Penaksir OLS gabungan

• Estimator OLS yang dikumpulkan menggunakan variasi antara dan dalam untuk
memperkirakan parameter.
• Tumpuk datanya Dan menjadi satu regresi panjang
• Penaksir OLS gabungan:
• = 0+ 1 1 + 2 2 + , = 1 … , = 1 …
• pengamatan

5
Antar estimator
• Estimator antar menggunakan variasi antar (antar
individu)
• Menggunakan rata-rata waktu semua variabel � , 1̅ , 2̅
• Antara penduga:
�= 0+ 1 1̅ + 2 2̅ + � , =1…
• pengamatan
• Jarang digunakan karena data panel akan diciutkan seiring berjalannya waktu.

6
Penaksir perbedaan pertama

• Penduga perbedaan pertama menggunakan perubahan satu periode untuk setiap individu.
• Model data panel: = 0+ 1 1 + 2 2 + + , = 1 … , = 1 …
• Efek spesifik individu adalah faktor-faktor yang tidak teramati yang dikaitkan dengan setiap individu.
• Penaksir perbedaan pertama:
− ( −1)= 0+ 1( 1 − 1 ( −1)) + 2( 2 − 2 ( −1)) + ( − ( −1))
• Estimasi OLS terhadap perubahan satu periode variabel dependen terhadap
perubahan satu periode variabel independen.
• Jumlah observasi: ( − 1) (periode pertama hilang karena perbedaan)
• Efek spesifik individu Batalkan.
• Variabel invarian waktu dikeluarkan dari model dan koefisiennya tidak
diperkirakan.

7
Memperbaiki efek dalam estimator

• Penaksir efek tetap menggunakan variasi dalam (dalam individu yang sama, dari waktu ke waktu) dengan
menggunakan variabel yang diremehkan dari waktu ke waktu.

• Model data panel: = 0+ 1 1 + 2 2 + + , = 1 … , = 1 …


• Efek spesifik individu berpotensi berkorelasi dengan variabel
independen.
• Rata-rata waktu (mengambil rata-rata dari waktu ke waktu): � = 0+ 1 1̅ + 2 2̅ + � + �
• Kurangi persamaan kedua dari persamaan pertama, efek spesifik individual akan
hilang karena tidak berubah seiring waktu.
• Efek tetap dalam estimator (menggunakan variabel yang diremehkan waktu):
− �= 1( 1 − 1̅ )+ 2( 2 − 2̅ )+( − �)

8
Memperbaiki efek dalam estimator

• Model yang diremehkan berdasarkan waktu tidak mencakup efek spesifik individu ( ) dan dapat
diperkirakan dengan OLS.

• Jumlah pengamatan adalah .


• Estimator dalam tidak dapat memasukkan variabel invarian waktu karena variabel tersebut
akan keluar.

• Setelah estimasi efek tetap, masing-masing efek spesifik dapat


diperkirakan sebagai:
� = � − ̂ 0− ?̂? 1 1̅ − 2̂ 2̅

• Efek spesifik individu berjumlah nol pada semua individu ,


∑ =1 = 0

9
Regresi variabel dummy dengan efek tetap
• Regresi dengan efek tetap sebagai variabel dummy:
= 0+ 1 1 + 2 2 + 1 1+ 2 2+ ⋯+ +
=1… , =1…
• Variabel tiruan 1= 1untuk individu pertama dan nol untuk orang lain, 2= 1 untuk
individu kedua dan nol untuk orang lain, …, = 1untuk individu ke-N dan nol
untuk individu lainnya.
• Dalam regresi variabel dummy, koefisien 1= 0dinormalisasi ke nol, jadi
variabel dummy 1adalah kategori referensi yang tidak termasuk dalam model.
• Efek spesifik individu adalah koefisien yang akan diestimasi dalam
regresi variabel dummy.
• Estimator efek tetap (dalam) setara dengan regresi dengan variabel dummy
untuk setiap individu.

10
Contoh data panel
kode f tahun sisa ini d88 d89 hibah hibah_1
410523 1987 - 2.81 40 0 0 0 0
410523 1988 - 3.00 40 1 0 0 0
410523 1989 - 3.00 60 0 1 0 0
410538 1987 0,97 0 0 0 0 0
410538 1988 1.01 0 1 0 0 0
410538 1989 0,93 30 0 1 0 0
410563 1987 1.79 0 0 0 0 0
410563 1988 1,95 0 1 0 0 0
410563 1989 1.61 50 0 1 0 0
Data panel (3 tahun, 54 perusahaan). Tingkat sisa log perusahaan (lscrap) dijelaskan oleh apakah perusahaan
menerima hibah (grant) dan total jam pelatihan (tothrs). d88 dan d89 adalah boneka waktu untuk setiap tahun.

Apakah perusahaan dengan jam pelatihan atau hibah yang lebih banyak mempunyai tingkat pembuangan yang lebih rendah?

11
Sarana dan variasi untuk variabel panel
Variabel Berarti Std. Dev. Minimal Maks Pengaturan data panel: fcode
(kode perusahaan) hanya
fcode secara keseluruhan 416314 3759 410523 419483 memiliki variasi antara (3782)
di antara 3782 410523 419483 dan tidak dalam (0). tahun
di dalam 0 416314 416314 hanya ada di dalam
(0,82) dan tidak ada

tahun secara keseluruhan 1988 0,82 1987 1989 variasi antara (0).
di antara 0 1988 1988
di dalam 0,82 1987 1989 Deviasi standar:
Ada lebih banyak variasi
untuk tingkat scrap log
lscrap secara keseluruhan 0,39 1.49 - 4.61
3,40 antar perusahaan (1,43)
di antara 1.43 - 3.01
3,21 dibandingkan di dalam perusahaan (0,45).
di dalam 0,45 - 2.03
2.12 Jumlah jam pelatihan memiliki
variasi yang hampir sama
secara keseluruhan 23.71 28.01 0 154 antar perusahaan (21.06)
di antara 21.06 0 93 dan di dalam perusahaan (18.58).
di dalam 18.58 - 19.62 100,38 12
OLS yang dikumpulkan, antara estimator, dan
estimator perbedaan pertama
• OLS yang dikumpulkan

= 0+ 1 + 2 + 3 + 4 + 5 _1 +
• Antar estimator

= 0+ 1 + 2 + 3 + 4 + 5 _1 + �

• Penaksir perbedaan pertama

( − −1) = 1( − −1) + 2( − −1) +( -

−1)

• Dalam penduga perbedaan pertama, boneka waktu dibedakan dan tidak dapat dimasukkan.

13
OLS yang dikumpulkan dan antar estimator
OLS yang dikumpulkan Antar estimator Model OLS yang dikumpulkan menumpuk data untuk
VARIABEL sisa sisa individu dan tahun serta memperkirakan model dengan OLS.
ini - 0,005 - 0,01
Hasil menunjukkan bahwa pengaruhnya satu
(0,005) (0,01)
jam pelatihan tambahan di seluruh perusahaan dan
d88 - 0,27 - 3.14
dari waktu ke waktu pada catatan tingkat sisa.
(0,33) (5.11)
Pengaruh ini tidak signifikan.
d89 - 0,51
(0,37)
menganugerahkan 0,38 2.49 Estimator antar menggunakan rata-rata variabel dari
(0,38) (1.81) waktu ke waktu untuk setiap perusahaan.
hibah_1 0,08 - 1.19 Hasil menunjukkan pengaruh satu jam pelatihan
(0,45) (1.77) tambahan untuk suatu perusahaan dibandingkan dengan
Konstan 0,66*** 1.27 perusahaan lain pada log tingkat scrap untuk perusahaan
(0,22) (1.71) ini dibandingkan dengan perusahaan lain. Pengaruh ini
tidak signifikan.

14
Penaksir perbedaan pertama
Perbedaan pertama Penduga perbedaan pertama menggunakan perbedaan pertama dari semua
VARIABEL dlscrap variabel. Hasilnya menunjukkan pengaruh peningkatan total jam pelatihan
dtothrs - 0,003 dari satu tahun ke tahun berikutnya pada perusahaan yang sama terhadap
(0,003) perubahan tingkat sisa kayu dari satu tahun ke tahun berikutnya pada
hibah 0,05 perusahaan yang sama. Pengaruh ini tidak signifikan.
(0,12)
Konstan - 0,21***
(0,06)

15
Memperbaiki efek dalam regresi variabel
estimator dan dummy
• Memperbaiki efek dalam estimator:

( − )= 1( − )+ 2( − )+ 3( − )+ 4(

− )+ 5( _1 − _1 ) + ( − �)
• Efek spesifik individu dapat dipulihkan sebagai:
�= − ?̂? 0− 1̂ − ?̂? 2 − ?̂? 3 − 4 ̂ − ?̂? 5 _1
• Efek spesifik individu jumlahkan menjadi nol.

• Regresi variabel tiruan:


• = 0+ 1 + 2 + 3 + 4 + 5 _1 + 1 1+ 2 2+
⋯+ +
• Terdapat N=54 variabel dummy, satu untuk setiap perusahaan. 1= 0dinormalisasi ke nol untuk
perusahaan pertama. Koefisien diestimasi dan dimasukkan dalam keluaran regresi.

16
Memperbaiki efek dalam estimator
Memperbaiki efek di dalam Transformasi dalam memiliki setiap variabel dikurangi rata-ratanya
penaksir dari waktu ke waktu.
VARIABEL sisa Hasil menunjukkan peningkatan total jam pelatihan untuk
ini - 0,005
perusahaan yang sama dari rata-rata pada log tingkat scrap dari
(0,003)
rata-rata untuk perusahaan yang sama. Pengaruh ini tidak
d88 - 0,07
signifikan.
(0,12)
d89 - 0,22
(0,16) Penerimaan hibah pada periode sebelumnya dikaitkan dengan tingkat scrap

menganugerahkan - 0,12 yang lebih rendah sebesar 41%.

(0,18)
hibah_1 - 0,41*
(0,23)
Konstan 0,66***
(0,09)
R-kuadrat 0,23

17
Memperbaiki efek di dalam Variabel tiruan
penaksir regresi
VARIABEL sisa sisa Perbandingan efek tetap menggunakan
ini - 0,005 - 0,005
estimator dalam dan regresi variabel dummy.
(0,003) (0,003)
Koefisien pada variabel-variabelnya sama pada
d88 - 0,07 - 0,07
kedua model.
(0,12) (0,12)
d89 - 0,22 - 0,22 Regresi variabel dummy mencakup koefisien
(0,16) (0,16) pada variabel dummy (410538.fcode,
menganugerahkan - 0,12 - 0,12 410563.fcode, dll.) tetapi karena terdapat
(0,18) (0,18) (N-1)=53 koefisien, biasanya koefisien tersebut
hibah_1 - 0,41* - 0,41* tidak disertakan saat menyajikan hasil.
(0,23) (0,23)
410538.fcode 3.73***
(0,43)
410563.fcode 4.58***
(0,43)
…. …

419483.fcode 5,95***
(0,44)
Konstan 0,66*** - 2.62***
(0,09) (0,33)
18
R-kuadrat 0,23 0,92
Efek spesifik individu
Efek tetap Memperbaiki efek dengan Efek spesifik individu ditambah intersepsi
(dalam penduga) regresi variabel dummy

kode f 410523 �1= −3.2 �1= 0 − 3,2 + 0,66 = 0 + −2,62


kode f 410538 �2= 0,45 �2= 3,73 0,45 + 0,66 = 3,73 + −2,62

kode f 410563 �3= 1,30 �3= 4,5 1,30 + 0,66 = 4,5 + −2,62

Mencegat 0,66 − 2.62

Untuk penduga dalam, efek spesifik individual berjumlah nol. Tingkat sisa kayu gelondongan untuk perusahaan kedua adalah
0,45 lebih tinggi dibandingkan rata-rata tingkat sisa kayu gelondongan di seluruh perusahaan.
Untuk regresi variabel dummy, koefisien pada variabel dummy efek tetap dinormalisasi menjadi nol untuk perusahaan
pertama. Tingkat kayu sisa pada perusahaan kedua adalah 3,73 lebih tinggi dibandingkan dengan perusahaan pertama.

Efek spesifik individu ditambah intersep regresi adalah intersep spesifik individu untuk perusahaan
19
ini.
R-kuadrat untuk regresi dalam estimator vs
variabel dummy
• R-squared lebih tinggi untuk regresi variabel dummy dibandingkan FE dalam
estimator yang hanya menjelaskan dalam variasi.
• Untuk FE dalam estimator: Model SS = 7, Residual SS = 24, R-squared =
Model SS / (Model SS + Residual SS) = 7/(7+24)= 0,22
• Untuk regresi variabel dummy: Model/SS Terjelas = 287, Residual SS = 24, R-
squared = Model SS / (Model SS + Residual SS) = 287/(287+24)= 0,92
• Variasi sisa yang sama.
• Variabel direndahkan untuk FE dalam estimator ( − ), sehingga variasi total yang
perlu dijelaskan dalam penduga FE lebih sedikit dan sebagian besar merupakan variasi sisa yang
menyebabkan R-kuadrat lebih rendah.
• Terdapat lebih banyak variasi total untuk regresi variabel dummy karena variabel-variabel
tersebut tidak direndahkan. Variabel tiruan ( 1, 2,… ) membantu menjelaskan variasi model,
sehingga menghasilkan R-kuadrat yang lebih tinggi.

20
Diskusi tentang estimator efek tetap

• Model asli harus memiliki eksogenitas, dimana variabel tidak berkorelasi


dengan istilah kesalahan.
• R-squared untuk model demeaned (dalam estimator) kurang tepat
karena variabel-variabelnya didemean sehingga hanya menunjukkan
variasi dalam, bukan variasi keseluruhan.
• Variabel invarian waktu tidak dapat dimasukkan karena variabel tersebut dikeluarkan.
Istilah interaksi dengan variabel invarian waktu dapat dimasukkan ke dalam model.

• Variabel yang berubah secara deterministik dari waktu ke waktu (misalnya pengalaman
yang bertambah satu tahun setiap tahunnya) tidak dapat dimasukkan ke dalam model.

21
Efek tetap versus penaksir perbedaan pertama

• Penaksir efek tetap dan perbedaan pertama identik dengan dua


periode waktu (T=2).
• Perbedaan pertama,∆ = − −1
• Dalam penduga, variabel yang diremehkan waktu:
+ −1 − −1
• − =� - =
2 2
• Dengan periode waktu yang lebih banyak (T>2)
• Efek tetap akan lebih efisien jika asumsi klasik terpenuhi.
• Perbedaan pertama mungkin lebih baik jika terdapat banyak periode waktu dengan korelasi
serial yang kuat dalam kesalahannya.

22
Penaksir efek acak
• Model data panel: = 0+ 1 1 + 2 2 + + , = 1 …
, =1…
• Asumsi efek acak: efek spesifik individu diasumsikan
“acak” dan tidak berkorelasi dengan independen
variabel, , = 0.
• Istilah kesalahan + berkorelasi serial dalam individu:
• + , + −1 = , = 2
• Efek spesifik individu berkorelasi dalam diri individu dari waktu ke
waktu.

23
Penaksir efek acak
• Berdasarkan asumsi efek acak, variabel independen tidak berkorelasi dengan istilah
kesalahan, sehingga OLS yang dikumpulkan akan memberikan perkiraan yang
konsisten namun tidak efisien.

• Dengan OLS, kesalahan standar perlu disesuaikan karena kesalahan tersebut


berkorelasi seiring waktu.
• Transformasikan model sehingga kesalahan baru tidak berkorelasi:
− �= 0+ 1( 1 − 1̅ )+ 2( 2 − 2̅ )+( − � )+( − �)

24
Penaksir efek acak
• Penaksir efek acak:
− �= 0+ 1( 1 − 1̅ )+ 2( 2 − 2̅ )+( − � )+( − �)
2
• Parameter efek acak dapat diperkirakan: = 1 −
2+ 2

• ?̂? =0sesuai dengan OLS yang dikumpulkan ( tidak penting)


• ?̂? =1sesuai dengan FE dalam estimator ( penting)
• Penduga efek acak adalah rata-rata tertimbang dari kumpulan OLS
dan FE dalam penduga.
• Penduga efek acak dapat mencakup variabel invarian waktu.

25
Penaksir efek acak
• Penaksir efek acak
•( − )= 1( − )+ 2( − )+ 3( − )+ 4( −
)+ 5( _1 − _1 ) + ( − �)

• Laporan keluaran estimasi RE = 1,3 Dan = 0,51.Efek spesifik individu lebih penting
daripada istilah kesalahan khusus .
• Median untuk parameternya adalah:
2 0,512
• =1− =1−
2+ 2 0,512+3∗1.392= 0,7 ,yang lebih dekat dengan model FE dibandingkan model gabungan
model OLS. Ini berarti bahwa efek spesifik individu lebih penting.
• (Stata menunjukkan sebagai dan menunjukkan sebagai .)

26
Penaksir efek acak
Untuk penaksir efek acak, untuk setiap jam tambahan
Efek acak
dalam total pelatihan, tingkat sisa lebih rendah sebesar
VARIABEL sisa
0,5%. Koefisien time dummies dan grants tidak signifikan.
ini - 0,005*
(0,005)
d88 - 0,09
(0,12)
d89 - 0,25
(0,15)
menganugerahkan - 0,07
(0,18)
hibah_1 - 0,35
(0,22)
Konstan 0,66***
(0,22)

27
tes Hausman
• Uji Hausman digunakan untuk memutuskan apakah akan menggunakan estimator efek
tetap (FE) atau efek acak (RE).
• H0: tidak ada korelasi antara efek spesifik individu dengan variabel
bebas, koefisien FE dan RE tidak berbeda nyata satu sama lain

• HA: korelasi antara efek spesifik individu dan variabel independen,


koefisien FE dan RE berbeda signifikan satu sama lain
• Hitung selisih koefisien RE dan FE ( − ) dan kovariannya.

• Statistik uji Hausman:


−1
=β −β ' − β −β ~ 2

28
tes Hausman
Penaksir H0adalah benar HAadalah benar

penduga RE Konsisten dan efisien Tidak konsisten

penduga FE Konsisten namun tidak efisien Konsisten

• Jika statistik uji Hausman tidak berbeda nyata dari nol, maka
penduga FE dan RE sama-sama konsisten. Estimator RE
sebaiknya digunakan karena lebih efisien.
• Jika statistik uji Hausman berbeda secara signifikan dari nol, maka
hanya penduga FE yang konsisten dan sebaiknya digunakan.
• Uji Hausman mengevaluasi konsistensi penduga RE terhadap
penduga FE kurang efisien yang diketahui konsisten.
• Efek spesifik individu biasanya berkorelasi dengan variabel
independen, sehingga penduga FE lebih tepat.
29
Contoh uji Hausman
Efek tetap Efek acak Koefisien penduga FE dan RE (
VARIABEL sisa sisa Dan ) mirip. Statistik uji Hausman
ini - 0,005 - 0,005*
W= 1,51, dan pvalue=0,91.
(0,003) (0,005)
d88 - 0,07 - 0,09
Tidak ada perbedaan signifikan pada koefisien FE
(0,12) (0,12)
dan RE, sehingga keduanya merupakan estimator
d89 - 0,22 - 0,25
(0,16) (0,15) yang konsisten. Estimator RE sebaiknya
menganugerahkan - 0,12 - 0,07 digunakan karena lebih efisien.
(0,18) (0,18)
hibah_1 - 0,41* - 0,35
(0,23) (0,22)
Konstan 0,66*** 0,66***
(0,09) (0,22)

30
Tinjau pertanyaan

• Jelaskan secara keseluruhan, di antara, dan di dalam variasi.


• Jelaskan efek spesifik individu. Bagaimana efek tetap
dipulihkan setelah estimasi?
• Jelaskan berbagai metode estimasi untuk model data panel
• Model gabungan/ Antara estimator/ Estimator perbedaan pertama
• Efek tetap (dalam) estimator/regresi variabel tiruan
• Penaksir efek acak
• Bandingkan efek tetap dalam regresi variabel estimator dan
dummy.
• Jelaskan uji Hausman untuk efek tetap versus efek acak. Asumsi
apa yang dibuat oleh penaksir efek tetap dan efek acak mengenai
masing-masing efek spesifik? 31

You might also like