Professional Documents
Culture Documents
ABSTRACT
Panel data is a combination of cross-section data and time-series data. The panel data regression can
model the panel data. In its development, panel data regression has been developed to model spatial data,
called panel data spatial regression. Spatial data is data that considers the empirical observations and
considers the location factor of these observations. This study examines the spatial regression modeling of
panel data and applies it to model the factors that influence the Human Development Index (HDI) of
districts/cities in East Kalimantan Province from 2017 to 2020. HDI is a composite index that measures the
average achievement in the three basic dimensions of human development that are considered very basic,
namely life expectancy, knowledge, and a decent standard of living. HDI is one of the measuring tools
considered to reflect the status of human development in a region and plays an essential role in improving
the quality of human resources. The results show that the panel data spatial regression model suitable for
modeling the HDI of districts/cities in East Kalimantan Province from 2017 to 2020 is the Spatial
Autoregressive Fixed Effect (SAR-FE) model. The rate of economic growth and the district/city minimum
wage factors that significantly influence the HDI of districts/cities in East Kalimantan Province from 2017
to 2020 based on the SAR-FE model is the rate of economic growth and the district/city minimum wage.
Keywords: Panel Data, Spatial Data, Panel Data Spatial Regression, SAR-FE, HDI
semua variable independent kurang dari 10, maka masing intercept adalah peubah random. Dalam
tidak terjadi multikolinieritas dalam model regresi menduga parameter model panel spasial dapat
OLS (Kutner, Nachtsheim, & Neter, 2004). digunakan metode pendugaan maximum
likelihood. Model REM dapat ditulis sebagai
Regresi Data Panel berikut :
Prasanti (2015) mengungkapkan data panel 𝑦 = 𝛼 + 𝜷𝑻 𝑿 + 𝑞 (5)
merupakan gabungan antara data cross-section dengan
dan data time series. Pada data panel, data cross- 𝑞 =𝜀 +𝜀 (6)
section yang sama disurvei pada beberapa periode
waktu. di mana 𝑦 adalah variabel dependen untuk
Secara umum model regresi panel adalah pengamatan ke-𝑖 dan waktu ke-𝑡. 𝛼 adalah
sebagai berikut. intercept, 𝜷𝑻 adalah vektor persamaan berukuran
𝑦 = 𝛼 + 𝜷𝑻 𝑿 + 𝜀 (2) (1 × 𝑘), 𝑿 adalah vektor variabel independen
di mana 𝑦 adalah variabel dependen untuk berukuran 1 × (𝑘 × 1) dan 𝜀 adalah error pada
pengamatan ke-𝑖 dan waktu ke-𝑡. 𝛼 adalah unit pengamatan ke-𝑖 dan waktu ke-𝑡, untuk 𝑖 =
intercept unit cross-section ke-𝑖 untuk periode 1,2, … 𝑛 dan 𝑡 = 1,2, … , 𝑚.
waktu ke-𝑡, 𝜷𝑻 adalah vector persamaan
berukuran (1 × 𝑘), 𝑿 adalah vector variabel Uji Chow
independen berukuran 1 × (𝑘 × 1) dan 𝜀 adalah Uji Chow dilakukan untuk memilh model
error pada unit pengamatan ke-𝑖 dan waktu ke-𝑡, Common Effect atau model Fixed Effect yang
akan digunakan.
untuk 𝑖 = 1,2, … 𝑛 dan 𝑡 = 1,2, … , 𝑚.
Hipotesis uji Chow adalah sebagai berikut
(Baltagi, 2005).
Common Effect Model (CEM)
𝐻 : 𝜇 = 𝜇 = 𝜇 = ⋯ = 𝜇 = 𝜇 (model CEM)
Pendekatan ini diasumsikan bahwa nilai
𝐻 : Minimal terdapat satu 𝜇 ≠ 𝜇 , 𝑖 ≠ 𝑗; 𝑗 =
intercept dan slope masing-masing variabel
adalah sama untuk semua data cross-section dan 1,2, … , 𝑛 (model FEM)
data time series (Greene, 2000). Statistik uji :
( )/( )
𝑦 = 𝛼 + 𝜷𝑻 𝑿 + 𝜀 (3) 𝐹 = )
(7)
/(
di mana 𝑦 adalah variabel dependen untuk Daerah kritis : Tolak 𝐻 jika 𝐹 >
pengamatan ke-𝑖 dan waktu ke-𝑡. 𝛼 adalah 𝐹( ),( ) di mana 𝐽𝐾𝐺 adalah jumlah
intercept, 𝜷𝑻 adalah vektor persamaan berukuran kuadrat error CEM dan 𝐽𝐾𝐺 adalah jumlah
(1 × 𝑘), 𝑿 adalah vektor variabel independen kuadrat error FEM.
berukuran 1 × (𝑘 × 1) dan 𝜀 adalah error pada
unit pengamatan ke-𝑖 dan waktu ke-𝑡, untuk 𝑖 = Uji Hausman
1,2, … 𝑛 dan 𝑡 = 1,2, … , 𝑚. Uji Hausman dilakukan untuk memilih model
Random Effect atau model Fixed Effect yang akan
Fixed Effect Model (FEM) digunakan (Baltagi, 2005).
Pendekatan ini diasumsikan bahwa nilai Hipotesis uji Hausman adalah sebagai berikut.
slope masing-masing variabel adalah tetap, namun 𝐻 : Model Random Effect (REM)
nilai intersep berbeda-beda untuk setiap data 𝐻 : Model Fixed Effect (FEM)
cross-section dan tetap untuk setiap data time Statistik uji :
series (Greene, 2000). 𝜒 = 𝒒 [ (𝒒)] 𝒒 (8)
𝑦 = 𝛼 + 𝜷𝑻 𝑿 + 𝜀 (4)
dengan
di mana 𝑦 adalah variabel dependen untuk
pengamatan ke-𝑖 dan waktu ke-𝑡. 𝛼 adalah 𝒒=𝜷 −𝜷 ; 𝑣𝑎𝑟(𝒒) = 𝜎 (𝑿′𝑸𝑿) −
intercept, 𝜷𝑻 adalah vektor persamaan berukuran 𝜎 (𝑿′𝜴 𝑿) (9)
(1 × 𝑘), 𝑿 adalah vektor variabel independen Daerah kritis : Tolak 𝐻 jika 𝜒 > 𝜒( , )
berukuran 1 × (𝑘 × 1) dan 𝜀 adalah error pada di mana 𝜷 adalah vektor koefisien variabel
unit pengamatan ke-𝑖 dan waktu ke-𝑡, untuk 𝑖 = independen dari FEM dan 𝜷 adalah veKtor
1,2, … 𝑛 dan 𝑡 = 1,2, … , 𝑚. koefisien variabel independen dari REM.
memiliki LPP tertinggi adalah Kabupaten Kutai APM SMP, TPT, TPAK, LPE dan PDRB dapat
Timur pada tahun 2017 sebesar 4,16 persen, digunakan untuk model regresi spasial data panel.
sedangkan terendah adalah Kabupaten Mahakam
Ulu pada tahun 2019 sebesar 0,11 persen. Rata- Estimasi Parameter Model Regresi Data Panel
rata APM SMP sebesar 77,68 persen. Pengestimasian parameter model regresi data
Kabupaten/Kota yang memiliki APM SPM panel ada 3, yakni Common Effect Model (CEM),
tertinggi adalah Kota Samarinda pada tahun 2019 Fixed Effect Model (FEM) dan Random Effect
sebesar 93,29 persen, sedangkan terendah adalah Model (REM).
Kabupaten Mahakam Ulu pada tahun 2018
sebesar 62,77persen. Rata-rata TPT sebesar 6,25 CEM
persen. Kabupaten/Kota yang memiliki TPT Hasil estimasi parameter CEM seperti yang
tertinggi adalah Kota Bontang pada tahun 2017 disajikan pada Tabel 4.
sebesar 12,44 persen, sedangkan terendah adalah
Tabel 4. Estimasi parameter CEM
Kabupaten Mahakam Ulu pada tahun 2020
Parameter Estimasi
sebesar 3,49 persen. Rata-rata TPAK sebesar
65,36. Kabupaten/Kota yang memiliki TPAK 𝛼 93,5406
tertinggi adalah Kabupaten Mahakam Ulu pada 𝛽 0,4466
tahun 2018 sebesar 79,02 persen, sedangkan 𝛽 0,0346
terendah adalah Kota Samarinda pada tahun 2018 𝛽 1,1281
sebesar 60,82persen. Rata-rata LPE sebesar 1,86 𝛽 −0,4496
persen. Kabupaten/Kota yang memiliki LPE 𝛽 −0,0147
tertinggi adalah Kabupaten Kutai Timur pada 𝛽 0,0147
tahun 2019 sebesar 7,99 persen, sedangkan Berdasarkan Tabel 4, diperoleh CEM sebagai
terendah adalah Kabupaten Kutai Kartanegara berikut.
pada tahun 2020 sebesar -4,44 persen. Rata-rata 𝑦 = 93,5406 + 0,4466𝑋 + 0,0346𝑋 +
PDRB sebesar 175,86 juta. Kabupaten/Kota yang 1,1281𝑋 − 0,4496𝑋 − 0,0147𝑋 +
memiliki PDRB tertinggi adalah Kabupaten Kutai 0,0147𝑋 (28)
Timur tahun 2019 sebesar 355,99 juta, sedangkan di mana 𝑦 adalah estimasi CEM IPM di Provinsi
terendah adalah Kabupaten Penajam Paser Utara Kalimantan Timur. 𝑋 menyatakan LPP lokasi
tahun 2017 sebesar 53,77 juta. ke-𝑖 pada waktu ke-𝑡. 𝑋 menyatakan APM
SMP lokasi ke-𝑖 pada waktu ke-𝑡. 𝑋
Pendeteksian Multikolinieritas
menyatakan TPT lokasi ke-𝑖 pada waktu ke-𝑡.
Pendeteksian multikolinieritas bertujuan
𝑋 menyatakan TPAK lokasi ke-𝑖 pada waktu
untuk mengetahui apakah terdapat hubungan
ke-𝑡. 𝑋 menyatakan LPE lokasi ke-𝑖 pada
linier antar variabel independen dalam model
waktu ke-𝑡. 𝑋 menyatakan PDRB lokasi ke-𝑖
regresi menggunakan nilai VIF seperti pada Tabel
pada waktu ke-𝑡.
3.
Tabel 3. Multikolinieritas FEM
Variabel Indikasi Hasil perhitungan dengan software R pada
VIF
Independen Multikolinieritas diperoleh hasil estimasi parameter FEM seperti
Tidak terdapat yang disajikan pada Tabel 5.
LPP(𝑋 ) 2,212
multikolinieritas
Tabel 5. Estimasi parameter FEM
APM Tidak terdapat
1,523 Parameter Estimasi
SMP(𝑋 ) multikolinieritas
𝛽 −3,0991
Tidak terdapat
TPT(𝑋 ) 1,464 𝛽 0,0167
multikolinieritas
𝛽 0,0216
Tidak terdapat
TPAK(𝑋 ) 1,401 𝛽 0,0151
multikolinieritas
Tidak terdapat 𝛽 0,0045
LPE(𝑋 ) 1,085 𝛽 0,0094
multikolinieritas
Tidak terdapat Berdasarkan Tabel 5, diperoleh FEM sebagai
PDRB(𝑋 ) 2,369
multikolinieritas berikut.
Pada Tabel 3, terlihat bahwa semua variabel 𝑦 = −3,0991𝑋 + 0,0167𝑋 +
independen mempunyai nilai VIF kurang dari 10 0,0216𝑋 + 0,0151𝑋 + 0,0045𝑋 +
dan dapat disimpulkan bahwa tidak terdapat 0,0094𝑋 (29)
multikolinieritas antar variabel independen. Oleh di mana 𝑦 adalah estimasi FEM IPM di Provinsi
karena itu, semua variabel independen yaitu LPP, Kalimantan Timur. 𝑋 menyatakan LPP lokasi
ke-𝑖 pada waktu ke-𝑡. 𝑋 menyatakan APM
SMP lokasi ke-𝑖 pada waktu ke-𝑡. 𝑋 Berdasarkan Tabel 7, diperoleh nilai 𝐹 =
menyatakan TPT lokasi ke-𝑖 pada waktu ke-𝑡. 188,55 > 𝐹( ),( ) = 2,30 atau p-value =
𝑋 menyatakan TPAK lokasi ke-𝑖 pada waktu 2,2 × 10 < 𝛼 = 0,05, sehingga tolak 𝐻 . Hal
ke-𝑡. 𝑋 menyatakan LPE lokasi ke-𝑖 pada ini menunjukkan bahwa model regresi data panel
waktu ke-𝑡. 𝑋 menyatakan PDRB lokasi ke-𝑖 sementara adalah FEM.
pada waktu ke-𝑡.
Uji Hausman
REM Pada saat melakukan uji Chow didapatkan
Hasil estimasi parameter REM seperti yang hasil bahwa H0 ditolak, kemudian dilanjutkan
disajikan pada Tabel 6. dengan melakukan uji Hausman. Uji ini dilakukan
untuk mengetahui apakah model FEM atau REM
Tabel 6. Estimasi parameter REM
yang digunakan.
Parameter Estimasi
Hipotesis uji Hausman sebagai berikut
𝛼 73,8269 𝐻 : 𝐸(𝜀 |𝑋 ) = 0 (REM)
𝛽 −1,6354 𝐻 : 𝐸(𝜀 |𝑋 ) ≠ 0 (FEM)
𝛽 0,0119
Daerah kritis : Tolak 𝐻 jika 𝐶ℎ𝑖𝑠𝑞 >
𝛽 −0,3334
𝐶ℎ𝑖𝑠𝑞( ; , ) = 11,070 atau p-value < 𝛼 = 0,05.
𝛽 −0,0015
Hasil uji hausman disajikan pada Tabel 8 sebagai
𝛽 −0,0276
berikut.
𝛽 0,0149
Tabel 8. Hasil uji hausman
Berdasarkan Tabel 6, diperoleh REM sebagai
Chisq df p-value Keputusan
berikut.
1,171 ×
𝑌 = 73,8269 − 1,6354𝑋 + 0,0119𝑋 − 62,874 6 𝐻 ditolak
10-11
0,3334𝑋 − 0,0015𝑋 − 0,0276𝑋 +
0,0149𝑋 (30) Berdasarkan Tabel 8 diperoleh nilai 𝐶ℎ𝑖𝑠𝑞 =
di mana 𝑦 adalah estimasi REM IPM di Provinsi 62,874 > 𝐶ℎ𝑖𝑠𝑞( ; , ) = 11,070 atau p-value=
Kalimantan Timur. 𝑋 menyatakan LPP lokasi 1,171 × 10 < 𝛼 = 0,05, sehingga tolak 𝐻 .
ke-𝑖 pada waktu ke-𝑡. 𝑋 menyatakan APM Hal ini menunjukkan bahwa model regresi data
SMP lokasi ke-𝑖 pada waktu ke-𝑡. 𝑋 panel yang digunakan adalah FEM.
menyatakan TPT lokasi ke-𝑖 pada waktu ke-𝑡.
𝑋 menyatakan TPAK lokasi ke-𝑖 pada waktu Uji Lagrange Multiplier
ke-𝑡. 𝑋 menyatakan LPE lokasi ke-𝑖 pada Uji ini digunakan untuk mengetahui efek
waktu ke-𝑡. 𝑋 menyatakan PDRB lokasi ke-𝑖 spasial pada model SAR dan SEM. Hipotesis uji
pada waktu ke-𝑡. LM sebagai berikut.
Hipotesis uji LM
Pemilihan Model Regresi Data Panel 𝐻 : 𝛿 = 0 (tidak terdapat efek spasial pada
Pemilihan model regresi panel bertujuan model SAR)
untuk mendapatkan model regresi data panel yang 𝐻 : 𝛿 ≠ 0 (terdapat efek spasial pada model
sesuai untuk memodelkan IPM. Uji yang SAR)
digunakan untuk memilih model regresi data Daerah kritis: Tolak 𝐻 jika nilai LM >
panel ini adalah uji Chow kemudian dilanjutkan 𝜒( , , ) = 3,841 atau p-value < 𝛼 = 0,05.
dengan uji Hausman. Hipotesis uji LM
𝐻 : 𝜌 = 0 (tidak terdapat efek spasial
Uji Chow
pada SEM)
Uji Chow digunakan untuk memilih model
𝐻 : 𝜌 ≠ 0 (terdapat efek spasial pada SEM)
regresi data panel yaitu CEM atau FEM yang
Daerah kritis: Tolak 𝐻 jika nilai LM >
akan digunakan. Hipotesis uji Chow adalah
𝜒( , , ) = 3,841 atau p-value < 𝛼 = 0,05.
sebagai berikut.
𝐻 : 𝜇 = 𝜇 = 𝜇 = ⋯ = 𝜇 = 0 (CEM) Hasil uji LM untuk mengetahui adanya efek
𝐻 : 𝜇 ≠ 0 (FEM) spasial disajikan pada Tabel 9.
Daerah kritis : Tolak 𝐻 jika 𝐹 > 𝐹( ),( ) = 2,30 Tabel 9. Hasil Uji LM
atau p-value < 𝛼 = 0,05 Nilai
LM df p-value Keputusan
Hasil uji chow disajikan pada Tabel 7 sebagai LM
berikut. LM 11,648 1 0,0006 𝐻 ditolak
Tabel 7. Hasil uji chow 𝐻 gagal
F df1 df2 p-value Keputusan LM 0,7635 1 0,3822
ditolak
2,2 ×
188,55 9 24 𝐻 ditolak
10-16
Berdasarkan Tabel 9, diperoleh nilai penduduk maka nilai IPM akan berkurang sebesar
LM = 11,648 > 𝜒( , ; ) = 3,8415 atau p- 1,9993.
value= 0,0006 < 𝛼 = 0,05 dan LM = Variabel TPT memiliki nilai koefisien positif,
0,3822 < 𝜒( , ; ) = 3,8415 atau p-value= hal ini berarti setiap penambahan 1% pada
variabel TPT maka nilai IPM akan bertambah
0,3822 > 𝛼 = 0,05 , sehingga tolak 𝐻 pada uji
sebesar 0,0871.
LM dan gagal tolak 𝐻 pada uji LM . Hal
Variabel PDRB memiliki nilai koefisien
ini menunjukkan bahwa model yang terdapat efek
positif, hal ini berarti setiap penambahan 1% pada
spasial adalah model SAR.
PDRB maka nilai IPM akan bertambah sebesar
Pada saat pemilihan model regresi data panel 0,0108.
dilakukan dengan 2 uji yaitu uji Chow dan uji
Model SAR-FE yang terbentuk untuk masing-
Hausman, model yang terpilih adalah FEM, yang
masing kabupaten/kota di Provinsi Kalimantan
berarti model yang digunakan pada penelitian ini
Timur adalah sebagai berikut.
adalah model Spatial Autoregressive Fixed Effect
Intersep pada pemodelan SAR-FE masing-
(SAR-FE).
masing kabupaten/kota dapat dilihat pada
persamaan sebagai berikut.
Estimasi Model Spatial Autoregressive Fixed 1. Kabupaten Paser
Effect (SAR-FE)
𝑦 = 0,1673(0,25𝑦 + 0,25𝑦 ) + 15,5946 −
Hasil estimasi model Spatial Autoregressive
1,9993𝑋 − 0,0034𝑋 + 0,0871𝑋 −
tersaji dalam Tabel 10 sebagai berikut.
0,0213𝑋 − 0,0076𝑋 + 0,0108𝑋
Tabel 10. Estimasi dan signifikansi parameter 2. Kabupaten Kutai Barat
SAR-FE 𝑦 = 0,1673(0,5𝑦 + 0,143𝑦 + 0,143𝑦 +
Parameter Estimasi Nilai t p-value Keputusan 0,25𝑦 + 0,5𝑦 ) − 12,8308 −
1,246 1,9993𝑋 − 0,0034𝑋 + 0,0871𝑋 −
𝜆 0,1673 5,2866 𝐻 ditolak
× 10 0,0213𝑋 − 0,0076𝑋 + 0,0108𝑋
𝛽 −1,9993 −4,6454
3,394
𝐻 ditolak 3. Kabupaten Kutai Kartanegara
× 10 𝑦 = 0,1673(0,25𝑦 + 0,333𝑦 + 0,25𝑦 +
𝐻 gagal 0,5𝑦 + 0,5𝑦 + 0,5𝑦 ) − 45,4994 −
𝛽 −0,0034 −0,4021 0,6876
ditolak
1,9993𝑋 − 0,0034𝑋 + 0,0871𝑋 −
𝛽 0,0871 2,0001 0,0455 𝐻 ditolak
0,0213𝑋 − 0,0076𝑋 + 0,0108𝑋
𝐻 gagal
𝛽 −0,0213 −1,0996 0,2715
ditolak
4. Kabupaten Kutai Timur
𝐻 gagal 𝑦 = 0,1673(0,143𝑦 + 1𝑦 + 0,5𝑦 ) −
𝛽 −0,0076 −0,4739 0,6356 9,9158 − 1,9993𝑋 − 0,0034𝑋 +
ditolak
𝛽 0,0108 2,6409 0,0083 𝐻 ditolak 0,0871𝑋 − 0,0213𝑋 − 0,0076𝑋 +
0,0108𝑋
Berdasarkan estimasi parameter pada Tabel 5. Kabupaten Berau
10, diperoleh model SAR-FE sebagai berikut. 𝑦 = 0,1673(1𝑦 ) + 23,1084 − 1,9993𝑋 −
𝑦 = 0,1673 ∑ 𝑤 𝑦 + 𝛼 − 1,9993𝑋 − 0,0034𝑋 + 0,0871𝑋 − 0,0213𝑋 −
0,0034𝑋 + 0,0871𝑋 − 0,0213𝑋 − 0,0076𝑋 + 0,0108𝑋
0,0076𝑋 + 0,0108𝑋 (31) 6. Kabupaten Penajam Paser Utara
Berdasarkan persamaan diatas, dapat 𝑦 = 0,1673(0,5𝑦 + 0,25𝑦 + 0,143𝑦 +
disimpulkan bahwa efek spasial pada model IPM 0,5𝑦 ) − 14,4746 − 1,9993𝑋 −
terdapat hubungan yang nyata antara IPM 0,0034𝑋 + 0,0871𝑋 − 0,0213𝑋 −
disekitar atau tetangga antar wilayah. Besarnya 0,0076𝑋 + 0,0108𝑋
nilai 𝜆 sebesar 0,1673 yang bernilai positif 7. Kabupaten Mahakam Ulu
menunjukkan bahwa IPM dipengaruhi secara 𝑦 = 0,1673(0,25𝑦 + 0,143𝑦 ) + 0,4373 −
positif oleh rata-rata IPM kabupaten/kota tetangga 1,9993𝑋 − 0,0034𝑋 + 0,0871𝑋 −
disekitar daerah tersebut sehingga setiap kenaikan 0,0213𝑋 − 0,0076𝑋 + 0,0108𝑋
pada IPM di suatu wilayah akan berdampak pada 8. Kota Balikpapan
kenaikan IPM di wilayah yang berdekatan. 𝑦 = 0,1673(0,143𝑦 + 0,25𝑦 ) + 8,2124 −
Berdasarkan Tabel 10, setelah dilakukan 1,9993𝑋 − 0,0034𝑋 + 0,0871𝑋 −
pengujian signifikansi diperoleh bahwa variael 0,0213𝑋 − 0,0076𝑋 + 0,0108𝑋
LPP, TPT dan PDRB memiliki nilai p-value < 9. Kota Samarinda
0,05, maka dapat disimpulkan bahwa variabel 𝑦 = 0,1673(0,143𝑦 ) + 18,7125 −
yang berpengaruh terhadap IPM kabupaten/kota 1,9993𝑋 − 0,0034𝑋 + 0,0871𝑋 −
adalah LPP, TPT dan PDRB. 0,0213𝑋 − 0,0076𝑋 + 0,0108𝑋
Variabel laju pertumbuhan penduduk memiliki 10. Kota Bontang
nilai koefisien negatif, hal ini berarti setiap
penambahan 1% pada variabel laju pertumbuhan
Daftar Pustaka
Anselin, L. (1988). Spatial Econometrics: Method
and Models. Dordrecht: Kluwer Academic
Publisher.
Badan Pusat Statistik. (2018). Indeks
Pembangunan Manusia 2017. Jakarta:
Badan Pusat Statistik.
Badan Pusat Statistik. (2019). Indeks
Pembangunan Manusia 2018. Jakarta:
Badan Pusat Statistik.
Badan Pusat Statistik. (2020). Indeks
Pembangunan Manusia 2019. Jakarta:
Badan Pusat Statistik.