You are on page 1of 37

BAB 7 SPESIFIKASI : MEMILIH SEBUAH BENTUK FUNGSI

Spesifikasi: Memilih

Formulir Fungsional
7.1 Penggunaan dan Interpretasi Istilah Konstan
7.2 Formulir Fungsional Alternatif
7.3 Variabel-variabel Independen Tertinggal
7.4 Slope Dummy Variables
7.5 Masalah dengan Formulir Fungsional yang Salah
7.6 Ringkasan dan Latihan
7.7 Lampiran: Econometric Lab # 4

Bahkan setelah Anda memilih variabel independen Anda, pekerjaan menentukan


persamaannya belum berakhir. Langkah selanjutnya adalah memilih bentuk fungsional dari
hubungan antara masing-masing variabel independen dan variabel dependen. Haruskah
persamaan melewati titik asal? Apakah Anda mengharapkan kurva sebagai gantinya dari garis
lurus? Apakah efek dari puncak variabel di beberapa titik dan kemudian mulai menurun?
Jawaban afirmatif untuk setiap pertanyaan ini menunjukkan itu persamaan selain model
linear standar dari bab-bab sebelumnya mungkin cocok. Spesifikasi alternatif semacam itu
penting untuk dua alasan: variabel penjelas yang benar mungkin tampak tidak signifikan atau
untuk memiliki tanda tak terduga jika formulir fungsional yang tidak pantas digunakan, dan
konsekuensi dari bentuk fungsional yang salah untuk interpretasi dan peramalan bisa menjadi
parah.

Pertimbangan teoritis biasanya mendikte bentuk model regresi.


Teknik dasar yang terlibat dalam memutuskan bentuk fungsional adalah memilih bentuk yang
paling baik mencontohkan ekonomi atau bisnis mendasar yang diharapkan prinsip dan
kemudian menggunakan bentuk matematika yang menghasilkan bentuk itu. Untuk membantu
dengan pilihan itu, bab ini berisi plot-plot yang paling umum digunakan bentuk fungsional
bersama dengan persamaan matematika yang sesuai untuk masing-masing.

190. Bab ini dimulai dengan diskusi singkat tentang istilah konstan. Khususnya, kami
menyarankan bahwa istilah konstan harus dipertahankan dalam persamaan dan bahwa
perkiraan jangka waktu konstan tidak dapat diandalkan untuk kesimpulan atau analisis. Bab
ini diakhiri dengan diskusi tentang variabel dummy lereng.

7.1 Penggunaan dan Interpretasi Istilah Konstan

Dalam model regresi linier, _0 adalah intercept atau constant term. Ini adalah nilai Y yang
diharapkan ketika semua variabel penjelas (dan istilah kesalahan) sama dengan nol. Perkiraan
_0 memiliki setidaknya tiga komponen:
1. _0 yang benar,
2. dampak konstan dari setiap kesalahan spesifikasi (variabel yang dihilangkan, misalnya),
3. mean e untuk persamaan yang ditentukan dengan benar (jika tidak sama dengan nol).

Sayangnya, komponen-komponen ini tidak dapat dibedakan satu sama lain karena kita hanya
bisa mengobservasi _N 0, jumlah dari tiga komponen. Hasil adalah bahwa kita harus
menganalisa _N0 berbeda dari cara kita menganalisa yang lain koefisien dalam persamaan
Kadang-kadang, _0 adalah kepentingan teoritis. Pertimbangkan, misalnya, persamaan biaya
berikut:

Ci = _0 + _1Qi + ei

dimana Ci adalah total biaya produksi output Qi. Istilah _1Qi mewakili total biaya variabel
yang terkait dengan tingkat output Qi, dan _0 mewakili total biaya tetap, yang didefinisikan
sebagai biaya ketika output Qi = 0. Dengan demikian, regresi Persamaan mungkin tampak
berguna bagi seorang peneliti yang ingin menentukan besaran relatif biaya tetap dan variabel.
Ini akan menjadi contoh bergantung pada istilah konstan untuk penyimpulan. Di sisi lain,
produk yang terlibat mungkin salah satunya diketahui bahwa ada beberapa — jika ada —
biaya tetap. Dalam kasus seperti itu, seorang peneliti mungkin ingin menghilangkan istilah
konstan; untuk melakukannya akan sesuai dengan Gagasan nol biaya tetap dan akan
menghemat tingkat kebebasan (yang mungkin akan membuat perkiraan _1 lebih tepat). Ini
akan menjadi sebuah contoh menekan istilah konstan.

1. Jika komponen kedua dan ketiga dari _0 kecil dibandingkan dengan komponen pertama,
Maka perbedaan ini berkurang. Lihat R. C. Allen dan J. H. Stone, “Buku Teks Mengabaikan
Konstan Koefisien, ”The Journal of Economic Education, Fall 2005, hlm. 379–384.

Tidak menekan istilah konstan atau mengandalkannya sebagai inferensi disarankan,


bagaimanapun, dan alasan untuk kesimpulan ini dijelaskan dalam bagian berikut. Jangan
Menekan Jangka Waktu Konsta Dalam banyak kasus, menekan istilah konstan menyebabkan
pelanggaran terhadap Klasik Asumsi, karena sangat jarang teori ekonomi menyiratkan bahwa
intersep benar, _0, sama dengan nol. Jika Anda menghilangkan istilah konstan, maka
dampaknya dari konstanta dipaksa ke dalam perkiraan dari koefisien lain, menyebabkan
bias potensial. Ini ditunjukkan pada Gambar 7.1. Mengingat pola tersebut X dan Y observasi,
memperkirakan persamaan regresi dengan istilah konstan kemungkinan besar akan
menghasilkan garis regresi yang diperkirakan sangat mirip dengan yang benar garis regresi,
yang memiliki istilah konstan (_0) sangat berbeda dari nol.

Kemiringan garis estimasi ini sangat rendah, dan nilai t-taksiran koefisien kemiringan
mungkin sangat dekat dengan nol. Namun, jika peneliti itu menekan istilah konstan, yang
mana menyiratkan bahwa garis regresi diperkirakan harus melewati asal, kemudian garis
regresi yang diperkirakan ditunjukkan pada

Gambar 7.1 akan menghasilkan. Lereng


Gambar 7.1 Efek Berbahaya Menekan Istilah Konstan

Jika konstanta (atau intercept) term ditekan, estimasi regresi akan berjalan asal. Efek seperti
itu berpotensi membuat bias _N dan meng-upgrade t-skor mereka. Khususnya ini Misalnya,
kemiringan yang benar mendekati nol dalam kisaran sampel, tetapi memaksa regresi melalui
asal membuat lereng tampak positif secara signifikan.

Koefisien lereng bias ke atas dibandingkan dengan koefisien kemiringan yang benar. Itu
t-score juga bias ke atas, dan mungkin cukup besar untuk menunjukkan bahwa koefisien
kemiringan yang diperkirakan secara statistik signifikan positif. Kesimpulan seperti itu akan
salah. Dengan demikian, meskipun beberapa paket regresi mengijinkan istilah konstan
menjadi ditekan (ditetapkan ke nol), aturan umumnya adalah: Jangan! Jangan Mengandalkan
Estimasi Istilah Konstan Tampaknya logis jika itu adalah ide yang buruk untuk menekan
istilah konstan, maka istilah konstan harus menjadi alat analitis penting untuk digunakan
dalam mengevaluasi hasil dari regresi. Sayangnya, setidaknya ada dua alasan yang
menunjukkan bahwa intersepsi tidak harus diandalkan untuk tujuan analisis atau
penyimpulan.

Pertama, istilah kesalahan dihasilkan, sebagian, oleh kelalaian angka variabel independen
marginal, efek rata-rata yang ditempatkan di istilah konstan. Istilah konstan bertindak sebagai
pengumpul sampah, dengan sebuah jumlah yang tidak diketahui dari efek berarti ini dibuang
ke dalamnya. Konstan koefisien estimasi jangka mungkin berbeda dari yang seharusnya tanpa
melakukan tugas ini, yang dilakukan demi persamaan sebagai a seluruh. Akibatnya, tidak ada
artinya menjalankan uji-t pada _N0.

Kedua, istilah konstan adalah nilai dari variabel dependen kapan semua variabel independen
dan istilah kesalahan adalah nol, tetapi variabelnya digunakan untuk analisis ekonomi
biasanya positif. Jadi, asalnya sering terletak di luar jangkauan pengamatan sampel (seperti
dapat dilihat pada Gambar 7.1). Sejak istilah konstan adalah perkiraan Y ketika Xs berada di
luar jangkauan pengamatan sampel, perkiraan itu renggang.

Koefisien lereng bias ke atas dibandingkan dengan koefisien kemiringan yang benar. T-score
juga bias ke atas, dan mungkin cukup besar untuk menunjukkan bahwa koefisien kemiringan
yang diperkirakan secara statistik positif signifikan. Kesimpulan seperti itu akan salah. Jadi,
meskipun beberapa paket regresi memungkinkan istilah konstan untuk ditekan (ditetapkan ke
nol), aturan umumnya adalah: Jangan!

Jangan Mengandalkan Perkiraan Istilah Konstan

Tampaknya logis bahwa jika ide yang buruk untuk menekan istilah konstan, maka istilah
konstan harus menjadi alat analitis penting untuk digunakan dalam mengevaluasi hasil
regresi. Sayangnya, setidaknya ada dua alasan yang menunjukkan bahwa intersepsi tidak
harus diandalkan untuk tujuan analisis atau penyimpulan. Pertama, istilah kesalahan
dihasilkan, sebagian, oleh kelalaian sejumlah variabel independen marjinal, efek rata-rata
yang ditempatkan dalam istilah konstan. Istilah konstan bertindak sebagai pengumpul
sampah, dengan jumlah yang tidak diketahui dari efek berarti ini dibuang ke dalamnya.
Koefisien perkiraan jangka konstan mungkin berbeda dari apa yang seharusnya tanpa
melakukan tugas ini, yang dilakukan demi persamaan secara keseluruhan. Akibatnya, tidak
ada artinya menjalankan uji-t pada β N0. Kedua, istilah konstan adalah nilai dari variabel
dependen ketika semua variabel independen dan istilah kesalahan adalah nol, tetapi variabel
yang digunakan untuk analisis ekonomi biasanya positif. Dengan demikian, asal sering
terletak di luar kisaran pengamatan sampel (seperti dapat dilihat pada Gambar 7.1). Karena
istilah konstan adalah perkiraan Y ketika Xs berada di luar rentang pengamatan sampel,
perkiraannya adalah lemah.

7.2 Formulir Fungsional Alternatif

Pilihan bentuk fungsional untuk persamaan adalah bagian penting dari spesifikasi persamaan
itu. Sebelum kita dapat berbicara tentang bentuk-bentuk fungsional, bagaimanapun, kita perlu
membuat perbedaan antara persamaan yang linear dalam koefisien dan salah satu yang linear
dalam variabel. Persamaan linear dalam variabel jika merencanakan fungsi dalam hal X dan
Y menghasilkan garis lurus. Misalnya, Persamaan 7.1:

Y = β0 + β1X + є (7.1)

adalah linear dalam variabel, tetapi Persamaan 7.2:

Y = β0 + β1X2 + є (7.2)

tidak linier dalam variabel, karena jika Anda merencanakan Persamaan 7.2 itu akan menjadi
kuadrat, bukan garis lurus.

Persamaan linear dalam koefisien hanya jika koefisien (βs) muncul dalam bentuk yang paling
sederhana — mereka tidak dinaikkan ke kekuatan apa pun (selain dari satu), tidak dikalikan
atau dibagi dengan koefisien lain, dan tidak termasuk beberapa jenis fungsi (seperti log atau
eksponen). Sebagai contoh, Persamaan 7.1 adalah linear dalam koefisien, tetapi Persamaan
7.3:

Y = β0 + Xβ1 (7.3)

tidak linier dalam koefisien β0 dan β1. Persamaan 7.3 tidak linier karena tidak ada penataan
ulang persamaan yang akan membuatnya linear dalam βs dari minat awal, β0 dan β1. Bahkan,
dari semua persamaan yang mungkin untuk variabel penjelas tunggal, hanya fungsi dari
bentuk umum:

f (Y) = β0 + β1f(X) (7.4)


linear dalam koefisien β0 dan β1. Analisis regresi linier dapat diterapkan pada persamaan yang
tidak linier dalam variabel selama persamaannya linear dalam koefisien. Memang, ketika ahli
ekonometrik menggunakan frase "regresi linier" (misalnya, dalam Asumsi Klasik), mereka
biasanya berarti "regresi yang linear dalam koefisien." Penggunaan OLS mensyaratkan
bahwa persamaan menjadi linier dalam koefisien, tetapi ada adalah berbagai macam bentuk
fungsional yang linear dalam koefisien sementara nonlinear dalam variabel. Memang, dalam
bab-bab sebelumnya kami telah menggunakan beberapa persamaan yang linear dalam
koefisien dan nonlinear dalam variabel, tetapi kami telah mengatakan sedikit tentang kapan
harus menggunakan persamaan nonlinear tersebut. Tujuan dari bagian saat ini adalah untuk
menyajikan rincian bentuk-bentuk fungsional yang paling sering digunakan untuk membantu
pembaca mengembangkan kemampuan untuk memilih yang benar ketika menentukan
persamaan. Pilihan bentuk fungsional hampir selalu harus didasarkan pada teori yang
mendasari dan jarang pada bentuk mana yang paling cocok. Bentuk logis dari hubungan
antara variabel dependen dan variabel independen yang bersangkutan harus dibandingkan
dengan sifat-sifat berbagai bentuk fungsional, dan yang paling dekat dengan teori yang
mendasarinya harus dipilih. Untuk memungkinkan perbandingan semacam itu, paragraf yang
mengikuti ciri bentuk yang paling sering digunakan dalam hal grafik, persamaan, dan contoh.
Dalam beberapa kasus, lebih dari satu bentuk fungsional akan berlaku, tetapi biasanya pilihan
antara bentuk-bentuk fungsional alternatif dapat dibuat berdasarkan informasi yang akan
kami hadirkan.

Bentuk Linear

Model regresi linier, yang digunakan hampir secara eksklusif dalam teks ini sejauh ini,
didasarkan pada asumsi bahwa kemiringan hubungan antara variabel independen dan variabel
dependen adalah konstan: 2

Jika hubungan yang dihipotesiskan antara Y dan X sedemikian rupa sehingga kemiringan
hubungan dapat diharapkan menjadi konstan, maka bentuk fungsional linear harus digunakan.
Karena kemiringannya konstan, elastisitas Y terhadap X (perubahan persentase dalam
variabel dependen yang disebabkan oleh peningkatan 1 persen dalam variabel independen,
memegang variabel lain dalam persamaan konstanta) dapat dihitung dengan mudah:
Kecuali teori, akal sehat, atau pengalaman membenarkan penggunaan beberapa bentuk
fungsional lainnya, Anda harus menggunakan model linier. Karena, pada dasarnya, itu
digunakan secara default, model linier kadang-kadang disebut sebagai bentuk fungsional
standar.

Formulir Double-Log

Bentuk double-log adalah bentuk fungsional yang paling umum yang tidak linier dalam
variabel sementara masih linear dalam koefisien. Memang, bentuk double-log sangat populer
sehingga beberapa peneliti menggunakannya sebagai bentuk fungsional standar mereka
daripada bentuk linear. Dalam bentuk fungsional double-log, log alami Y adalah variabel
dependen dan log alami X adalah variabel independen:

lnY = β0 + β1 lnX1 + β2 lnX2 + є (7.5)

di mana lnY mengacu pada log natural dari Y, dan seterusnya. Untuk tinjauan singkat tentang
makna log alami, lihat fitur kotak di halaman 196 dan 197.

Bentuk double-log, kadang-kadang disebut bentuk log-log, sering digunakan karena peneliti
telah menetapkan bahwa elastisitas model adalah konstan dan lereng tidak. Ini berbeda
dengan model linier, di mana lerengnya konstan tetapi elastisitasnya tidak. Dalam persamaan
double-log, koefisien regresi individu dapat diartikan sebagai elastisitas karena:
Karena koefisien regresi adalah konstan, kondisi bahwa model memiliki elastisitas konstan
dipenuhi oleh persamaan double-log. Cara menginterpretasikan βk dalam persamaan double-
log adalah jika Xk meningkat sebesar 1 persen sementara X lainnya dipertahankan konstan,
maka Y akan berubah sebesar βk persen. Karena elastisitasnya konstan, lereng sekarang tidak
lagi konstan. Gambar 7.2 adalah grafik fungsi double-log (mengabaikan istilah kesalahan).

Apa itu Log? Apa itu log? Jika e (konstan sama dengan 2,71828) ke "bth power" menghasilkan x, maka b
adalah log dari x:

b adalah log dari x ke basis e jika: eb = x

Jadi, log (atau logaritma) adalah eksponen ke mana basis ya ng diberikan harus diambil untuk menghasilkan
angka tertentu. Meskipun log memiliki lebih dari satu variasi, kami hanya akan menggunakan log natural
(log ke basis e) dalam teks ini. Simbol untuk log natural adalah "ln," jadi ln1x2 = b berarti 12.718282 b = x
atau, lebih sederhana,

ln1x2 = b berarti eb = x

Sebagai contoh, karena e2 = (2.718282)2 = 7.389, kita dapat menyatakan bahwa:

ln17. 3892 = 2

Dengan demikian, log natural 7.389 adalah 2! Dua adalah kekuatan e yang menghasilkan 7.389. Mari kita
lihat beberapa perhitungan log natural lainnya:

ln (100) = 4.605

ln (1000) = 6.908

Panel di sebelah kiri menunjukkan konsep ekonomi dari isoquant atau kurva indiferen.
Isoquants dari fungsi produksi menunjukkan berbagai kombinasi faktor X1 dan X2, mungkin
modal dan tenaga kerja, yang dapat digunakan untuk menghasilkan tingkat output yang
diberikan Y. Panel di sebelah kanan Gambar 7.2 menunjukkan
hubungan antara Y dan X1 yang akan ada jika X2 dipertahankan konstan atau tidak termasuk
dalam model. Perhatikan bahwa bentuk kurva tergantung pada tanda dan besarnya koefisien
β1. Jika β1 negatif, bentuk fungsional double-log dapat digunakan untuk memodelkan kurva
permintaan yang khas. Model double-log harus dijalankan hanya ketika variabel yang di-log
mengambil nilai positif. Variabel dummy, yang dapat mengambil nilai nol, seharusnya tidak
dicatat.

Semilog Form

Bentuk fungsional semilog adalah varian dari persamaan double-log di mana beberapa tetapi
tidak semua variabel (dependen dan independen) dinyatakan dalam log alami mereka.
Misalnya, Anda mungkin memilih untuk menggunakan logaritma dari salah satu variabel
independen asli, seperti dalam:

Yi = β0 + β1 Dalam X1i + β2X2i + єi (7.7)

Dalam hal ini, arti ekonomi dari dua koefisien kemiringan berbeda, karena X2 berhubungan
linier dengan Y sedangkan X1 secara non-linear terkait dengan Y.

ln1100002 = 9.210
ln11000002 = 11.513
ln110000002 = 13,816

Perhatikan bahwa ketika angka mulai dari 100 hingga 1.000.000, log naturalnya berasal4,605
menjadi hanya 13,816! Karena log adalah eksponen, bahkan perubahan kecil dalam logbisa
berarti perubahan besar dalam hal dampak. Akibatnya, log dapat digunakan dalam
ekonometri jika seorang peneliti ingin mengurangi ukuran absolut dari angka-angka yang
terkaitdengan makna yang sebenarnya sama.Salah satu properti yang berguna dari kayu alam
dalam ekonometri adalah yang mereka buatlebih mudah untuk mengetahui dampaknya dalam
persentase. Jika Anda menjalankan double-logregresi, arti koefisien kemiringan adalah
perubahan persentase dalam variabel dependen yang disebabkan oleh peningkatan satu poin
persentase dalam independen variabel, memegang variabel independen lainnya dalam
persamaanconstant.3 Ini karena persentase ini mengubah properti yang koefisien
kemiringannyadalam persamaan double-log adalah elastisitas.
3. Ini karena turunan dari log natural X sama dengan dX / X (atau X / X), yang samasebagai
perubahan persentase.

Sisi kanan Gambar 7.3 menunjukkan hubungan antara Y dan X1 pada persamaan semilog
seperti ini ketika X2 dipertahankan konstan. Perhatikan bahwa jika 1 lebih besar dari nol,
dampak perubahan X1 pada Y menurun saat X1 semakin besar. Jadi, itu bentuk fungsional
semilog harus digunakan ketika hubungan antara X1 dan Y dihipotesiskan untuk memiliki
bentuk "meningkat pada laju penurunan" ini.4 Aplikasi formulir semilog cukup sering.
Sebagai contoh, sebagian besar fungsi konsumsi cenderung meningkat dengan laju penurunan

4. Bentuk fungsional lain yang dapat digunakan ketika Anda mengantisipasi bahwa hubungan
antaraX dan Y memiliki "peningkatan pada tingkat penurunan" bentuk adalah bentuk
fungsional terbalik. Formulir inimenyatakan Y sebagai fungsi timbal balik (atau kebalikan)
dari satu atau lebih variabel independen
(dalam hal ini X1):
Yi = 0 + 1 (1 / X1i) + 2X2i + ei

Bentuk fungsional terbalik harus digunakan ketika dampak dari variabel independen
tertentudiharapkan mendekati nol karena variabel independen mendekati infinity. Untuk
melihat ini,perhatikan bahwa ketika X1 semakin besar, dampaknya pada Y menurun.Hati-
hati, karena X1 tidak dapat sama dengan nol, karena jika X1 menyamai nol, membaginya
menjadiapa pun akan menghasilkan nilai yang tak terbatas atau tidak terdefinisi.

Gambar 7.3 Fungsi Semilog


Bentuk fungsional semilog di sebelah kanan (lnX) dapat digunakan untuk menggambarkan
situasiyang di dampak X1 pada Y diperkirakan akan meningkat pada tingkat yang menurun
ketika X1 semakin besar asalkan 1 lebih besar dari nol (menahan konstanta X2). Bentuk
fungsional semilog di sebelah kiri (lnY) dapat digunakan untuk menggambarkan situasi di
mana peningkatan X1 menyebabkan Y menjadi meningkat pada tingkat yang meningkat

beberapa tingkat pendapatan. Kurva Engel ini cenderung rata karena pendapatan menjadi
lebih tinggi, persentase pendapatan yang lebih kecil masuk ke konsumsi dan persentase yang
lebih besar pergi ke tabungan. Konsumsi dengan demikian meningkat pada a tingkat
penurunan. Jika Y adalah konsumsi barang dan X1 dapat dibuang pendapatan (dengan X2
berdiri untuk semua variabel independen lainnya), lalu penggunaan bentuk fungsional
semilog dibenarkan kapan saja
konsumsi dapat diharapkan meningkat pada tingkat penurunan sebagai pendapatan
meningkat. Misalnya, ingat persamaan permintaan daging sapi, Persamaan 2.7, dari Bab 2:
CBt = 37,54 - 0,88Pt + 11,9Ydt (2,7)
(0,16) (1,76)
t= -5.36 6.75
R2 = 0,631 N = 28 (tahunan)

dimana:
CB = konsumsi daging sapi per kapita
P = harga daging sapi dalam sen per pon
Yd = pendapatan sekali pakai AS dalam ribuan dolar

Jika kita mengganti log dari disposable income (lnYdt) untuk pendapatan sekali pakai dalam
Persamaan 2.7, kita mendapatkan:
CBt = -71,75 - 0,87Pt + 98,87lnYdt (7,8)
(0,13) (11,11)
t= -6,93 8,90
R2 = 0,750 N = 28 1annual2

Dalam Persamaan 7.8, variabel independen termasuk harga daging sapi dan log
penghasilan sekali pakai. Persamaan 7.8 akan sesuai jika kita berhipotesis bahwa ketika
pendapatan naik, konsumsi akan meningkat pada tingkat yang menurun. Untuk yang lain
produk, mungkin seperti yacht atau rumah musim panas, tidak ada penurunan laju yang bisa
terjadi dihipotesiskan, dan fungsi semilog tidak akan sesuai. Tidak semua fungsi semilog
memiliki log di sisi kanan persamaan, seperti pada Persamaan 7.7. Bentuk semilog alternatif
adalah memiliki logon sisi kiri persamaan. Ini berarti bahwa log alami Y akan menjadi fungsi
dari nilai Xs yang belum terinstal, seperti pada:

lnY = _0 + _1X1 + _2X2 + e

Model ini tidak memiliki kemiringan konstan maupun elastisitas konstan, tetapi koefisien
memiliki interpretasi yang sangat berguna. Jika X1 meningkat sebesar satu unit, maka Y akan
berubah dalam persentase. Secara khusus, Y akan berubah sebesar 1 # 100 persen untuk
setiap unit yang X1 meningkat, menahan konstanta X2. Sisi kiridari Gambar 7.3
menunjukkan fungsi semilog seperti itu.

Fakta ini berarti bahwa fungsi semilog lnY dari Persamaan 7.9 adalah sempurna untuk model
apa pun di mana variabel dependen menyesuaikan dalam istilah persentase ke unit berubah
dalam variabel independen. Ekonomi paling umum dan aplikasi bisnis Persamaan 7.9 adalah
dalam model pendapatan dari individu, di mana perusahaan sering memberikan kenaikan
tahunan dalam hal persentase. Sedemikian model, Y akan menjadi gaji atau upah karyawan
engan, dan X1 akan pengalaman pekerja engan. Setiap tahun X1 akan meningkat satu, dan 1
akan mengukur kenaikan persentase yang diberikan oleh perusahaan.

Perhatikan bahwa kita sekarang memiliki dua jenis bentuk fungsional semilog yang berbeda,
menciptakan kebingungan yang mungkin terjadi. Akibatnya, banyak ekonometrik
menggunakan frasa seperti "Sisi kanan semilog" atau "bentuk fungsional lin-log" untuk
merujuk ke Persamaan 7.7 sementara
menggunakan "sisi kiri semilog" atau "bentuk fungsional log-lin" untuk merujuk ke
Persamaan 7.9
FORMULIR POLINOMIAL

Dalam kebanyakan fungsi biaya rata-rata, kemiringan kurva biaya mengubah tanda sebagai
outputperubahan. Jika kemiringan hubungan diharapkan tergantung pada tingkatvariabel itu
sendiri, maka model polinomial harus dipertimbangkan. Polinomial, formulir fungsional
menyatakan Y sebagai fungsi variabel independen, beberapa di antaranyadibangkitkan untuk
kekuatan selain 1. Sebagai contoh, dalam polinomial tingkat dua(Juga disebut kuadrat)
persamaan, setidaknya satu variabel independen dikuadratkan:
Yi = 0 + 1X1i + 2 (X1i) 2 + 3X2i + ei (7.10)
Model seperti itu memang bisa menghasilkan lereng yang mengubah tanda sebagai
independenvariabel berubah. Kemiringan Y sehubungan dengan X1 dalam Persamaan 7.10
adalah:
Y
X1= 1 + 2 2X1 (7.11)

Perhatikan bahwa kemiringan tergantung pada tingkat X1. Untuk nilai kecil X1, 1
mungkinmendominasi, tetapi untuk nilai besar X1, 2 akan selalu mendominasi. Jika ini
biayafungsi, dengan Y menjadi biaya produksi rata-rata dan X1 adalah tingkatoutput dari
perusahaan, maka kita akan mengharapkan 1 menjadi negatif dan 2 menjadi positif
jikaperusahaan memiliki kurva biaya berbentuk U khas yang digambarkan di bagian kiri
Gambar 7.4. Untuk contoh lain, pertimbangkan model penghasilan karyawan tahunan sebagai
fungsi usia setiap karyawan dan sejumlah ukuran lainnyaproduktivitas seperti pendidikan.
Apa dampak yang diharapkan dari usia terhadap penghasilan?Ketika seorang pekerja muda
bertambah usia, penghasilannya biasanya akan meningkat.

Gambar 7.4 FUNGSI POLINOMIAL


Bentuk fungsional kuadrat (polinomial dengan istilah kuadrat) mengambil U atau U terbalik
bentuk, tergantung pada nilai-nilai koefisien (memegang X2 konstan). Panel kiri
menunjukkan bentuk fungsi kuadrat yang dapat digunakan untuk menunjukkan kurva biaya
yang khas; panel kanan memungkinkan deskripsi dampak yang naik dan kemudian jatuh
(seperti dampak usia terhadap penghasilan).

Namun, di luar titik tertentu, peningkatan usia tidak akan meningkatkan penghasilan
sangat banyak sekali, dan sekitar masa pensiun kami mengharapkan penghasilan mulai turu
tiba-tiba dengan usia. Akibatnya, hubungan logis antara penghasilan dan usiamungkin terlihat
seperti separuh kanan dari Gambar 7.4; pendapatan akan naik,
naik level, dan kemudian jatuh saat usia bertambah. Hubungan teoretis seperti itu bisa
dimodelkan dengan persamaan kuadrat:
Pendapatani = β0 + β1Usiai + β2Usia2i+ .... + €i

Apa yang akan tanda-tanda yang diharapkan? β1 dan? β2 menjadi? Karena Anda
mengharapkan dampaknya usia naik dan turun, sehingga Anda berharap? β1 menjadi positif
dan? β2 menjadi negatif (semua yang lain sama). Sebenarnya, ini adalah apa yang banyak
peneliti di ekonomi tenaga kerja telah diamati.

Dengan regresi polinomial, interpretasi regresi individu koefisien menjadi sulit, dan
persamaan dapat menghasilkan yang tidak diinginkan hasil untuk rentang X tertentu.
Perhatian besar harus diambil saat menggunakan polinomial persamaan regresi untuk
memastikan bahwa bentuk fungsional akan tercapai apa yang dimaksudkan oleh peneliti dan
tidak lebih.

Memilih Formulir Fungsional


Cara terbaik untuk memilih bentuk fungsional untuk model regresi adalah dengan memilih
spesifikasi yang paling cocok dengan teori yang mendasari persamaan.
Dalam sebagian besar kasus, bentuk linier akan memadai, dan untuk sebagian besar
istirahat, akal sehat akan menunjukkan pilihan yang cukup mudah dari alternatif
diuraikan di atas. Tabel 7.1 berisi ringkasan sifat-sifat berbagai itu
bentuk-bentuk fungsional alternatif.

Tabel 7.1 Ringkasan Formulir Fungsional Alternatif


Formulir fungsional Persamaan X saja Perubahan dalam Y
saat X Perubahan
Linear Yi = β0 + β1Xi + €i Jika X meningkat sebesar
satu unit, Y akan berubah
dengan β1 unit.
Log Ganda lnYi = β0 + β1lnXi + €i Jika X meningkat satu
persen, Y akan berubah
sebesar β 1 persen. (Jadi
β1 adalah elastisitas Y
terhadap X.)
Semilog lnX Yi = β0 + β1 lnXi + €i Jika X meningkat satu
persen, Y akan berubah
dengan β1/100 unit.
Semilog lnYi = β0 + β1Xi + €i Jika X meningkat sebesar
satu unit, Y akan
berubah sekitar 100
β1persen.
Polinominal Yi = β0 + β1Xi + β2X2i+ €i Jika X meningkat sebesar
satu unit, Y akan
ubah dengan (β1 +
2β2X ) unit.

7.3 Variabel-variabel Independen Tertinggal


Hampir semua regresi yang kami pelajari sejauh ini adalah "seketika" alam. Dengan kata lain,
mereka telah memasukkan variabel independen dan dependen dari periode waktu yang sama,
seperti pada:

Yt = β0 + β1X1t + β2X2t + €t (7.13)


di mana t subskrip digunakan untuk merujuk ke titik waktu tertentu. Jika semua variabel
memiliki subscript yang sama, maka persamaannya seketika.

Namun, tidak semua situasi ekonomi atau bisnis menyiratkan sesaat seperti itu
hubungan antara variabel dependen dan independen. Di banyak kasus waktu berlalu antara
perubahan dalam variabel independen dan perubahan yang dihasilkan dalam variabel
dependen. Periode waktu antara penyebab (perubahan X) dan efek (perubahan dalam Y)
disebut lag. Periode waktu dapat diukur dalam beberapa hari, bulan, tahun, dll. Banyak
ekonometrik persamaan termasuk satu atau lebih variabel independen yang tertinggal seperti
X1t-1, di mana subscript t - 1 menunjukkan bahwa pengamatan X1 berasal periode waktu
sebelum periode waktu t, seperti dalam persamaan berikut:

Yt = β0 + β1X1t -1 + β2X2t + €t(7.14)

Dalam persamaan ini, X1 telah tertinggal oleh satu periode waktu, tetapi hubungannya
antara Y dan X2 masih seketika. Sedangkan jeda waktu satu kali ini lag paling sering dalam
ekonomi, tertinggal dari dua atau lebih periode waktu dapat digunakan ketika dibenarkan
oleh teori yang mendasarinya. Untuk contoh variabel independen yang tertinggal, pikirkan
tentang prosesnya dimana persediaan suatu produk pertanian ditentukan. Sejak pertanian
barang membutuhkan waktu untuk tumbuh, keputusan tentang berapa banyak hektar untuk
ditanam atau berapa banyak telur yang dibiarkan menetas menjadi ayam penghasil telur
(bukan menjualnya segera) harus dilakukan berbulan-bulan, jika tidak bertahun-tahun,
sebelum produk benar-benar dipasok ke konsumen. Setiap perubahan di pasar pertanian,
seperti peningkatan harga yang dapat diperoleh petani untuk menyediakan kapas, memiliki
efek tertinggal pada suplai produk tersebut:
Ct = β +β1PCt-1 + β2PFt + €t

di mana:
Ct = jumlah kapas yang disediakan di tahun t
PCt-1 = harga kapas pada tahun t - 1
PFt = harga buruh tani di tahun t
Perhatikan bahwa persamaan ini menghipotesiskan lag antara harga kapas dan
produksi kapas, tetapi tidak di antara harga tenaga kerja pertanian danproduksi kapas. Masuk
akal untuk berpikir bahwa jika harga kapas berubah,petani tidak akan dapat segera bereaksi
karena butuh waktu lama untuk kapasuntuk ditanam dan tumbuh.Yang dimaksud dengan
koefisien regresi dari variabel yang tertinggal adalah bukansama dengan arti koefisien
variabel yang tidak terikat. Perkiraankoefisien X yang tertinggal mengukur perubahan pada Y
tahun ini yang dikaitkan dengan peningkatan satu unit di X tahun lalu (memegang konstan X
lain dalam persamaan).Dengan demikian? 1 dalam Persamaan 7.15 mengukur jumlah ekstra
unit kapasyang akan diproduksi tahun ini sebagai hasil dari peningkatan satu unit
terakhirharga kapas tahun ini, menahan harga konstan tenaga kerja tahun ini.
Jika struktur lag dihipotesiskan berlangsung lebih dari satu kaliperiode, atau jika variabel
dependen tertinggal dimasukkan di sisi kanansebuah persamaan, pertanyaannya menjadi jauh
lebih kompleks. Seperti itukasus, yang disebut kelambatan terdistribusi, akan dibahas dalam
Bab 12.
7.4 Slope Dummy Variables

Dalam Bagian 3.3 kami memperkenalkan konsep variabel boneka, yang kami
didefinisikan sebagai salah satu yang mengambil nilai 0 atau 1, tergantung pada
kualitatifatribut seperti jenis kelamin. Di bagian itu fokus kami hanya pada
penggunaanvariabel dummy sebagai intercept dummy, yang mengubah konstanta
ataumemotong istilah, tergantung pada apakah kondisi kualitatif terpenuhi. Ini
ambil bentuk umum:

Yi = β0 + β1Xi +β2Di + €i (7.16)

di mana Di = e1 jika observasi ke-engan memenuhi suatu kondisi tertentu


0 sebaliknya.
Hingga saat ini, setiap variabel independen dalam teks ini telah dikalikan dengantepat satu
item lain: koefisien kemiringan. Untuk melihat ini, lihat lagiPersamaan 7.16. Seperti yang
Anda lihat, X dikalikan hanya dengan 1, dan D dikalikanhanya dengan? 2, dan tidak ada
faktor lain yang terlibat.

Pembatasan ini tidak berlaku untuk jenis variabel baru yang disebut interaksiistilah. Istilah
interaksi adalah variabel independen dalam regresipersamaan yang merupakan kelipatan dari
dua atau lebih variabel independen lainnya.

Setiap istilah interaksi memiliki koefisien regresi sendiri, sehingga hasil akhirnya adalah
bahwa istilah interaksi memiliki tiga atau lebih komponen, seperti dalam? 3XiDi. Seperti
ituistilah interaksi digunakan ketika perubahan dalam Y terhadap satu independenvariabel
(dalam hal ini X) tergantung pada tingkat independen lain
variabel (dalam hal ini D). Untuk contoh penggunaan istilah interaksi, lihat
Latihan 8.

Istilah interaksi dapat melibatkan dua variabel kuantitatif ( β3X1X 2) atau dua
variabel dummy (β3D1D2), tetapi aplikasi interaksi yang paling seringistilah melibatkan satu
variabel kuantitatif dan satu variabel dummy (β3X1D2),
kombinasi yang biasanya disebut dummy lereng. Variabel dummy lerengmemungkinkan
kemiringan hubungan antara variabel dependen danvariabel independen menjadi berbeda
tergantung apakah kondisinyaditentukan oleh variabel dummy terpenuhi. Ini berbeda dengan
intersepsivariabel dummy, yang mengubah intercept, tetapi tidak mengubah slope,ketika
suatu kondisi tertentu terpenuhi.

Secara umum, dummy lereng diperkenalkan dengan menambahkan ke persamaan variabelitu


adalah kelipatan dari variabel independen yang memiliki kemiringan Andaingin berubah dan
variabel dummy yang ingin Anda ubah lereng. Bentuk umum dari persamaan dummy lereng
adalah:

Yi = β0 + β1Xi + β2Di + β3XiDi + €i (7.17)

Perhatikan bahwa Persamaan 7.17 sama dengan Persamaan 7.16, kecuali yang kita
milikimenambahkan sebuah istilah interaksi di mana variabel dummy dikalikan dengan
variabel independen (β3XiDi). Mari periksa untuk memastikan kemiringan Y
sehubungan dengan X memang berubah jika D berubah:

Ketika D = 0, ΔY /ΔX =β1


Ketika D = 1, Δ Y / ΔX = (β1+β3)

Intinya, koefisien X berubah ketika kondisi ditentukan olehD terpenuhi. Untuk melihat ini,
gantikan D = 0 dan D = 1, secara berurutan, menjadi Persamaan 7.17 dan faktor X.

Perhatikan bahwa Persamaan 7.17 mencakup dummy lereng dan intercept


bodoh. Ternyata setiap kali dummy lereng digunakan, sangat penting juga
memiliki? βXi dan β2D dalam persamaan untuk menghindari bias dalam perkiraan koefisien
dari istilah dummy lereng. Jika ada X lain dalam sebuah persamaan, mereka
tidak boleh dikalikan dengan D kecuali Anda berhipotesis bahwa lereng mereka
berubah terhadap D juga. Lihatlah Gambar 7.5, yang memiliki dummy lereng dan
interceptbodoh. Pada Gambar 7.5, intercept akan menjadi 0 ketika D = 0 dan β0 + β2 saat D
= 1. Selain itu, kemiringan Y terhadap X akan menjadi 1 ketika D = 0
dan β1 + β3 ketika D = 1. Akibatnya, memang ada dua persamaan:

Yi = βo + β1Xi + €i [ketika D = 0]

Yi = (β0 + β2) + (β1 + β3)Xi + €i [ketika D = 1]


Dalam prakteknya, slope dummies memiliki banyak kegunaan realistis. Misalnya, dalam
mempertimbangkan pertanyaan tentang perbedaan penghasilan antara pria dan wanita.
Meskipun ada sedikit argumen bahwa perbedaan ini ada, ada cukup banyak

Gambar 7.5 Slope dan Intercept Dummies

Jika slope dummy (β3Xi Di) dan memotong dummy (β2Di ) istilah ditambahkan ke persamaan,
grafik persamaan akan memiliki penyadapan yang berbeda dan kemiringan yang berbeda
tergantung pada nilai kondisi kualitatif yang ditentukan oleh variabel dummy. Perbedaan
antara dua intersep adalah β2, sedangkan perbedaan antara dua lereng adalah β3.

kontroversi tentang sejauh mana perbedaan-perbedaan ini disebabkan oleh seksual


diskriminasi (dibandingkan dengan faktor-faktor lain). Misalkan Anda memutuskan untuk
membangun model penghasilan untuk mendapatkan pandangan yang lebih baik dari
kontroversi ini. Jika Anda berhipotesis bahwa pria mendapatkan lebih banyak rata-rata
daripada wanita, maka Anda mungkin akan menggunakan intercept dummy variable untuk
gender dalam persamaan penghasilan yang disertakan ukuran pengalaman, keterampilan
khusus, pendidikan, dan sebagainya, sebagai independen variabel:

ln (Earningsi ) = β0 + β1Di + β2EXPi + g + ei (7.18)


dimana: Di = 1 jika pekerja adalah laki-laki dan 0 sebaliknya
EXPi = pengalaman bertahun-tahun dari pekerja
Ei = istilah kesalahan klasik

Dalam Persamaan 7.18, 1 akan menjadi perkiraan perbedaan rata-rata dalam penghasilan

antara laki-laki dan perempuan, berpegang pada pengalaman mereka dan faktor lain dalam
persamaan. Persamaan 7.18 juga memaksa dampak kenaikan pengalaman (dan faktor-faktor
lain dalam persamaan) memiliki efek yang sama bagi perempuan seperti bagi laki-laki karena
slopenya adalah sama untuk kedua jenis kelamin.

Jika Anda berhipotesis bahwa pria juga meningkatkan penghasilan mereka lebih banyak per
tahun daripada wanita, maka Anda akan menyertakan boneka slope dummy juga sebagai
intercept dalam model seperti ini:
ln (Earningsi ) = β0 + β1Di + β2EXPi + β3Di EXPi + g + ei (7.19)

Dalam Persamaan 7.19,

3 akan menjadi perkiraan dampak diferensial dari suatu tahun tambahan pengalaman tentang

penghasilan antara pria dan wanita. Kita bisa menguji kemungkinan beta β 3 positif dengan

menjalankan uji t satu arah pada 3. Jika 3 berbeda secara signifikan dari nol ke arah yang

positif, maka kita bisa menolak hipotesis nol tidak ada perbedaan karena jenis kelamin dalam
dampak pengalaman pada pendapatan, memegang konstan variabel lain dalam persamaan.

7.5 Masalah dengan Bentuk Fungsional yang Salah


Sesekali keadaan akan muncul di mana model secara logis tidak linier dalam variabel, tetapi
bentuk yang tepat dari non-linearitas ini sulit untuk ditentukan. Dalam kasus seperti itu,
bentuk linier tidak benar, namun pilihan antara berbagai bentuk nonlinier tidak dapat dibuat
atas dasar teori ekonomi. Bahkan dalam kasus-kasus ini, bagaimanapun, masih membayar
(dalam hal memahami yang benar hubungan) untuk menghindari memilih bentuk fungsional
atas dasar kecocokan saja. Jika bentuk-bentuk fungsionalnya serupa, dan jika teori tidak
secara spesifik menentukan yang mana bentuk untuk digunakan, mengapa kita harus
mencoba untuk menghindari penggunaan kesesuaian atas sampel untuk menentukan
persamaan mana yang digunakan? Bagian ini akan menyoroti dua jawaban untuk pertanyaan
ini:

2
1. s sulit untuk membandingkan jika variabel dependen berubah.

2. Bentuk fungsional yang salah dapat memberikan kecocokan yang wajar dalam sampel
tetapi memiliki potensi untuk membuat kesalahan perkiraan besar ketika digunakan di luar
kisaran sampel

2
s Sulit Dibandingkan Saat Y Berubah
2
Ketika variabel dependen berubah dari versi linearnya, secara keseluruhan ukuran fit, s,

tidak dapat digunakan untuk membandingkan kecocokan nonlinear persamaan dengan yang
asli linear satu. Masalah ini tidak terlalu penting dalam banyak kasus karena penekanan
2
dalam analisis regresi yang diterapkan biasanya pada estimasi koefisien. Namun, jika s

pernah digunakan untuk membandingkan kesesuaian dua bentuk fungsional yang berbeda,
maka menjadi sangat penting untuk ini kurangnya komparabilitas harus diingat. Misalnya,
Anda mencoba untuk membandingkan persamaan linear:

Y = β0 + β1X1 + β2X2 + e (7.20)

dengan versi semilog dari persamaan yang sama (menggunakan versi semilog fungsi yang
mengambil log dari variabel dependen):

lnY = β0 + β1X1 + β2X2 + e (7.21)

Perhatikan bahwa satu-satunya perbedaan antara Persamaan 7.20 dan 7.21 adalah bentuk
2
fungsional dari variabel dependen. Alasan bahwa s dari persamaan masing-masing tidak

dapat digunakan untuk membandingkan kecocokan keseluruhan dari dua persamaan adalah
jumlah total kuadrat (TSS) dari variabel dependen sekitar artinya berbeda dalam dua
2
formulasi. Yaitu, s tidak sebanding karena variabel dependen berbeda. Tidak ada alasan

untuk itu berharap bahwa variabel dependen yang berbeda akan memiliki yang identik (atau
mudah sebanding) derajat dispersi di sekitar sarana mereka
Bentuk Fungsional yang Salah di Luar Rentang Sampel
Jika bentuk fungsional yang salah digunakan, maka kemungkinan salah kesimpulan tentang
parameter populasi yang sebenarnya akan meningkat. Menggunakan sebuah Bentuk
fungsional yang salah adalah sejenis kesalahan spesifikasi yang mirip dengan menghilangkan
bias variabel yang dibahas dalam Bagian 6.1. Bahkan jika salah fungsional formulir
menyediakan statistik yang baik dalam sampel, residual besar hampir pasti akan muncul
ketika persamaan misspecified digunakan pada data yang bukan bagian dari sampel yang
digunakan untuk memperkirakan koefisien.

Secara umum, ekstrapolasi persamaan regresi ke data yang berada di luar kisaran di mana
persamaan diperkirakan mengalami peningkatan risiko kesalahan perkiraan besar dan
kesimpulan salah tentang nilai populasi. Risiko ini meningkat jika regresi menggunakan
bentuk fungsional yang tidak pantas untuk variabel tertentu yang sedang dipelajari.

Dua bentuk fungsional yang berperilaku sama di atas rentang sampel mungkin berperilaku
sangat berbeda di luar jangkauan itu. Jika formulir fungsional dipilih atas dasar teori, maka
peneliti dapat memperhitungkan bagaimana Persamaan akan bertindak atas berbagai rentang
nilai, bahkan jika beberapa dari nilai-nilai tersebut di luar kisaran sampel. Jika formulir
fungsional dipilih atas dasar dari fit, kemudian ekstrapolasi di luar sampel menjadi renggang.

Gambar 7.6 berisi sejumlah contoh hipotetis. Seperti yang terlihat, beberapa bentuk
fungsional yang memiliki potensi untuk cukup pas di luar
Gambar 7.6 Formulir Fungsional yang Salah di Luar Rentang Sampel
Jika formulir yang salah diterapkan pada data di luar rentang sampel yang menjadi tempatnya
Diperkirakan, kemungkinan kesalahan besar meningkat. Khususnya, perhatikan bagaimana
polinomial bentuk fungsional dapat mengubah kemiringan dengan cepat di luar rentang
sampel (panel b) dan bahwa bahkan bentuk linear dapat menyebabkan kesalahan jika bentuk
fungsional yang sebenarnya adalah nonlinier (panel d).

berbagai sampel. Grafik semacam itu dimaksudkan sebagai contoh dari apa yang bisa terjadi,
bukan sebagai pernyataan apa yang akan terjadi, ketika salah fungsional formulir didorong di
luar kisaran sampel di mana mereka diperkirakan. Jangan menyimpulkan dari diagram ini
bahwa fungsi nonlinear harus dihindari. Jika hubungan yang benar adalah nonlinier, maka
bentuk fungsional linier akan membuat kesalahan peramalan besar di luar sampel.
Sebaliknya, peneliti harus meluangkan waktu untuk memikirkan bagaimana persamaannya
akan bertindak untuk nilai-nilai baik di dalam maupun di luar sampel sebelum memilih
fungsional bentuk yang digunakan untuk memperkirakan persamaan. Jika secara teoritis tepat
Persamaan nonlinier tampaknya bekerja dengan baik di atas rentang yang relevan
nilai-nilai, maka itu harus digunakan tanpa mempedulikan masalah ini.

Ringkasan
1. Jangan menekan istilah konstan. Di sisi lain, jangan bergantung pada perkiraan istilah
konstan untuk penyimpulan bahkan jika tampaknya signifikan secara statistik.
2. Pemilihan bentuk fungsional harus didasarkan pada teori ekonomi yang mendasarinya
sejauh teori menyarankan bentuk yang serupa dengan yang diberikan oleh bentuk
fungsional tertentu. Suatu bentuk yang linear dalam variabel harus digunakan kecuali
hipotesis tertentu menunjukkan sebaliknya.
3. Bentuk fungsional yang tidak linier dalam variabel termasuk bentuk log ganda, bentuk
semilog, dan bentuk polinomial. Bentuk double-log sangat berguna jika elastisitas yang
terlibat diharapkan konstan. Bentuk semilog memiliki keuntungan yang memungkinkan
efek dari variabel independen terhadap ekor sebagai variabel itu meningkat. Bentuk
polinomial berguna jika lereng diharapkan untuk mengubah tanda, tergantung pada
tingkat variabel independen.
4. Sebuah model lereng (slope dummy) adalah variabel tiruan yang dikalikan dengan
variabel independen untuk memungkinkan kemiringan hubungan antara variabel
dependen dan variabel independen tertentu untuk berubah, tergantung pada apakah suatu
kondisi tertentu terpenuhi.
5. Penggunaan bentuk fungsional nonlinier memiliki sejumlah masalah potensial. Secara
khusus, R2 sulit untuk membandingkan jika Y telah ditransformasikan, dan residu
berpotensi besar jika bentuk fungsional yang salah digunakan untuk memperkirakan di
luar rentang sampel.

Latihan
(Jawaban untuk latihan bernomor genap ada di Lampiran A.)

1. Tuliskan arti dari masing-masing istilah berikut tanpa mengacu pada buku (atau catatan
Anda), dan bandingkan definisi Anda dengan versi dalam teks untuk masing-masing.

a. bentuk fungsional double-log (hal. 194)


b. elastisitas (hal. 194)
c. istilah interaksi (hal. 203)
d. intercept dummy (hal. 203)
e. lag (hal. 202)
f. linear dalam koefisien (hal. 193)
g. linear dalam variabel (hal. 192)
h. log (hal. 196)
i. log natural (hal. 196)
j. bentuk fungsional polinomial (hal. 199)
k. bentuk fungsional semilog (hal. 196)
l. slope dummy (hal. 204)

2. Untuk masing-masing pasangan dependen berikut (Y) dan independen (X) variabel, pilih
bentuk fungsional yang menurut Anda mungkin tepat, dan kemudian menjelaskan alasan
Anda (menganggap bahwa semua yang lain variabel independen yang relevan termasuk
dalam persamaan):

a. Y = penjualan sepatu
X = pendapatan sekali pakai
b. Y = kehadiran di simfoni luar ruangan Hollywood Bowl konser pada malam yang
diberikan
X = apakah konduktor orkestra paling terkenal dijadwalkan untuk melakukan malam
itu
c. Y = agregat konsumsi barang dan jasa di Amerika Serikat
X = pendapatan total agregat di Amerika Serikat
d. Y = jumlah uang beredar di Amerika Serikat
X = tingkat bunga pada Treasury Bills (dalam fungsi permintaan)
e. Y = biaya produksi rata-rata satu kotak pasta
X = jumlah kotak pasta yang diproduksi

3. Lihat persamaan berikut dan putuskan apakah keduanya linear dalam variabel, linear dalam
koefisien, keduanya, atau tidak:

a. Yi = β0 + β1X3i+ €i
b. Yi = β0 + β1ln Xi +€i
c. ln Yi = β0 + β1ln Xi +€i
d. Yi = β0 + β1Xiβ2 + €i
e. Y iβ 0 = β1 + β2Xi2 + €i

4. Pada tahun 2003, Ray Fair6 menganalisis hubungan antara harga saham dan penghindaran
risiko dengan melihat kinerja tahun 1996-2000 dari 65 perusahaan yang telah menjadi bagian
dari indeks terkenal Standard and Poor (S & P 500) sejak didirikan pada tahun 1957. Fair
terfokus pada P / E rasio (rasio harga saham perusahaan terhadap pendapatan per saham) dan
hubungannya dengan koefisien beta (ukuran suatu perusahaan keberisikoan — beta tinggi
menyiratkan risiko tinggi). Hipotesis bahwa harga saham akan menjadi fungsi positif dari
pertumbuhan laba dan dividen pertumbuhan, ia memperkirakan persamaan berikut:

LNPEi = 2,74 - 0,22BETAi + 0,83EARNi + 2,81DIVi

(0,11) (0,57) (0,84)

t = -1,99 1,44 3,33

N = 65 R2 = 0,232 2
= 0,194

di mana:

LNPEi = log rasio P / E median dari perusahaan engan dari tahun 1996 hingga 2000

BETAi = koefisien beta rata-rata dari perusahaan engan dari 1958 hingga 1994

EARNi = rata-rata persentase tingkat pertumbuhan pendapatan untuk perusahaan engan dari
tahun 1996 hingga 2000

DIVi = rata-rata persentase pertumbuhan dividen rata-rata untuk perusahaan engan dari tahun
1996 hingga 2000

6 Ray C. Adil, "Risiko Pembalikan dan Harga Saham," Paparan Yayasan Cowles Foundation 1382, Cowles Foundation: Universitas Yale, direvisi Februari 2003

© 2003. Sebagian besar artikel berada di luar cakupan teks ini, tetapi Fair dengan murah hati menyertakan data (termasuk data kepemilikan yang dihasilkannya)

yang diperlukan untuk mereplikasi hasil regresinya. Perhatikan bahwa koefisien beta tidak sama dengan? koefisien regresi yang digunakan dalam ekonometri.

a. Buat dan uji hipotesis yang tepat tentang koefisien kemiringan persamaan ini pada tingkat
5 persen.

b. Salah satu variabel ini tertinggal dan ini adalah persamaan cross-sectional

c. Jelaskan variabel mana yang tertinggal dan mengapa menurut Anda Fair tertinggal.

d. Apakah salah satu variabel Fair berpotensi tidak relevan? Yang mana? Menggunakan Stata,
EViews, atau program regresi Anda sendiri pada data di Tabel 7.2 untuk memperkirakan
persamaan Fair tanpa kemungkinan Anda

Tabel 7.2 Data untuk Contoh Harga Saham


COMPANY PE BETA EARN DIV
35 FPL Group 11.86 1.048 0.038 0.019
36 Pitney Bowes 16.11 1.064 0.049 0.086
37 Archer-Daniels-Midland 14.43 1.073 0.073 -0.011
38 Rockwell 9.42 1.075 0.062 0.020
39 Dow Chemical 15.25 1.081 0.042 0.026
40 General Electric 15.16 1.091 0.051 0.015
41 Abbott Laboratories 17.58 1.097 0.114 0.098
42 Merck & Co. 23.29 1.122 0.066 0.072
43 J C Penney 13.14 1.133 0.094 -0.003
44 Union Pacific Corp. 12.99 1.136 0.010 0.021
45 Schering-Plough 18.18 1.137 0.112 0.060
46 Pepsico 18.94 1.147 0.082 0.046
47 McGraw-Hill 16.93 1.150 0.051 0.052
48 Household International 8.36 1.184 0.019 0.008
49 Emerson Electric 17.52 1.196 0.047 0.044
50 General Motors 11.21 1.206 0.052 -0.023
51 Colgate-Palmolive 16.60 1.213 0.067 0.025
52 Eaton Corp. 10.64 1.216 0.137 0.001
53 Dana Corp. 10.26 1.222 0.069 -0.011
54 Sears Roebuck 12.41 1.256 0.030 -0.014
55 Corning Inc. 19.33 1.258 0.052 -0.013
56 General Dynamics 9.06 1.285 0.056 -0.023
57 Coca-Cola 21.68 1.290 0.085 0.055
58 Boeing 11.93 1.306 0.169 0.017
59 Ford 8.62 1.308 0.016 0.026
60 Peoples Energy 9.58 1.454 0.000 0.005
61 Goodyear 12.02 1.464 0.022 0.012
62 May Co. 11.32 1.525 0.050 0.006
63 ITT Industries 9.92 1.630 0.038 0.018
64 Raytheon 11.75 1.821 0.112 0.050
65 Cooper Industries 12.41 1.857 0.108 0.037
variabel yang tidak relevan dan kemudian menggunakan empat kriteria spesifikasi untuk
menententukan apakah variabel tersebut memang tidak relevan.

a. Formulir fungsional apa yang digunakan oleh Fair? Apakah formulir ini
tampaknya tepatatas dasar teori? (Petunjuk: Tinjauan literatur akan membantu
Anda menjawab pertanyaan ini, tetapi sebelum Anda memulai review,
pikirkan arti koefisien slope dalam bentuk fungsional ini.)
b. (opsional) Misalkan literature yang Anda review membuat Anda khawatir
bahwa Fair seharusnya menggunakan bentuk fungsional double-log untuk
persamaannya. Gunakan data pada Tabel 7.2 untuk memperkirakan bentuk
fungsional pada data Fair. Apa hasil perkiraan Anda? Apakah itu hasilnya
mendukung soal Anda? Jelaskan

5. Dalam upaya untuk menjelaskan perbedaan upah regional, Anda mengumpulkan data
upah dari 7.338 pekerja tidak terampil, membagi negara menjadi empat wilayah (Timur
Laut, Selatan, Barat Tengah, dan Barat), dan perkirakan persamaan berikut (kesalahan
standar dalam tanda kurung):
YN i = 4.78 - 0.038Ei - 0.041Si - 0.048Wi

(0.019) (0.010) (0.012)

R2 = .49 N = 7,338

Dimana: Yi = Gaji bulananan (dalam dollar) dari pekereja tidak terampil ke - i

Ei = sebuah variable dummy yang sama dengan 1 jika pekerja ke-i tinggal di Timur
Laut, 0 jika tidak

Si = = sebuah variable dummy yang sama dengan 1 jika pekerja ke-i tinggal di
Selatan, 0 jika tidak

Wi = = sebuah variable dummy yang sama dengan 1 jika pekerja ke-i tinggal di Barat,
0 jika tidak

a) Apa kondisi yang dihilangkan dalam persamaan ini?


b) Jika Anda menambahkan variabel dummy dengan kondisi yang dihilangkan ke
persamaan tanpa menghilangkan Ei, Si, atau Wi, apa yang akan terjadi?
c) Jika Anda menambahkan variabel dummy untuk kondisi yang dihilangkan ke
persamaan dan menghilangkan Ei, apa yang akan menjadi tanda untuk estimasi
koefisien variabel baru itu?
d) Manakah dari tiga pernyataan berikut yang paling benar? Paling tidak benar?
Jelaskan jawaban Anda.
i) Persamaan menjelaskan 49 persen dari variasi Y di sekitar mean dengan
variabel regional saja, jadi seharusnya ada sedikit variasi upah berdasarkan
wilayah.
ii) Koefisien dari variabel regional adalah sama, jadi seharusnya tidak banyak
variasi upah berdasarkan wilayah.
iii) Koefisien dari variabel regional cukup kecil dibandingkan dengan upah rata-
rata, jadi seharusnya tidak banyak variasi upah menurut wilayah.
6. Sarankan formulir fungsional yang sesuai untuk hubungan antara variabel berikut.
Pastikan untuk menjelaskan alasannya:
a. Usia rumah ke-i dalam persamaan cross-sectional untuk harga jual rumah di
Cooperstown, New York. (Petunjuk: Cooperstown dikenal sebagai kota yang
indah dengan sejumlah rumah bersejarah yang elegan.)
b. Harga gas alam di tahun t disisi permintaan dalam persamaan deret-waktu (time-
series) untuk konsumsi gas alam di Amerika Serikat.
c. Pendapatan dari individu ke-i dalam persamaan cross-sectional untuk jumlah
pakaian yang dimiliki oleh individu.
d. Variabel dummy untuk menjadi siswa (1 = ya) dalam persamaan yang ditentukan
pada bagian c.
7. V. N. Murti dan V. K. Sastri7 menyelidiki karakteristik produksi berbagai industri India,
termasuk kapas dan gula. Mereka menetapkan fungsi produksi Cobb – Douglas untuk
output (Q) sebagai fungsi log-ganda untuk pekerja (L) dan modal (K):

lnQi = β0 + β1lnLi + β2lnKi + ei

dan memperoleh perkiraan berikut (kesalahan standar dalam tanda kurung):

a. Apa saja elastisitas output sehubungan dengan tenaga kerja dan modal untuk
setiap industri?
b. Signifikansi ekonomi apa yang dipengaruhi oleh jumlah (β N1 + β N2) ?
c. Murti dan Sastri mengharapkan koefisien kemiringan positif. Uji hipotesis
mereka pada tingkat signifikansi 5 persen. (Petunjuk: Ini jauh lebih sulit dari
yang terlihat!)
8. Richard Fowles dan Peter Loeb mempelajari efek interaktif dari minum dan ketinggian
pada kematian lalu lintas. Para penulis berhipotesis bahwa kematian mengemudi dalam
keadaan mabuk lebih mungkin pada ketinggian tinggi daripada di ketinggian rendah
karena peningkatan yang lebih tinggi mengurangi asupan oksigen otak, meningkatkan
dampak dari jumlah alkohol yang diberikan. Untuk menguji hipotesis ini, mereka
menggunakan variabel interaksi antara ketinggian dan konsumsi bir. Mereka
memperkirakan model cross-sectional (oleh negara bagian untuk Amerika Serikat)
berikut tingkat kematian kendaraan bermotor (Catatan: skor-t dalam tanda kurung):

Di mana:

Fi = kematian lalu lintas per mil untuk kendaraan bermotor yang digerakkan dalam
keadaan i.

Bi = konsumsi bir per kapita (minuman malt) di negara i.


Si = kecepatan mengemudi rata-rata dijalan raya dalam keadaan i
Di = variabel dummy sama dengan 1 jika keadaan-i memiliki program inspeksi
keselamatan kendaraan, 0 jika tidak.

Ai = rata-rata ketinggian wilayah metropolitan dalam keadaan –I (dalam ribuan).

a. Hati-hati nyatakan dan uji hipotesis yang tepat tentang koefisien B, S, dan D
pada tingkat 5-persen. Apakah hasil ini memberikan indikasi masalah
ekonometrik dalam persamaan? Jelaskan.
b. Pikirkan melalui variabel interaksi. Apa itu mengukur? Sebutkan arti koefisien
B * A.
c. Buat dan uji hipotesis yang tepat tentang koefisien variabel interaksi pada
tingkat 5 persen.
d. Perhatikan bahwa Ai termasuk dalam persamaan dalam variabel interaksi tetapi
bukan sebagai variabel independen independen. Jika sebuah persamaan
mencakup variabel interaksi, haruskah kedua komponen interaksi interaksi
tersebut menjadi variabel independen dalam persamaan sebagai hal yang biasa?
Mengapa iya atau mengapa tidak? (Petunjuk: Ingat bahwa dengan slope
dummy, kami menekankan bahwa baik intercept dummy dan variabel slope
dummy harus dalam persamaan.)
e. Ketika penulis memasukkan Ai dalam model mereka, hasilnya seperti pada
Persamaan 7.23 (dengan skor-t sekali lagi dalam kurung). Persamaan apa yang
Anda lebih pilih? Jelaskan.
7.7 Lampiran: Ekonometrika Lab#4

Pada laboratorium ini terdapat latihan spesifikasi yaitu: memilih variabel dan bentuk
fungsional. Ini juga akan memberikan anda pengalaman dalam mengubah variabel dan
melakukan tes hipotesis bersama di perguruan tinggi atau program perangkat lunak
ekonometrik pada komputer anda. Variabel yang akan kita pelajari adalah harga traktor
pertanian yang di jual di Amerika Serikat.

Langkah 1: Tinjauan Literatur

Karena anda mungkin bukan ahli dalam harga pada traktor, mari mulai dengan tinjauan
singkat pada literatur ini. Ini adalah model harga traktor yang digunakan sebagai fungsi dari
atribut traktor dan waktu penjualan, jadi ini adalah salah satu contoh lain dari model hedonis.
Untuk lebih lanjut tentang model hedonis, lihat pada halaman 358.

Percaya atau tidak, telah ada sejumlah penelitian ekonometrik tentang harga traktor. Yang
paling signifikan, pada tahun 2008 Diekmann dkk. mempelajari harga traktor bekas yang
menggunakan bentuk fungsional semi kayu dan menemukan bahwa kunci dari variabel
independen utama termasuk dari membuat, daya kuda, umur, waktu penggunaan, tanggal
penjualan, penggerak (penggerak roda empat atau penggerak roda dua), transmisi otomatis,
dan bahan bakar (diesel atau gas). Ini memberikan titik awal yang berguna.

9. Florian Diekmann, Brian E. Roe, dan Marvin T. Batte, “Traktor di eBay: Perbedaan antara Internet
dan Lelang Langsung. ” Ekonomi Pertanian pada Jurnal Amerika, Vol. 90, No. 2, hal. 306–320. Lihat
juga Gregory Perry, Ahmet Bayaner, dan Clair J. Nixon, “Pengaruh dari Penggunaan dan Ukuran pada
Penyusutan Traktor” Ekonomi Pertanian pada Jurnal Amerika, Vol. 72, No. 2, pp. 317–325

Tabel 7.3 Definisi Variabel untuk Model Harga Traktor yang Digunakan
Variabel Deskripsi Analisis Tanda
pada Koefisien

Y i = Harga Jual Harga traktor i dalam dollar n/a

Spesifikasi Traktor:

tenaga kuda i Traktor i tenaga kuda +

usia i Jumlah tahun sejak traktor i diproduksi _

waktu i Jumlah waktu yang digunakan traktor i _


diesel i Variabel dummy = 1 Jika traktor i dijalankan +
pada traktor bensin, jika tidak 0

fwd i Variabel dummy = 1 jika traktor memiliki +


roda empat, jika tidak 0

Manual Variabel dummy = 1 jika traktor tranmisi _


manual, jika tidak 0

johndeere i Variabel dummy = 1 jika traktor diproduksi +


oleh John deere, jika tidak 0

kabin i Variabel dummy = 1 jika traktor dikelilingi +


kabin, jika tidak 0

Musim per tahun:

Musim semi i Variabel dummy = 1 Jika traktor habis ?


terjual pada bulan April atau Mei, jika tidak
0

Musim panas i Variabel dummy =1 Jika traktor habis terjual ?


pada bulan Juni-September, jika tidak 0

Musim dingin i Variabel = 1 Jika traktor habis terjual pada ?


bulan Desember-Maret, jika tidak 0

Langkah 2: Perkiraan Model Dasar

Seperti model dasar yang kita gunakan, mari kita perkirakan variasi model Diekmann
menggunakan kumpulan data yang lebih baru. Tabel 7.3 berisi definisi variabel yang kita
butuhkan untuk meniru regresi Diekmann. Variabel dependen adalah harga yang digunakan
pada traktor pertanian yang telah terjual dan di lelang di Amerika Serikat antara 1 Juni 2011
dan 31 Mei 2012. Tersedia data di situs web dalam kumpulan data TRAKTOR7. Tabel 7.3
juga memiliki dugaan hipotesis dari koefisien masing-masing variabel, berikut adalah hal
yang mendasari teori tesebut. Yaitu:
a. Memperkirakan persamaan harga jual dari kayu asli (harga jual i) sebagai variabel
dependen dan semua variabel lain dalam Tabel 7.3 sebagai variabel independen. (Petunjuk:
Jangan lupa untuk membuat harga yang tidak terjual sebelum anda menjalankan regresi, dan
pastikan untuk tidak menyertakan variabel apa pun yang tidak terdapat pada Tabel 7.3.)
b. Lihatlah hasil regresi Anda. Apa itu R 2? Apakah ini terlihat masuk akal? Jelaskan hasil
pemikiran Anda.
c. Apakah salah satu koefisien yang telah anda perkirakan memiliki tanda-tanda yang tidak
terduga? Jika ya, yang mana?
d. Jalankan uji t 5-persen satu sisi pada semua koefisien variabel independen anda kecuali
untuk keadaan musiman. Untuk koefisien yang mana anda dapat menolak hipotesis nol?
e. Tafsirkan dengan hati-hati koefisien johndeere. Apa artinya dalam istilah dunia nyata?
f. Apa masalah ekonometrik (jika ada) yang terdapat dalam model dasar tersebut?

Langkah 3: Pertimbangkan Formulir Fungsional Polinomial untuk Daya Kuda


Misalkan Anda menunjukkan hasil model dasar anda ke penjual traktor bekas yang kebetulan
mengambil ekonometrika saat di perguruan tinggi. Dia mengatakan bahwa hasil anda
menjanjikan, tetapi ia merasa sangat sulit untuk menjual traktor bekas yang bertenaga karena
traktor ini membuang bahan bakar dan tidak memberikan manfaat tambahan kepada pembeli.
Dia berpikir bahwa pembeli traktor baru sering melebih-lebihkan seberapa besar kekuatan
yang mereka perlukan dan itu sering digunakan oleh para pembeli traktor untuk tidak sering
membuat kesalahan. Oleh karena itu, ia menyarankan bahwa itu terjadi mungkin karena
meningkatnya tenaga kuda, harga yang meningkat, setidaknya hingga satu titik, tetapi di luar
titik itu, peningkatan lebih lanjut pada tenaga kuda mulai memiliki efek negatif pada harga.
Anda memutuskan untuk mengambil saran tersebut dan mempertimbangkan untuk mengubah
bentuk fungsional tenaga kuda menjadi polinomial.
a. Buatlah variabel baru dan jalankan regresi baru. (Petunjuk: Apakah anda ingat tanda untuk
berhipotesis pada koefisien tenaga kuda dan kuadratnya sebelum Anda menjalankan regresi?)
b. Jalankan 5-persen t-tes satu sisi pada hipotesis anda untuk koefisien dari tenaga kuda dan
kuadratnya.
c. Pada tenaga kuda (ke angka bulat terdekat) apakah nilai traktor mencapai perbedaan yang
besar (hal lain dianggap sama)? Apakah perbedaan minimum atau maksimum?
d. Persamaan apa yang lebih anda sukai antara persamaan dasar dan persamaan polinomial?
Mengapa? (Pastikan untuk menyebutkan bukti untuk mendukung pilihan anda.)

Langkah 4: Tambahkan Potensi Variabel yang Dihilangkan pada іLangkah 3 Model


Anda
Ketika anda meninggalkan banyak traktor yang digunakan, anda kebetulan memperhatikan
bahwa beberapa traktor memiliki kabin yang tertutup. Karena kabin yang seperti itu akan
berguna dalam cuaca buruk, anda tiba-tiba merasa bahwa Anda mungkin memiliki variabel
yang telah dihilangkan! Untuk menguji ini, Anda menemukan data untuk kabin (untungnya
juga di TRACTOR7). Sekarang:
a. Tambahkan kabin ke model yang Anda sukai pada Langkah ke 3, bagian d, dan perkiraan
lagi persamaan nya.
b. Gunakan empat kriteria spesifikasi kami untuk memutuskan apakah kabin termasuk dalam
persamaan. (Petunjuk: Tuliskan jawaban spesifik untuk semua empat kriteria dan kemudian
berikan kesimpulan Anda.)

Langkah 5: Pengujian Hipotesis Bersama


Kembali ke model dasar pada Langkah ke 2, dan uji pada tingkat 5 persen hipotesis bersama
bahwa waktu tahun penjualan tidak berpengaruh pada harga traktor:
a. Apakah kondisi yang dihilangkan dalam model musiman ini? Hal apa yang tidak biasa ?
b. Tuliskan dengan hati-hati hipotesis nol dan alternatif nya.
c. Perkirakan persamaan yang menjadi kendala anda.
d. Jalankan F-test yang sesuai pada level 5 persen. Hitung F dan cari nilai F yang sesuai.
e. Apa kesimpulanmu? Apakah harga traktor yang digunakan memiliki pola musiman?

(Opsional) Langkah 6: Pertimbangkan Dummy Lereng yang Menggabungkan


Penggunaan Diesel

Sudah diketahui bahwa mesin diesel cenderung lebih tahan lama daripada mesin bensin.
Fakta itu menimbulkan pertanyaan apakah tambahan jam mempengaruhi nilai penggunaan
pada traktor diesel dan traktor bensin. Hasilkan variabel yang Anda perlukan untuk menguji
hipotesis ini, tambahkan variabel ini ke model dasar pada Langkah ke 2, perkirakan revisi
pada model dummy lereng, dan uji hipotesis dummy lereng yang sesuai pada tingkat 5
persen. Berapa nilai t anda? Bisakah Anda menolak hipotesis nol?

You might also like