You are on page 1of 21

EKONOMETRI: SUATU PENGANTAR & REGRESI SEDERHANA:KERANGKA DASAR

Arief yulianto 1.1 Pengantar “What is econometrics?” Sederhananya, “ekonometrik” diartikan sebagai “ukuran ekonomi” atau economic

measurement. Ekonometri memiliki cakupan yang sangat luas, seperti: bisnis, ekonomi,
sosial dan sebagainya. Sebagai contoh adalah penggunaan ekonometri untuk analisis dampak promosi terhadap penjualan, dampak kenaikan harga BBM terhadap permintaan BBM, dampak kenaikan SPP terhadap permintaan sekolah, dampak kenaikan jasa transportasi terhadap penawaran jasa transportasi, dampak kenaikan tarif dasar listrik (TDL) terhadap permintaan listrik dan sebagainya.

Disisi lain, apabila ekonometri dilihat dari perspektif teoritis, beragam pendapat para ahli tentang konteks ekonometri itu sendiri. Kesemuanya menunjukkan bahwa ekonoemtri memiliki cakupan pembahasan yang luas.

“Econometrics, the result of a certain outlook on the role of economics, consits of the apllication of
mathematical statistics to economic data to lendempirical support to the models constructed by mathematical economics and to obtain numerical results.1

....econometrics may be defined as the quantitative analysis of actual economic phenomena based on concurrent development of the theory and observation, related by appropriate methods of inference.2

“Econometrics is concerned with the empirical determination of economic laws.3

Sumber: Gujarati, 2003, hlm.1

Sekarang ini, ekonometri merupakan suatu metode yang lazim digunakan untuk keperluan peramalan. Dalam konteks permasalahan sebagai
1

ekonomi, ekonometri bisa diterjemahkan solusi berbagai masalah ekonomi.

art

of

science

dalam

menawarkan

Gerhard Tintner, Methodology of Mathematical Economics and Econometrics, The University of Chicago Press, Chicago, 1968, p.74. 2 P.A Samuelson, T.C Koopmans, and J.R.N. Stone, “Report of the Evaluative Committee for Econometrica,” Econometrica, vol.22, no.2, April 1954, pp. 141-146. 3 H. Theil, Principles of Econometrics, John Wiley & Sons, New York, 1971, p.1.

1

Sederhananya, ekonometri berusaha menterjemahkan suatu masalah dari aspek ekonomi, matematik ekonomi dan statistik ekonomi secara komprehensif. Ketiga bidang ilmu itu merupakan pondasi dalam penerapan ekonometri.

Dalam ekonometri, permasalahan dipetakan berdasarkan teori (ekonomi) yang ada, dinyatakan dengan persamaan matematik dan digunakan kriteria statistik untuk menganalisis permasalahan yang ada. Sebagai contoh adalah harga minyak mentah dan permintaan minyak mentah. Berdasarkan teori ekonomi, dengan asumsi barang normal, harga berbanding terbalik dengan permintaan dan berbanding lurus dengan penawaran. Artinya, berdasarkan hukum permintaan, jika harga minyak mentah naik, maka permintaan minyak mentah akan mengalami penurunan. Sebaliknya, jika harga minyak mentah turun, maka permintaan akan minyak mentah mengalami kenaikan. Sedangkan berdasarkan hukum penawaran, jika harga minyak mentah naik maka penawaran minyak mentah akan mengalami kenaikan, dan sebaliknya jika terjadi penurunan harga. Akan tetapi, teori ekonomi tidak menjelaskan lebih lanjut berapa besar dampak kenaikan harga terhadap perubahan permintaan. Di sini, ekonometri berperan dalam memberikan ukuran atas besarnya perubahan permintaan sebagai akibat dari perubahan harga.

Berkaitan dengan ekonometri, peran matematika ekonomi adalah menyatakan teori ekonomi dalam bentuk matematika atau persamaan matematika. Tujuannya adalah untuk penyederhaan masalah. Seperti dibahas sebelumnya, ekonometri berusaha melakukan

verifikasi empiris atas teori ekonomi yang berlaku. Dan hal ini akan lebih mudah apabila permasalahan ekonomi dinyatakan dalam bentuk matematik.

Fokus dari statistik ekonomi adalah berkaitan dengan pengumpulan data, pengolahan data, dan analisis data. Data bisa dinyatakan dalam grafik, diagram ataupun tabel. Jadi dari aspek statistik, data merupakan “bahan mentah” yang harus diolah lebih lanjut dalam ekonometri. Data yang berasal dari berbagai publikasi baik swasta atau pemerintah bersifat given. Artinya, data mentah itu diluar kontrol econometrician apabila data mengandung kesalahan pengukuran, dan berbagai kesalahan lainnya. Oleh karena itu,

econometrician mengembangkan metode untuk mengatasi berbagai masalah berkaitan
dengan kesalahan pengukuran.

2

1.2

Metodologi Ekonometri

Yang menjadi pertanyaan lebih lanjut adalah bagaimana prosedur baku ekonometrik bisa digunakan untuk menganalisis permasalahan ekonomi. Atau dengan kata lain, bagaimana “metodologi” ekonometri. Berangkat dari teori ekonomi, menyatakan masalah secara matematis dan penggunaan data mentah sampai pada analisis masalah, adalah prosedur baku yang digunakan dalam ekonometri. Metodologi yang digunakan dalam ekonometrik adalah sebagai berikut : 1. Pernyataan teori atau pembuatan hipotesa berdasarkan teori

2. Menyatakan teori dalam persamaan atau model matematik 3. Melakukan spesifikasi statistik atas model yang sudah dibuat 4. Pengumpulan data yang dibutuhkan 5. Melakukan estimasi parameter dari model ekonometri yang sudah ditentukan 6. Pengujian hipotesa yang diturunkan dari model 7. Membuat peramalan berdasarkan data yang tersedia 8. Penggunaan model sebagai referensi kebijakan

Untuk memudahkan penterjemahan metodologi di atas, dibuat contoh yang sangat sederhana sebagai berikut.

Contoh 1 Akbar adalah manajer penjualan ayam goreng “Selalu Renyah” di kota Depok. Dia harus menyiapkan strategi yang tepat untuk mempertahankan tingkat penjualan tahun ini. Berdasarkan data jumlah biaya promosi dan besarnya penjualan ayam goreng, dilihat ada hubungan positif antara promosi dan penjualan. Dia merencanakan promosi besar-besaran dengan memasang spanduk di seluruh sudut kota Depak. Untuk meyakinkan atasannya, dia membuat analisis ekonometri antara promosi dan penjualan sebagai berikut. 1. Pernyataan berdasarkan teori Berdasarkan teori pemasaran dapat dinyatakan bahwa promosi berbanding positif terhadap penjualan. Artinya, semakin besar biaya promosi, mengalami peningkatan. penjualan akan

2. Spesifikasi Model Matematik

3

Hubungan antara penjualan (y) dan promosi (x) bisa dinyatakan sebagai hubungan linier ataupun non-linier. Untuk persamaan linier, hubungan x dan y dapat dinyatakan dengan

y = β1 + β 2 x
(1)

.......

Variabel bebas (x) dinyatakan di sebelah kanan persamaan dan variabel tidak bebas atau dependent variable (y) dinyatakan di sebelah kiri persamaan.

β 1 dan

β 2 disebut sebagai parameter. β 1 disebut dengan intersep ketika nilai x sama
dengan nol.

β 2 juga disebut dengan slope. Slope menyatakan berapa besar

perubahan tingkat penjualan jika promosi berubah sebesar satu satuan. Untuk penjualan yang dinyatakan dengan unit dan promosi dengan Rp juta, maka slope dapat diartikan dengan berapa unit perubahan penjualan jika promosi

ditingkatkan sebesar Rp 1 juta.

Secara grafis, hubungan yang linier dan non linier dari penjualan dan promosi ayam goreng dapat ditunjukkan sebagai berikut:

a.Fungsi Linier y

b. Fungsi Non-Linier y

penjualan 1 1

penjualan

x promosi promosi

x

Yang menjadi topik bahasan utama adalah bagaimana econometrician merumuskan fungsi model yang tepat untuk menyatakan permasalahan yang ada. Dan ini akan dibahas lebih lanjut pada topik pemilihan model dan analisisnya.

4

3. Spesifikasi statistik atau ekonometrika Dalam model matematik, pada umumnya hubungan antar variabel (misal: penjualan dan promosi) dinyatakan sebagai hubungan yang “eksak” atau “deterministik”. Padahal dalam kondisi riil, banyak sekali hubungan antar variabel yang tidak dapat dinyatakan secara eksak. Untuk melihat hal ini, dapat dibuat scatter diagram. Dari scatter diagram dapat dilihat pola persebaran data. Sebagai contoh, dapat dilihat bagaimana persebaran data antara set data penjualan dan promosi pada periode tahun 1991-2004. Tabel 1 Data Penjualan dan Promosi Tahun 1991-2004
Tahun Tahun 1991 Tahun 1992 Tahun 1993 Tahun 1994 Tahun 1995 Tahun 1996 Tahun 1997 Tahun 1998 Tahun 1999 Tahun 2000 Tahun 2001 Tahun 2002 Tahun 2003 Tahun 2004 Promosi (Rp juta) 100 150 170 200 250 300 350 380 340 400 420 450 450 450 Penjualan (juta unit) 10 15 18 20 25 30 35 38 36 42 43 46 46 46

Scatter Diagram Antara Penjualan dan Promosi
Hubungan Penjualan dan Promosi
Penjualan 60 40 20 0 0 200 400 600 Promosi

Series1

Berdasarkan persebaran data tersebut, hubungan antara penjualan dan promosi bisa dikatakan linier tetapi tidak exact linier karena ada beberapa data yang tidak tepat di dalam garis. Untuk membuat sebuah garis hanya dibutuhkan dua titik. Dan ternyata tidak semua titik berada pada garis tersebut.

5

Dalam konteks hubungan penjualan dan promosi, yang perlu diingat adalah promosi bukanlah satu-satunya variabel yang mempengaruhi penjualan meskipun promosi cukup dominan dalam mempengaruhi penjualan. Oleh karena itu, untuk

mengakomodir variabel lain sebenarnya cukup mempengaruhi penjualan akan tetapi tidak dinyatakan secara eksplisit dalam model digunakan variabel u. Sehingga hubungan antara penjualan dan promosi dapat dinyatakan dengan

y = β1 + β 2 x + u
(2)

.......

Dimana u disebut dengan random error term atau lebih sering disebut dengan

error term. Error inilah yang membedakan antara ekonometrik dengan
persamaan matematik pada umumnya. Persamaan (1.2) di atas disebut sebagai persamaan ekonometrik atau model regresi linier.

4. Pengumpulan Data Salah satu hal penting dalam prosedur ekonometrik adalah pengumpulan data.

Econometrician harus menentukan data yang tepat berdasarkan model yang sudah
ditentukan, bagaimana karakteristik data yang dipilih sesuai dengan kebutuhan analisis yang akan dibuat. Ada beberapa jenis data yang lazim digunakan untuk analisis empiris, yaitu: •

Time Series Time Series adalah data dari suatu variabel yang dikumpulkan
berdasarkan periode waktu. Seperti, data jumlah uang yang beredar, tingkat suku bunga, jumlah pengangguran, jumlah angkatan kerja dan sebagainya.

Cross-Section Cross-Section adalah data dari satu atau lebih variabel yang dikumpulkan
pada titik waktu tertentu. Seperti, data tingkat penjualan dan promosi mobil “Atoz” pada tahun 2004 di lima dealer di Jakarta.

Pooled Pooled merupakan gabungan antara time series dan cross-section.
Seperti, data tingkat penjualan dan promosi mobil “Atoz” pada tahun 2000-2004 di lima dealer di Jakarta.

6

5. Estimasi Parameter Dengan menggunakan set data penjualan dan promosi, dapat dilakukan estimasi parameter

β1 dan β 2 . Hubungan antara penjualan dan promosi dapat dinyatakan
y = -0.321 + 0.103* x

sebagai berikut:

Dari persamaan tersebut diketahui parameter

β1 = −0.321 dan β 2 = 0.103 .

Artinya, penjualan akan negatif atau ayam tidak terjual apabila perusahaan tidak melakukan promosi. Sedangkan bila perusahaan melakukan promosi sebesar satu satuan, maka perubahan penjualan akan sebesar 0.103.

6. Pengujian Hipotesa Berdasarkan hasil pengolahan data empiris di atas, econometrician ingin meng-

confirm antara hasil empiris dengan teori ekonomi yang berlaku, bagaimana peran
promosi terhadap penjualan. Bagaimana dengan intersep yang negatif? Bagaimana dengan nilai koefisien promosi yang nilainya ternyata sangat kecil? Bagaimana relevansi hasil pengujian dengan teori yang berlaku? Kesemuanya itu harus dipikirkan oleh econometrician untuk menghasilkan analisis yang tepat.

7. Peramalan Dalam konteks peramalan, econometrician dapat memprediksi besarnya penjualan dengan memasukkan berbagai skenario alokasi promosi. Sehingga dapat dibuat estimasi hasil penjualan berdasarkan skenario promosi yang dibuat.

1.3 Model Regresi Linier Sederhana (Ordinary Least Square): Kerangka Dasar Model regresi linier sederhana melihat hubungan antara dua variabel. Salah satu variabel menjadi variabel independen dan yang lain menjadi variabel dependen. Hubungan antara dua variabel tersebut dapat dilihat secara visual melalui plot dari pasangan data untuk variabel yang diteliti atau sering dikenal dengan scatterplot. Biasanya pasangan data tersebut tidak selalu tepat sama (exactly) dengan garis lurus yang menunjukkan

hubungan antara promosi dan penjualan. Persebaran data di seputar garis lurus tersebut

7

lebih mencerminkan kecenderungan lemah atau kuatnya hubungan antara promosi dan penjualan. Garis lurus mencerminkan hubungan antara dua variabel secara rata-rata.

Gambar 1 Berbagai Variasi Plot Data
0

0

Y

0

0 0

Y

Y

X

X

X

Y

Y

X

X

Y

X

Ketika pemetaan masalah sudah dilakukan (hubungan antara promosi dan penjualan), selanjutnya perlu dibangun model yang menyatakan hubungan tersebut. Dalam hal ini adalah model regresi sederhana. Komponen pembentukan model mencakup: (i) Data Data dibutuhkan untuk melihat persebaran dari pasangan dua variabel terhadap garis lurus.

(ii)

Model Statistik Model Statistik dibutuhkan karena hubungan antara promosi dan penjualan tidak selalu tepat sama pada garis lurus, atau persebaran data lebih menunjukkan kuat atau lemahnya hubungan antara dua variabel. Sehingga model statistik sangat berguna untuk menganalisis jenis hubungan tersebut.

(iii)

Komponen sistematik dan random error. Model Statistik memisahkan dari komponen sistematik dari komponen random

Dalam hal ini, perlu diketahui perbedaan komponen sistematik pada ANOVA dan regresi. Pada ANOVA, komponen sistematik adalah variasi rata-rata antara sampel atau

tratment, dan komponen random adalah variasi yang tidak bisa dijelaskan. Sedangkan
pada regresi, komponen sistematik adalah keseluruhan hubungan linier dan komponen random adlaah variasi diseputar garis lurus.

8

Sebagai contoh dari model regresi sederhana adalah hubungan antara promosi dan tingkat penjualan. Variabel promosi diperlakukan sebagai variabel independen dan diplot pada sumbu x. Sedangkan variabel penjualan diperlakukan sebagai variabel dependen dan diletakkan pada sumbu y. Pada umumnya penentuan status suatu variabel, apakah sebagai variabel dependen atau independen tergantung dari teori yang berlaku. Untuk kasus dua variabel di atas, berdasarkan teori pemasaran dapat diketahui bahwa promosi mempengaruhi penjualan. Variabel yang menentukan/mempengaruhi tersebut dijadikan variabel independen, sedangkan variabel yang ditentukan/dipengaruhi dijadikan variabel dependen.

Untuk kasus regresi sederhana, yang dilihat adalah hubungan antara dua variabel. Sedangkan untuk lebih dari dua variabel, dikenal dengan istilah regresi berganda.

Berikut ini adalah Model Regresi Linier Sederhana dari populasi.

Y=

β0

+ β1 X

+

ε
Random komponen

Non-random Atau komponen sistematik

Variabel y menunjukkan variabel dependen (variabel yang ingin diprediksi), variabel x adalah variabel yang digunakan untuk memprediksi atau dikenal juga dengan variabel independen atau variabel prediksi, ε adalah error term, satu-satunya komponen random dalam model dan selanjutnya merupakan sumber kerandoman dalam y.

β0 adalah intersep dari komponen sistematik dalam hubungan regresi dan β1 adalah slope dari komponen sistematik. Rata-rata (conditional mean) y dapat dihitung dengan rumus berikut:

E [Y X ] = β 0 + β1 X

9

Gambar 2 Model Regresi Linier Sederhana
Y

Regression Plot

E[Y]=β + β X 0 1 Yi

Error: εi

{
Xi

}

β1 = Slope

} }
1

β0 = Intercept

X

Model Regresi Linier Sederhana menunjukkan hubungan yang tepat sama (exact) antara nilai rata-rata variabel dependen dan independen. Atau dapat dirumuskan:

E[Yi] = β0 + β1 Xi
Perbedaan antara nilai riil dan nilai ekspektasi dari y dijelaskan dalam random error. Secara matematis dirumuskan sebagai berikut:

Yi = E[Yi] + εi = β0 + β1 Xi + εi
Model Regresi Linier Sederhana memiliki beberapa asumsi dasar yang harus dipenuhi untuk menghasilkan estimasi yang baik atau dikenal dengan BLUE ( Best Linier Unbiased

Estimator). Asumsi-asumsi dasar tersebut mencakup homoskedastik, no-multicollinearity
dan no-autocorrelation.

Selanjutnya, yang perlu diketahui adalah, dalam konteks pendugaan koefisien regresi sampel, secara umum, metode OLS sudah diterima sebagai suatu kriteria yang baik. Tidak dibutuhkan asumsi-asumsi lebih lanjut. Akan tetapi, dalam konteks inferensi regresi, yaitu dalam pembuatan pendugaan interval dan pengujian parameter regresi populasi, dibutuhkan asumsi-asumsi berikut: 1. Model regresi adalah linier dalam parameter.

2. Variabel bebas memiliki nilai yang tetap untuk sampel yang berulang (bersifat
nonstokastik). Implikasinya, variabel bebas tidak berhubungan dengan error

term. Atau kovarian antara variabel bebas dan error term dinyatakan dengan

10

(u i , X i ) =∈ [ X i − ∈ ( X i )][u i − ∈ (u i )] = 0 3. Berkaitan dengan error term, ada beberapa persyaratan sebagai berikut:
a. Error term memiliki rata-rata sama dengan nol dan varian konstan
(homoscedasticity) untuk setiap nilai Xi. Sehingga dapat dinyatakan

∈ (u i X i ) = 0 dan Var (u i X i ) = σ 2 b. Error term pada suatu observasi tidak berhubungan dengan error
term pada observasi lain (no-autocorrelation).

c. Error term (u) memiliki distribusi normal. Implikasinya, Y dan
distribusi sampling koefisien regresi memiliki distribusi normal.

Gambar 3 Error yang bersifat Homoskedastik
Y

Assumptions of the Simple Linear Regression Model

E[Y]=β0 + β1 X

Identical normal distributions of errors, all centered on the regression line.

X

Hasil estimasi OLS sering disebut dengan istilah BLUE (Best Linier Unbiased

Estimator). Sederhananya, hasil estimasi yang bersifat BLUE adalah:
1. Efisien, artinya hasil nilai estimasi memiliki varian yang minimum dan tidak bias. 2. Tidak bias, artinya hasil nilai estimasi sesuai dengan nilai parameter. 3. Konsisten, artinya jika ukuran sampel ditambah tanpa batas maka hasil nilai estimasi akan mendekati parameter populasi yang sebenarnya.

11

Apabila asumsi normalitas terpenuhi (syarat 3c) dimana error terdistribusi secara normal dengan rata-rata sama dengan nol dan standar deviasi konstan atau singkatnya dinyatakan dengan

u ~ N (0, σ 2 ) , maka

2 4. Intersep (a) akan memiliki distribusi normal atau a ~ N ( A, σ a ) . 2 5. Koefisien regresi akan memiliki distribusi normal atau b ~ N ( B, σ b ) .

Dalam hal ini, asumsi normalitas sangat penting untuk penyederhanaan dalam melakukan pendugaan interval dan pengujian hipotesis secara statistik.

Estimasi dari model regresi sederhana bertujuan untuk mendapatkan nilai intersep dan slope dari garis regresi linier. Secara matematis dinyatakan:

Y=b0 + b1X + e
Keterangan:

b0 adalah estimasi untuk intersep garis regresi populasi, atau dinotasikan dengan β0 b1 adalah estimasi slope garis regresi populasi, atau dinotasikan dengan β1 e adalah observed errors – residu antara garis regresi populasi b0 + b1X dengan titiktitik observasi.

Estimasi garis regresi:

ˆ Y = b0 + b1 X ˆ Y menunjukkan nilai Y yang terletak pada “fitted” regression line untuk berbagai nilai X.
Y

Gambar 4 Fitting a Regression Line

Y

Data Three errors from the least squares regression line X
e

X Y

Three errors from a fitted line
X

Errors from the least 12 squares regression line are minimized
X

Metode estimasi yang sering digunakan untuk mengestimasi fungsi regresi populasi dari fungsi regresi sampel adalah metode OLS. Kriteria dari OLS adalah "line of best

fit" atau dengan kata lain, jumlah kuadrat dari deviasi antara titik-titik observasi
dengan garis regresi adalah minimum. "Line of best fit" adalah garis yang memiliki ∑e² paling kecil. Berkaitan dengan konteks kuadarat error yang minimum, best

fitting line disebut dengan least square line. Least square line dapat ditentukan
dengan menghitung set observasi (x,y) data. Perhitungan tersebut menghasilkan nilai b0 dan b1. Selanjutnya, nilai tersebut disubstitusikan ke dalam persamaan

 Y = b0 + b1 X
sebagai berikut: 1.

untuk

memperoleh

persamaan

garis

regresi

least

square.

Sederhananya, prosedur yang meminimumkan kuadrat error terkecil dapat dijelaskan

Persamaan garis regresi sampel

 Yi = b0 + b1 X i

2. Bentuk stokastik dari persamaan regresi sampel

Yi = b0 + b1 X i + ei
Dengan memasukkan persamaan pada point (1) di atas diperoleh

 Yi = Yi + ei  ei = Yi − Yi

Jadi nilai error dapat dinyatakan dengan

Gambar 5 Error dalam Regresi

Errors in Regression

Y

Yi

 Error ei = Yi − Yi  Yi

{

.

 Y = b0 + b1 X

the fitted regression line

 Yi the predicted value of Y for X

i

13

X

Dari beberapa persamaan di atas dapat disimpulkan bahwa garis regresi sampel yang paling mendekati garis regresi populasi adalah yang meminimumkan kuadrat

error. Kuadrat error minimum dapat dinyatakan dengan:
1. 2. 3.

∑ ei2  ∑(Yi − Yi ) 2 ∑(Yi − b0 − b1 X i ) 2

Untuk

 Y = b0 + b1 X , nilai b0 dan b1 diperoleh berdasarkan rumus: b1 = b0 = n(ΣXY ) − (ΣX )(ΣY ) n(ΣX 2 ) − (ΣX ) 2 ΣY − b1 (ΣX ) n

dimana n adalah jumlah data atau banyaknya observasi. Rumus di atas akan menjadi lebih sederhana jika variabelnya dinyatakan dalam bentuk deviasi standar terhadap rata-rata sampel. Jika

x=X −X y = Y −Y

maka rumus a dan b dapat dinyatakan dengan

b1 =

Σxy dan b0 = Y − b1 X Σx 2

Karakteristik garis regresi sampel adalah:

14

1. Garis regresi sampel akan melalui X dan Y yang merupakan rata-rata dari
variabel X dan Y yang diperoleh dari sampel.

2. Nilai residu akan memiliki rata-rata sama dengan 0 karena ∑ ei = 0
Berikut ini adalah contoh data dua variabel, x dan y, untuk dijadikan latihan dalam mencari nilai b0 dan b1 dari suatu persamaan regresi.

Contoh 1 x 1211 1345 1422 1687 1849 2026 2133 2253 2400 2468 2699 2806 3082 3209 3466 3643 3852 4033 4267 4498 4533 4804 5090 5233 y 1802 2405 2005 2511 2332 2305 3016 3385 3090 3694 3371 3998 3555 4692 4244 5298 4801 5147 5738 6420 6059 6426 6321 7026 x2 1466521 1809025 2022084 2845969 3418801 4104676 4549689 5076009 5760000 6091024 7284601 7873636 9498724 10297681 12013156 13271449 14837904 16265089 18207288 20232004 20548088 23078416 25908100 27384288 xy 2182222 3234725 2851110 4236057 4311868 4669930 6433128 7626405 7416000 9116792 9098329 11218388 10956510 15056628 14709704 19300614 18493452 20757852 24484046 28877160 27465448 30870504 32173890 36767056

15

5439

6964

29582720

37877196 390185024

79498 10605 293426944 Jawab: Rumus dari sum of square and cross products adalah:

(∑ x) 2 SS x = ∑( x − x ) = ∑ x − n (∑ y ) 2 SS y = ∑( y − y ) 2 = ∑ y 2 − n (∑ x)(∑ y ) SS xy = ∑( x − x )( y − y ) = ∑ xy − n
2 2

Sedangkan rumus untuk least square regression estimator adalah:

b1 =

SS XY SS X

b0 = y − b1 x

Untuk mencari nilai b0 dan b1 dapat dibuat prosedur pengerjaan sebagai rumus di atas:

SS x = ∑ x

2

( ∑ x)
n

2 2 = 40947552

= 293426944 − SS xy = ∑ xy −

79448

(

25 ∑ x (∑ y)

)

n 2 106605 = 390185024 − = 51402848 25 SS XY 51402848 b1 = = = 1.255333776 ≈ 1.26 SS X 40947552 106605  79448 b0 = y − b1 x = − (1.255333776)    25  25 = 274 .85

16

Analisis Regresi dari kasus di atas adalah: Persamaan garis regresi y = 275 + 1.26 x

Predictor Constant X s = 318.2

Coef 274.8 1.25533

Stdev 170.3 0.04972

t-ratio 1.61 25.25

p

0.120 0.000

R-sq = 96.5%

R-sq(adj) = 96.4%

Analysis of Variance SOURCE Regression Error Total 23 24 DF 1 SS 64527736 2328161 66855896 MS 64527736 101224 F p 637.47 0.000

Selanjutnya dibahas Error Variance dan the Standard Errors of Regression Estimators. Perlu diperhatikan, sebelum melakukan pengerjaan lebih lanjut, pertama kali harus ditentukan derajat kebebasan (degree of freedom). Dalam hal ini, derajat kebebasan sebesar df = (n-2) Keterangan: n menunjukkan total observasi dikurangi dengan derajat kebebasan untuk setiap parameter yang diestimasi, yaitu b0 dan b1.

( SS XY ) 2 SSE = ∑( y − y ) = SS y − SS X
2

SSE = SS Y − b1 SS XY
Estimator yang tidak bias (unbiased estimator) dari s2 ditunjukkan pada rumus berikut:

MSE =

SSE n−2

Berdasarkan contoh di atas, bisa dicari nilai dari SSE sebagai berikut:

17

SSE = SS Y − b1 SS XY SSE = 66855898 − (1.255333776)(51402852.4) SSE = 2328161.2 SSE 2328161.2 MSE = = n−2 23 MSE = 101224.4 S = MSE S = 101284.4 S = 318.158
Standar Error estimasi regresi dari soal di atas dapat diselesaikan dengan rumus berikut: 1. Standar error dari intersep atau b0

s (b0) =

s ∑ x2 nSS x

s = MSE
2. Standar error dari slope atau b1

s (b1) =

s SS X

Masih merujuk soal di atas, dapat dicari standar error dari b0 dan b1 sebagai berikut: 1. Standar error dari intersep, b0

s (b0) = s (b0) =

s ∑ x2 nSS x 318.158 293426944 (25)(4097557.84) = 170.338

2. Standar error dari slope, b1

s (b1) = s (b1) =

s SS X 318.158 409 = 0.04972

18

Interval keyakinan dari parameter regresi dirumuskan sebagai berikut:

A (1 - α ) 100% confidence interval for b 0 : b ± t α s (b ) 0  ,(n− 2 ) 0  2  A (1 - α ) 100% confidence interval for b : 1 b1 ± t α s (b1 )   ,(n− 2 ) 2 

Mengacu pada soal di atas, nilai dari tingkat kepercayaan 95% adalah: 1. Interval kepercayaan (confidence interval) untuk intersep, b0 adalah

b0 ± t ( 0.025,( 25−2 )) s (b0) = 274.85 ± (2.069)(170.338) = 274.85 ± 352.43 = (−77.58;627.28)
2. Interval kepercayaan (confidence interval) untuk slope, b1 adalah:

b1 ± t( 0.025,( 25−2 )) s(b1) = 1.25533 ± (2.069)(0.04972) = 1.25533 ± 0.10287 = (1.15246;1.35820)
1.4 Analisis Korelasi dan Kovarian Salah satu topik penting yang perlu dipahami, yaitu analisis korelasi. Sederhananya, analisis korelasi adalah suatu alat statistik untuk menunjukkan seberapa besar tingkat (degree) hubungan suatu variabel secara “linier” terhadap variabel lain. Korelasi itu sendiri menyatakan tingkat hubungan atau keterkaiatan antara dua variabel. Seringkali analisis korelasi ini digunakan secara bersama-sama dengan analisis regresi untuk mengukur seberapa tepat garis regresi mampu menjelaskan variasi variabel dependen.

Ada dua ukuran yang mencerminkan korelasi antara dua variabel, yaitu: koefisien determinasi dan koefisien korelasi. Koefisien determinasi digunakan untuk mengukur kesesuaian model, atau dinotasikan dengan R2. Indikator ini menyatakan seberapa besar variasi dari variabel bebas (X) mampu menjelaskan perubahan variabel terikat (Y).

19

Sedangkan untuk koefisien korelasi, dalam hal ini korelasi populasi, dinotasikan dengan p, memiliki nilai dari -1 ke 1. Ada beberapa ragam nilai korelasi yang menunjukkan karakteristik hubungan antara dua variabel, yaitu:

• • • • •

ρ=-1

menunjukkan hubungan linier negative sempurna (perfect negative linear

relationship)
-1< ρ <0 menunjukkan hubungan linier negative (negative linear relationship) ρ=0 menunjukkan tidak ada hubungan linier

0< ρ <1 menunjukkan hubungan linier positif (positive linear relationship) ρ=1 menunjukkan hubungan linier positif sempurna (perfect positive linear

relationship)

Nilai absolute dari p menunjukkan kekuatan atau ketepatan suatu hubungan. Gambar 6 Berbagai Jenis Korelasi Dua Variabel

Y

ρ=1

Y

ρ= 0

Y

ρ= 1

X Y ρ=.8 Y ρ= 0

X Y ρ=. 8

X

X

X

X

Kovarian dan Korelasi 1. Kovarian dari dua variabel random X dan Y adalah :

Cov ( X , Y ) = E[( X − π X )(Y − π Y )]
Untuk

π X dan π Y adalah rata-rata populasi.
Cov ( X , Y ) σ XσY

2. Koefisien korelasi populasi dirumuskan dengan:

ρ=

Sedangkan untuk koefisien korelasi sample dirumuskan dengan:

20

r=

SS XY SS X SS Y

Merujuk soal di atas, bisa dicari koefisien korelasi sampel sebagai berikut:

r= r=

SS XY SS X SS Y 51402852.4 ( 409475578)(6655589) = 51402852.4 = 0.982 5232191.2

Selanjutnya, pembahasan tentang berbagai uji dalam regresi sederhana akan dibahas pada modul 3. Modul 2 lebih menekankan uji hipotesis dan confidence interval dari perspektif teoritis. Hal ini bertujuan agar filosofi dasar dari uji hipotesis dapat dipahami dengan baik.

21