Professional Documents
Culture Documents
Teorema 6.2
Dalam sampel yang besar, dengan penarikan sampel aak sederhana, perkiraan rasio ŶR
memiliki suatu varians yang lebih kecil daripada perkiraan Yˆ = N yang diperoleh y
1 Sx
2 X koefisien var iansi xi
ρ> =
Sy 2(koefisien var iansi y i )
Y
Bukti:
Untuk Ŷ kita peroleh
ˆ N 2 (1 − f ) 2
V (Y ) = Sy
n
Suatu hasil dalam teori regresi yang baik menunjukan jenis populasi dengan perkiraan
rasio yang dapat disebut terbaik di antara sejumlah kelas perkiraan. Hasilnya pertama
kali di buktikan untuk populasi tidak terbatas. Brewer (1963b) dan Royall (1970a)
mengembangkan hasilnya untuk populasi terbatas. Hasilnya terpenuhi jika dua kondisi
dipenuhi yaitu:
1. Hubungan antara yi dan xi merupakan sebuah garis lurus melalui origin
2. Varian yi di sekitar garis ini adalah proporsional terhadap xi
1
Penduga tidak bias linear terbaik di definisikan sebagai berikut. Misalkan seluruh
penduga Ŷ dari Y yang merupakan fungsi linear dari nilai-nilai sampel y i yang
bentuknya l1 y1 + l 2 y 2 + ... + l n y n dengan l tidak bergantung pada yi , meskipun bisa saja
fungsi dari xi dan l dibatasi untuk memberikan perkiraan yang tidak bias dari Y .
penduga yang memiliki varians terkecil disebut penduga tidak bias linear terbaik
(PTLT).
Brewer dan Royall menganggap nilai-nilai populasi N ( y i , xi ) adalah sebuah sampel
acak dari sebuah populasi dengan y i = β xi + ε i dimana ∈i bebas dari xi dan xi > 0 , rata-
rata 0 dan varians λxi ; i = 1.2.3... . Brewer dan Royall menganggap suatu penduga Ŷ
adalah tidak bias jika E (Yˆ ) = E (Y ) dalam pemilihan berulang dari model dengan
sampel dan populasi terbatas. Penduga seperti itu bisa disebut model tidak bias.
Teorema 6.3.
Xy
Dalam model y i = β xi + ε i rasio penduga YˆR = (penduga tidak bias linear terbaik
x
untuk setiap sampel acak atau tidak dipilih secara terpisah menurut nilai-nilai dari xi)
Bukti:
Karena E ∈i xi = 0 dalam penarikan sampel berulang, hal ini mengikuti y i = β xi + ε i
N
bahwa Y = β X + ∑ ε i : E (Y ) = β X
Jika kita mengambil n sampel nilai xi tetap dalm penarikan sampel berulang dalam
model y i = β xi + ε i , maka
n n
E (Yˆ ) = β ∑ l i xi : V (Yˆ ) = λ ∑l i
2
εi
N n n
2
N n n
X
dengan l = ,
nx
n N
X n N X − nx n N −n
YˆR − Y = ∑ l i ε i − ∑ ε i = ∑ ε i − ∑ ε i = ∑ i ∑εi
ε −
nx nx
N −n
Dimana ∑ menujukan jumlah seluruh (N-n) nilai populasi yang tidak terdapat dalam
Praktek yang berhubungan dengan hasilnya adalah menganggap kondisi penduga rasio
yang lebih baik tidak hanya unuk y ,tetapi adalah yang terbaik dari seluruh penduga.
Bila kita mencoba untuk memutuskan jenis perkiraan mana yang digunakan, suatu
grafik yang nilai sampel yi di plot terhadap xi adalah sangat beguna. Jika grafik ini
menunjukan suatu hubungan garis lurus melalui titik origin dan jika varians dari titik-
titik yi di sekitar garis terlihat secara kasar proporsional terhadap xi, penduga rasio akan
menjadi sukar untuk di bentuk
Kadang kadang varians yi dalam susunan dengan xi tetap tidak proporsional terhadap xi.
Jika residu varians ini adalah dari bentuk λv( xi ) , dimana v( xi ) diketahui, Brewer dan
n
∑w y x i i i
1
wi = , dalam sebuah sampel populasi dari Greece, Jessen dan kawan-kawan
v ( xi )
2
(1947) menetapkan bahwa residu varians bertambah secara kasar sebesar xi . Ini
1
menyarankan sebuah menimbang regresi dengan wi = 2 , yang menghasilkan
xi
3
n
X (∑ wi y i xi )
X n
yi
Yˆ = n
=
n
∑ x
i
∑w x i
2
i
muncul menjadi sensitif untuk ketidaktelitian dalam model, walaupun ini membutuhkan
studi lebih lanjut. Selanjutnya perkerjaan dari Royall dan Herson(1973) membicarakan
jenis distribusi sampel yang dibutuhkan terhadap xi, ŶR tidak bias bila terdapat sebuah
regresi polinomial dari yi terhadap xi.
Sehingga hubungan yang terpenting dalam bias berasal dari faktor kedua dalam krung.
Selanjutnya,
4
1− f
Ey ( x − X ) = E ( y − Y )( x − X ) = ρS y S x
n
Dengan teorema 2.3 dan definisi tentang ρ . Juga,
1− f 2
Ex ( x − X ) = E ( x − X ) 2 = Sx
n
Dengan demikian hubungan terpenting dalam bias adalah
1− f 1− f
E ( Rˆ − R ) = 2
( RS x2 − ρS y S x ) = (C xx − C xy ) R
nX n
Sekarang hubungan terpenting dalam V (Rˆ ) adalah
1− f 2 Yˆ
V ( Rˆ ) = 2
( S y − R 2 S y2 − 2 RρS y S x ) dari 6.5 dengan mengantikan Rˆ = R
nX NX
1− f 1− f 2
Dari E ( Rˆ − R ) = 2
( RS x2 − ρS y S x ) dan V ( Rˆ ) = ( S y − R 2 S y2 − 2 RρS y S x ) nilai
nX nX 2
(nias/ kesalahan baku), yang mana sama untuk Rˆ , YR , YˆR , dapat dinyatakan sebagai:
(bias) ( RS x − ρS y )
kv( x ) = 1
kesalahan baku
( R S − 2 RρS y S x + S )
2 2 2 2
x y
1− f Sx
Dimana kv( x ) = dengan mengganti perkiraan sample dari
nX
(bias) ( RS x − ρS y )
kv( x ) = 1
,
kesalahan baku
( R S − 2 RρS y S x + S )
2 2 2 2
x y
Kish, Namboodiri, dan Pillai (1962) menhitung nilai (bis/ keasalahan baku) sejumlah
item dalam berbagi penelitian nasional dan lebih dibatasi. Seluruh nilai (bias/kesalahan
baku) <0,03 dan >0,10 dalam peneletiannya diperoleh hanya untuk satu lapisan tunggal
dengan nh=6 rumahsakit kecil.
Hasil kedua, oleh Hartley dan Ross (1954) memberi suatu hasil yang tepat untuk
biasnya dan suatu batas atas rasio dari bias terhadap kesalahan bakunya. Perhatikan
kovarians nilai R̂ dan x , dalam sample acak sederhana dengan ukuran n.
y
kov( Rˆ , x ) = E x − E ( Rˆ ) E ( x ) = Y − X E ( Rˆ )
x
Dengan demikian
Y 1 1
E ( Rˆ ) = − kov( Rˆ , x ) = R − kov( Rˆ , x )
X X X
1
Jadi bias didalam R̂ adalah − kov( Rˆ , x ) . tidak seperti pendekatan Taylor
X
1− f
E ( Rˆ − R ) = 2
( RS x2 − ρS y S x ) untuk biasnya, bentuk ini adalah tepat. Selanjutnya
nX
5
ρ Rˆ , x σ Rˆ σ x
σ Rˆ σ x bla00
bias dalamRˆ = ≤
X X
Karena R̂ dan x tidak dapat mempunyai kolerasi >1. oleh karena itu,
bias dalamRˆ σ
≤ x = kv dari x
σ Rˆ X
batas yang sama diterapkan untuk bias dalam Yˆ dan Yˆ . dengan demikian, jika
R R
kovarians varaisi x < 0,1 , biasnya bisa dipertimbangkan untuk diabaikan dalam
hubungannya dengan kesalahan baku.