Professional Documents
Culture Documents
Tek Örnek P.O.İ.T. Teorisi
Tek Örnek P.O.İ.T. Teorisi
İSTATİSTİK – II DERSLERİ
7. ÜNİTE
PARAMETRİK OLMAYAN
İSTATİSTİK TEKNİKLER
ERZURUM, 2020
7. BÖLÜM
PARAMETRİK OLMAYAN
İSTATİSTİK TEKNİKLER
Hipotezler:
a. (Çift yönlü test): H0 : M = M0, H1 : M ≠ M0
b. (Tek yönlü test): H0 : M ≤ M0, H1 : M > M0
c. (Tek yönlü test): H0 : M ≥ M0, H1 : M < M0
Test İstatistiği
Örnekteki her bir ölçümden farazi medyan değeri M0’ı çıkardıktan sonra
bulunacak farkın işaretini kaydediniz.
Eğer sıfır hipotezi doğru ise; yani, anakütle medyanı gerçekten M0’a eşitse
anakütleden çekilen tesadüfi örnekte n adet Xi − M0 farklılığı hesap edilirken ar-
tı ve eksi işaretlerin birbirine eşit olması beklenir. Eğer istatistiki bakımdan
önemli düzeyde az artı veya eksi işareti müşahede edersek a şıkkındaki sıfır hi-
potezini reddederiz. Eğer istatistiki bakımdan çok az sayıda eksi işareti müşahe-
de edersek b şıkkındaki sıfır hipotezini reddederiz. Bununla birlikte, önemli dü-
zeyde az artı işareti müşahede edersek c şıkkındaki sıfır hipotezini reddederiz.
Böylece a şıkkındaki hipotezler için test istatistiği, artı veya eksi işaretlerinden
az sayıda olanıdır. b şıkkındaki hipotezler için test istatistiği eksilerin sayısı, c
şıkkındaki hipotezler için artıların sayısıdır.
Daha önce de belirtildiği gibi testin geçerli olması için üzerinde durulan
değişkenin sürekli değişken olması gerekir. Bu yüzden Xİ − M0 farkları hesapla-
nırken sıfır farkın bulunmaması beklenir. Bununla birlikte, uygulamada sıfır
farklılık gözlenebilir. Bu durumda sıfır farklılığa sebep olan müşahedeler analiz-
den çıkarılır ve örnek hacmi n buna göre azaltılır.
Karar
Eksi veya artı işaretlerden az olanının gözlenmesi ihtimali α/2’ye eşit ve-
ya küçük ise α önem seviyesinde a şıkkındaki sıfır hipotezini reddederiz.
Eksi işaretinin gözlenmesi ihtimali α’ya eşit veya küçük ise α önem sevi-
yesinde b şıkkındaki sıfır hipotezini reddederiz.
Artı işaretinin gözlenmesi ihtimali α’ya eşit veya küçük ise α önem sevi-
yesinde c şıkkındaki sıfır hipotezini reddederiz.
Gerçekte müşahede edilene eşit veya ondan daha büyük bir değeri bulma
ihtimalini belirlemek için, artı ve eksi işaretlerin oluşturduğu bir anakütleden çe-
kilen n adet müşahedeyi ihtiva eden örnekteki artı ve eksi işaretlerin sayısını göz
önüne almamız gerekir. Diğer bir ifadeyle, elimizde bulunan n hacimli örneğin
kendisinden çekilmiş olduğu ikili (artı ve eksi işaretler) sonuçlardan müteşekkil
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 178
gözlemleri ihtiva eden bir anakütleyi göz önüne alalım. Sıfır hipotezi doğru iken,
farz edilen hipoteze göre üzerinde durulan işareti veren farklılıkların tesadüfi
dağılımı p = 0.5 parametresiyle binom dağılımıdır. Sıfır hipotezi doğru ise ana-
kütleden çekilen bir tesadüfi örneğin artı işaretine sahip olması ihtimali eksi işa-
retine sahip olması ihtimaline eşittir. Yani Xİ − M0 farklılığının artı işareti ver-
mesi ihtimali ile eksi işareti vermesi ihtimali 0.5’e eşittir.
Tablo 11, p = 0.50 olduğunda verilen n değerlerine göre x olaylarının ger-
çekleşme ihtimallerini vermektedir. Bu tabloyu kullanarak gerçekte müşahede
edilene eşit veya ondan daha büyük bir test istatistiği elde etme ihtimalini hesap-
layabiliriz. Eğer X değerinin eldeki hipotezlere göre üzerinde durulan işaretin
sayısını gösteren bir tesadüfi değişken olduğunu ve x değerinin de test istatisti-
ğinin gözlenen değerini gösterdiğini kabul edersek, aradığımız şey
P(X ≤ x | n, 0.50)
ihtimalidir. Bu ihtimal, içerisindeki artı ve eksi işaretlerin birbirine eşit olduğu
bir anakütleden çekilen n hacimlik bir tesadüfi örnekte X değerinin x değerine
eşit veya küçük olması ihtimalidir.
x değeri, Tablo 11 yardımıyla bulunan X kritik değerinden büyük oldu-
ğunda veya bu değere eşit olduğunda sıfır hipotezini reddederiz.
n > 20 olduğunda Tablo 11’i kullanamayız. 20’den büyük örnekler için
binomun normale yaklaşımını kullanarak, test istatistiğini,
x − n (0.5)
Zh =
n (0.5)(1 − 0.5)
olurken, P(X ≤ 4) = P(Z ≤ −0.32) = 0.5 − 0.1255 = 0.3745 olur. Bulunan P değe-
ri 0.025’den büyük olduğu için binomun normale yaklaşımı durumunda da sıfır
hipotezi kabul edilerek pillerin medyan dayanma süresinin 1.50’ye eşit olduğuna
karar verilir.
Hipotezler
a. (Çift yönlü test): H0: M = M0 , H1: M ≠ M0
b. (Tek yönlü test): H0: M ≥ M0 , H1: M < M0
c. (Tek yönlü test): H0: M ≤ M0 , H1: M > M0
Test İstatistiği
Test istatistiğini bulmada aşağıdaki prosedürü takip ederiz:
1. Her bir müşahede değerinden farazi medyanı çıkarırız. Yani, her bir
müşahede için,
Di = Xi − M0
farkını hesaplarız. Herhangi bir Xi müşahede değeri farazi medyan değeri M0’a
eşit ise söz konusu müşahede değerini test prosedüründen çıkararak örnek hac-
mini buna göre azaltırız.
2. İşaretlerine bakmaksızın farkları küçükten büyüğe doğru sıraya koyarız.
Diğer bir ifadeyle, fark değerlerini temsil eden ⏐Di⏐ değerlerini sıraya koyarız.
İki veya daha fazla ⏐Di⏐ değeri birbirine eşitse, bu değerlerin sıra ortalamaları
bulunur.
3. Herbir sıra değerine ilgili farkın işaretini koyarız.
4. T+ olarak adlandırılacak artı değerli sıraların toplamını ve T− olarak ad-
landırılacak eksi işaretli sıraların toplamını buluruz. Gerçekte bu değerlerden sa-
dece birini hesap etmek yeterlidir. Bilinen değer yardımıyla diğer değeri hesap-
lamada, T+ = [n(n+1)/2] − T− ilişkisinden yararlanabiliriz.
Sıfır hipotezinin doğru olması yani, gerçek anakütle medyanı M’nin farazi
medyan M0’a eşit olması halinde Wilcoxon testine ait faraziyeler karşılanıyorsa,
pozitif bir Di = Xi − M0 farklılığı görme ihtimali negatif farklılık görme ihtima-
line eşittir. Böylece tekrarlı örneklemede sıfır hipotezi doğru ve gerekli farazi-
yeler karşılanırsa, beklenen T+ değeri, beklenen T− değerine eşit çıkar. Verilen
KISA TEORİK BİLGİLER 181
bir örnekte T+ değerinin T− değerine eşit olması beklenmez. Bununla birlikte sı-
fır hipotezi doğru ise, bu iki değer arasında çok önemli bir farklılığın olması
beklenmez. Bu yüzden önemli ölçüde küçük bir T+ veya T− değeri, sıfır hipote-
zinin reddedilmesine sebep olacaktır.
Her bir hipotez çifti için hesaplanacak test istatistiği aşağıdaki gibidir:
a) Önemli ölçüde küçük T+ veya T− değeri, sıfır hipotezinin reddedilme-
sine sebep olacağı için a şıkkında belirtilen hipotezler için geçerli test istatistiği
T+ ve T− değerlerinin küçük olanıdır. Kolaylık sağlaması açısından bu iki değe-
rin küçük olanını T ile göstereceğiz.
b) Negatif işaretli sıralarda yeterince büyük bir toplam elde edildiğinde,
sıfır hipotezine göre, bu toplamın pozitif sıralardan hesaplanacak toplamdan çok
fazla olacağını ümit ettiğimiz için H0: M ≥ M0 hipotezini reddederiz. Aynen bu-
nun gibi yeterince küçük bir T+ değeri b şıkkında belirtilen sıfır hipotezinin red-
dedilmesine sebep olacaktır.
c) Benzer sebeplerden dolayı c şıkkında belirtilen sıfır hipotezi için geçerli
olan test istatistiğinin T− olduğunu görürüz.
Karar
Tablo 12, Wilcoxon işaretli sıralar testinde kullanılacak kritik değerleri
göstermektedir. Bu tabloda farklı ihtimal seviyesi veren mümkün bütün sıra top-
lamları (T) için 0.0001’den 0.5000’ye kadar ihtimal seviyeleri verilmiştir. Söz
konusu tabloda, n = 5’den n = 30’a kadar olan bütün örnek hacimleri için sıra
toplamları (T) listelenmiştir.
İkinci safhada bahsedilen herbir hipotez çifti için geçerli olan karar modeli
aşağıdaki gibidir:
a. Hesaplanan T değeri, n örnek hacmi ve önceden seçilen α/2 önem sevi-
yesine göre Tablo 12’den bulunacak tablo T değerine eşit veya bu değerden kü-
çük olursa α önem seviyesinde H0 hipotezini reddederiz.
b. T+ değeri, n örnek hacmi ve önceden seçilen α önem seviyesine göre
Tablo 12’den bulanacak değere eşit veya bu değerden küçükse α önem seviye-
sinde H0 hipotezini reddederiz.
c. T− değeri, n örnek hacmi ve önceden seçilen α önem seviyesine göre
Tablo 12’den bulanacak değere eşit veya bu değerden küçükse α önem seviye-
sinde H0 hipotezini reddederiz.
YEDİNCİ BÖLÜM: PARAMETRİK OLMAYAN TEKNİKLER 182
test istatistiği, standart normal dağılıma yaklaşır. Tek yönlü testlerde, bu formül-
deki T değerinin yerine, duruma göre, T− veya T+ değerlerinden birisini yazabili-
riz.
Örnek: Atatürk Üniversitesinde okuyan öğrencilerin günde ortalama 60
dk ders çalıştığı iddia edilmektedir. İddiayı test için tesadüfi olarak seçilen 8 öğ-
rencinin günlük ders çalışma süreleri aşağıdaki gibidir.
55 80 45 68 70 110 30 50
Buna göre, %5 önem seviyesinde ortalama ders çalışma süresinin 60 da-
kikadan az olduğu söylenebilir mi?
H0 : M ≥ 60 dk
H1 : M < 60 dk
Serideki rakamlardan, iddia edilen medyan değeri çıkarıldığında aşağıdaki
seri elde edilir.
-5 20 -15 8 10 50 -30 -10
İşaretlerine bakmaksızın fark serisinde rakamlar küçükten büyüğe doğru
sıralandığında aldıkları sıra değerleri aşağıdaki gibi olur.
1 6 5 2 3.5 8 7 3.5
Bu sıra değerlerine farkların işareti verildiğinde aşağıdaki seri elde edilir.
-1 6 -5 2 3.5 8 -7 -3.5
Test istatistiği, artı işaretli sıra değerlerinin toplamıdır. Daha açık bir ifa-
deyle, test istatistiği, T+ = 6 + 2 + 3.5 + 8 = 19.5’tir.
n = 8 ve α = 0.05 önem seviyesine göre Tablo 12’den bulunan kritik değer
6’dır. Test istatistiği tablo değerinden büyük olduğu için %5 önem seviyesinde
sıfır hipotezi reddedilemez ve medyan çalışma süresinin 60 dakikadan az olma-
dığına karar verilir.
KISA TEORİK BİLGİLER 183
şeklinde olsa, bu durumda da sadece iki dizinin olması yüzünden seçimin tesa-
düfiliğinden bahsedilemez.
Tek örnek dizi sayıları testi, olay, eşya veya sembollerden müteşekkil bir
serinin, tesadüfi bir seçimin sonuçları olup olmadığını anlamada işimize yarar.
Bu analizde kullanılacak veriler, vuku bulma sıralarına göre kaydedilmiş,
başlıca iki kategori tipi içerisinde toplanabilecek bir seri müşahededen oluşmalı-
dır. Eğer toplam müşahede sayısına n dersek, n1, birinci tip müşahede sayısını ve
n2, diğer tip müşahede sayısını gösterir.
Hipotezler
H0: İki müşahede tipinin vuku bulması durumu tesadüfi bir prosesin
sonucudur.
H1: Vuku bulma durumu tesadüfi değildir.
Test İstatistiği
Serideki dizi sayısı, test istatistiğini vermektedir. Test istatistiği r ile gös-
terilir.
Karar
Sıfır hipotezi yön belirtmediği için çift yönlü hipotez testi yapılır. Test is-
tatistiği için alt ve üst kritik değerini belirlememiz gerekir. r değeri, alt kritik de-
ğere eşit veya küçükse sıfır hipotezi reddedilir. Test istatistiği, üst kritik değere
eşit veya büyük olduğunda da sıfır hipotezi reddedilir.
En fazla 20’ye kadar olan n1 ve n2 değerleri itibariyle Tablo 13, alt kritik
değeri ve Tablo 14, üst kritik değeri verir. Her iki tablo da 0.05 önem seviyesine
göre hazırlanmıştır.
n1 ve n2 değerlerinden birisi 20’yi geçtiğinde hipotezlerimizi test etmede
Tablo 13 ve Tablo 14’ü kullanamayız. Bununla birlikte, büyük örnekler için;
r − {[ (2 n 1 n 2 ) / ( n 1 + n 2 )] + 1}
z=
2 n 1 n 2 (2 n 1 n 2 − n 1 − n 2 )
( n 1 + n 2 ) 2 ( n 1 + n 2 − 1)
değeri, H0 hipotezi doğru iken standart normal dağılıma yaklaşır. Belli bir önem
seviyesi için tablodan bulunacak kritik Z değeri, yukarıdaki formül yardımıyla
hesaplanacak z değeri ile karşılaştırılır.
KISA TEORİK BİLGİLER 185