You are on page 1of 6

SIRALI ANAL Z N KULLANIMIYLA ORANLARIN VE YZDELER N TEST ED LMES VE B R BENZET M ALI MASI

Latif ZTRK K r kkale niversitesi, ktisadi ve dari Blimler Fakltesi, Yard mc Doent Dr. Habip KOAK Marmara niversitesii, ktisadi ve dari Blimler Fakltesi, retim Grevlisi Dr.

TESTING RATIOS AND PERCENS USING SEQUENTIAL ANALYSIS AND A SIMULATION STUDY Abstract: In this study, sequential analysis (SA) and simple random sampling (SRS) are explained briefly and samples are taken from the constructed data base with SA and SRS by using simulation methods. The main difference between SA and traditional SRS is that sample size is not predetermined in SA. The result of the observations which are obtained one by one or as a group, are compared with two statistics which are computed before. The main objective in these comparisons is to determine whether to continue sampling and which alternative to accept. It is continued sampling sequentially until deciding one of the two alternatives in accordance with the statistics computed before. There is no necessity to make comparison after each observation while practicing the SR. The comparisons could be done after making a group of observations. As a result, SA has important advantage by means of sample size compared to SRS. By means of sample size, these two methods are compared according to different errors value by using simulation. Keywords: Sampling, Simulation

SIRALI ANAL Z N KULLANIMIYLA ORANLARIN VE YZDELER N TEST ED LMES VE B R BENZET M ALI MASI zet: Bu al mada s ral analiz(SA) ve basit rastsal rnekleme (BR) yntemlerinden k saca bahsedilerek, olu turulan veritaban ndan benzetim yntemi kullan larak BR ve SA ile rneklemler ekilmi ve analiz edilmi tir. SA ile geleneksel BR aras ndaki temel farkl l k s ral analizde rnek hacminin daha nceden belirlenmi olmamas d r. Teker teker veya grup halinde elde edilen gzlemlerin sonular daha nceden hesaplanan bir ift istatistik ile kar la t r lmaktad r. Bu kar la t rmadaki temel ama, rneklemeye devam edilip edilmeyece ine ve hangi alternatifin kabul edilece ine karar vermektir. Daha nce hesaplanan istatistiklere gre iki alternatiften birisine karar verilinceye kadar rneklemeye s ral olarak devam edilir. S ral analizi uygularken her gzlemden sonra kar la t rma zorunlulu u yoktur. Bir grup gzlem al nd ktan sonrada kar la t rma yap labilir. Dolay s yla, buda BR ye gre rnek hacmi a s ndan nemli avantajlar sa lamaktad r. rnek hacimleri a s ndan bu iki yntem e itli hata de erlerine gre benzetim yntemi arac l ile kar la t r lm lard r. Anahtar Kelimeler: rnekleme, Benzetim

I. Giri Ara t rmalar n o unda rnekleme maliyeti byk problemler yaratmakta ve ara t rman n s n rlar n n daralt lmas na veya rnek say s nda bir k s tlamaya gidilmesine neden olmaktad r. Bu da ara t rman n do rulu unu ve etkinli ini azaltmaktad r. o u ara t rmada rneklem hacmi nceden belirlenen BR yntemi ile belirlenmektedir. Burada benzetim ynteminin de kullan lmas yla oran ara t rmalar nda SA tekni inin rneklem hacminde BR ye gre rneklem hacmi a s ndan sa lad avantajlar incelenmektedir. BR, N birimlik bir anaktleden, nceden belirlenen n birimlik bir rne in, anaktledeki tm birimlere e it

seilme ans verilerek seilmesidir. Bu tr rastsal seimde anaktle bir btn olarak ele al n r. BR, N hacimli birimlik bir anaktleden ba ms z olarak seilebilecek birbirlerinden farkl ve n birimlik hacimli rneklemelerin

C =
N n

N! n!( N - n)!

(1)

say daki kombinasyonlar na e it seilme ans tan yan bir rnekleme tekni idir. Bu tekni in uygulamas nda anaktle k s mlara ayr lmaks z n, birimler aras ndan anaktlenin tamam n temsil edecek bir rneklem rastsal olarak seilir. Anaktledeki her birimin seilecek rneklemde bulunmas olas l ise n / N dir.[1]

II. S ral Analiz SA oklu rneklemenin en u durumudur. zellikle kinci Dnya Sava s ralar nda istatistikiler bu konuda nemli ad mlar atm ve ba ar l al malar yapm lard r. SA ile BR aras ndaki temel SA de rneklem hacminin daha nceden belirlenmemi olmas d r. Bu rnekleme trnde birimler teker teker veya bir grup olarak rastsal rnekleme yntemiyle seilip incelenir ve kararlar her birimin gzlenmesinden hemen sonra al n r.[2] Karar kabul, red veya rneklemeye devam eklinde olmaktad r. Bu rnekleme trlerinde yanl karar alma riskleri ayn hipotez testlerindeki risklere benzemektedir. Risklerin azalmas ku kusuz rnek birim say s n n artt r lmas na ba l d r. rnek gzlemlerden elde edilen sonuca ba l l n yan nda SA in rneklem hacmi, do al olarak kabul edilebilir yanl karar alma riskinden ve alternatif karar n zerine kurulan daha nceden belirlenmi kritik seviyelerin fark ndan etkilenmektedir. Yani, %99 do ru karar olas l beklenen bir rneklem i leminde, %90 do ru karar beklenen bir rneklem operasyonundan daha fazla rneklem hacmi gerekmektedir. SA di er rnekleme tekniklerine alternatif olu turmaktan ziyade bir tamamlay c d r.[3] Di er rnekleme teknikleri ve formlleri gibi SA de rastsall k oldu u durumlarda uygulan r. S n flanm rneklemin uyguland

durumlarda, SA de yaln zca s n flar n kendi iinde uygulan r, s n flar aras nda veya btn rneklem zerinde uygulanamaz. SA, h zl , verimli, gvenilir ve anla labilir bir ara t rma arac d r.[4] SA in uygulanmas iin di er nemli bir gereksinim, btn rneklerin rastgele ekilmi olmas ve btn rneklerin birbirinden ba ms z olmalar d r. ekilen rnekler belli de erler aral nda tan mlanarak ya 0 yada 1 eklinde bir oran hesaplamak iin birikimli de erler haline dn trlmektedir. Sabit rneklem hacminin SA de kullan lan rnek hacminden daha byk olmas gereklili i gz nnde bulundurulmal d r. III. SA de Kullan lan De erler Btn s ral problemler a a da a klanan de er taraf ndan tan mlanmaktad rlar;[5] Kullan lan tan mlama e risi (TE); Bu e ri belirli rnekleme plan n n, test edilen veya ara t r lan oran ile di erleri aras ndaki ay r m ne derece iyi yapt n gsterir. Burada, dikey eksen uygulanan rnekleme plan iin incelenen rneklerin kabul edilme olas l n , yatay eksen ise ara t rmaya konu de erlerin d ndaki de erlerin yzdesini gstermektedir. Binom olas l k da l m kullan larak, verilen bir rnekleme plan iin a a daki tan mlama e risi olu turulabilir. Burada, n rneklem hacmini ve c ekilen rneklemi kabul etmek iin rnek iinde bulunabilecek ara t r lan birimlerin maksimum say s n gstermektedir.

Binom Da l m ile Olu turulan Tan mlama E risi n=15 c=0


1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 0,05

Ara t r lan Oran n Kabul Edilme Olas l

a = %3.67
b = %8,74
P0=%3 P1=%15

0,1

0,15

0,2

0,25

Ara t r lan Oran D

ndaki%

ekil 1: Tan mlama E risinin Grafik Gsterimi anlam na gelmektedir), P tan mlanan yanl negatif 1 Burada, , gerekte do ru oldu u halde hipotezin oran n kontrol edilmesi iin alternatif hipotez alt ndaki reddedilme olas l n ; , gerekte yanl olan bir P nin de erini gstermektedir. hipotezi kabul etme olas l n , P0, ula lacak amalara gre rneklem oran n n istenilen standarda ula mas n , TE e risinin P0 da ki de eri ile 1 aras ndaki fark ( P < P0 ise ara t rma hipotezinin do ruland de eri bu noktadaki olas l n gstermektedir.

Benzer olarak TE e risinin P deki de eri ile 0 1 aras ndaki fark da olas l n gstermektedir.[6] Do ru karar olas l klar n ykselterek bu olas l klar nemli derecede kltilebilir. Bununla beraber, do ru karar olas l klar ne kadar ykseltilirse rneklem hacmi de o oranda byk olacakt r. Bu olas l klar n belirlenmesi, problemin zelli ine ve ara t rmac n n insiyatifine ba l d r.[7] Ortalama-rnek-say s (OS): Bir SA de karara varmadan nce test edilecek olan bilinmeyen parametrelerin tm olas de erleri iin elde edilecek gzlem de erlerinin ortalamas d r. Kritik de erler olan P0 , P1 ve do ru karar alma olas l n belirledikten sonra, SA iin ortalama rneklem say s hesaplan r ve

sabit rneklem taraf ndan belirlenen rneklem say s ile kar la t r l r. E er P = P0 ve P = P noktas ndaki 1 iki ortalama rneklem say s n n en byk de eri, SA kullanmak iin sabit rneklem taraf ndan gerekli olan say n n yeterli derecede alt nda ise kabul ve red de erleri hesaplan r ve rnekleme i lemine geilir. Kabul ve red say lar kmesi: ( K n ve R n ) , Kabul ve red say lar ara t rmac taraf ndan belirlenen ( , ,P0,P1) drt ayr de er kullan larak hesaplan r. Bunlar, do ru veya yanl karar alma olas l klar , ara t r lan problemdeki hipotezi reddetmek iin en kk de er, say veya yzdelik ve kabul etmek iin en byk de er, say veya yzdeliktir.[8]

9 7 Birikimli Olumsuz Birim 5 3 1

H0 n kabul edilmesi

Kn

Rn Karars zl k Blgesi, rneklemeye

H0 n red edilmesi

-1 -3 -5

10

15

20

25

30

rneklem Say s , n

ekil 2: SA in Grafik Gsterimi ile gsterilecek olursa X Q B S i X Q < B S e kar Grafikte n ile gsterilen paralel eksen, ekilen test etmek iin P0 = 1 - Q olarak belirlenir ve B S in rneklem say s n , dikey eksen ise, n rnek ekildikten sonra tan mlamaya gre 0 lar n veya 1 lerin oran n gstermektedir. Grafikteki iki do ru kabul ve red do ru yzdelik olmas durumunda yanl l kla blgelerinin s n rlar n gstermektedir. reddedilmesi iin en byk kabul edilebilir hata oran da a ya e itlenir. E er Q nun yzdeli i gerekten K n ve R n , do rular n n dikey eksen ve BS den kk ise bu da yzdeli in minimum de eri bunlar n e imi ile kesi imleri SA iin nemli parametrelerdir. P0 < P1 olarak tan mlan r, bu durumun olas l da en Her defas nda tek bir rnek al nmakta ve her rnekten sonra birikimli sonular belirlenmektedir. az 1 - b olmal d r.[9] E er birikimli toplam yukar daki do ruyu keser ve kabul blgesine girerse H0 hipotezi kabul edilir. E er IV. SA in Algoritmas birikimli toplam red blgesine girerse H0 reddedilir. Di er durumda rneklemeye devam edilir. Q nun yzdeli inin B S e e it olup olmad n Test edilen konu ile ilgili P nin standard B S test etmek iin, SA in algoritmas a a daki gibi olarak belirlenirse ve verideki Q.yzdelik dilimi X Q olu turulur.[10]

1.

Kabul ve red kriterlerinin belirlenmesi;

4.

E er k nM + C B rnek ekmeyi durdurup

1- b 1-a A = ln( )

B = ln(

H 0 : P P1 hipotezini reddediyoruz. Test


5. 6. edilen P0 ile P1 aras nda olmad sonucuna ula yoruz. Yukar daki belirtilen 3. ve 4. ko ullardan ikisi de gerekle mezse rneklemeye devam edilir. ekilen rnek say s 2 * nf de erini a t nda rnekleme durdurulup, e er

(2) (3)

1 - P0 R1 = 1- P 1 P R2 = 0 P 1

(4)

k nM +
(5)

CA + CB 2 CA + CB 2

ise H 0 : P P0

hipotezi kabul edilir. Di er durumda e er

Yukar da hesaplanan de erler kullan larak kabul ve red blgelerini belirleyen do rular n e imi bulunur.

k < nM +

ise

H 1 : P P1

ln R1 M = R ln( 1 ) R2 A ln( R2 / R1 ) B CB = ln( R2 / R1 ) CA =


Sabit rneklem hacmi hesaplan r.

hipotezi kabul edilir.[12] V. Benzetim al mas ve Elde Edilen Sonular Bu benzetim al mas nda, 2004-2005 retim y l nda K r kkale niversitesi nde renim gren rencilerin tamam na (11500 ki i) sosyo-ekonomik profillerini belirlemek zere bir anket uygulanm t r. Bu anketin verileri ile bir veritaban olu turulmu tur. Burada sorulan bir soru zerinde BR ve SA yntemi uygulayarak bu soruya verilen yan tlar n oranlar elde edilmi tir.[13] Buradaki ama KKU den gnbirlik Ankara ya gidi -geli yapan rencilerin oran n n belirlenmesidir. Bu problemde, e itli girdi de erleri kullan larak hem BR ye gre hem de SA e gre oranlar tespit edilmeye al lm ve rneklem hacimleri ve hipotezlerin sonular kar la t r lm t r. Olu turulan hipotezler gidi -geli yapan rencilerinin oranlar ile ilgilidir. a , b , P0 ve P1 in e itli de erlerine gre hipotezlerin red ve kabul edilip edilmedikleri ve rneklem hacimleri BR ile kar la t r lm t r. Yap lan benzetim al mas nda BS kullan larak 100 den 600 e kadar de i en rneklem hacmi kullan larak oran tespit edilmi ve gerek orandan farklar hesaplanm t r. A a daki tabloda da grlece i gibi rneklem hacmi artt ka rneklemden elde edilen oran gerek orana yakla maktad r. Devam nda rastsal olarak rnekler veritaban ndan teker teker ekilerek yukar daki SA algoritmas na gre incelenmi ve karar verilmi tir. Anaktle oran bilindi inden dolay bu kararlar n do rulu u ve rneklem hacimleri a s ndan kar la t rmalar yap lmas daha gereki bir sonu elde edilmesine yard mc olmu tur. BR kullan lmas durumunda sonlu anaktle iin rneklem hacimleri e hata dzeyini Z gvenilirlik dzeyinin standart normal da l m tablo de erini P anaktle oran n gstermesi ko ulu ile a a daki gibi tan mlanabilir.[14]

(6)

ve daha sonra bu iki do runun dikey ekseni kesti i noktalar bulunur. (7) (8)

Z1- b P1 (1 - P1 ) + Z 1-a P0 (1 - P0 ) (9) nd = P0 - P1

2.

Her rnek ekiminden sonra; belirlenen standard geen birimlerin birikimli toplam n almak

k = yi
i =1

(10)

y i = 1 e er i. rnek standartlar n zerinde ise, y i = 0 di er durumda, n ise bu sreye kadar


ekilen rnek say s n gstermektedir, k n n yeni de erinin daha nce hesaplanan kritik de erler ile kar la t r lmas , H0 hipotezinin kabul veya red edilmesi iin veya rneklemeye devam edilmesi iin.[11] 3. n = 1 de eri ile ba land nda e er

k nM + C A ise rnek ekmeye son verip H 0 : P P0 hipotezini kabul ediyoruz.


Ara t rmaya konu olan oran n P0 oran ndan byk ve P1 oran ndan kk oldu unu onayl yoruz.

n0 =
n=

Z 2 pq e2

sonlu

anaktle iin

dzeltmesi

uyguland ktan sonra oran

rneklem hacmi

n0 eklinde hesaplanmaktad r. Buna n0 - 1 1+ N

0.20 0.25 Red 363 0.25 0.30 Kabul 954 Tablo 3. a = 0.01 b = 0.05 oldu unda P0 ve P1 in e itli oranlar iin SA benzetim sonular

gre e itli hata dzeylerine ve oranlara gre sabit rneklem hacimleri a a daki gibi olmaktad r.

P0 0.10 0.15 0.20 0.25

P1 0.15 0.20 0.25 0.30

Karar Red Red Red Kabul

Hata Oranlar (%) 5 4 3 2 1

Ara t rmaya Konu olan P de erleri(%) 10 15 20 25 30 96 170 343 874 3429 136 239 480 1200 4321 170 298 596 1467 4949 198 348 692 1682 5400 222 388 770 1851 5725

Kullan lan rneklem Hacmi 58 123 287 760

Tablo 4. a = 0.02 b = 0.05 oldu unda P0 ve P1 in e itli oranlar iin SA benzetim sonular Kullan lan rneklem Hacmi 0.10 0.15 Red 55 0.15 0.20 Red 110 0.20 0.25 Red 261 0.25 0.30 Kabul 740 Tablo 5. a = 0.03 b = 0.05 oldu unda P0 ve P1 in e itli oranlar iin SA benzetim sonular P0 P1 Karar Kullan lan rneklem Hacmi 0.10 0.15 Red 48 0.15 0.20 Red 104 0.20 0.25 Red 281 0.25 0.30 Kabul 687 Tablo 6. a = 0.04 b = 0.05 oldu unda P0 ve P1 in e itli oranlar iin SA benzetim sonular P0 P1 Karar Kullan lan rneklem Hacmi 0.10 0.15 Red 45 0.15 0.20 Red 78 0.20 0.25 Red 223 0.25 0.30 Kabul 659 Tablo 7. a = 0.05 b = 0.05 oldu unda P0 ve P1 in e itli oranlar iin SA benzetim sonular VI. Sonular n De erlendirilmesi ve neriler Benzetim sonular ndan elde edilen bilgiler de erlendirilecek olursa, rneklem hacmi a s ndan SA in BR ye gre byk avantajlar ta d grlmektedir. BR tekni i ile oran ara t rmas yap lmak istendi inde %1 lik bir hata pay kullan ld nda rneklem hacminin 5000 civar nda olmas gerekirken, SA de ayn sonuca varmak iin sadece 954 birimin incelenmesi yeterli olmaktad r. Ayn ekilde s ras yla hata oranlar %2, %3, %4 ve %5 iin SA ve BR iin benzetim al mas yap ld nda P0 P1 Karar

Tablo 1. Hata Dzeylerine ve Anaktle Oranlar na Gre Sabit rneklem Hacimleri BR yntemi ile n tane rnek ekildikten ve 100 benzetim dngs yap ld ktan sonraki ara t rmaya konu olan oran n da l m ve gerek orandan(%26.76) fark a a daki tablolarda gsterilmi tir. rnek Elde Fark(%) rnek Elde Fark(%) Hacmi edilen Hacmi edilen Oran(%) Oran(%) 24,21 2,55 26,56 0,20 100 400 28,58 1,82 26,57 0,19 200 500 27,77 1,01 26,85 0,09 300 600 Tablo 2. BS Yoluyla Elde Edilen Benzetim Sonular Sabit rneklem hacmi belirlerken hata dzeyi ve ara t rmaya konu olan anaktlenin oran kullan ld ndan kan sonu anaktle iin bir hata pay ile bir tahmindir. S ral analizde ise hipotezlerimizi a a daki gibi belirleyip rneklem sonucunda hipotezlerin red veya kabulu, karar verirken kullan lan rneklem hacmi gz nnde bulundurulmaktad r. H 0 : P P0 ve H 0 : P P 1 hipotezlerinden birisi kabul edilir veya di eri reddedilir. ki durumunda gerekle memesi halinde sabit rneklem hacmine ula l nca rnekleme durdurularak yine yukar da belirtilen kriterlere gre karar verilir. P0 P1 Karar Kullan lan rneklem Hacmi 0.10 0.15 Red 61 0.15 0.20 Red 138

hata oran artt ka rnek hacimlerinin birbirlerine yak n de erler ald grlmektedir. Uygulama probleminde de grld gibi P0 = 0,25 ve P = 0,30 oranlar 1 al nd nda H0 hipotezi reddedilmemektedir. Gerek oran da zaten %26.76 ile bu aral k ierisindedir. Dolay s yla hata pay n n daha d k olmas gerekti i durumlarda, SA tekni iyle ara t rmalar n yap lmas BR tekni ine gre daha ekonomik olaca grlmektedir. Daha ncede bahsedildi i gibi, BR tekni inde rnek hacmi nceden belirlenip uygulamaya konulaca ndan, hata pay n n d k olmas istenen ara t rmalarda ok byk rnek hacimleri ile kar kar ya kal nmaktad r. Buda byk zaman ve para kayb na neden olmaktad r. SA da ise rnek hacmi nceden belirlenmedi i iin daha az rnek birim ile ayn sonucu elde etme ans bulunmaktad r. SA da ki en kt durum, uzun sre bir karar verilemeyip rnek ekmeye devam etmektir. Burada da en son BR deki rnek hacmine ula l nca rneklemeye yine son verilmektedir. Dolay s yla rnek hacmi a s ndan bak ld nda, SA da al nacak en fazla rnek hacmi BR de ara t rman n ba nda belirlenen rnek hacmine e ittir. YARARLANILAN KAYNAKLAR
[1] Neyran Orhunbilge, rnekleme Yntemleri ve Hipotez Testleri , Avc ol Bas m Yay n, 2000, stanbul. [2] Watanabe Osuma, Sequential sampling technique for algorithmic learning theory , Theoretical Computer Science, 348(2005) [3] Robert Ferber, "Statistical Techniques in Market Research", McGraw-Hill Book Company, INC. New York, 1949. [4] Maxfield, Margaret W., and Joseph Barton-Dobenin, A Sequential Sampling Plan For Determining Market Bounderies , Journal of Small Business Management, July 1980 [5] evrimii: www.clu-in.org/download/stats/vol1soils.pdf Methods for Evaluating the Attainment of Cleanup Standards Volume 1: Soils and Solid Media , United States Environmental Protection Agency, Office of Policy, Planning and Evaluation. February 1989. [6] Denrell, J. and James G. Adaptation as Information Restriction: The Hot Stove Effect Organization Science, Vol. 12, No. 5, September October 2001 [7] Xawier Serpaggi, Bernard Peroche, An adaptive method for indirect illumination using light vectors , Eurographics, 2001, vol.20 no.3

[8] L.D.Maxim, D.E.Cullen and F.X.Cook, Jr., Optimal Acceptance Sampling Plans for Auditing Batched Stop and Go vs. Conventional Single-Stage Attributes Plans , The Accounting Review, January 1976 [9] J. A. Brown, A comparison of two adaptive sampling designs , Australia & New Zeland J. Statistics, 41(4), 1999 evrimii: http://www.itl.nist.gov/div898/handbook/ pmc/section2/pmc26.htm Eri im: 24.09.2006

[10]

[11] Mohammad M.Salehi, George A.F.Seber, Unbiased Estimators for Restricted Adaptive Cluster Sampling , Austral. & New Zeland J. Statistics, 44(1), 2002 [12] Philip Sutton, James VanKirk, Principles of scientific sampling ,Overview, http://www.nysaes.cornell.edu/ ipmnet/sare.mod/ Cornell University [13] Frank Olken, Random sampling from databases , 1993, Doktora tezi, University of California, Berkley. [14] evrimii: http://edis.ifas.ufl.edu/PD006 Determining Sample Size , University of Florida, Eri im:07.03.2007

Latif ZTRK (latifozturk@kku.edu.tr) has Ph.D. of Robust Estimation Techniques in Linear Regression and Their Comparisons at Mimar Sinan University in 2003. His research areas are regression, robust estimators and simulation. Habip KOAK (hkocak@marmara.edu.tr) has Ph.D. of Operational Research at Marmara University. His research areas are Logistics Managemenet, Optimization Theory.

You might also like