Professional Documents
Culture Documents
BYOSTATSTK
Yazarlar
Yard.Do.Dr. Fikret ER (nite 2 , 3 ,8 , 9 ,10)
Yard.Do.Dr. Kadir zgr PEKER (nite 1, 4 , 5 , 6 , 7)
Editr
Yard.Do.Dr. Harun SNMEZ
ANADOLU NVERSTES
Biyoistatistik
ISBN
978-975-06-0620-5
1. Bask
Bu kitap ANADOLU NVERSTES Web-Ofset Tesislerinde 350 adet baslmfltr.
ESKfiEHR, Eyll 2009
iii
indekiler
indekiler
nsz ............................................................................................................ viii
1. NTE
3
3
3
4
4
4
4
4
5
5
5
5
5
6
6
6
7
7
7
8
8
8
8
10
11
12
12
12
12
15
15
16
16
19
19
21
22
22
23
24
24
26
2. NTE
iv
indekiler
Histogram ................................................................................................
Salm Grafii .........................................................................................
zet ...............................................................................................................
Kendimizi Snayalm .....................................................................................
Yaflamn inden ...........................................................................................
Kendimizi Snayalm Yant Anahtar ............................................................
Sra Sizde Yant Anahtar ..............................................................................
Yararlanlan Kaynaklar..................................................................................
3. NTE
Tanmlayc statistikler........................................................... 36
MERKEZ ELM LLER .......................................................................
Aritmetik Ortalama ........................................................................................
Medyan ..........................................................................................................
Mod ................................................................................................................
Geometrik Ortalama......................................................................................
DEfiKENLK LLER.............................................................................
Deiflim Aral ..............................................................................................
Ortalama Sapma ............................................................................................
Varyans ve Standart Sapma ..........................................................................
Deiflkenlik Katsays ....................................................................................
FREKANS DAILIMLARINDA SMETR VE ASMETR................................
Aritmetik Ortalama, Mod ve Medyan Arasndaki liflki...............................
Eiklik Katsays.............................................................................................
CHEBYSHEV TEOREM ................................................................................
zet................................................................................................................
Kendimizi Snayalm......................................................................................
Yaflamn inden............................................................................................
Kendimizi Snayalm Yant Anahtar ............................................................
Sra Sizde Yant Anahtar ..............................................................................
Yararlanlan Kaynaklar..................................................................................
4. NTE
26
28
30
31
32
33
33
35
37
37
40
43
43
44
45
45
46
49
50
50
50
51
52
53
54
54
54
55
57
57
58
58
59
61
61
62
63
65
67
68
68
70
71
74
75
80
indekiler
82
83
83
84
85
rnekleme.................................................................................. 86
RNEKLEMEYE LfiKN TEMEL TANIM VE ..............................................
KAVRAMLAR..................................................................................................
Tam Saym .....................................................................................................
rnekleme Oran ..........................................................................................
rnekleme erevesi ....................................................................................
Ana Ktle Birimi............................................................................................
rnekleme Birimi..........................................................................................
Gzlem Birimi ...............................................................................................
Tahminci ........................................................................................................
RNEKLEMENN AVANTAJLARI..................................................................
RNEKLEME SRECNN ADIMLARI ..........................................................
RNEKLEMEDE HATA KAVRAMI ...............................................................
Sistematik Hata ..............................................................................................
Rassal Hata (rnekleme Hatas) ..................................................................
RNEKLEME YNTEMLER ........................................................................
Olaslkl rnekleme Yntemleri..................................................................
Basit Rassal rnekleme ................................................................................
Sistematik rnekleme ...................................................................................
Tabakal rnekleme......................................................................................
Kme rneklemesi .......................................................................................
Olaslkl Olmayan rnekleme Yntemleri .................................................
Kolayda rnekleme ......................................................................................
Kota rneklemesi .........................................................................................
Kartopu rneklemesi....................................................................................
Karar rneklemesi .......................................................................................
RNEKLEM HACMNN BELRLENMES......................................................
Ana Ktle Ortalamas ve Oran Tahminleri in rneklem Hacminin
Belirlenmesi ...................................................................................................
Maliyet Faktrne Gre rneklem Hacminin ...........................................
Belirlenmesi ...................................................................................................
RNEKLEME DAILIMLARI .........................................................................
MERKEZ LMT TEOREM ...........................................................................
zet ...............................................................................................................
Kendimizi Snayalm .....................................................................................
Yaflamn inden ...........................................................................................
Kendimizi Snayalm Yant Anahtar ............................................................
Sra Sizde Yant Anahtar ..............................................................................
Yararlanlan Kaynaklar..................................................................................
5. NTE
87
87
87
87
87
88
88
88
88
88
89
89
89
90
90
90
91
92
93
94
95
95
95
96
96
96
96
99
99
99
101
105
107
108
108
108
110
6. NTE
vi
indekiler
Yanszlk.........................................................................................................
En Kk Varyans.........................................................................................
Tutarllk.........................................................................................................
Yeterlilik.........................................................................................................
ARALIK TAHMNLEMES ..............................................................................
ANA KTLE ARTMETK ORTALAMASI N GVEN ARALIKLARI .........
Byk rneklemlerde in Gven Aral ...............................................
Kk rneklemlerde in Gven Aral ...............................................
Ana Ktle Ortalamalar Arasndaki Fark in Gven Aral ......................
Ana Ktle Standart Sapmalar 1 ve 2 Biliniyorsa ..............................
Ana Ktle Standart Sapmalar Bilinmiyorsa...........................................
ANA KTLE ORANI N GVEN ARALIKLARI .........................................
Ana Ktle Oranlar Arasndaki Fark in Gven Aral .............................
zet ...............................................................................................................
Kendimizi Snayalm .....................................................................................
Yaflamn inden ...........................................................................................
Kendimizi Snayalm Yant Anahtar ............................................................
Sra Sizde Yant Anahtar ..............................................................................
Yararlanlan ve Baflvurulabilecek Kaynaklar ...............................................
7. NTE
115
115
115
115
116
117
117
119
120
121
121
122
124
125
127
128
129
129
130
133
134
134
135
135
137
138
140
140
140
141
141
143
145
145
146
148
152
154
155
155
156
156
vii
indekiler
9. NTE
179
179
179
180
182
183
184
185
186
189
191
193
194
195
195
195
202
8. NTE
159
160
161
163
163
164
167
169
171
174
175
176
176
177
177
205
207
207
207
209
210
211
216
219
219
10. NTE
viii
indekiler
HACCP ...........................................................................................................
GIDA SANAYSNDE UYGULANACAK KALTE KONTROL
PARAMETRELER ............................................................................................
zet ...............................................................................................................
Kendimizi Snayalm .....................................................................................
Yaflamn inden ...........................................................................................
Kendimizi Snayalm Yant Anahtar ............................................................
Sra Sizde Yant Anahtar ..............................................................................
Yararlanlan ve Baflvurulabilecek Kaynaklar ...............................................
220
223
224
225
226
227
227
228
nsz
nsz
Anadolu niversitesi Ak retim Fakltesi nlisans Programlarndan olan Gda
Kalite Kontrol ve Analizi nlisans Programnda yrtlecek olan Biyoistatistik
dersi iin hazrlanan bu kitap on niteden oluflmaktadr.
Bu kitapta Biyoistatistiin temel konular, teorik anlatmdan kanlarak ele
alnmfltr. Konularn anlatmnda uygulamaya arlk verilmifltir. Her nitenin
baflnda yer alan Amalar ve Anahtar Kavramlar, rencilerin ilgili niteden ele
edecekleri kazanmlar gstermektedir. renciler, nitelere alfltktan sonra bu
kazanmlar elde edip etmediklerini ilgili Amalar ve Anahtar Kavramlar yardmyla
kolaylkla sorgulayabilecektir. Her nite iinde yer alan Sra Sizde sorular, niteyi
okuyan rencilerin alfltklar konuyu kavrayp kavrayamadn anlamak iin
verilmifltir. nite sonunda yer alan Kendimizi Snayalm ksmnda renciler, ilgili
nitede rendiklerinin kk bir snamasn yapabileceklerdir. renciler,
Hayatn inden ksmyla ilgili nitedeki konunun gerek hayatta nasl bir rnekle ortaya ktn anlayabilecektir.
rencilerin bu kitaba alflrken konuyla ilgili problemleri nasl zeceine
ynelik deil, konular iyice kavrayp, anlamaya ynelik alflmalar yapmas gelecekte karfllaflacaklar problemlerin zmnde ok daha etkili olacaktr.
Bu kitabn meydana gelmesi iin, kitap ekibinin oluflturulmas ve bu ekibin
alflmalarnn yrtlmesinde her trl imkan salayan Anadolu niversitesi
Rektr Prof. Dr. Fevzi SRMELye, Ak retim Fakltesi Dekan Prof. Dr.
Aydn Ziya ZGRe ve Genel Koordinatr Prof. Dr. Levend KILIn flahsnda
kitabn hazrlanmas iin emei geen alflanlara, editr ve yazarlar olarak teflekkr
ederiz.
Editr
Yard.Do.Dr. Harun SNMEZ
ix
BYOSTATSTK
Amalarmz
N
N
N
Anahtar Kavramlar
statistik
Biyoistatistik
Birim
Ana ktle
Deiflken
fik
rneklem
Parametre
rnekleme
lme ve lek
erik Haritas
Biyoistatistik
Temel Kavramlar
ve Tanmlar
STATSTK VE BYOSTATSTK
BYOSTATSTE LfiKN
TEMEL KAVRAMLAR
LME VE LEKLER
Temel Kavramlar ve
Tanmlar
STATSTK VE BYOSTATSTK
statistik
statistik kelimesi, gnlk hayatta sklkla yanlfl kullanlmasna ramen, herkesin
az ok fikir sahibi olduu bir bilim daln ifade etmede kullanlr. Bu nedenle de,
bu konuda yazlan kaynaklarn hemen hepsinde ayr bir istatistik tanm bulunmaktadr. adafl anlamda istatistik; doadaki deiflkenlikten ortaya kan saysal
verilerin incelenmesine iliflkin bilimsel alflmalarn btn olarak tanmlanabilir.
Daha ayrntl bir tanm vermek gerekirse, istatistik; belirli bir ama iin birimlerin saylabilir ya da llebilir zellikleri ile ilgili bilgilerin, baflka bir ifadeyle verilerin toplanmas, toplanan verilerin ak ve anlafllr biimde dzenlenerek tablo
ve grafiklerle gsterilmesi, verilerin elde edildii topluluu zet olarak belirten deerlerin hesaplanmas, verilerin analizi, elde edilen sonularn yorumlanmas, uygun kararlar alnmas ve genellemeler yaplmas ile uraflan bir bilim daldr.
statistik bilim dal bu ifllemlerin tesinde, saysal bilgiler arasnda karfllafltrmalar yaparak, incelenen zelliklerin birbirleri ile iliflkilerini belirleyerek ya da gelecee ynelik tahminlerde bulunmak zere eldeki saysal verileri istatistiksel analize tabi tutarak irdelenmesini ve yorumlanmasn salayan, dier btn bilim dallarna yardmc yntemler topluluudur.
Birtakm ortak ynleri bulunmakla birlikte genellikle aralarnda nemli farkllklarn bulunduu olaylara kollektif olay denir. Kollektif olaylar istatistiin konusunu oluflturur.
Btn canl varlklar ve bu varlklarn yaflayfllarna iliflkin olaylar genellikle
kollektif nitelik taflrlar.
Biyoistatistik
Biyoistatistik; istatistiksel yntemlerin, biyolojik ve salk olgular ile ilgili problemlerin zmnde kullanlmas olarak tanmlanabilir. Bilgilerin toplanmas, snflandrlmas ve sunulmas tekniklerini ieren, toplum parametrelerini tahmin eden ve
olgularn nedenlerine iliflkin doru kararlarn alnmasna yardmc olan, istatistik
biliminin bir daldr.
Biyoistatistik bilim dal, betimsel (tanmlayc biyoistatistik) ve zmsel (analitik
biyoistatistik) olmak zere iki ana blme ayrlabilir:
Biyoistatistik: statistiin
biyolojik arafltrmalarda
uygulanmas yntemlerini
ierir.
Biyoistatistik
Bir arafltrmada hakknda bilgi edinilmek istenilen, zerinde zellikleri ile ilgili lm, saym ya da gzlemlerin yaplabildii canl, cansz varlklar veya olaylarn her
birine birim ad verilir. statistikte bir olgunun birim olarak kabul edilebilmesi
iin, saylabilir ya da llebilir zellikleri bulunmas gerekir.
rnein; belirli bir hastala yakalanan ve tedavi amacyla hastaneye baflvuran
hastalarn incelendii bir arafltrmada her hasta birer birimdir. Belli bir flehirdeki
hastanelerde bulunan ortalama yatak saysnn belirlenmek istenildii bir arafltrmada, her hastane birer birimdir. Uak kazalarnn olufl nedenlerine iliflkin bir arafltrmada ise her bir uak kazas bir birim olarak alnabilir. Birinci rnekte tanmlanan birim canl varlk, ikinci rnekteki birim cansz varlk ve son rnekteki birim
ise bir olay olarak karflmza kar.
Ayrca, belli bir ama iin arafltrma biriminden elde edilen saysal bilgilere veri
ad verilir. Veriler llebilir, saylabilir ya da sralanabilir zellikler taflrlar. Biyoistatistiksel bir arafltrmada gerekli verileri elde etmenin eflitli yollar vardr. En sk
baflvurulan veri elde etme yntemleri arasnda; yazl kaynaklar ya da daha nce tutulmufl kaytlardan yararlanarak, gzlem yntemiyle, anket yntemiyle ve deneysel
yntemlerle veri elde etme yntemleri bulunur.
statistik biliminde genellikle birimler topluluu ya da grubu ile ilgilenilir. Dolaysyla, arafltrma yaplabilmesi iin tek bir veri deil, belli miktarda veri toplanmas gerekir. Buna gre, tek bir canldan elde edilen lm ya da tek bir biyokimyasal test sonucu elde edilen veri biyoistatistiin ilgi alan deildir. Birka canldan
rnek toplanmadka ya da belli sayda test uygulanmadka, biyoistatistik yntemlerinin herhangi bir deeri yoktur.
Ana Ktle
Ana ktle: Arafltrma
yaplacak toplumun tmne
verilen addr.
Ana ktle kavram, sonlu ve sonsuz ana ktle olmak zere iki flekilde ortaya
kabilir.
Deiflken
Birimlerin sahip olduklar ve birbirlerinden ayrt edilmelerini salayan zelliklere
deiflken ad verilir. Bu zellikler birimden birime farkl deerler alabilen ve llebilen zelliklerdir.
rnein; insanlar zerinde yaplan bilimsel deney alflmalarnda, gzlem sonucu zerinden bilgi toplanan her insan bir birimdir. Bu insanlarn kaydedilen verileri arasnda rnein yafl, cinsiyet, arlk, boy gibi zellikleri ise birer deiflkendir. statistiksel arafltrmalarda, ilk olarak temel birimin, ana ktlenin, llecek
zelliklerin ve deiflkenlerin tanmlanmas ok nemlidir. Deiflkenler genellikle
X,Y,Z,... gibi harflerle gsterilirler.
Deiflken kavram, nitel (kategorik) ve nicel deiflkenler olmak zere iki flekilde incelenebilir:
Nicel Deiflkenler
Belli bir deiflkenin ortaya kfl biimi rakamla ifade edilebilen deiflkenlere nicel
deiflken denir. Nicel deiflkenlerin alaca deerler, bir lm sonucunda ya da
deiflkenin zelliine gre sralama sonucunda belirlenir. Vcut arl, vcut scakl, yafl gibi deiflkenler nicel deiflken grubuna girerler.
Nicel deiflkenler, kesikli ve srekli deiflkenler olmak zere iki gruba ayrlabilir:
Kesikli Deiflkenler
Alaca deerler tamsay olarak belirtilebilen deiflkenlerdir. Bu nedenle, kesikli
deiflkenlerin ondalkl deerler almas sz konusu deildir ve genellikle nitel deiflkenlerin ounluu kesikli deiflken zellii taflrlar. Salk bilimlerinde sk karfllafllan kesikli deiflkenlere rnek olarak, belli bir canl trnn yavru says, belli bir blgedeki mikroorganizma ya da hayvan kolonisi says ya da belli bir arazide yetiflen bitki trleri verilebilir.
Biyoistatistik
Srekli Deiflkenler
Say dorusu zerinde kesirli ondalk saylar halinde ifade edilebilen deiflkenlerdir. Srekli deiflkenler lm sonucunda elde edildikleri iin, bir veya birden fazla aralkta ve sonsuz sayda deer alabilir. Srekli deiflkenler genellikle nicel zellik taflrlar. Salk bilimlerinde zerinde alfllan birok srekli deiflken tr bulunmaktadr. rnein, uzunluk, alan, hacim, arlk, scaklk, zaman periyodu,
oran gibi birok deiflken srekli deiflken trne dahildir.
fiekil 1.1
Deiflken Tipleri
Deiflken Tipleri
Nitel
Cep telefonu markas
Gz rengi
Cinsiyet
SIRA SZDE
D fi N E L M
Kesikli
Srekli
ocuk says
Yumurta says
Gelir
Uzunluk
Bir hastanenin
servisine bir gn ierisinde baflvuran hastalara iliflkin kaydedilebilecek
SIRAacil
SZDE
deiflkenleri belirleyiniz ve bu deiflkenlerin trlerini belirtiniz.
fik
D fi N E L M
Belli bir deiflkenin ortaya kfl biimlerine flk ad verilir. rnein, eitim durumu
O R U okur-yazar deil, ilkretim, orta retim, yksek retim ya
deiflkenininS flklar;
da lisansst eitim olacaktr. Doum tr deiflkeninin flklar; canl doum ya da
l doum olarak
D K K A Ttanmlanabilir.
S O R U
DKKAT
SIRA SZDE
Nicel
rneklem
N N
K T A P
TELEVZYON
SIRA SZDE
Bir ana ktledeki btn birimlere ulafllamadnda, ana ktleyi temsil etmek zere daha az sayda birim alarak oluflturulan alt kmeye rneklem denir. ncelemeler bu rneklem
zerinden yaplr. statistikte rneklemden yararlanlarak ana ktAMALARIMIZ
leye iliflkin tahmin ve genelleme yaplmas ok nemlidir. Bu ifllemleri yaparken
belli kurallara uyma zorunluluu vardr. yi bir rneklem ana ktle ile ayn zellikK T yan
A P sra, ana ktleyi doru flekilde yanstabilmelidir.
leri taflmasnn
Ana ktleden belli yntemlerle ekilen bir rneklemdeki toplam birim says n
harfi ile gsterilir (n<N).
TELEVZYON
Parametre
NTERNET
Herhangi bir deiflken incelenirken, ana ktledeki btn birimlerin ele alnarak, ilgilenilen deiflkenin
incelenmesi sonucunda hesaplanan saysal ya da oransal deNTERNET
erlere parametre ad verilir. Parametre, ana ktle zelliklerinin almfl olduu saysal deerleri ifade eder. karmlarda parametreler genel olarak simgesi ile belirtilir. statistikte en sk kullanlan parametreler, ana ktle aritmetik ortalamas
ve ana ktle varyans 2dir.
rnek olarak; Trkiyede 2008 ylnda ilk kez evlenen bayanlarn evlenme yafl ortalamas 19,2dir. denildiinde, bu deer ilgili ylda ilk kez evlenen tm bayanlarn evlenme yafllar elde edilerek hesapland iin bir parametredir.
statistik
Ana ktleyi temsil eden rneklemlerden alnan ve ilgilenilen deiflkene iliflkin
hesaplanan tanmlayc llere istatistik ad verilir. rneklem istatistii, ana
ktle parametresinin bir tahminidir ve karmlarda genel olarak ! simgesi ile
gsterilir. En sk kullanlan istatistikler, rneklem aritmetik ortalamas X ve rneklem varyans s2dir.
SIRA
SZDE tm renAnadolu niversitesine 2009-2010 retim yl Gz dneminde kayt
yaptran
ciler bilgi formu doldurmufltur. Rassal olarak seilen 180 form incelenmifltir. Formlarda
Ailenizin aylk geliri, Ailenizde yaflayan fert says, Ailenizin yaflad il sorular buD fi N E L M
lunmaktadr. Bu arafltrma iin, birimi, ana ktleyi, rneklemi ve deiflkenleri tanmlaynz.
rnekleme
S O R U
statistik: rneklem
deerlerinden hesaplanan
zet deerlerdir.
SIRA SZDE
D fiktleden
NELM
rnekleme: Ana
rneklem seme amacyla
uygulanan yntemlerin
btnne verilen addr.
S Onemli
R U
statistikte yaplan
ifllevlerden birisi, rnekleme
teknii kullanlarak seilen
rneklemden elde edilen
D K ana
KAT
istatistik yardmyla
ktle parametresinin tahmin
edilmesidir. Yaplan tahmin
belli miktarda hatay da
SIRA Tahmin
SZDE
beraberinde getirir.
srecinde bu hata payna
dikkat edilmelidir.
N N
AMALARIMIZ
fiekil 1.2
rnekleme Tanm
Ana Ktle
K T A P
T E L E Vrneklem
ZYON
K T A P
TELEVZYON
rnekleme
NTERNET
LME VE LEKLER
Birimlerin sahip olduu zelliklerin derecesinin belirlenerek, sonularn saysal
olarak ifade edilmesine lme ad verilir. Dier bir deyiflle, gzlem ya da deney sonucunda elde edilen verilerin nicel olarak belirtilebilmesi amacyla lmeye baflvurulur. Sonu olarak lmede bir tanmlama sz konusudur ve lmenin hangi
lek ile yaplarak deerlendirildii nemlidir. rnek olarak, bir markette satlan
rnlerin trlerine gre snflanmas, market alflanlarnn ynetim katndan en alt
alflanna kadar sralanmas, market alflveriflinde satn alnacak bir rnn arlnn llmesi ve alflanlarn aylk performanslarna gre deerlendirilerek ll-
NTERNET
Biyoistatistik
lek Trleri:
Snflayc lek
Sralayc lek
Aralkl lek
Oransal lek
mesi ifllemlerinin tamamnda bir lme ifllemi vardr. Bu lme ifllemleri arasndaki fark, her birinde kullanlan leklerin farkl olmasdr. Burada lek kavram;
lmeye konu olan zelliklerin snflanmas, sralanmas, derecelenmesi ya da miktar ve derecelerinin belirlenebilmesi iin uyulmas gereken kurallarla kstlamalar
belirleyen lme arac olarak tanmlanr (Gltekin, 2001, syf.211).
Yukarda verilen rnekler dorultusunda, lmede kullanlan lekler snflayc lek, sralayc lek, aralkl lek ve oransal lek olarak drt farkl flekilde
ortaya karlar.
Snflayc lek
Birimlerin sahip olduklar zelliklere iliflkin olarak belli snflara ayrlmasnda kullanlan lek trdr. Bu lekte lme, eflit olup olmama ile iliflkilidir. Snflayc
lekler, gzlem deerlerinin tek tek nitel kategori ya da snflara atanmas sonucu oluflan lektir. Yukarda verilen bir markette satlan rnlerin trlerine gre snflanmas rneinde, snflayc lek kullanlr. Cinsiyet snflamas veya hastaneye baflvuran hastalarn rahatszlklarna gre snflandrlmas, snflayc lee rnek olarak verilebilir.
Sralayc lek
Birimlerin sahip olduklar zellik says ya da derecesi bakmndan sraya dizilmesinde kullanlan lek trdr. Bu sralamada stn olma ya da eflit olma ls
birlikte deerlendirilir. Yukarda verilen market alflanlarnn ynetim katndan en
alt kademeye kadar sralanmas rnei, sralayc lee rnek olarak verilebilir.
alflanlarn konumlar arasnda, bir baflka alflana gre daha yksek nvan ya da
kdem ynnden derecelendirme sz konusudur. Bunun yannda, ayn nvana ya
da kdeme sahip kifliler arasnda ise eflit leklendirmeden sz edilebilir. Snflayc lekte, lme yalnzca eflitlik lsne dayandrlyordu. Sralayc lek ise,
hem eflitlik hem de sralama lsn kullandndan, snflayc lei de kapsar.
Sralayc lee baflka bir rnek olarak, rencilerin niversite bitirme dereceleri
ynnden sralanmas verilebilir.
Aralkl lek
Sralayc leklerde olduu gibi, aralkl lekte de birimler belli bir zellie gre
sralanr. Aralkl lein sralayc lekten temel fark ise; lmn bir bafllang,
bir bitifl noktasnn olmas ve ilgili bir l biriminin kullanlmasdr. Bu bafllang
ve bitifl noktalarnn bulunmasndan dolay lek, aralkl lek adn almfltr. Aralkl lek saysal olarak ifade edilebilen ve hem snflayc hem de sralayc lekleri kapsayan bir lek trdr. Aralkl lee verilebilecek en basit rnek, scaklk lleridir. Aralkl leklerden elde edilen lm sonular zerinde bir takm
aritmetik ve istatistiksel ifllemler yaplabilir.
Oransal lek
lm sonular, hem snflayc, hem sralayc, hem de aralkl leklerinin zelliklerini salyor, ayn zamanda bu sonularn oranlar da hesaplanabiliyor ise, kullanlabilecek en iyi lek oransal lektir. Oransal lein aralkl lekten en
nemli fark; sabit bir bafllang noktasnn bulunmasdr. Bu leklerdeki bafllang noktasnn sabit olmas, lmlerin oransal karfllafltrlmasna imkan tanr. Ayrca oransal lekte standart l birimleri kullanlr. En temel oransal lekler,
uzunluk ve arlk lleridir.
fiekil 1.3
lek Trleri
lek Trleri
Snflayc
Sralayc
Aralkl
Oransal
Veri sadece
snflara
ayrlabilir.
Veri snflar
anlaml
sralamaya
sahiptir.
lmn bir
bafllang ve bir
bitifl noktas
vardr.
Bafllang noktas
sabit ve lmler
oransal olarak
karfllafltrlabilir.
Araba markas
Gz rengi
Snf listesindeki
renci sras
Scaklk
Tedavi edilen
hasta says
SIRA SZDE
D fi N E L M
D fi N E L M
S O R U
S O R U
DKKAT
DKKAT
SIRA SZDE
AMALARIMIZ
N N
SIRA SZDE
AMALARIMIZ
K T A P
K T A P
TELEVZYON
TELEVZYON
NTERNET
NTERNET
10
Biyoistatistik
zet
N
A M A
N
A M A
N
AM A
11
Kendimizi Snayalm
1. Belli bir zellie ait saysal bilgileri derleyerek, bunlar dzenlemelere tabi tutarak tablolar halinde sunan
ve bu saysal bilgilerden zet deerler elde edilmesini
salayan teknikler topluluuna ne ad verilir?
a. Parametre
b. rneklem
c. statistik
d. Ana ktle
e. Matematik
2. Afladakilerden hangisi istatistikte ilgilenilen konulardan biri deildir?
a. Saysal bilgiler arasnda karfllafltrma yapmak
b. ncelenen zelliklerin birbiriyle iliflkisini belirlemek
c. Elde edilen verileri deifltirmek
d. Gelecee ynelik tahminlerde bulunmak
e. Verileri analize tabi tutarak incelemek
3. Biyolojik ve salk olgular ile ilgili bilgilerin toplanmas, snflandrlmas ve sunulmas yntemlerini ieren, ana ktle parametrelerini tahmin eden ve olgularn
nedenlerine iliflkin doru kararlarn alnmasna yardmc olan bilim dalna ne ad verilir?
a. Tanmlayc istatistik
b. Biyoistatistik
c. Deneysel istatistik
d. Betimsel istatistik
e. zmsel istatistik
4. Eskiflehir ilinde bulunan eczanelere iliflkin istatistiksel bir arafltrma planlanmaktadr. Bu arafltrmadaki birim afladakilerden hangisi olabilir?
a. Eskiflehir ilinde bulunan eczanelerin her biri
b. Eskiflehir ilinde bulunan eczanelerden oluflan
topluluk
c. Eskiflehir ilinde bulunan eczanelerin toplam says
d. Eskiflehir ilinde bulunan tm eczanelerin listesi
e. Eskiflehir ilinde alflan eczaclarn oluflturduu
topluluk
5. ncelenecek konuya iliflkin ortak zellikler gsteren,
bilinen canl ve cansz birimlerin oluflturduu toplulua
ne ad verilir?
a. Ana ktle
b. rneklem
c. Deiflken
d. Birim
e. Parametre
12
Biyoistatistik
Yaflamn inden
Kalp hastalklar konusunda ihtisasn yapmfl bir uzman doktor, bulduu yeni bir ilacn, kalp ritim bozukluu bulunan hastalarda kalp atfllarn dzenlemeye etkisini arafltrmak istemektedir. Bu doktor alannda tannmfl bir doktor olmak istedii iin, ilacn gelecekte
de ila tedavisi grmesi muhtemel tm kalp hastalarnda kullanlmasn hedeflemektedir. Bu amala, setii
krk kalp hastasnn tedavisinde bu ilac kullanmfl ve
bu hastalarn kalp ritimlerini lmlemifltir. Arafltrmada
rneklemi oluflturan bu krk hastada ilacn ritim dzenlemede olumlu etkilerini gzlemledikten sonra, doktorun elde ettii bulgular, bu ilacn gelecekte de kalp ritim bozukluu olan hastalar zerinde benzer olumlu
etkiler yaratacan, sonu olarak ilacn tedavide kullanlan dier ilalara oranla daha ok tercih edilen bir ila
olabileceini gstermifltir.
Bu arafltrmada kalp ritim bozukluu bulunan her bir
hasta bir birimi, bu hastalarn oluflturduu topluluk ise
ana ktleyi temsil eder. Seilen krk adet hasta ise rneklemi oluflturur. Hastalarn kalp ritim lm sonular ise kaydedilen deiflken olarak tanmlanr. Bu deiflken nicel ve srekli bir deiflkendir.
Sra Sizde 1
Hastann cinsiyeti (nitel deiflken), hastann yafl (srekli ve nicel deiflken), hastann boyu (srekli ve nicel
deiflken), hastann arl (srekli ve nicel deiflken),
hastann flikayet sebebi (nitel deiflken), hastann servise kanc kez baflvurduu (kesikli ve nicel deiflken)
gibi deiflkenler kaydedilebilir.
Sra Sizde 2
Bu arafltrmada; Anadolu niversitesine 2009-2010 retim yl Gz dneminde kayt yaptran her bir renci bir arafltrma birimidir. Anadolu niversitesine 20092010 retim yl Gz dneminde kayt yaptran rencilerin tamam ana ktleyi oluflturur. Bu ana ktleden
rassal olarak seilen 180 renciden elde edilen formlar rneklemi oluflturur. Arafltrmada, adet deiflken
bulunmaktadr. Bu deiflkenler ve trleri Ailenin aylk
geliri: Srekli ve nicel deiflken, Ailede yaflayan fert says: Kesikli ve nicel deiflken, Ailenin yaflad il: Nitel
deiflken olarak belirlenebilir.
Sra Sizde 3
Snflayc lek kullanlr. Snflayc lek eflit olup olmamaya iliflkindir. Burada ilkokul rencilerinin sadece verem afls olup olmamalarna gre bir snflama sz
konusudur. Bir rencinin bir dierine gre arafltrlan
konuda herhangi bir stnlk derecesi bulunmadndan, ya da yaplan ifllemde herhangi bir lm yaplmadndan dolay sralayc lek, aralkl lek veya
oransal lek kullanlamaz.
Yararlanlan Kaynaklar
Dodge, Y. (2003). The Oxford Dictionary of Statistical Terms, Oxford University Press.
Gltekin, M. (2001). retimde Planlama ve Deerlendirme, Eskiflehir: Anadolu niversitesi Akretim Fakltesi Yayn No:716.
Sarabafl, T., Kutsal, A. (1987). Betimsel statistik,
Ankara: H.. Fen Fakltesi Yaynlar.
Serper, . (2000). Uygulamal statistik I, Bursa: Ezgi
Kitabevi.
Sokal, R.R., Rohlf, F.J. (1981). Biometry, W.H. Freeman and Company, New York.
Yzer, A.F. (2007). statistik, Eskiflehir: Anadolu niversitesi Akretim Fakltesi Yayn No:771.
BYOSTATSTK
Amalarmz
N
N
N
Anahtar Kavramlar
Frekans serisi
Sturges kural
Gruplandrlmfl frekans serisi
Stun grafii
Pasta grafii
Pareto grafii
Histogram
Kontenjans tablosu
erik Haritas
Biyoistatistik
Frekans Dalmlar
ve Grafikler
VERNN DZENLENMES
VERNN GRAFKSEL GSTERM
Frekans Dalmlar ve
Grafikler
VERNN DZENLENMES
Farkl kaynaklardan elde edilen verinin daha dzenli bir flekilde sunulmas ve eflitli
istatistiksel hesaplamalara hazr durama getirilmesi gereklidir. Bu amala, elde edilen
veri basit seri, frekans serisi veya gruplandrlmfl seri fleklinde dzenlenebilir
Basit Seri
Arafltrmaclar, arafltrmalarnda ilgilendikleri deiflken ya da deiflkenlerin aldklar deerleri arafltrma sresince derleyerek kendilerince uygun bir ortamda kayt
ederler. Baz durumlarda arafltrmac elde ettii deney sonularn o anda yannda
bulunan not defterine kayt ederken, dier durumlarda lm cihaznn verdii sonular direk olarak bir bilgisayar dosyasna kayt edebilir. Deney ve arafltrma sonucunda elde edilen ve ilgilenilen deiflkenin herhangi bir zelliine gre sralanmfl veri kmesine basit seri ad verilir. Basit seri, zerinde analizler yaplacak
olan verinin kkten bye veya bykten ke doru sralanmfl durumudur. eflitli kriterlere gre farkl basit serilerin oluflturulmas sz konusu olabilir.
Biyoistatistiin genel konusu ierisinde basit seriler genellikle nicel deiflkenlerin
sonularn ierebilecei gibi nitel de53
71
80
84
88
iflkenlerin sonularn da ierebilir.
Tablo 2.1.de belirli bir blgede hiz53
71
80
84
90
met vermekte olan 50 adet lokantann
66
72
80
84
90
yerel belediye salk ekipleri tarafndan
66
72
80
85
90
yrtlen son salk denetiminde 100
66
72
80
85
90
zerinden aldklar puanlar, kkten
bye doru sralanarak basit seri flek67
76
80
85
90
linde gsterilmifltir. Bu salk denetle67
76
80
85
90
mesinde elde edilebilecek en yksek pu71
76
80
88
95
an 100, temizlik ve hijyeni gsterirken; 0
71
76
80
88
95
puan temizlik, salk ve hijyen koflullarna uyulmadn gstermektedir.
71
76
84
88
95
Tablo 2.1., yaplan salk denetimi
sonucunda elde edilen en yksek puann 95 ve en kk puann ise 53 olduunu gzlemleme flans vermektedir. Fakat
Tablo 2.1. dikkatle incelendiinde baz gzlem deerlerinin birden fazla sayda
tekrarland grlmektedir. Bu aflamada hazrlanan basit seri, tekrarl gzlemlerin
hangilerinin olduu ve kaar kez tekrarlandnn grlebilecei yeni bir dzenlemeye tabii tutulabilir.
Tablo 2.1.
Lokanta Hijyen
Puan Verisi
16
Biyoistatistik
Frekans Serisi
Tablo 2.2.
Lokanta Hijyen
Puan Frekans Serisi
Herhangi bir arafltrma da elde edilen sonularn, ilgilenilen deiflkenin ald birbirinden farkl deerlerinin tekrarlanma saylarn da gsterecek flekilde dzenlenmifl
haline frekans serisi ad verilir. Frekans serilerinde birbirinden farkl olarak ortaya kan sonularn tekrar saylarna frekans ad verilir. Frekans serilerinde ncelikle
birbirinden farkl olarak ortaya kan
Puan
Frekans
deerler belirlenerek bir stunda alt
alta sralanr, daha sonra her bir deer
53
2
iin kaar adet gzlem olduu sayla66
3
rak ilk stunun yannda oluflturulan
67
2
ve frekans ad verilen stuna yazlr.
71
5
Tablo 2.1.de verilen 50 lokanta dene72
3
tim verisi iin oluflturulan frekans seri76
5
si Tablo 2.2.de verilmifltir.
80
9
Tablo 2.2. incelendiinde bu de84
4
netleme sonucunda 3 adet lokantann 95 puan ald ve 2 adet lokanta85
4
nn da en dflk deer olan 53 pua88
4
n aldklar gzlemlenmektedir. Ek
90
6
olarak en yksek frekans deeri 9
95
3
lokanta iin 80 puan olarak ortaya
Toplam
50
kmfltr.
Gruplandrlmfl frekans
serisi frekans serilerinin her
satrnn bir aralk
yardmyla temsil
edilmesidir.
Tablo 2.3.
Lokanta Hijyen
Puan in rnek
Gruplandrlmfl
Frekans Serisi
Frekans serisi basit seri gsterimine gre verinin ok daha zet bir flekilde gsterilmesinde yardmc olmaktadr. Fakat bir ok arafltrmada ilgilenilen deiflkenden
elde edilen birbirinden farkl sonu says arttka frekans serisindeki kategori says yani satr says da artmaktadr. Birbirinden farkl kategori, sonu ya da satr saysnn artmasyla frekans serisinin anlafllabilirlii azalabilir. Bu problemi ortadan
kaldrabilmek iin sonularn gsteriminde yeni bir dzenlemeye gidilebilir. Hatrlanacak olursa frekans serisi oluflturulurken birbirinden farkl her bir gzlem deeri ve bu gzlem deerine ait sayma yoluyla hesaplanan tekrar says iin frekans
deeri olacak flekilde dzenleme yaplmflt. Frekans serilerinin her bir satr belirli bir aral temsil edecek flekilde dzenlenebilir. Birbirinden farkl olarak ortaya
kan tm sonularn tekrar saylar yerine bu sonularn belirli aralklara ya da snflara blnmesi ve her aralkta ya da snfta yer alan birim says frekanslar oluflturacak flekilde yeniden dzenlenen frekans serisine gruplandrlmfl frekans
serisi ad verilir. Tablo 2.3.de lokanta hijyen puan veri seti iin rnek gruplandrlmfl frekans serisi verilmifltir.
Gruplandrlmfl frekans serisi olufltuPuan Snflar
Frekans
rulurken snflarn dzenlenmesine ait ke50 - 60
2
sin bir kural yoktur. Bu ifllemin gereklefltirilmesi iin birok teknik kullanlmakta60 - 70
5
dr. Sklkla kullanlmakta olan teknik Stur70 - 80
13
ges kural olarak bilinen tekniktir. Tekni80 - 90
21
in nasl yrtleceini incelemeden nce bir gruplandrlmfl frekans serisinin bi90 - 100
9
leflenlerini izleyen flekilde sralayabiliriz.
Toplam
50
17
Snflar: Bir alt ve bir de st limit olacak flekilde her bir satrda yer alan
aralklar,
Snf aral: Bir snfn alt ve st limiti arasndaki fark,
Toplam frekans: N, arafltrmada yer alan birim saysdr.
Kesikli deiflkenler iin gruplandrlFrekans
Mflteri Says
mfl frekans serisi oluflturulurken izlenecek genel ilke snf st snrlarna eflit
0-4
170
olan gzlem birimlerinin o snfa ait bi5-9
140
rimler olarak gsterilmesidir. rnein se10 - 14
30
ne boyunca hi ara vermeden alflan bir
15 - 19
15
lokanta, kapanfl saati olan 22:30u daha
20 - 24
10
ne alabilmek iin her gece saat 21:00
Toplam
365
ile 22:30 arasnda gelen mflteri says istatistiini bir sene sresince kaydetmifltir. Mflteri says kesikli bir deiflkendir. Lokanta tarafndan toplanan gecelik mflteri says deerleri Tablo 2.4.de gruplandrlmfl frekans serisi olarak sunulmufltur.
Tablo 2.4.deki gibi kesikli deiflkenler ile alflldnda her snfta yer alacak
birim says hesaplanrken snf st limitlerinde yer alan gzlem birimlerinin o snfa ait olduklar sylenir. Lokanta gecelik mflteri says veri setinde mflteri saysnn 4 olduu geceler ilk snfta yani toplam 170 gecenin olduu snfta saylmaktadr. Ayn flekilde 14 mflterinin olduu geceler 3. snfta yer almaktadr ve bu snfnda frekans 30dur.
Srekli deiflkenler iin gruplandrlmfl frekans serisi oluflturulurken izlenecek
genel ilke ise snf st snrlarna eflit olan gzlem birimlerinin bir sonraki snfa dahil edilmesidir. Srekli deiflkenler iin oluflturulan gruplandrlmfl frekans serilerinde ilk snfn st snr bir sonraki snfn alt snr olarak ele alnr. Eer bir gzlem deeri herhangi bir snfn st snrna eflit bir sonu deerine sahip ise bu gzlem izleyen snfn frekansna dahil edilir. Tablo 2.3.de verilen gruplandrlmfl seri bu duruma bir rnek olarak gsterilebilir. Tablo 2.3. oluflturulurken ilk snfn st
snrna eflit deerler alan lokantalar, 60 puan alan lokantalar, ikinci snfn frekanslarna eklenmifllerdir.
Kesikli ve srekli deiflkenler iin gruplandrlmfl frekans serilerinin gsterim
flekillerini ele aldktan sonra alnmas gereken karar bu snflarn nasl oluflturulacadr. Snf aralnn belirlenmesi, ilk adm oluflturmaktadr. Snf aral iin
Sturges kural izleyen eflitlik yardmyla hesaplanabilir.
Snf aral =
Eflitlikte yer alan N, toplam frekans temsil etmektedir. Sturges kural yardmyla elde edilen sonu genellikle uygun en yakn deere yuvarlanr.
Snf aralnn tespitinden sonra gruplandrlmfl frekans serisi oluflturulabilir.
lk olarak birinci snfn bafllang deerine karar verilir. Birinci snfn bafllang
deeri veri ierisinde yer alan en kk gzlem deerine eflit veya daha kk olabilecek ve gruplandrlmfl serinin anlafllmasn kolaylafltracak bir rakam olarak
belirlenir. rnein en kk gzlem birimi 11e eflit ise ilk snfn alt limiti olarak
10 alnabilir. Daha sonra Sturges kural yardmyla elde edilen ve en yakn bir st
tamsayya yuvarlanan snf aral deeri kullanlarak snflar oluflturulur. Eer snf
aral Sturges kural ile 4,87 olarak bulunmufl ise 5e yuvarlanr ve ilk snf alt de-
Tablo 2.4.
Bir Lokantann
Gecelik Mflteri
Says
Gruplandrlmfl
Frekans Serisi
Sturges kural
gruplandrlmfl frekans
serisi snf aral hesabnda
kullanlr.
18
Biyoistatistik
erine eklenir. rnein ilk snf alt limiti 10 olarak tespit edildi ise bu snfn st limiti 10 + 5 = 15 olacaktr. Deiflkenin kesikli ya da srekli olmasna dikkat edilerek dier snflarda en son snf verideki en byk deeri kapsayncaya kadar oluflturulur. Daha sonra her snf ierisinde kaar birim olduu saylarak gruplandrlmfl frekans serisi oluflturulur.
Tablo 2.2.de gsterilen lokanta hijyen puan frekans serisi iin Sturges kural
uygulanarak gruplandrlmfl frekans serisi oluflturulabilir. Bu veri setinde en byk
gzlem deeri 95e ve en dflk gzlem deeri 53e eflittir. Toplam 50 adet lokanta bu alflmada yer almaktadr. Bu bilgiler dorultusunda snf aral Sturges eflitlii yardmyla izleyen flekilde hesaplanlmfltr.
Snf aral =
Tablo 2.5.
Lokanta Hijyen
Puan Verisi in
Gruplandrlmfl
Frekans Serisi
Tablo 2.6.
Lokanta Hijyen
Puan Verisi in
Gruplandrlmfl
Frekans Serisi
Tablo 2.7.
Lokanta Hijyen
Puan Verisi in
Gruplandrlmfl
Frekans Serisi (Puan
st Snr Yok)
95 53
42
=
= 6, 31
1 + (3, 332) log 50 6, 66
Elde edilen sonu en yakn st deere yuvarlanr. Sturges kural yardmyla bulunan 6,31
50 - 57
2
deeri yuvarlanarak 7 olarak ele alnr. En kk gzlem deeri 53 olduundan ilk snf bafl57 - 64
0
lang noktas olarak 50 alnabilir. Snflar olufl64 - 71
5
turulduktan sonra her snf aralnda yer alan
71 - 78
13
birim says saylarak frekanslar oluflturulur.
Tablo 2.5.de bu hesaplamalara gre gruplan78 - 85
13
drlmfl frekans serisi sunulmufltur.
85 - 92
14
Gruplandrlmfl frekans serisi oluflturul92 - 99
3
duktan sonra frekanslar incelenir. Eer herhangi bir snf iin sfr frekans deeri elde
Toplam
50
ediliyorsa bir dzeltme yaplmas nerilir.
Herhangi bir snf frekans sfra eflit kar ise nerilen teknik snflarn birlefltirilmesidir. Fakat bu ifllem tamam ile arafltrmacnn kararna braklmfltr. Kimi durumlarda sfr frekans deeri gzlemleniyor olsa
Puan Snflar
Frekans
bile gruplandrlmfl frekans serisi olduu gibi
braklabilir. Ama birden fazla snfta sfr fre50 - 64
2
kans deeri gzlemlenmiflse snflarn birlefl64 - 78
18
tirilmesi kanlmazdr. Tablo 2.5. incelendi78 - 92
27
inde 57 - 64 snfnda hi gzlem (sfr fre92 - 106
3
kansa sahip) bulunmamaktadr. Dolaysyla
gruplandrlmfl frekans serisinde yer alan sToplam
50
nflar ikiflerli olarak birlefltirilip yeni bir gruplandrlmfl frekans serisi oluflturulabilir. Tablo 2.6.da lokanta hijyen verisi iin snflarn birlefltirilmesi ile elde edilen gruplandrlmfl frekans serisi sunulmufltur.
Baz problemlerde ilgilenilen deiflken
Puan Snflar
Frekans
iin st limit olmayabilir. Byle bir problemde gruplandrlmfl frekans serisi olufltu50 - 64
2
rulur ise en son snf ak ulu olarak d64 - 78
18
zenlenir. rnein lokanta hijyen verisinde
alnacak puan iin st snr olmasayd Tab78 - 92
27
lo 2.7.de rneklenen ak ulu gsterim
92 ve zeri
3
benimsenebilirdi.
Puan Snflar
Toplam
Frekans
50
19
Frekans
-den az
-den ok
50 - 60
48 + 2 = 50
60 - 70
2+5=7
43 + 5 = 48
70 - 80
13
7 + 13 = 20
30 + 13 = 43
80 - 90
21
20 + 21 = 41
9 + 21 = 30
90 - 100
41 + 9 = 50
Toplam
50
Tablo 2.8.
Lokanta Hijyen
Puan Verisi in
Kmlatif (-den az
ve -den ok ) Frekans
Serisi
-den az deerleri yardmyla 7 tane lokantann 70 puandan daha az puan aldklar sylenebilir. Benzer flekilde -den ok deerleri yardmyla 30 lokantann 80 puan ve zeri bir puan ald sylenebilir.
Frekans
Oransal Frekans
50 - 60
2 / 50 = 0,04
60 - 70
5 / 50 = 0,10
70 - 80
13
13 / 50 = 0,26
80 - 90
21
21 / 50 = 0,42
90 - 100
9 / 50 = 0,18
Toplam
50
Tablo 2.9.
Lokanta Hijyen
Puan Verisi in
Oransal Frekans
Dalm
20
Biyoistatistik
Tablo 2.9.a gre lokantalarn %42si 80 ile 90 puan arasnda bir puana sahip olduu sylenebilecei gibi yalnzca %4nn 50 ile 60 arasnda bir puana sahip olduklar sylenebilir.
RNEK 2.1
Tablo 2.10.
Kekik Otu Paket
Arlklar (gr.)
Bir turistik otelin bafl afls bir baharat reticisinden alnan 150 gr.lk (art eksi 5
gr.) kekik otu paketlerinin zerinde yazan arlklara sahip olmadklarndan flphelenmektedir. Bu amala, alnan son 32 paketin her birinin tartlmasn istemifltir. Elde edilen gzlem sonular basit seri fleklinde Tablo 2.10.da verilmifltir.
140
140
141
141
141
142
142
142
142
142
144
145
145
145
146
146
146
147
147
147
147
147
147
147
147
149
149
149
149
150
151
151
Arlk (gr.)
Frekans
140
141
142
144
145
146
147
149
150
SIRA SZDE
D fi N E L M
Snf aral =
=
151 140
=
1 + (53, 332) log 32
11
= 1,8829
6, 015
Tablo 2.12.
Gruplandrlmfl
Frekans Serisi
En kk 1 SIRA
ve enSZDE
byk 30 deerini ald bilinen bir srekli deiflken iin rassal olarak
30 deer belirleyiniz. Daha sonra oluflturduunuz bu veri kmesi iin frekans serisi ve
gruplandrlmfl frekans serisini oluflturunuz.
D fi N E L M
S O R U
S O R U
DKKAT
DKKAT
21
Kontenjans Tablosu
ki ynl snflama tablosu olarak da adlandrlan kontenjans tablosu iki deiflken
arasndaki iliflki hakknda daha fazla bilgi edinebilmek amac ile oluflturulur. Kontenjans tablosunda yer alacak deiflkenlerin kategorik ya da kategorik deiflkene
dnfltrlebilir olmas gerekir. Ele alnan iki deiflkenden birisine satrda, dierine ise stunda yer vererek bir tablo oluflturulur. Tablonun ii sayma yolu ile doldurulur. Tablonun gzelerinde frekanslar yer alr. Tablo 2.13.de kontenjans tablosu bileflenleri gsterilmifltir. Bu tabloda iki adet deiflken bulunmaktadr. Burada
deiflkenlerin her ikisi de iki kategoriye sahiptir. rnein deiflken 1 cinsiyet ise
deer 1 erkek, deer 2de kadn olacaktr.
Tablo 2.13.
Kontenjans Tablosu
Deiflken 2
Deiflken 1
Deer 1
Deer 2
Deer 1
Frekans11
Frekans12
Toplam1+
Deer 2
Frekans21
Frekans22
Toplam2+
Toplam+1
Toplam+2
Toplam
RNEK 2.2
22
Tablo 2.14.
retmenlerin
Cinsiyete Gre Et Ve
Et rn Tketimleri
Kontenjans Tablosu
Biyoistatistik
Et Tketimi
Cinsiyet
Hi
1 Kez
3 Kez
Erkek
10
20
Kadn
25
12
18
45
Tablo 2.15.
Ocak Ay Meyve
Dalm
Baz arafltrmalarda nitel (kategorik) deiflkenler ile alfllabilir. rnein bir ilkretim okulunda Ocak ay iinde le yemeinde rencilere verilecek olan meyvelerin gnlere gre dalm nitel veri olarak ele alnabilir. Nitel deiflkenler iin
elde edilen sonular frekans serilerinde gsterilebilirler. Tablo 2.15.de bir ilkretim okulu le yemei mensnde ocak ay sresince eflitli meyvelerin kaar kez
verilecei gsterilmektedir.
Nitel bir frekans serisinde
her bir kategoriden ne oranda
Meyve Ad
Frekans (Gn Says)
olduunun tespit edilebilmesi
Elma
6
iin oransal frekans dalm
Mandalina
3
oluflturulabilir. Oransal frekans dalm oluflturulurken
Muz
5
her bir kategorinin oransal frePortakal
7
kans ilgili kategori frekans deerinin toplam birim saysna
Toplam
21
blm ile elde edilir. rnein Tablo 2.15.de 21 gn bulunmaktadr, rencilere portakal verilecek gnlerin
oran tespit edilmek istenirse, portakal verilen gn says olan 6, toplam gn says olan 21e blnecektir. Tablo 2.16.da Ocak ay meyve dalm oransal frekans
dalm verilmifltir.
23
Meyve Ad
Oransal Frekans
Elma
6 / 21 = 0,286
Mandalina
3/ 21 = 0,143
Muz
5 / 21 = 0,238
Portakal
7 / 21 = 0,333
Toplam
21
21 / 21 = 1,000
Tablo 2.16.
Ocak Ay Meyve
Dalm
Tablo 2.16.ya gre toplam 21 gnn yaklaflk %24nde renciler muz ile besleneceklerdir.
Stun Grafii
Nitel verilerin grafiksel gsteriminde sklkla kullanlan teknik, verinin stun grafiinin izilmesidir. Stun grafiklerinde eksenlerden bir tanesinde etiketlenmifl olarak
nitel deiflkenin ald kategorik deerler yer alrken dier eksende ilgili kategorik
snfn ortaya kfl says yani frekanslar yer alr. Her bir kategori iin ilgili frekans
deerinin temsil edecek bir stun oluflturularak grafik izilir. Bu stunun ykseklii ilgili frekans ya da oransal frekans deerine eflit olacaktr. fiekil 2.1.de Ocak ay
meyve dalm stun grafii frekans dalm kullanlarak oluflturulmufltur.
fiekil 2.1
Ocak Ay Meyve
Dalm Stun
Grafii
Stun grafikleri oransal frekanslar kullanlarak da oluflturulabilir. Ocak ay meyve dalm stun grafii oransal frekanslar kullanlarak fiekil 2.2.de verilmifltir.
24
Biyoistatistik
fiekil 2.2
Ocak Ay Meyve
Dalm Oransal
Stun Grafii
Pareto Grafii
Frekans ya da oransal
frekanslarn bykten
ke sralanmas ile
oluflturulan stun grafiidir.
fiekil 2.3
Ocak Ay Meyve
Dalm Pareto
Grafii
Pasta Grafii
Pasta grafikleri genellikle nitel deiflkenlerin oransal frekanslarn gstermek iin
kullanlrlar. Pasta grafikleri temel olarak, her bir blm kategorik deiflkenin bir seviyesini gsterecek ve kaplad alan ilgili frekans deerine orantl olacak flekilde bir
dairenin blmlere ayrlmas ifllemidir. Genellikle bilgisayar yazlmlar yardmyla
oluflturulurlar. fiekil 2.4.de Ocak ay meyve dalm iin pasta grafii izilmifltir.
25
fiekil 2.4
Ocak Ay Meyve
Dalm Pasta
Grafii
Mandalina
14%
Portakal
33%
Muz
24%
Elma
29%
Tablo 2.17.de bir niversite rencisinin bir ay ierisinde nerelere harcama yapt verilmifltir.
Bu renci iin pareto grafii ve pasta
grafiini oransal frekanslar iin oluflturalm. ncelikle Tablo
2.17.de verilen bilgiler
dorultusunda oransal
frekanslar hesaplayalm. Tablo 2.18.de ilgili oransal frekans serisi
verilmifltir.
Harcamalar
Trk Liras
Ulaflm
125
Kira
300
Eitim
150
Beslenme
350
Dier
75
Toplam
1.000
Harcamalar
Trk Liras
Oransal Frekans
Ulaflm
125
Kira
300
Eitim
150
Beslenme
350
Dier
75
75 / 1000 = 75
Toplam
1.000
75 / 75 = 1,000
Tablo 2.18. kullanlarak oluflturulan pareto grafii fiekil 2.5.de ve pasta grafii
de Tablo 2.18.de verilen oransal frekanslara gre bir dairenin blmlere ayrlmasyla fiekil 2.6.da verilmifltir. Pareto grafii bu rencinin en yksek harcamay, yani gelirinin %35ini, beslenme iin yaptn grmemizi salamaktadr. Pasta grafii de farkl harcama seeneklerinin toplam iindeki paylarn karfllafltrmal olarak
bir grafikte gzlemleme flans tanmaktadr.
RNEK 2.3
Tablo 2.17.
Bir niversite
rencisinin Aylk
Harcamalar
Tablo 2.18.
Bir niversite
rencisinin Aylk
Harcamalar
26
Biyoistatistik
fiekil 2.5
niversite
rencisinin Aylk
Harcama Pareto
Grafii
fiekil 2.6
Harcamalar Dalm
niversite
rencisinin Aylk
Harcama Pasta
Grafii
Dier
8%
Ulaflm
12%
Kira
30%
Beslenme
35%
Eitim
15%
SIRA SZDE
D fi N E L M
S O R U
DKKAT
SIRA SZDE
AMALARIMIZ
Arkadafllarnzdan
20 tanesinin kan gruplarn reniniz. Kan gruplarnn frekans dalSIRA SZDE
mn oluflturunuz ve pasta grafiini iziniz.
D fi N E L MGrafiksel Gsterimi
Nicel Verinin
HistogramS
O R U
eflitli snflar ya da aralklarda yer alan gzlem saylarnn stunlar yardmyla gsterimine histogram ad verilir. Histogramlar srekli deiflkenlerin grafiksel gsteriDKKAT
minde kullanlrlar. Ksaca gruplandrlmfl frekans serilerinin stunlar ile gsterilmesine histogram ad verilir. Histogram iziminde yatay eksen, histogram izilen
SZDE
deiflkenin SIRA
deerlerine
gre ayarlanrken dfley eksen ise her snf iin ilgili frekans veya oransal frekans deerine gre dzenlenir. Deiflkenin deer aral ierisinde nerelerde younlafltn ve verinin genel deiflkenliini dier bir ifadeyle,
AMALARIMIZ
terimlerin birbirlerinden ortalama olarak ne kadar uzakta olduklarn gsterir. Histogram oluflturulurken alan ilgili frekans deerine ve tabanda snf aralna eflit
N N
K T A P
K T A P
TELEVZYON
TELEVZYON
27
olacak flekilde stunlarn yan yana izilmesi ifllemi gereklefltirilir. rnek 2.1.de
oluflturulan gruplandrlmfl frekans serisi Tablo 2.19.da verilmifltir.
Burada ilgilenilen deiflken
Arlk (gr.)
Frekans
srekli bir deiflkendir. Tablo
2.19.da snflar oluflturulmufl ve
140 - 142
5
ilgili frekanslarda verilmifltir. Ya142 - 144
5
tay eksende kekik otu paket a144 - 146
4
lklarn gram cinsinden ve dfley
eksende de bu arlklar baflna
146 - 148
11
dflen paket saysn gsterecek
148 - 150
4
flekilde histogram izelim. Stun
150 - 152
3
grafiinden farkl olarak histogToplam
32
ram izerken her snf iin izilen
stunlar birbirlerinden ayrk olarak deil yanyana olacak flekilde izim yaplmaktadr. fiekil 2.7.de ilgili histogram
izilmifltir.
fiekil 2.7.de yer alan histogram incelendiinde paket arlklarnn 146-148 gr.
arlk aralnda younlafltklar grlmektedir. Paketlerin 150 gr. olmas gerektiinden, bafllangta younlaflmann burada olmas beklenmesine ramen younlaflma daha dflk bir deer aralnda olmaktadr. Arafltrmac paket zerinde belirtilen arlktan daha az miktarda kekik ald flphesinde hakl olabilir. Arafltrmacnn hakll ilerleyen nitelerde incelenecektir. Bu aflamada histogram, problem ile ilgili genel bir fikir edinme imkan vermifltir.
Tablo 2.19.
Kekik Otu Paket
Arlklar
Gruplandrlmfl
Frekans Serisi
fiekil 2.7
Kekik Otu Paket
Arlklar
Histogram
Histogramlar gruplandrlmfl frekans serileri iin izilebildii gibi gruplandrlmfl oransal frekans serileri iinde izilebilirler. Kekik paket arlklar histogramnn oransal frekanslara gre gsterimi fiekil 2.8.de verilmifltir.
Histogramlar zerinde alfllan deiflkenin dalm hakknda da bir fikir verebilirler. fiekil 2.9.da buna iliflkin farkl histogramlar verilmifltir. Simetrik histogramlar ortadan ikiye katlandklarnda birbirinin yansmas olan histogramlardr. Dzgn dalm durumunda her snf iin frekanslar birbirine eflittir. Sola ya da saa
eik histogramlarda ise histogramn bir kuyruu dierine gre daha uzun olacak-
28
Biyoistatistik
tr. Sola eik histogramlarda ilk snftan bafllayarak frekans says artmakta ama sonra seri sonuna gelindiinde frekans says dflmektedir. Benzer flekilde saa eik
histogramlarda ilk snf frekansndan sonra en yksek frekans deerine bir ykselme olmakta daha sonra da dier snflarn frekanslar gittike azalmaktadr.
fiekil 2.8
Kekik Otu Paket
Arlklar Oransal
Frekanslar in
Histogram
fiekil 2.9
Farkl Histogram
fiekilleri
Salm Grafii
Salm grafikleri iki srekli deiflken arasnda herhangi bir iliflkinin varln arafltrmak iin oluflturulurlar. Salm grafiinde yer alan her bir nokta bir gzlem deerini temsil eder. Salm grafikleri oluflturulurken yatay eksen bir deiflkeni dfley eksen ise bu deiflken ile arasnda iliflki arafltrdmz bir deiflkeni temsil
eder. Her iki eksende deiflkenlerin aldklar deerlere gre dzenlenir ve her birimin bu iki deiflken iin aldklar deerler grafikte efllefltirilir. fiekil 2.10.da rnek
29
Salm grafikleri kullanlarak deiflkenler arasndaki iliflkiler gzlemlenebilecei gibi serilerin genel gidifline uymayan gzlemler de tespit edilebilir. Bu tr
gzlemlere aykr deer ad verilir ve analizlerin yrtlmesinde olumsuz katk
salayabilirler. fiekil 2.11.de, A ve B deiflkenleri iin bir baflka salm grafii verilmifltir. Bu salm grafiinde deiflkenler arasnda negatif bir iliflki vardr. Deiflkenlerden birinin deeri arttka dierinin deeri azalmaktadr. Ayrca bir adet
gzlem deeri dier birimlerden ok farkl bir blgede yer almaktadr. Dolaysyla
bu birim bir aykr deerdir.
Salm grafikleri
deiflkenler arasndaki
iliflkilerin arafltrlmasnda
yardmc olurlar.
fiekil 2.11
A ve B Deiflkenleri
Arasnda Negatif
liflki Ve Bir Aykr
Deer Durumu
SIRA SZDE
D fi N E L M
D fi N E L M
S O R U
S O R U
DKKAT
DKKAT
30
Biyoistatistik
zet
N
AM A
N
A M A
N
AM A
31
Kendimizi Snayalm
1. Basit Seri ile ilgili afladaki ifadelerden hangisi dorudur?
a. Kontenjans tablosu dzenlenerek zlebilir.
b. Sralanmfl veri kmesidir.
c. Sturges kural uygulanr.
d. Pareto grafii ile zmlenir.
e. Snf aralklar eflittir.
2. Herhangi bir arafltrmada ilgilenilen deiflkenin birbirinden farkl sonularnn kaar kez tekrarlandn
gsteren seriye ne ad verilir?
a. Frekans serisi
b. Zaman serisi
c. Basit seri
d. Pareto grafii
e. Histogram
3. Herhangi bir arafltrmada ilgilenilen deiflkenin birbirinden farkl sonularnn kaar kez tekrarlandn snflar ya da aralklar kullanarak gsteren seriye ne ad
verilir?
a. Pareto grafii
b. Histogram
c. Gruplandrlmfl frekans serisi
d. Snf aral
e. Sturges kural
4. Bir arafltrmada deiflkenin belirli bir sonucunun toplam ierisindeki orann belirleyebilmek iin oluflturulan frekans serisine ne ad verilir?
a. Basit seri
b. Oransal frekans serisi
c. Kmlatif Frekans serisi
d. Kontenjans tablosu
e. Histogram
5. ki srekli deiflken arasndaki iliflkinin belirlenebilmesi iin afladaki grafiklerden hangisi izilir?
a. Histogram
b. Kontenjans tablosu
c. Stun grafii
d. Pareto grafii
e. Salm grafii
Frekans
0 - 50
50 - 100
15
100 - 150
18
150 - 200
Toplam
45
6. Bu
a.
b.
c.
d.
e.
32
Biyoistatistik
Yaflamn inden
Bir ila fabrikasnda alflmakta olan ynetici piyasaya
srdkleri ila fliflelerinin kapaklarn deifltirmek istemektedir. Bu amala yapt arafltrmalar sonucunda
ila fliflelerinde uygulanabilecek 4 farkl eflit kapak olduunu renmifltir. Ynetici zellikle retilmekte olan
tansiyon ilac fliflelerinin kapaklarndan memnun deildir. Ayrca bu ila kapaklarnn ocuklar tarafndan alamayacak flekilde dizayn edilmesi gerekmektedir. retilmekte olan tansiyon ilalar flekerlemelere benzedikleri iin ocuklarnda ilgisini ekmektedir. Ynetici yeni retilecek flifle kapaklarnn ocuklar tarafndan kolay alamayan kapak olmasn istemektedir.
Ynetici yerel bir ilkretim okulunun mdrnden bu
konuda yardm istemifltir. Okul mdr fabrikaya yaplacak bir gezi srasnda 50 rencinin bir oyun erevesi ierisinde flifle kapaklarn ama testine katlabileceklerini belirtmifltir.
Pazartesi sabah bu ilkretim okulundan 50 adet renci fabrikay gezmeye gelmifltir. Ynetici bu renci
grubunu yafllarna gre 25er kifliden oluflan iki guruba
ayrarak fabrikay tantmfltr. Gezi sonunda renciler
bir salonda toplanarak ila retiminde kullandklar fliflelerden bazlar ile oyunlar oynanaca sylenmifltir.
Her ocuk nlerine konulan 4 farkl kapak teknii ile
kapatlmfl flifleleri almfl ve bu flifleleri amaya alflmfllardr. rencilere flifleleri atklar zaman ilerinde kk not katlar olduu ve bu not katlarnn zerinde de kitap, kupa, cam bardak gibi hediyelerin yazl
olduu sylenmifltir. rencilerin bu flifleleri ama sreleri kayt altnda tutulmufltur. Sonular izleyen gruplandrlmfl frekans serilerinde sunulmufltur.
A tipi kapak
Sre (saniye)
5-25
25-45
15
45-65
30
65-85
Toplam
50
B tipi kapak
Sre (saniye)
5-25
35
25-45
10
45-65
65-85
Toplam
50
C tipi kapak
Sre (saniye)
5-25
40
25-45
45-65
65-85
Toplam
50
D tipi kapak
Sre (saniye)
5-25
25-45
45-65
65-85
36
Toplam
50
Frekans dalmlar incelendiinde D tipi kapan alabilme sresinin dierlerine gre daha uzun olduu gzlemlenmifltir. Ynetici bu sonular daha ileri analizler
uygulanmas iin AR-GE birimine gndermifltir.
33
1. b
Sra Sizde 1
zleyen 30 gzlem deeri rassal olarak retilmifltir. Basit seri gsteriminde sunulmufltur.
2. a
3. c
4. b
5. e
6. d
7. c
8. c
9. d
10. d
14
18
24
11
14
20
26
11
16
22
26
11
16
22
28
12
17
22
30
14
17
23
30
Frekans
11
12
14
16
17
18
20
22
23
24
26
28
30
Toplam
30
Snf aral =
30 1
29
=
= 4, 89
1 + (3, 332) log 30 5, 922
34
Biyoistatistik
Yuvarlama ifllemi sonras snf aral iin 5 deeri kullanlabilir. lk snf alt limiti iin en kk deer olan 1i
alalm. lgili veri iin gruplandrlmfl frekans serisi izleyen tabloda yer almaktadr.
Sra Sizde 3
10 arkadaflnzn boy ve kilo bilgilerini elde ediniz. Daha sonra elde ettiiniz bu deerler iin salm grafiini
izerek bu iki deiflken arasnda bir iliflki olup olmayaca konusunda yorum yapnz.
ncelikle 10 arkadaflmzn boy ve kilo bilgilerini bir
tabloda toplayalm. zleyen tabloda nite yazarnn 10
arkadafln boy ve kilo deerleri sunulmufltur.
Deer
Frekans
1-6
6 - 11
11 - 16
16 - 21
Boy
21 - 26
(cm)
26 - 31
Toplam
30
Sra Sizde 2
ncelikle 20 kifliden kan gruplarn renelim. zleyen
frekans dalm nite yazarnn ulaflt 20 kiflinin kan
gruplarn gstermektedir.
Kan Grubu
Frekans
Kifli
Kilo
10
172 175 172 180 165 157 168 185 192 151
62
69
65
86
55
48
57
97
100
46
(kg)
Oransal Frekans
3 / 20 = 0,15
7 / 20 = 0,35
5 / 20 = 0,25
AB
5 / 20 = 0,25
Toplam
20
20 / 20 = 1,00
0
15%
A
35%
AB
25%
B
25%
Boy ve kilo salm grafii incelendiinde bu iki deiflken arasnda bir iliflkinin varl sylenebilir.
Yararlanlan Kaynaklar
Bland, M. (1995). An Introduction to Medical Statistics,
Oxford Medical Publications.
Er, F. (2003). Aklayc Veri Analizi, Kaan Kitabevi.
Freund, J.E. ve Williams F.J. (1966). Dictionary/Outline
of Basic Statistics, Dover.
Johnson, R. (1995). Just The Essentials of Elementary Statistics, Duxbury Press.
Myatt, G.J. (2007). Making Sense of Data A Practical
Guide to Exploratory Data Analysis and Data
Mining, Wiley.
Rowe, P. (2007). Essential Statistics for the Pharmaceutical Sciences, Wiley.
Sullivan, M. (2005). Fundamentals of Statistics, Pearson
Prentice Hall.
35
BYOSTATSTK
Amalarmz
N
N
N
N
Anahtar Kavramlar
Aritmetik Ortalama
Medyan
Mod
Geometrik Ortalama
Deiflim Aral
Ortalama Sapma
erik Haritas
Biyoistatistik
Tanmlayc
statistikler
Tanmlayc statistikler
MERKEZ ELM LLER
Arafltrmaclar zerinde alfltklar deiflkenlere iliflkin tipik bir deer verme eilimindedirler. Gnlk hayat ierisinde genellikle herhangi bir deiflkeni temsil ettii dflnlen ve onun hakknda genel bir fikir edinmeye yardmc olan ortalama
kavramn duyarz. rnein Erkek bebeklerin ortalama doum arl A blgesinde 3.400 gram olarak gerekleflmektedir. ifadesinde yer alan ortalama kavram, A
blgesinde dnyaya gelen bebeklerin doum arlklarnn hangi deer etrafnda
topland hakknda bir fikir vermektedir. Ortalamalar, ilgilenilen veri kmesinin
merkezinin nerede olabilecei konusunda bilgi verdikleri iin merkezi eilim lleri ad altnda toplanmaktadrlar.
Aritmetik Ortalama
Merkezi eilim lleri arasnda incelenecek ilk ortalama tr, genellikle ortalama
denildiinde tm arafltrmaclarn aklna gelen aritmetik ortalamadr. En basit
ifadeyle aritmetik ortalama, ilgilenilen deiflkende yer alan tm terimlerin matematiksel toplamnn seri terim saysna blnmesidir. rnein ilgilenilen deiflkenin
1, 3, 5, 8, 9 deerlerini ald bilindiinde bu deiflkenin aritmetik ortalamas, terimlerin matematiksel toplam olan 26 deerinin (1+3+5+8+9) terim says olan 5e
blnmesiyle hesaplanr. Bu deiflkenin aritmetik ortalamas 5,20 olacaktr. Bir seride yer alan gzlem birimleri x ile sembolize edilir, ayrca bunlarn toplanacan
gstermek iin sembol kullanlr. Burada toplam, birinci terimden bafllayarak
son terim saysna kadar ilerleyecektir. Hesaplanan ortalamann gsteriminde ise
hesaplamann hangi veri seti iin yapldna gre iki farkl sembol kullanlmaktadr. Eer ana ktle aritmetik ortalamas hesaplanyorsa aritmetik ortalama iin
sembol kullanlrken aritmetik ortalama rneklem iin hesaplanyor ise x sembol kullanlr.
Aritmetik ortalama ana ktle iin hesaplanrken terimler toplam ana ktle terim says olan N e blnrken rneklem iin aritmetik ortalama hesaplanrken rneklem terim says toplam rneklem birim says olan ne blnr. Eer x1, x2,
x3, ..., xN ilgilenilen deiflkenin ana ktleden elde edilen gzlem deerleri ise basit serilerde ana ktle ortalamas , izleyen eflitlik yardmyla hesaplanr.
x1 + x2 + ... + x N
N
iN=1 xi
N
38
Biyoistatistik
Eer x1, x2, ..., xn ilgilenilen deiflken iin elde edilen n birimlik rneklem sonular ise rneklem aritmetik ortalamas x , izleyen eflitlik yardmyla hesaplanr.
x1 + x2 + ... + xn
x=
in=i xi
n
Frekans serilerinin aritmetik ortalamas hesaplanrken her satrda yer alan frekanslarn dikkate alnmas gerekir. Bu nedenle her satrda yer alan frekanslar ile
gzlem deerleri arplr ve daha sonra bu arpmlarn toplam ele alnr. Frekans serilerinde ana ktle ve rneklem ortalamalar hesabnda kullanlan eflitlikler srasyla,
iN=1 fi xi
x=
in=1 fi xi
n
olacaktr. Eflitliklerde yer alan fi deerleri birbirinden farkl olarak ortaya kan
gzlemlerin frekanslar olacaktr. Gruplandrlmfl frekans serileri iin aritmetik ortalama hesabnda ise ncelikle gruplandrlmfl frekans serisine yeni bir stun eklenir. Bu stun elemanlar her snfn orta noktas olur. Snf orta noktas snfn st
snr ile alt snrnn toplanp ikiye blnmesi ile elde edilir. Daha sonra bu stunda yer alan deerler gzlem deerleriymifl gibi dflnlerek frekans serilerindeki
eflitlikler yardmyla hesaplama yaplr. Gruplandrlmfl frekans serilerinde hesaplanan aritmetik ortalama deeri yaklaflk bir deer olacaktr. Unutulmamaldr ki
gruplandrlmfl frekans serilerinde her snf bir deer ile deil bir aralk ile temsil
edilmektedir. Dolaysyla aritmetik ortalamay hesaplamak iin her snfn orta noktasnn alnmas bir miktar bilgi kaybna yol aacaktr. Bu bilgi kayb aritmetik ortalamann yaklaflk bir deer olarak ortaya kmasna sebep olur. Gerek arafltrmalarda mmkn olduunca ortalama hesabnda gruplandrlmfl frekans serisi yerine
verinin orijinal halinin kullanlmas daha doru olacaktr.
Aritmetik ortalamann hesaplanmas ve yorumlanmas ok kolay olduu iin
sklkla kullanlr. Ancak aritmetik ortalamann bir dezavantaj bulunmaktadr. Aritmetik ortalama seride var olabilecek aykr deerlerin etkisinden kurtulamaz ve
olumsuz sonular verebilir. rnein 3 birimlik bir ana ktlede birimler 30, 50 ve
70 deerlerini alyor ise ana ktle ortalamas 50dir. Varsayalm, arafltrma yrtlrken son gzlem deeri 70 yerine 130 olarak kayt altna alnsn. Verinin bu yeni durumu iin ana ktle ortalamas 70 olacaktr. Grld gibi serideki bir tek
deer bile aritmetik ortalama deerinin hemen ykselmesine ve dolaysyla aritmetik ortalamann bu seri iin temsil gcnn azalmasna neden olur. Bu nedenle uygulamada aritmetik ortalama dflnda hesaplanabilecek ve bu problemden etkilenmeyen ortalama dier ortalama trlerini kullanmak doru olacaktr.
RNEK 3.1
Bir ana ktlede 20 adet birim bulunmaktadr. Bu birimlerin bir F deiflkeni iin
lm sonular izleyen basit seride verilmifltir. Ana ktle aritmetik ortalamasn
basit seri ve frekans serisi eflitlikleri yardmyla hesaplaynz.
1
2
3
4
1
2
3
4
1
3
3
5
2
3
3
5
2
3
4
6
39
x + x2 + ... + xn
1 + ... + 5 + 6
600
=3
= 1
=
=
20
20
N
olur. fiimdi basit seriyi, frekans serisi fleklinde dzenleyerek aritmetik ortalamay
hesaplayalm. Frekans serilerinde aritmetik ortalama hesaplanmak iin satrlardaki
gzlem deerlerinin ilgili satr frekans ile arplmas gerekmektedir. zleyen tabloda arpma sonular da gsterilmektedir.
Gzlem Deeri
Frekans
1x3=3
2x4=8
3 x 7 = 21
4
5
3
2
4 x 3 = 12
5 x 2 = 10
6x1=6
Toplam
20
fixi= 60
iN=1 fi xi
N
60
=3
20
fleklinde hesaplanr.
zleyen tabloda verilen gruplandrlmfl frekans serisi iin ana ktle aritmetik ortalamas y hesaplaynz.
Arlk
Frekans
0 - 50
50 - 100
100 - 150
150 - 200
200 - 250
Toplam
20
Gruplandrlmfl frekans serilerinde ncelikle her snfn orta noktas belirlenerek bir stunda gsterilir. Daha sonra bu orta nokta deerleri ile ilgili snf frekanslar arplarak yeni bir stun oluflturulur. zleyen tabloda bu ifllemler gsterilmifltir.
Arlk
Frekans
Orta Deer
0 - 50
25
25 x 3 = 75
50 - 100
75
75 x 5 = 375
100 - 150
125
125 x 9 = 1.125
150 - 200
175
175 x 2 = 350
200 - 250
225
Toplam
20
225 x 1 = 225
fixi = 2.150
RNEK 3.2
40
Biyoistatistik
iN=1 fi xi
N
2.150
= 107, 50
20
olur.
SIRA SZDE
zleyen tabloda
SIRAverilmifl
SZDE gruplandrlmfl frekans serisi iin ana ktle aritmetik ortalamasn hesaplaynz.
D fi N E L M
D fi N E L M
Uzunluk (mm)
Frekans
0-2
S O R U
S O R U 2-4
4-6
DKKAT
DKKAT 6 - 8
8 - 10
SIRA SZDE
AMALARIMIZ
K T A P
TELEVZYON
NTERNET
N N
Toplam
SIRA SZDE
MedyanAMALARIMIZ
20
Terimleri kkten bye sralanmfl bir seride, serinin tam ortasnda yer alan terimin ald deere medyan ya da ortanca ad verilir. Medyan deeri hesaplanrken seride Kyer
Talan
A P tm terimlerin deeri deil yalnzca kkten bye sralanmfl serinin tam ortasndaki terimin deeri ile ilgilenilmektedir. Bu zelliinden dolay medyan, serinin ularnda yer alan aykr deerlerden etkilenmeyecektir. Veri
ierisinde Taz
E L sayda
E V Z Y O Naykr deer bulunmas durumunda aritmetik ortalamaya gre
tercih edilen bir ortalamadr. Basit ve frekans serilerinde medyan deeri hesaplamas yapabilmek iin ncelikle serinin tam ortasnda yer alan terimin sra numarasnn belirlenmesi gerekir. Seride yer alan terim saysnn tek say ya da ift say ol N T Emedyan
RNET
mas durumu
deerinin hesaplanmasna etki yapmaktadr.
Basit veya frekans serilerinde medyan deerine sahip olan terimin sra numarasn tespit etmek iin, analizde yer alan birim says olmak zere, (n+1)/2 kullanlr. Seride yer alan terim says tek say ise (1, 3, 5 vb.) kan sonu bize medyan
deerini verecek olan terimin sra numarasn verecektir. Bu terim serinin tam ortasndaki terim olacaktr. rnein seride 5 adet gzlem deeri varsa medyan deeri, (5+1)/2=3, nc terimin ald deer olacaktr. Ancak seride yer alan terim says ift say ise (2, 4, 6 vb.) medyan deeri serinin tam ortasnda yer alan iki terimin ortalamas olarak alnacaktr. rnein seride 8 adet gzlem deeri varsa medyan deerini bulmak iin hesaplanan medyan terimi sra numaras, (8+1)=4,50 olacaktr. Bu tr durumlarda hesaplanan sra numarasnn bir st ve bir alt deerine
eflit sra numarasndaki terimlerin aldklar deerlerin aritmetik ortalamas medyan
deeri olur. Burada dikkat edilmesi gereken nokta, (n+1)/2 medyann kendisini
deil medyan olarak kullanlacak deerin serideki sra numarasn vermesidir. Frekans serilerinde medyan sra numaras belirlendikten sonra kmlatif frekanslar
stunu oluflturularak ilgili sra numarasna sahip terimin tespiti kolaylafltrlr.
Gruplandrlmfl frekans serilerinde medyan hesaplamak daha zordur. Medyan
iin kesin bir deer hesaplanmas bu durumda tam olarak mmkn deildir. Gruplandrlmfl frekans serilerinde medyann hangi snfta olduu bilinir. Ortaya kan
problem bu snf ierisinde medyann konumunun belirlenmesidir. Medyan dee-
41
ri ilgili snfn alt limiti, st limiti, tam ortas veya bir baflka deer midir? sorusunun cevab aranarak gruplandrlmfl frekans serilerinde medyan hesaplanr. Gruplandrlmfl frekans serilerinde medyan deeri iin izleyen eflitlik kullanlr.
Medyan = L +
c
fm
f
k
2
Eflitlikte,
L; medyan ierdii dflnlen medyan snfnn alt limitini,
c; medyan snfnn snf araln,
fm; medyan snfnn frekansn,
n; toplam terim saysn,
fk; medyan snfndan nce yer alan kmlatif frekans
gsterir. Verilen eflitlik incelendiinde, eflitliin zlebilmesi iin medyan snfnn belirlenmesi gerekir. Gruplandrlmfl frekans serilerinde medyan snf (n/2)
inci gzlemin yer ald snftr. Kmlatif frekans dalm yardmyla n/2 deeri
hesaplanr ve bu sra numarasna sahip terimin yer ald snf medyan snf olarak
belirlenir. rnek 3.5.de gruplandrlmfl frekans serisinin medyan hesab yer almaktadr.
Bir test sonucunda elde edilen gzlem sonular 80, 84, 89, 90, 68, 75, 78, 79, 94
olarak verilmifltir. Bu serinin medyan katr?
RNEK 3.3
Seride 9 terim bulunmaktadr, ilk olarak seri kkten bye sralanr. Sral
serimiz
68, 75, 78, 79, 80, 84, 89, 90, 94
olur. Medyan deerini bulmak iin gerekli medyan sra numaras bu rnekte
(9+1)/2= 5 olacaktr. Dolaysyla kkten bye sral serideki beflinci terimin deeri medyan deeridir. Bu veri setinde soldan saa sayarsak beflinci terimin ald
deer 80dir. Dolaysyla bu veri setinin medyan 80dir. Yukardaki veri setine 92
deerine sahip bir gzlem daha eklensin. Eklenen bu yeni deer ile veri seti,
68, 75, 78, 79, 80, 84, 89, 90, 92, 94
olur. Terim says 10, ift saydr. Bu serinin medyan sra numaras (10+1)/2=5,50dir.
Bu sra numarasnn anlam, kkten bye dizili serideki beflinci ve altnc terimlerin deerlerinin aritmetik ortalamasnn medyan olacadr. Seride beflinci terim deeri 80 ve altnc terim deeri 84 olduundan bu yeni serinin medyan deeri (80+84)/2= 82 olur.
RNEK 3.4
Frekans
10
30
50
70
90
Toplam
16
42
Biyoistatistik
Bu veri setinde terim says 16, ift saydr. Medyan terimi sra numaras
(16+1)/2=8,50 olur. Kkten bye sral olan bu seride sekizinci ve dokuzuncu terimlerin deerlerini bulmak gerekir. Bu terimleri tespit etmek iin tabloya kmlatif frekans deerleri eklenir. Aflada kmlatif frekanslar verilmifltir.
Uzunluk (mm)
Frekans
Kmlatif Frekans
10
30
50
11
70
14
90
16
Toplam
16
Kmlatif frekanslara gre ilk 5 terim 10 veya 30 deerini almaktadr. 6. Terimden, 11. terime kadar olan terimler ise 50 deerini almaktadr. 8 ve 9uncu terimler bu aralkta yer aldndan medyan deeri de 50 olacaktr.
RNEK 3.5
Hasta Says
Kmlatif Frekans
4 -6
6-8
8 - 10
14
23
10 -12
29
12 - 14
34
Toplam
34
ncelikle medyan snf belirlenir. Toplam 34 adet hasta olduuna gre 34/2=17
olarak bulunur. Dolaysyla gruplandrlmfl frekans serisinde yer alan 17inci terimin yer ald snf medyan snf olacaktr. Kmlatif frekanslar yardmyla ilk 9
gzlemin ilk iki snfta yer ald gzlemlenmektedir. 10uncu terimden 23nc terime kadar olan terimler ise 8 - 10 snfnda yer almaktadr. 17de bu aralkta yer
aldndan medyan snf, 8 - 10 snfdr. Gruplandrlmfl frekans serilerinde medyan hesab iin verilen eflitlikte bilinmeyen deerleri tablo yardmyla tespit ederek
yerine koyarsak, ilgilenilen bu gruplandrlmfl frekans serisinde medyan deeri,
Medyan = L +
c
fm
k
2
eflitlii yardmyla,
Medyan = 8 +
2 34
9 = 9,143
14 2
olarak hesaplanr.
43
Mod
Bir seride en ok tekrarlanan terimin deerine mod denir. Hesaplanmas en kolay
ortalama trdr. Bir seride 2 adet en ok tekrarlanan terim sz konusu ise bu tr
seriye ift modlu seri denir. 2den daha fazla terimin en ok tekrar saysna sahip
olmas durumunda ise bu seride modun temsili bir ortalama olmayaca belirtilerek uygun bir dier ortalama hesaplanr. Gruplandrlmfl frekans serilerinde mod
bir tek gzlem deerine karfllk gelmez. Bunun yerine bir snfa karfllk gelir. En
yksek frekansa sahip snf mod snf olarak adlandrlr. Daha sonra mod snf
yardmyla gruplandrlmfl frekans serisinin mod deeri hesaplanr. Gruplandrlmfl frekans serisinde mod hesab iin,
f m1
Mod = Salt +
c
f m1 + f m+1
Frekans
0-4
21
4-8
34
8 - 12
45
12 - 16
49
16 - 20
42
Toplam
191
En yksek frekans 12 -16 snf iindir. Mod snf bu snf olarak alnmaldr. stenen mod deeri eflitlik yardmyla,
Mod = 12 +
4
4 = 13, 45
4+7
olur.
Geometrik Ortalama
Arafltrlan deiflkenin oran, indeks, yzde ya da artfl oran olarak lmlendii
problemlerde deiflken iin ortalama hesaplanlmas gerektiinde kullanlan ortalama tr geometrik ortalamadr. n tane birim iin geometrik ortalama bu n tane
RNEK 3.6
44
Biyoistatistik
G.O =
( x1 )( x2 )...( xn )
Seride yer alan terim says arttnda arpma ve kk alma ifllemi zorlaflacandan geometrik ortalama doal logaritma yardmyla da hesaplanr. Logaritma yardmyla geometrik ortalama eflitlii,
log (G.O) =
1 n
log ( xi )
n i =1
olarak yazlr. Eflitlik yardmyla hesaplanan deerin anti-logaritmas alnarak geometrik ortalama deeri bulunur.
RNEK 3.7
Bir bakterinin 5 farkl zamanda oalma miktarlar (yzde olarak) 10, 17, 42, 21
ve 19 olarak hesaplanmfltr. Bakteri oalma miktarlar iin geometrik ortalamay hesaplaynz.
lk olarak geometrik ortalamann standart formln kullanalm. Bu problem
iin geometrik ortalama,
G.O =
(10)(17)(42)(21)(19) = 19, 54
olur. Bu alflmada bakterilerin ortalama oalma miktarlar yaklaflk %20dir. Ayn geometrik ortalama deerine logaritma kullanlarak da ulafllabilir. Eflitlie gre,
log(G.O ) =
1
(log (10) + log (17) + log (42) + log (211) + log (19)) = 1, 290
5
DEfiKENLK LLER
Aritmetik ortalama, medyan gibi merkezi eilim lleri yalnzca verinin merkezinin nerede olduunu tanmlamaktadr. Ancak verinin nasl bir yaylma ya da salma sahip olduu hakknda bir fikir vermezler. rnein seyahate gitmek istediiniz bir blgedeki mevcut ortalama scaklk deerini seyahat acentenizden renebilirsiniz. Fakat aldnz bu deerin gece iin mi yoksa gndz iin mi olduunu
renmeniz gerekir. zellikle karasal iklime sahip bir blgeye seyahat etmeyi
planlyorsanz gece ve gndz arasndaki s farklarnn yksek olabilecei beklenir. Eer ortalama scaklk seyahat edilecek blgede 6 derece daha fazla veya daha az olabilecei ek bilgisini alrsanz, seyahat planlarnz tekrar gzden geirip
uygun kyafetlere karar verebilirsiniz.
Salm ls iin elde edilecek kk bir deer ilgilenilen verinin birbirine
yakn deerler aldn anlatr. rnein aritmetik ortalamaya yakn deerler olabilirler. Salmnn byk olduu durumlarda ise verinin u noktalarnda aykr deerler olabileceini anlatr. Bu durum, aritmetik ortalamann gvenilirliini azaltr.
Serilerin salmlarn incelemenin bir baflka nedeni ise serilerin karfllafltrlmas gerekliliidir. rnein A ve B blgelerinden elde edilmifl er adet gzlem olduu varsaylsn. A blgesi lm deerleri srasyla 10, 50 ve 90 iken B blgesi lm deerleri srasyla 40, 50 ve 60 olsun. Bu iki blgeyi yalnzca ortalama kullanarak karfllafltrmak isteyebiliriz. Her iki blge iinde aritmetik ortalama hesaplanrsa hem A blgesinin hem de B blgesinin aritmetik ortalamas 50e eflit olacaktr. Aritmetik ortalama bu durumda A ve B blgelerinin ilgilenilen deiflken bakmndan ayn olduunu sylemektedir. Ancak veri incelendiinde kolaylkla grlebilir ki B blgesindeki gzlem deerleri A blgesine gre aritmetik ortalamaya
daha yakn deerler almaktadr. Bu yaknln derecesini ortaya koyabilmek iin
salmn bir ls olarak deiflkenlik lleri nerilmifltir.
Deiflim Aral
Deiflkenlik ls olarak kullanlacak en basit l, deiflim aral olarak adlandrlr. Deiflim aral hesaplanabilmesi iin serinin yalnzca iki deerinin bilinmesi yeterlidir. Bu iki deer serinin en byk ve en kk deeridir. Bunlar arasndaki fark bize deiflim aral deerini verecektir. Bir veri kmesi iin deiflim aral hesabnda izleyen eflitlik yazlr.
Deiflim aral = En byk deer - En kk deer
Deiflim aral genellikle kalite kontrol alflmalarnda hesaplama kolaylndan dolay kullanlr.
Ortalama Sapma
Deiflkenlik iin aralk kullanldnda yalnzca serinin iki deerine ihtiya duyulmaktadr. Seride bulunan btn terimlerin kullanlabilecei deiflkenlik llerinden ilki ortalama sapmadr. Ana ktle ya da rneklemde yer alan terimlerin aritmetik ortalama ya da medyandan ortalama olarak ne kadar saptklarn gstermek
amac ile oluflturulur. Eflitliinde, aritmetik ortalamaya yer verildiinde ortalama
sapma adn alrken terimlerin medyandan olan ortalama sapmasn gstermek iin
eflitlikte medyan kullanldnda medyan sapma adn alr.
Aritmetik ortalamaya gre ortalama sapma,
Ortalama sapma =
in=1 xi x
n
eflitlii yardmyla hesaplanr. Dikkat edilecek olursa, eflitlikte farklarn mutlak deerleri alnmaktadr. Bu mutlak deer alma ifllemi gereklefltirilmez ise bir seride
yer alan btn terimlerin aritmetik ortalamadan sapmalar toplam her zaman iin
0 (sfr) olacandan faydal bir deer olmayacaktr. Medyan deeri kullanlarak hesaplanan medyan sapma iin,
Medyan sapma =
eflitlii kullanlr.
in=1 xi
medyan
n
45
46
RNEK 3.8
Biyoistatistik
olur. Seri kkten bye sral verilmifltir. Seride 6 terim olduuna gre,
(6+1)/2=3,50 medyan sra numarasn vermektedir. Seride yer alan 3. terim deeri 21 ve 4. terim deeri 24 olduundan bu serinin medyan 21 ve 24 deerlerinin
ortalamas olan 22,50dir. fiimdi bu deerlerden yararlanarak izleyen tablo oluflturulabilir.
Kaymak Arl (gr.)
xi x
xi x
xi medyan
xi medyan
17
17 - 21,67 = -4,67
4,67
17 - 22,50 = -5,50
5,50
17
21
24
24
27
Toplam
17 - 21,67 = -4,67
21 - 21,67 = -0,67
24 - 21,67 = 2,33
24 - 21,67 = 2,33
27 - 21,67 = 5,33
4,67
0,67
2,33
2,33
5,33
20
17 - 22,50 = -5,50
21 - 22,50 = -1,50
24 - 22,50 = 1,50
24 - 22,50 = 1,50
27 - 22,50 = 4,50
5,50
1,50
1,50
1,50
4,50
20
Ortalama sapma =
in=1 xi
20
= 3, 33
6
ve
Medyan sapma =
in=1 xi
medyan
n
20
= 3, 33
6
olur.
47
iN=1( xi
s=
in=1( xi
n1
eflitlii yardmyla hesaplanr. Dikkat edilirse ana ktle standart sapmas hesaplanrken eflitlikte ana ktle ortalamas ve ana ktle birim says N yer alrken, rneklem standart sapma hesabnda rneklem ortalamas x ve n-1 yer almaktadr.
Frekans serilerinde standart sapma veya varyans hesaplanlmas gerektiinde
her terimin tekrar saysn gsteren frekanslarnda gz nne alnmas gerekir. Frekans serilerinde ana ktle standart sapmas,
iN=1( xi
) fi
2
s=
in=1( xi
fi
n1
eflitlii ile elde edilir. Gruplandrlmfl frekans serilerinde ise aritmetik ortalama
hesabnda olduu gibi her snfn orta noktas belirlenir ve bu orta noktalar x
deerleri olarak ele alnarak frekans serisi formlleri yardmyla hesaplamalar
yrtlr.
Aflada verilen frekans serisi iin varyans ve standart sapmay hesaplaynz.
Kalori
100
200
300
400
Toplam
rn Says
17
34
30
19
100
ncelikle rneklem aritmetik ortalamas hesaplanr. Bu amala frekans serisinde yeni bir stun oluflturulur.
RNEK 3.9
48
Biyoistatistik
Kalori
rn Says
Kalori x rn Says
100
17
1.700
200
34
6.800
300
30
9.000
400
19
7.600
Toplam
100
25.100
x=
in=1 fi xi
n
25.100
= 251
100
olur. Hesaplanan ortalama yardmyla varyans ve standart sapma iin gerekli deerleri frekans tablosuna stun ekleyerek hesaplayalm.
Kalori
rn Says
100
17
22.801
22.801 x 17 = 387.617
200
34
200 - 251 = - 51
2.601
2.601 x 34 = 88.434
300
30
300 - 251 = 49
2.401
2.401 x 30 = 72.030
400
19
22.201
22.201 x 19 = 421.819
Toplam
100
( xi x )
( xi x ) 2
( xi x ) 2 f i
969.900
s=
in ( xi
fi
n 1
969.900
= 9.796, 9697 = 98, 979
100 1
SIRAserisi
SZDEbir ana ktle iin tanmlanmfltr. Standart sapmay bulunuz.
zleyen frekans
Arlk
Frekans
5
7
9
11
4
8
6
2
D fi N E L M
D fi N E L M
S O R U
S O R U
DKKAT
D K K A TToplam
SIRA SZDE
N N
RNEK 3.10
AMALARIMIZ
SIRA SZDE
20
zleyen ana ktle gruplandrlmfl frekans serisi iin standart sapma hesaplaynz.
Anaktle ortalamas, = 4,86 olarak bilinmektedir.
AMALARIMIZ
K T A P
K T A P
TELEVZYON
TELEVZYON
( xi )
( xi ) 2
( xi )2 f i
1-3
2 - 4,86 = -2,86
8,1796
8,1796 x 2 =16,352
3-5
5-7
6
4
4
6
4 - 4,86 = -0,86
6 - 4,86 = 1,14
0,7396
1,2996
0,7396 x 6 = 4,4376
1,2996 x 4 = 5,1984
7-9
Toplam
2
14
8 - 4,86 = 3,14
9,8596
9,8596 x 2 = 19,719
45,7072
49
Ana ktle frekans serisi standart sapma eflitliinde tablo yardmyla bilinmeyenler yerine konulursa ana ktle standart sapma deeri,
iN=1( xi
) fi
2
45, 7072
= 3, 2648 = 1, 807
14
olur.
Deiflkenlik Katsays
Farkl lm birimleriyle lmlenmifl iki ya da daha fazla deiflkenin standart sapma gibi bir l yardmyla deiflkenliklerinin karfllafltrlmas mmkn deildir.
rnein bir yemek fabrikasnda alflanlarn yafllar ile aldklar maafllar standart
sapma cinsinden karfllafltrmak mmkn deildir. Bu gibi durumlarda farkl lm
birimine sahip deiflkenlerin karfllafltrlmasnda oransal bir deer kullanlabilir.
Karl Pearson bu amala deiflkenlik katsays ad altnda bir oran nermifltir. Deiflkenler farkl lm birimlerine sahip olduunda veya deiflkenler ayn lm birimleriyle lmlenmifl olsa da ortalamalar arasnda ok byk farklar varsa deiflkenlik katsays faydal bir karfllafltrma aracdr. Standart sapmas ve aritmetik
ortalamas bilinen bir deiflkenin deiflkenlik katsays,
Deikenlik katsays =
s
x
fliler;
225
4.500
= 0, 05
Deiflkenlik katsays =
90
1.800
= 0, 05
RNEK 3.11
50
Biyoistatistik
Grld gibi ynetici ve iflilerin aylk cretleri arasnda oransal deiflkenlik bakmndan bir fark yoktur, her iki grupta %5 oransal deiflkenlie sahiptir.
Aritmetik
Ortalama, Medyan
ve Mod iliflkisi
Sola Eik
Saa Eik
Medyan Mod
Medyan
Mod Medyan
Eiklik Katsays
lgilenilen deiflkenin frekans dalmnn simetri derecesini tespit etmek amac ile
eiklik katsays hesaplanr. Eikliin hesaplanmas iin bir ka teknik bulunmakla birlikte bunlarn en basit olan Karl Pearson (1837-1936) tarafndan gelifltirilmifltir. Aritmetik ortalamas, medyan ve standart sapmas bilinen bir veri setinde Pearson eiklik katsays izleyen eflitlik yardmyla hesaplanr.
51
3 x medyan
s
Eiklik katsaysnda 0 (sfr) deeri frekans dalmnn simetrik olduunu, pozitif deerler saa doru eiklii ya da asimetriyi, negatif deerler ise sola doru
eiklii ya da asimetriyi gsterir. Eiklik katsays -3 ile +3 arasnda deerler alr.
D fi N E L M
SIRA SZDE
D fi N E L M
CHEBYSHEV TEOREM
O R U
Kk standart sapma deerinin serideki terimlerin aritmetik Sortalama
etrafnda
younlafltn ve byk bir standart sapma deerinin de terimlerin ortalamadan
uzak bir yaylma sahip olduunun bir gstergesi olabilecei belirtilmiflti. HerhanDKKAT
gi bir veri kmesinde, ilgilenilen deiflkenin frekans dalmnn flekline bakmakszn (simetrik, saa eik veya sola eik gibi) aritmetik ortalama deerinden belirSIRA SZDE
li bir standart sapma uzaklkta yer alan birimlerin en kk oran
P.L. Chebyshev
tarafndan bir teorem yardmyla gsterilmifltir. Chebyshev teoremine gre birimlerin %75i aritmetik ortalamadan art eksi 2 standart sapma aralnda
deerler alAMALARIMIZ
maktadr. Herhangi bir veri seti iin (rneklem veya ana ktle) aritmetik ortalamadan k standart sapma uzaklkta, k>1 olmak zere, yer alacak terimlerin en dflk
oran 1-(1/k2) olur.
K T A P
O R U
Pafnuty LvovichSChebyshev
(1821-1894) bir Rus
matematikidir. Olaslk,
istatistik ve sayD teorisi
KKAT
zerine yapt alflmalar
ile tannr. Rus
matematiinin kurucusu
SIRA SZDE
olarak kabul edilir.
Bir st rnleri fabrikasnda retilen yourtlar 500 gr.lk kutularda piyasaya srlmektedir. Fabrika kalite kontrol sorumlusu, son 45 dakikaT Eiinde
500
L E V Z Y Oretilen
N
gr.lk yourtlardan 35 tanesini alarak tartlmalarn istemifltir. Tartlan yourtlarn ortalamas 502 gr. ve standart sapmas da 1 gr. olarak hesaplanmfltr. retilen
500 gr.lk yourtlarn en az yzde ka art eksi 3,5 standart sapma aralnda
NTERNET
yer almaktadr?
RNEK 3.12
N N
Burada yourt arl deiflkenin frekans dalm hakknda hi bir bilgi verilmemifltir. Dalmn simetrik ya da asimetrik olduu konusunda bir bilgi yoktur.
Dolaysyla zm iin Chebyshev teoremi kullanlabilir. stenen aralk 3,5 standart
sapma aral olduu iin teoreme gre yourtlarn en az,
1
1
= 0, 92
1 = 1
k 2
3, 52
AMALARIMIZ
K T A P
TELEVZYON
NTERNET
52
Biyoistatistik
zet
N
A M A
N
A M A
N
A M A
N
A M A
53
Kendimizi Snayalm
1. 3, 6, 7, 8, 9, 11, 2, 8, 9 basit serisinin aritmetik ortalamas katr?
a. 5
b. 7
c. 9
d. 10
e. 11
2. 3, 5, 6, 7, 7, 8, 8, 9, 9, 9, 9, 9, 9, 10 basit serisinin
medyan katr?
a. 7
b. 7,5
c. 8
d. 8,5
e. 9
Arlk (kg.)
2-4
4-6
6-8
Frekans
2
7
4
8 - 10
Toplam
2
15
100
150
11
200
Toplam
25
6. Bir arafltrmada 7 fleker hastasnn kanlarndaki serum kolesterol deerleri 55, 60, 81, 94, 100, 110 ve 120
olarak llmfltr. Buna gre, bu basit seri iin deiflim aral katr?
a. 94
b. 89
c. 81
d. 65
e. 55
7. 1, 5, 6, 7, 8, 9, 10 basit serisinin varyans katr?
a. 8,95
b. 7,5
c. 5,58
d. 3
e. 2,99
8. Bir arafltrma sonucunda deiflken ortalamas 27,
medyan 34 ve mod deeri de 45 olarak hesaplanmfltr.
Buna gre, bu deiflkenin frekans dalmyla ilgili
afladaki ifadelerden hangisi dorudur?
a. Simetrik frekans dalmdr.
b. ki modlu frekans dalmdr.
c. Saa eik frekans dalmdr.
d. Sola eik frekans dalmdr.
e. Kmlatif frekans dalm hesaplanamaz.
9. Bir arafltrmada aritmetik ortalama 45, medyan 42 ve
varyans 25 olarak hesaplanmfltr. Bu deerlere gre,
hesaplamalar yaplan deiflkenin frekans dalm iin
Pearson eiklik katsays kaa eflittir?
a. 0,60
b. 1,20
c. 1,80
e. 3
d. 4,11
10. Ayn lm birimi ile lmlenmemifl iki deiflkenin deiflkenlik oranlarn karfllafltrmak iin afladakilerden hangisi kullanlr?
a. Aritmetik ortalama
b. Chebyshev teoremi
c. Eiklik katsays
d. Deiflkenlik katsays
e. Standart sapma
54
Biyoistatistik
Yaflamn inden
Bir konserve balk retim fabrikas yneticisi yaklaflmakta olan toplu szleflme grflmelerinde kullanlmak
zere fabrikada alflanlarn ortalama cretlerinin tespit
edilmesini istemifltir. Bu amala ynetici, fabrika personel blmnde alflmakta olan 3 grevliyi konu ile ilgili bilgilendirmifl ve ertesi sabah ortalama deeri hesaplamalarn istemifltir. Kendi aralarnda anlaflan 3 personel ifte kontrol olur dflncesi ile ortalama deerini
ayr ayr hesaplama kararna varmfltr.
Ertesi sabah ynetici bu personeli ofisine armfl
ve ortalama aylk cretin ne olduunu sormufltur. Birinci personel aylk ortalama cretin 3.400 TL olduunu,
ikinci personel 1.850 TL olduunu belirtmifltir. nc
personel ise iki adet ortalama bulduunu, bunlardan
birincisinin ynetim kadrosunda yer alanlarn cret ortalamas olan 4.550 TL ve ifli kadrosunda yer alanlarn
1.945 TL olduudur. personelde kendi hesapladklar ortalamann en doru ortalama olduunu iddia etmektedir.
Birinci personel aritmetik ortalamay tespit etmifltir. Fakat az sayda olan yneticiler ile ok sayda olan iflileri birbirinden ayrt etmeden bir ortalama hesaplamfltr.
Dolaysyla yksek deerli ynetici cretleri genel ortalamay ykseltmifltir.
kinci personel medyan deerini hesaplamfltr. Bu personelde yneticiler ve ifliler ayrm yapmayarak tm
personelin kkten bye sralanmfl cretlerine gre medyan yardm ile ortalama creti bulmufltur.
nc personel ise bu problem iin en uygun olabilecek flekilde iki ortalama hesaplamfltr. Fabrikada iki
farkl grupta alflan olduunu fark etmifl ve her grup
iin ayr ayr ortalama deerlerini hesaplamfltr.
nne sunulan farkl ortalamalar inceleyen ynetici
toplu szleflme grflmelerine, bir sonraki problemde
hangi ortalamay istediini daha net bir flekilde ifade etmesi gerektiini dflnerek, nc personelin verdii
ortalamalarla gitmifltir.
1.
2.
3.
4.
5.
6.
7.
8.
b
d
d
a
e
d
a
d
9. c
10. d
Snf Ortas
x Frekans
0 -2
2-4
12
4-6
35
6-8
21
8 - 10
18
Toplam
20
87
Ana ktle aritmetik ortalama eflitliinde bilinmeyen deerler tablo yardmyla yerlerine yazlrsa, ana ktle aritmetik ortalamas,
iN=1 fi xi
N
87
= 4, 35
20
olur.
Sra Sizde 2
Standart sapma hesaplanabilmesi iin anaktle ortalamasna da ihtiya vardr. Ana ktle ortalamas ve standart sapma hesabnda kullanlan deerler izleyen tabloda verilmifltir.
55
Yararlanlan Kaynaklar
Arlk Frekans xifi
( x )
( xi )
( xi ) fi
20
-2,60
6,76
27,04
56
-0,60
0,36
2,88
54
1,40
1,96
11,76
3,40
11,56
23,12
11
22
Toplam
20
152
64,80
iN=1 fi xi
152
= 7, 60
20
iN=1( xi
) f i
64, 80
= 1, 80
20
olur.
Sra Sizde 3
Bir arafltrmada aritmetik ortalama 70, medyan 64 ve
standart sapma da 6 olarak hesaplanlmfltr. Pearson
eiklik katsays yardmyla bu arafltrmada ilgilenilen
deiflkenin frekans dalmnn eikliini yorumlaynz.
Pearson eiklik katsays,
3 x medyan
s
olarak tanmlanmfltr. Problemde verilen deerler eflitlikte yerine yazlrsa, Pearson eiklik katsay deeri,
3(70 64)
6
=3
BYOSTATSTK
Amalarmz
N
N
N
N
N
N
Anahtar Kavramlar
Faktriyel
Permtasyon
Kombinasyon
Olaslk
rneklem Uzay
Deneme
Olay
Ayrk Olaylar
Rassal Olay
Koflullu Olaslk
Bamsz Olaylar
Rassal Deiflken
Olaslk Dalm
Binom Denemesi
Olaslk Younluk
Fonksiyonu
Standartlafltrma
erik Haritas
Biyoistatistik
OLASILIA GRfi
OLASILIK TANIMLARI VE RNEKLEM
UZAYI
OLAYLAR VE BR OLAYIN OLASILII
KOfiULLU OLASILIK
BAIMSIZ OLAYLAR
RASSAL DEfiKENLER VE OLASILIK
DAILIMLARI
RNEK 4.1
RNEK 4.2
58
Biyoistatistik
Faktriyel
Faktriyel: 1den n pozitif
tamsaysna kadar tm tamsaylarn arpmna, n faktriyel denir ve n! ile gsterilir.
n pozitif tamsaysndan kk ve eflit btn pozitif tamsaylarn arpm, n faktriyel olarak adlandrlr ve bu ifade n! ile gsterilir. Bu tanma gre;
n! = 1x2x...xn
= nx(n-1)x...x2x1
= n(n-1)!
olarak yazlabilir. zel olarak; 0! = 1 ve 1! = 1 dir.
RNEK 4.3
4! deerini hesaplaynz.
4! = 4x3x2x1 = 24
RNEK 4.4
8! deerini hesaplaynz.
8! = 8x7x6x5x4x3x2x1 = 8(7!) = 40.320
Permtasyon
ou zaman, belli bir dzende sralanmfl nesnelerden oluflan bir toplulukta sonularn ka farkl biimde ortaya ktyla ilgilenilir. rnein, 4 kitabn bir rafa
ka farkl flekilde dizilebilecei hesaplanmak istenebilir. Bu rnekte olduu gibi
yaplabilecek her bir farkl dzenleme bir permtasyon olarak adlandrlr. Tanm
vermek gerekirse, n sayda elemandan oluflan bir kmenin herhangi bir alt kmesinden yaplan her farkl sralamaya bir permtasyon denir. Permtasyonda, sralanan nesnelerin dizildii sraya dikkat edilmesi gerekir. Aflada, permtasyona
iliflkin baz zellikler ve rnekler verilmifltir.
zellik 1: n tane nesne kendi aralarnda sralandnda elde edilecek farkl dzen
says veya permtasyon says nPn ile gsterilir ve bu deer n!e eflittir.
RNEK 4.5
n!
( n - k )!
59
RNEK 4.6
PERMTASYON kelimesi 11 harften oluflur. Bu 11 harften 4 harfli oluflturulabilecek kelime saysn bulacaz. Kelimelerde harflerin sras nemlidir. Buna gre elde edilebilecek kelime says;
11 P4
11!
11! 7 ! x 7 x8x 9x10 x11
=
=
= 7.920 ' dir.
(11 - 4)! 7 !
7!
RNEK 4.7
n!
n1 ! n 2 ! n k !
ile bulunur.
BYOSTATSTK kelimesinin harflerini her dzende kullanmak kofluluyla, anlaml veya anlamsz ka farkl kelime elde edilebilir?
RNEK 4.8
n!
14 !
olur.
=
= 302.702.4
n1 ! n 2 ! n8 ! 1! 4 ! 1! 1! 2 ! 3!1!1!
400
2 yourt, 5 peynir ve 3 st kutusu bir rafa ka farkl flekilde dizilebilir?
SIRA SZDE
Kombinasyon
fi N E L M
n sayda nesne arasndan r adet nesnenin dizilifl sras dikkate Dalnmadan
ka farkl biimde seilebileceinin belirlenmesine iliflkin problemler ile karfllafllabilir. Bu
O Rbulunur.
U
durumda yaplabilecek dzenleme says kombinasyon yardmS ile
Buna
gre, n sayda nesneden herhangi r tanesi (r n) rastgele seilir ve bu r eleman
herhangi bir srada yazlrsa, buna r-dereceli kombinasyon denir. Kombinasyon
DKKAT
ile permtasyon arasndaki fark; nesnelerin dizilifl sralamas permtasyonda nemli iken, kombinasyonda nemli olmamasdr. rnein; A, B, C ile gsterilen nesnelerden iki tanesini sray gz nne almadan semek isteyelim.SIRA
AB,SZDE
AC ve BC gibi
3 farkl seim yaplabilir. Kombinasyonda nesnelerin sras nemli olmad iin
AMALARIMIZ
K T A P
N N
SIRA SZDE
D fi N E L M
S O R U
DKKAT
SIRA SZDE
AMALARIMIZ
K T A P
60
Biyoistatistik
AB ile BA ayn seimlerdir. Aflada, kombinasyona iliflkin baz zellikler ve rnekler verilmifltir.
zellik 1: n (n 0) sayda nesneden yaplabilecek r (n > r) birimlik kombinas n
n
ile gsterilir ve
yon says; n Cr , Cr ya da
r
n
n!
r = r !( n - r )! , r = 0,1, 2, ..., n
RNEK 4.9
nCn
7!
7!
= 7 =
=
= 21 olur.
5 5!(7 - 5)! 5! 2 !
zellik 3: n + n
r r + 1
n + 1
=
r + 1
' dir.
zellik 4: n + n + 1
0
n + 2
+
2
++ n + r
zellik 5: n
n - r
RNEK 4.10
= 0 ' dir.
n + r + 1
=
r
' dir.
n
=
' dir.
r
3 bayan ve 6 erkek doktor arasndan 5 kiflilik bir kurul oluflturulacaktr. Bu kurulun, 2 bayan ve 3 erkek doktordan oluflmas gerekmektedir. Buna gre, ka farkl
seim yaplabilir?
Kurula girecek, 2 bayan doktor iin 3C2 farkl seim, 3 erkek doktor iin ise 6C3
farkl seim yaplabilir. Buna gre 5 kiflilik farkl kurul says, saymann temel prensibi de dikkate alnarak; (3C2) (6C3) = 60 olarak elde edilir.
SIRA SZDE
5 renci arasndan
3 renci ka farkl flekilde seilebilir?
SIRA SZDE
D fi N E L M
D fi N E L M
S O R U
S O R U
DKKAT
DKKAT
SIRA SZDE
SIRA SZDE
AMALARIMIZ
AMALARIMIZ
61
RNEK 4.11
62
Biyoistatistik
rneklem Uzay
rneklem Uzay: Bir denemenin olas tm sonularnn oluflturduu kmeye rneklem uzay denir.
RNEK 4.12
Gnlk hayatta Ann gerekleflme olasl pdir. kalbna uyan birok ifade kullanrz. Burada A; herhangi bir olay (rnein, yenilen yiyecein bayat olmas), p
ise; nicelii ifade eden bir sayy (rnein, beflte bir) ya da bir sfat (rnein, yksek) belirtir. A olaynn meydana gelmesi ya da meydana gelmemesi, ilgili durumlara iliflkin olarak yaplan tekrarl deney ya da denemelere baldr. Bir denemenin
kesin sonucunu deneme tamamlanmadan nce tahmin etmek genelde mmkn
olmaz. Ancak, olas sonular kmesini oluflturmak mmkndr.
Olaslk kavram, bir olayn ortaya kmas ya da kmamasyla iliflkili bir kavramdr. Bu nedenle ncelikle olay ve olaya iliflkin baz kavramlar tanmlamak gerekir.
statistikte bir gzleme ya da bir lme uygulanan herhangi bir ifllem deney ya
da deneme olarak adlandrlr. Bir denemenin kesin sonucunu deneme tamamlanmadan nce tahmin etmek genellikle mmkn olmaz. Ancak, olas sonular kmesini oluflturmak mmkndr.
Bir denemenin tm olas sonularndan oluflan kmeye rneklem uzay denir
ve bu kme S harfi ile gsterilir. Denemenin olas tm sonularna Snin bir eleman karfllk gelir. Bu elemana da rneklem uzay noktas ad verilir.
Hilesiz iki bozuk para birlikte atlyor. Herhangi bir parann yaz gelmesi Y ile tura gelmesi ise T ile belirtildiinde, bu denemedeki olas sonu says 4tr. Bu denemeye iliflkin, rneklem uzay S = {YY, YT, TY, TT} olacaktr. Yaplan bu para atma denemesinde rnein, her iki parann da yaz gelmesi ya da paralardan birinin yaz, dierinin tura gelmesi vb. gibi olaylarn ortaya kma olaslklar hesaplanmak istenebilir.
rneklem uzay genellikle ierdii eleman saysna gre snflandrlr. Yukarda verilen rnekteki rneklem uzay sonlu sayda elemandan oluflmaktadr. Fakat, bir bozuk parann tura gelinceye kadar atlmas denemesinde rneklem uzay; S = {T, YT, YYT, YYYT, YYYYT, YYYYYT, ...} olarak karflmza kacaktr. Burada, rneklem uzay sonsuz sayda ardflk elemandan oluflur. Ancak bu durumda da eleman says bir tamsayya karfllk gelecektir. Bu trden rneklem uzaylar saylabilir niteliktedir. Eer bir rneklem uzay sonlu sayda ya da sonsuz fakat
saylabilir sayda eleman ieriyor ise, bu rneklem uzay kesikli rneklem uzay
adn alr.
Baz denemelerin sonular ise ne sonlu ne de saylabilir sonsuz sayda olabilir. Bir rneklem uzay sonsuz ya da saylamayacak sayda elemandan olufluyor ise,
bu rneklem uzay srekli rneklem uzay adn alr. Srekli rneklem uzaylar, uygulamalarda genellikle arlk, uzunluk, scaklk vb. gibi doal olaylara iliflkin denemelerde ortaya karlar.
63
A B : A ile B olaylarnn
birleflimi,
A B : A ile B olaylarnn
kesiflimi,
A : A olaynn tmleyeni.
RNEK 4.13
64
Biyoistatistik
RNEK 4.14
Hilesiz adet parann birer kez atlmas denemesinde en az ikisinin tura olmas olasl nedir?
Y, parann yaz gelmesi durumunu, T ise tura gelme durumunu gstersin. 3 adet
para birer kez atldna gre rneklem uzay;
S = {YYY, YYT, YTY, TYY, YTT, TYT, TTY, TTT}
olacaktr. Bu rneklem uzaynn tm sonular eflit olaslkl olduundan, her bir
rneklem uzay noktasnn ortaya kma olasl 1/8dir. A olay; parann en az
ikisinin tura gelmesi olarak tanmlanrsa, A = {YTT, TYT, TTY, TTT} olacaktr. Buna gre, en az iki tura elde etme olasl;
1 1 1 1 1
P( A ) = P( YTT) + P(TYT) + P(TTY) + P(TTT) = + + + =
8 8 8 8 2
olarak hesaplanr.
65
zellik 2: olanaksz olay ise, herhangi bir S rneklem uzay iin, P() = 0 dr.
zellik 3: A; S rneklem uzaynda herhangi bir olay ve A ; bu olayn tmleyeni ise, A olaynn gerekleflme olasl P( A) = 1 - P(A) ile hesaplanr.
Bu zellik, olasln greli frekans tanm ile iliflkilendirildiinde, rnein bir
olay %28 orannda gereklefliyorsa, %72 orannda da gerekleflmedii sonucu ortaya kar.
zellik 4: A ve B; S rneklem uzaynda herhangi iki olay olsun. P(AB) = P(A) +
P(B) - P(AB) olur.
Bir mandradan alflverifl yapan ailelerin %74nn inek peynirini, % 41inin koyun peynirini, %35inin hem inek peyniri hem de koyun peynirini tercih ettikleri
bilinmektedir. Bu mandradan alflverifl yapan herhangi bir ailenin inek ya da koyun peynirini tercih etmesi olasl nedir?
RNEK 4.15
SIRA SZDE
D fi N E L M
S O R U
S O R U
KOfiULLU OLASILIK
Olaslk kuramnda koflullu olaslk kavram, herhangi bir olaynD ortaya
K K A T kma olasl hesaplanrken baflka bir olayn bilindii durumun dikkate alnmasna olanak
tanr. A ve B, S rneklem uzaynda herhangi iki olay olsun. B olaynn gerekleflSIRA SZDE
tii bilindiinde, A olaynn ortaya kmas olasl koflullu olaslk olarak tanmlanr ve bu olaslk P(A|B) ile gsterilir. P(A|B) ifadesi, B bilindiine gre, Ann
koflullu olasl olarak okunur ve afladaki gibi hesaplanr: AMALARIMIZ
P( A B) =
P( A B)
P( B)
DKKAT
N N
P( B) > 0 iin
SIRA SZDE
AMALARIMIZ
K T A P
K T A P
TELEVZYON
TELEVZYON
NTERNET
NTERNET
66
RNEK 4.16
Biyoistatistik
ki adet hilesiz zar atlyor. Birinci zarn 4 geldii bilindiine gre, iki zarn toplamnn 7ten byk olmas olasl nedir?
rneklem uzaynda 6 6 = 36 sonu bulunur. A = {ki zarn toplamnn 7den
byk olmas} ve B = {Atlan birinci zarn 4 gelmesi} olarak tanmlayalm. Buna gre,
A = {(2,6),(3,5),(3,6),(4,4),(4,5),(4,6),(5,3),(5,4),(5,5),(5,6),(6,2),(6,3),(6,4),(6,5),(6,6)},
B = {(4,1),(4,2),(4,3),(4,4),(4,5),(4,6)} ve AB = {(4,4),(4,5),(4,6)} olacaktr. Bu olaylarn ortaya kma olaslklar;
P( A ) =
15
6
3
, P ( B) = , P ( A B) =
36
36
36
3
P( A B) 36 1
P( A B) =
=
=
P( B)
6
2
36
Koflullu olaslk eflitliinin her iki taraf P(B) ile arplrsa, olaslkta arpm kural elde edilir. Bu kurala gre; A ve B, S rneklem uzaynda herhangi iki olay ve
P(B) 0 ise,
P(AB) = P(B) P(A|B) olur.
olur.
Yani, A ve B olaylarnn birlikte ortaya kma olasl, B olaynn gerekleflme
olasl ile B bilindiine gre Ann koflullu olaslnn arpmna eflittir. Ya da,
P(A) 0 ise, A ve B olaylarnn birlikte ortaya kma olasl, A olaynn gerekleflme olasl ile A bilindiine gre Bnin koflullu olaslnn arpmna eflittir. Bu
durumun gsterimi ise;
P(AB) = P(A) P(B|A)
olarak yaplr.
Koflullu olaslk eflitlii ile arpm kural arasndaki tek fark, hangi olaslklarn
bilindiine ve hangi olasln hesaplanacana iliflkindir. P(AB) kesiflim olasl
ve P(A) olasl bilindiinde, P(B|A) koflullu olasl hesaplanabilir. P(A) ve P(B|A)
bilindiinde ise P(AB) olasl hesaplanabilir. Ayrca, P(A|B) koflullu olasl
iin, B olaynn gerekleflmesinden sonra A olaynn ortaya kmas olasl incelendii iin, bu koflullu olasln rneklem uzay B olay olacaktr. Burada Bye indirgenmifl rneklem uzay ad verilir.
67
Gda sektrnde faaliyet gsteren bir flirkette gda hijyeni denetleyicisi olarak iki
kifli grevlendirilecektir. fiirketin arafltrma blmnde befl adet, gelifltirme blmnde ise adet denetleyici bulunduuna gre, her iki denetleyicinin de arafltrma blmnden seilmesi olasl nedir?
RNEK 4.17
BAIMSIZ OLAYLAR
A ve B gibi herhangi iki olaydan birinin gereklefltiinin bilinmesi, dierinin ortaya kma olasln etkilemiyor ise, bu iki olaya bamsz olaylar ad verilir. rnein, bir zarn iki kez atlmas denemesinde, ikinci atfln alt gelmesi olay, birinci atflta elde edilen sonutan bamszdr. Dolaysyla, birinci atfl ne gelmifl olursa
olsun, ikinci atflta zarn alt gelmesi olasl deiflmeyecektir.
Yukarda verilen tanma gre P(A|B) = P(A) ve P(B|A) = P(B) ise, A ve B olaylar bamsz olaylardr. Dolaysyla P(A) 0 ve P(B) 0 olmak zere, belirtilen
her iki koflullu olaslk var olduunda, verilen eflitliklerden birinin dierini de salad grlr. Olaslkta arpm kural eflitliinde P(B|A) olasl yerine P(B) yazldnda,
Bamsz olaylar:
P(A|B) = P(A) ya da
P(B|A) = P(B) ise A ve B
bamsz olaylardr.
Dolaysyla, A ve B bamsz
olaylar ise,
P(AB) = P(A).P(B) olur.
RNEK 4.18
68
Biyoistatistik
3 3 1
= = P( A ) P( B) olduundan A ile B bamsz olaylardr.
8 4 2
3 1
3
= = P( A ) P(C) olduundan A ile C bamsz deildir.
4 4 16
1
1
1
elde edilir. Buna gre,
, P(C) = ve P( B C) =
2
4
8
P( B C) =
1 1 1
= = P( B) P(C)
8 2 4
Bamszlk kavram ikiden fazla olay iin de tanmlanabilir. Buna gre, A1, A2,
..., Ak olaylarnn bamsz olmas iin gerek ve yeter koflul, bu olaylarn her adedinin kesiflimleri olaslnn, ayr ayr olaslklarnn arpmna eflit olmasdr. Bu
duruma tam bamszlk ad verilir. rnein, A, B ve C gibi olayn tam bamszl iin, flu eflitliklerin salanmas gerekir:
P(AB) = P(A) P(B),
P(AC) = P(A) P(C),
P(BC) = P(B) P(C) ve
P(ABC) = P(A) P(B) P(C)
Burada belirtilmesi gereken bir konu; k olayn tam bamsz olmas, bu olaylarn ikifler ikifler de bamszlk koflulunu saladklarn gsterir. Ancak, ikifler ikifler
bamsz olmalar, tam bamsz olmalarn gerektirmez.
SIRA SZDE
D fi N E L M
SIRA SZDE
Milli Piyangonun
dzenledii flans oyunlar ekilifllerinden Saysal Loto ekiliflinde, bir
kiflinin tek bir kolonda 6 rakamdan yalnzca birini bilme olasl 0,41 iken, Sper Loto
ekiflinde bu olaslk 0,40tr. Her iki flans oyunundan da birer kolon oynayan bir kiflinin
D fi N E L M
her iki ekiliflte de 6 rakamdan yalnzca birini bilme olasl nedir?
S O R U
O R U
RASSALS DEfiKENLER
VE OLASILIK DAILIMLARI
DKKAT
Rassal Deiflken
DKKAT
SIRA SZDE
AMALARIMIZ
Olasla iliflkin olaylarn ounluunda, deneme sonularnn bir veya birka ynden incelenmesi sz konusudur. Bu incelemelerde, belirlenen bir deiflken zerinSIRA SZDE
de gzlemler yaplr. rnein, fleker hastalarnn kan flekeri lmnde, her hasta
iin kan flekeri miktar farkl deerler alaca iin, buradaki kan fleker deeri llebilir trden
bir rassal deiflken olacaktr. Yaplan lmlerin rastgele ve ngrAMALARIMIZ
lemeyen bir biimde deiflim gstermesi, rassal deiflken kavramnn tanmlanmas ihtiyacn ortaya karr. nk gzlenen olaylarda, genellikle olaslk deneme-
N N
K T A P
K T A P
TELEVZYON
TELEVZYON
69
lerinin sonularna iliflkin saylarla, yani rassal deiflkenlerin ald deerlerle ilgilenilir. Farkl kaynaklarda flans deiflkeni, stokastik deiflken ya da rastlant deiflkeni olarak da ifade edilen rassal deiflkenin matematiksel tanm flu flekilde ifade
edilebilir.
X; S rneklem uzaynn elemanlarna iliflkin olarak tanmlanan gerek deerli
bir fonksiyon ise, bu X deiflkenine rassal deiflken ad verilir. Rassal deiflkenleri dier deiflkenlerden ayran zellik, almfl olduu deerleri belli bir olaslkla
almasdr. Olaslk kuramnda rassal deiflkenler genellikle X, Y, Z, ... gibi byk
harflerle, deiflkenin ald deerler ise x, y, z, ... gibi kk harflerle belirtilir.
Bir adet hilesiz bozuk parann kez atlmas denemesinde, X rassal deiflkeni gelen yaz says olduuna gre, X rassal deiflkeninin ald deerleri ve bu deerleri almas olaslklarn belirtiniz.
RNEK 4.19
1
olarak elde edilir.
8
Rassal deiflkenler, genel olarak kesikli ve srekli rassal deiflkenler olmak zere iki flekilde karflmza karlar.
Sonlu ya da saylabilir sonsuz sayda olas deeri bulunan rassal deiflkenlere
kesikli rassal deiflken ad verilir. rnein, bir biskvi fabrikasnn gnlk retimi
ierisindeki kusurlu rn says, hastanenin acil servisine bir haftada baflvuran hasta says, biyoistatistik dersini alan renci says vb. gibi deiflkenler kesikli rassal
deiflkenlerdir. nk, bu deiflkenlerin her birinin saylabilir sayda deeri bulunmaktadr.
Saylamayacak ya da sonsuz sayda olas deeri bulunan ve bir say aral ya
da aralk kmesi zerinde tanmlanan rassal deiflkenlere srekli rassal deiflken
ad verilir. rnein, Eskiflehir ilinin gnlk en yksek hava scakl, markette satlan sv yalarn arlklar, yetifltirilen bir bitkinin boy uzunluu vb. gibi deiflkenler belli bir aralkta sonsuz sayda deerler alabilecekleri iin srekli rassal deiflkenlerdir.
Kesikli ve srekli rassal deiflkenler arasndaki farkllk, bir rassal deiflkenin
alaca deere iliflkin olaslklarn hesaplanmasnda ortaya kar. Bu farkll ortaya koyabilmek amacyla daha sonra olaslk dalmlar incelenmektedir.
Bilimsel arafltrmalarda kullanlan veriler, verinin zelliine gre belirli bir olaslk dalmna uyabilir. Herhangi bir olaslk dalm, X rassal deiflkeni kesikli
70
Biyoistatistik
ise, srekli ise biiminde belirtilir. Bu fonksiyonel gsterim nedeniyle, olaslk dalmlar kesikli durumda olaslk fonksiyonu, srekli durumda ise olaslk younluk fonksiyonu olarak da adlandrlrlar.
rneklemin ekildii ana ktleye iliflkin karmda bulunabilmek amacyla,
gzlenen rneklem sonularnn ortaya kma olaslklarnn bilinmesi gerekir. Bu
olaslklar, X rassal deiflkeninin olaslk dalm olarak adlandrlan teorik greli
frekanslarn dalmn elde etmede kullanlr. Olaslk dalmlar, kesikli ve srekli rassal deiflkenler iin olmak zere ikiye trde incelenir.
0 p( x ) 1
2)
ve
p( x ) = 1
' dir.
Yukarda belirtilen zellikleri salayan fonksiyonu, X kesikli rassal deiflkeninin olaslk fonksiyonu olarak da adlandrlr.
RNEK 4.20
71
fiekil 4.1
p(x)
3/8
1/8
0
Binom Dalm
Deneme saysnn sabit olduu, her denemede istenen olayn gerekleflme olaslnn deiflmedii ve tm denemelerin birbirinden bamsz yapld tekrarl denemeler, istatistik ve olaslkta ok nemli bir yer tutar. Binom dalm, tm denemelerin ayn koflullarda tekrarland ve her tekrarda birbirinden bamsz iki olaydan birinin meydana geldii denemelerde karflmza kar. Deerleri sayma yoluyla elde edilen ve sonular baflarl-baflarsz, var-yok, l-sa, pozitif-negatif gibi
ikili biimde deer alan, nitel deiflkenlere iliflkin bir dalmdr.
Bir denemenin baflarl ve baflarsz gibi olas iki sonucu bulunduunu ve bu
sonularn ortaya kma olaslklarnn srasyla p ve 1 - p = q olduunu varsayalm. rnein, hilesiz bir bozuk para atlmas denemesinde ilgilenilen zellik parann yaz gelmesi olsun. Bu durumda, p = 0,5 , q = 1 - p = 0,5 ve sonu olarak
p+q=1 olacaktr.
Yukarda belirttiimiz koflullarda deneme eer tek bir kez yaplyorsa, bu tek
denemede, ilgilenilen sonulardan birinin ya da tekinin ortaya kmas olaslklarn veren denemeye Bernoulli denemesi ad verilir. Eer deneme birden ok,
yani n kez tekrarlanrsa bu deneme Binom denemesine dnflr. Hilesiz bir bozuk para tek bir kez atldnda yaz gelmesi olasln veren deneme Bernoulli
denemesidir. Para 1den ok (n kez) atldnda bu deneme Binom denemesine
dnflr.
Binom denemesi afladaki zellikleri gsteren bir denemedir:
Yaplacak n adet deneme, daima ayn koflullarda tekrarlanmaldr.
Yaplacak her denemenin sonunda var olan iki sonutan birisi ortaya kmaldr. Bu sonulardan birisi ilgilenilen durum, dieri ise bunun tmleyeni
olan ilgilenilmeyen durumdur.
Tek bir denemede ilgilenilen durumun ortaya kma olasl p ve bunun
tersi durumunun olasl q tm denemelerde ayn kalmaldr.
Denemeler birbirinden bamsz yaplmaldr. Bir denemenin sonucu, dier
bir denemenin sonucunu etkilememelidir.
X kesikli rassal deiflkeni, n bamsz denemede gzlenen istenen durum
saysn belirtir.
Yukarda belirtilen koflullarda, n denemede x adet istenen durum ortaya kmas olasln hesaplayabilmek iin, Binom dalmnn olaslk fonksiyonu kullan-
72
Biyoistatistik
lr. Buna gre, bir X rassal deiflkeni Binom dalmna sahip ise, bu deiflken iin
olaslk fonksiyonu;
p(x) = nCx px qn-x
=0
RNEK 4.21
,
,
x = 0,1,2, ..., n
dier x deerleri iin
olarak hesaplanr.
Ayn flekilde olas dier durumlarn olaslklarn da hesaplamak mmkndr.
ikolatay yiyen drt kiflinin hibirinde belli bir sre sonra kaflnt oluflmamas
olasl:
40
ikolatay yiyen drt kifliden birinde belli bir sre sonra kaflnt oluflmas olasl:
41
ikolatay yiyen drt kiflinin ikisinde belli bir sre sonra kaflnt oluflmas olasl:
4 2
ikolatay yiyen drt kiflinin drdnde de belli bir sre sonra kaflnt oluflmas
olasl:
4 4
73
RNEK 4.22
Verilen olayn Binom denemesi olup olmadn inceleyelim. Burada her birinin
iinde altflar yumurta bulunan kutulardaki kusurlu yumurta says ile ilgilenilmektedir. Her kutuda altflar yumurta bulunduundan deneme says 6, sabit bir deerdir. Kutulardaki yumurtalarn kusurlu olmas ya da olmamas olarak tanmlayabileceimiz iki sonu vardr ve kutudan seilen herhangi bir yumurtann kusurlu olmas olasl (p = 0,10) tm denemelerde sabittir. Kutulardaki kusurlu yumurta saylar birbirlerinden bamszdr ve X rassal deiflkeni, seilen herhangi bir kutudaki kusurlu yumurta saysn belirtir. Sonu olarak yaplan deneme Binom denemesi koflullarn salar.
a) Seilen herhangi bir kutudaki yumurtalarn en fazla ikisinin kusurlu olmas
olasl, seilen kutuda hi kusurlu yumurta olmamas, bir kusurlu yumurta
olmas ve iki kusurlu yumurta olmas olaslklarnn toplamna eflittir.
60
61
6 2
ve istenen olaslk;
SIRA SZDE
D fi N E L M
D fi N E L M
S O R U
S O R U
DKKAT
DKKAT
SIRA SZDE
AMALARIMIZ
N N
SIRA SZDE
AMALARIMIZ
74
Biyoistatistik
Tm gerel saylar kmesinde tanml olan X srekli rassal deiflkenine ait bir
f(x) fonksiyonu, afladaki koflullar salyor ise, olaslk younluk fonksiyonu olarak adlandrlr.
1) f(x) 0 , - < x < iin,
2)
f ( x ) dx = 1
Srekli bir rassal deiflken iin olaslk dalm fiekil 4.3.te grlmektedir.
75
fiekil 4.3
fiekil 4.4
f(x)
f(x)
Taral alann
bykl=1
P(a X b)
Burada belirtilmesi gereken nemli bir konu, Xin olaslk dalmnn herhangi
bir c noktasndaki deeri olan f(c) ifadesi, kesikli durumdakinden farkl olarak P(X
= c) olasln vermez. Srekli rassal deiflkenlerde, olaslklar daima aralklara iliflkin olarak hesaplanr ve herhangi bir c sabit says iin P(X = c) = 0 dr.
Srekli rassal deiflkenlerin olaslk dalmnn uygulamalarda ounlukla tek tepeli ve an erisi fleklinde olduunu grrz. Bu trde veriler iin normal dalm
iyi bir model oluflturur. Normal dalm, istatistik teorisinde ok nemli bir yer tutar.
Normal Dalm
statistik teorisinde kullanlan tefiekil 4.5
mel olaslk dalmlarndan tartflf(x)
Normal Dalm
masz en nemlisi olan Normal daGrafii
lmn gnlk yaflamda pek ok
uygulamasyla karfllaflrz. rnein, gdalarn tazeliklerini koruma
sreleri, panik atak davranfllar
gsteren hastalarn psikiyatrik deerlendirme leine gre elde
edilen toplam puanlar, belli bir
sosyal evrede yetiflen okul ncex
76
Biyoistatistik
Normal dalm:
1 x
f (x) =
1
2
- < x <
fiekil 4.6
Normal Dalm
Erisinin Altnda
Kalan Alann kiye
Blnfl
Tablo 4.1
Normal Dalm in
Baz nemli Alan
Miktarlar
f (x) =
1
2
2
1 x
Standart Sapma
Kaplad Alan
0,3413+0,3413 = 0,6826
0,4772+0,4772 = 0,9544
0,4987+0,4987 = 0,9974
1.96
0,4750+0,4750 = 0,095
2.58
0,4950+0,4950 = 0,99
fiekil 4.7.de ise aritmetik ortalamadan dan 3 ya kadar uzaklaflldndaki kan alan miktarlar grlmektedir.
77
fiekil 4.7
Normal Dalmda
Aritmetik
Ortalamadan
dan 3 ya
Kadar
Uzaklaflldnda
Elde Edilen Alan
Miktarlar
f(x)
%68,26
%95,44
%99,74
3 2
+ +2 +3
ve parametrelerine iliflkin olarak ok sayda farkl normal dalm erisi izilebileceinden, tm eriler iin alanlar tablolamak mmkn deildir. Bu nedenle, Normal dalmda erinin altnda kalan alanlarn ve ya gre belirli deerlere eflit olmas gz nne alnarak x deerinin den farknn ya blnmesiyle Z harfi ile belirtilen standart deiflken elde edilir. Bu iflleme standartlafltrma ya
da z deerine dnfltrme ad verilir. Bu dnfltrme ifllemi afladaki eflitlik
yardmyla yaplr.
z=
f (z) =
1
2
1 2
z
2
Belli bir aralkta erinin altnda kalan alann hesaplanabilmesi amacyla, Standart Normal Dalmn olaslk younluk fonksiyonundan yararlanlarak oluflturulan Standart Normal Dalm Tablosu kullanlr. Bu tabloda, z deerleri ve bunlara
karfllk gelen olaslklar bulunur.
Ek-1de verilen tabloda, standart normal dalma sahip bir rassal deiflkenin 0
ile z aralnda bir deer almas olaslklar verilmektedir. Normal dalmn aritmetik ortalamaya gre simetrik bir dalm olmasndan dolay, znin negatif deerleri
iin ayn olaslklar kullanlabilir.
Standart Deiflken:
z=
78
Biyoistatistik
RNEK 4.23
fiekil 4.8
rnek 4.23. in
P(X > 16) Olasl
Bir iftlikte 200 adet bykbafl hayvan bulunmaktadr. Bu hayvanlardan elde edilen gnlk ortalama st retimi miktarnn, = 14 kg. ve standart sapmasnn
= 2,4 kg. ile normal dalma uyduu bilinmektedir.
a) Gnlk st retimi 16 kg.dan fazla olan hayvan oran ve saysn bulunuz.
b) Gnlk st retimi 10 ile 17 kg. arasnda olan hayvan oran ve saysn elde ediniz.
c) Gnlk st retimi 9 ile 11 kg. arasnda olan hayvan oran ve saysn hesaplaynz.
a) Gnlk st retimi 16 kg.dan fazla olan hayvan orann ve saysn bulabilmek iin
ncelikle X deiflkeninin ald deere karfllk gelen z deeri hesaplanmaldr.
x = 16 noktasna karfllk gelen z
deeri,
f(x)
z=
=14
16
z=0 z=0.83
x 16 14
=
= 0, 83
2, 4
P( X > 16) = P( Z > 0, 83) = 0, 5 P (0 < Z < 0, 83) = 0, 5 0, 2967 = 0, 2033 olur.
Sonu olarak, gnde 16 kg.dan fazla st reten hayvan oran % 20,33 ve says; 200 (0,2033) 41 olarak hesaplanr.
b) Gnlk st retimi 10 ile 17 kg. arasnda olan hayvan orann bulabilmek iin
bu deerlere karfllk gelen iki tane z deeri hesaplamak gerekir.
x 10 14
x 17 14
z alt = alt
=
= 1, 67 ve z st = st
=
2, 4
2
= 1, 25
2, 4
P(12 < X < 17) = P(1, 67 < Z < 1, 25) = P (0 < Z < 1, 67 ) + P(0 < Z < 1, 2
25)
= 0, 4525 + 0, 3944 = 0, 8469
Buna gre, gnlk st retimi
10 ile 17 kg. arasnda olan hayvan oran % 84,69 ve says: 200
(0,8469) 169 olarak hesaplanr.
fiekil 4.9
rnek 4.23 in
P(10 < X < 17)
Olasl
f(x)
10
z=-1.67
=14
z=0
17
z=1.25
79
x 9 14
x 11 14
z alt = alt
=
= 2, 08 ve z st = st
=
= 1, 25
2, 4
2, 4
P(9 < X < 11) = P(2, 08 < Z < 1, 25) = P(0 < Z < 2, 08) P(0 < Z < 1, 25)
= 0, 4812 0, 3944 = 0, 0868
Buna gre, gnlk st retimi 9 ile 11 kg. arasnda olan hayvan oran % 8,68
ve says: 200 (0,0868) 17 olur.
fiekil 4.10
f(x)
rnek 4.23 in
P(9 < X < 11)
Olasl
9
11
z=-2,08 z=-1.25
=14
z=0
SIRA
Yeni kan bir vitamin, arlk ortalamas 120 gr. ve standart sapmas
4,2SZDE
gr. olan fliflelerden satfla sunulmufltur. Eskiflehir ecza deposuna gnderilen 6.000 fliflelik bir partide
arl 110 gr. ile 128 gr. arasnda bulunan flifle saysn bulunuz.
SIRA SZDE
D fi N E L M
D fi N E L M
S O R U
S O R U
DKKAT
DKKAT
SIRA SZDE
AMALARIMIZ
N N
SIRA SZDE
AMALARIMIZ
K T A P
K T A P
TELEVZYON
TELEVZYON
NTERNET
NTERNET
80
Biyoistatistik
zet
N
AM A
n!
dzenlerin says, n Pk =
ile hesaplanr.
( n k )!
n sayda nesneden herhangi r tanesi rastgele seilir ve bu r eleman herhangi bir srada yazlrsa,
buna r-dereceli kombinasyon denilir. n sayda
nesneden yaplabilecek r birimlik kombinasyon
n!
says, n Cr =
ile hesaplanr. Komr !( n r )!
binasyon ile permtasyon arasndaki fark, nesnelerin dizilifl sralamas permtasyonda nemli
iken, kombinasyonda nemli olmamasdr.
N
AM A
n
oran ile hesaplanr.
N
Olasln greli frekans tanmna gre, bir olayn
gerekleflme olasl, bu olayn uzun dnemde
gerekleflme oranna eflittir.
Olasln kiflisel ya da sbjektif yorumuna gre
olaslk, belirsizlie iliflkin kiflisel fikirlerin saysal
olarak miktarn ifade eder. Genellikle duruma
iliflkin sezgilere ya da nceki tecrbelere dayanarak tahmin yrtme sonucunda verilen olaslktr.
Bir denemenin tm olas sonularnn oluflturduu kme rneklem uzay olarak adlandrlr ve
N
A M A
N
AM A
rneklem uzaynda tanmlanan iki olaydan birinin gereklefltii bilindiinde, dierinin ortaya
kma olasln hesaplamak.
A ve B, S rneklem uzaynda herhangi iki olay
olsun. B olaynn gereklefltii bilindiinde, A
olaynn ortaya kmas olasl koflullu olaslk
olarak tanmlanr ve bu olaslk P(A|B) ile gsterilir ve bu olaslk P( A B) =
N
A M A
P ( A B)
eflitliiyle
P ( B)
hesaplanr.
Olaslkta arpm Kuralna gre; A ve B, S rneklem uzaynda herhangi iki olay ve P(B) 0
ise, P(AB) = P(B) P(A|B) = P(A) P(B|A) olur.
Bamsz olaylar tanmlamak.
A ve B gibi herhangi iki olaydan birinin gereklefltiinin bilinmesi, dierinin ortaya kma olasln etkilemiyor ise, bu iki olaya bamsz olaylar ad verilir. Bu tanma gre, P(A|B) = P(A) ve
P(B|A) = P(B) ise, A ve B olaylar bamsz olaylardr. Buna gre, P(AB) = P(A) P(B|A) = P(A)
P(B) elde edilir. Bu eflitlik, iki olayn bamszl iin gerek ve yeter kofluldur. Ayrca, A ve B
olaylar bamsz ise, A ile, B , A ile B ve A ile B
olaylar bamszdr.
A1, A2, ..., Ak olaylarnn bamsz olmas iin
gerek ve yeter koflul, bu olaylarn her 2, 3, ..., k
adedinin kesiflimleri olaslnn, ayr ayr olaslklarnn arpmna eflit olmasdr. Bu duruma
tam bamszlk denilir.
N
AM A
81
Belli bir aralkta erinin altnda kalan alann hesaplanabilmesi amacyla, Standart Normal Dalmn olaslk younluk fonksiyonundan yararlanlarak oluflturulan Standart Normal Dalm Tablosu kullanlr. Bu tablo yardmyla, yukarda verilen formlle hesaplanan z deerlerine karfllk
gelen olaslklar bulunabilir.
82
Biyoistatistik
Kendimizi Snayalm
1. 10 adet yumurta kolisi 4 rafa dizilecektir. Birinci raf
2 koli, ikinci raf 4 koli, nc raf 1 koli ve drdnc
raf 3 koli alabildiine gre, bu dizme ifllemi ka farkl
biimde yaplabilir?
a. 24
b. 210
c. 5.040
d. 12.600
e. 362.880
83
Yaflamn inden
Yerel bir A firmas rettii yeni bir ikolatay bulunduu ilin marketlerinde satfla sunmufltur. Bu firma rettii mamule o kadar gvenmektedir ki, yapt televizyon reklamlarnda yeni ikolatann ok yksek bir oranda beenileceini iddia etmektedir. A firmasnn bu iddiasna flpheyle yaklaflan bir arafltrmac, byk bir spermarkete girerek rastgele setii on befl kifliden, A
firmasnn rettii bu yeni ikolatay tatmalarn istemifl
ve bu rn beenip beenmediklerini sormufltur. On
befl kiflinin tamam yeni ikolatay beenmediklerini
belirtmifllerdir. Acaba bu durumda, ikolatann satfla
sunulduu ilde A firmasnn rnn ok yksek oranda
beenilecei iddias hakknda ne karar verirsiniz?
Eer firma iddiasnda hakl ise, ilde rn deneyenlerin
en az yars rn beenmeli ve buna yakn bir oran da
rneklemde gzlenmelidir. Fakat A firmasnn iddias
ile ok eliflen bir durum olarak, seilen rneklemdeki
kiflilerin hibirisinin yeni ikolatay beenmedii sonucu ortaya kmfltr. Dolaysyla, ana ktledeki yeni ikolatay beenen kifli orannn % 50den az olduu ve
bu rnn beenilmeyecei sonucuna varabiliriz. Bu
karara varmamzn nedeni, rneklemden elde edilen
sonularn firmann iddiasyla yksek oranda eliflkili
olmasdr. Fakat, rassal olarak ekilen rneklemin aksi
ynde sonu vermesi, A firmasnn ortaya att iddiann gerekleflmeyecei anlamna da gelmemelidir. Bu
durumda sylenebilecek fley; byle bir sonucun olduka beklenmedik olduudur. Dolaysyla burada yaplmas gereken; A firmasnn yeni ikolatann beenilecei iddiasyla eliflkinin derecesini olaslk bakmndan
lmektir.
Bu sonu karmnda olasln roln daha iyi grebilmek amacyla, seilen onbefl kifliden yedisinin rn
beendiini, sekizinin ise beenmediini varsayalm.
Bu sonucun beklenmeyen bir sonu olduunu ve A firmasnn iddasna ters dfltn dflnmeli miyiz? Peki
alt beenen, dokuz beenmeyen ya da drt beenen,
on bir beenmeyen olursa ne sylemeliyiz? Kararmz
etkileyecek snr ne olmal? A firmasnn iddiasnn doru olduunu varsaydmzda, bu iddiaya katlmamamz salayacak gzlenen rneklem sonularnn beklenmedik bir durum olduuna hangi noktada karar vereceiz? Bu sorulara cevap verebilmek iin, belli bir rneklem sonucunun elde edilmesi olasln nasl bulacamz bilmemiz gerekir. Bu olaslk bilindii takdirde, A firmasnn iddiasna katlp katlmayacamz belirleyebiliriz. Olaslk, sonu karm yapmamz salayan bir ara olarak karflmza kar.
1. d
2. e
3. d
4. e
5. b
6. c
7. e
8. c
9. d
10. b
84
Biyoistatistik
Sra Sizde 6
f(x)
n!
10 !
=
= 2.520 farkl flekilde
dndan,
n1 ! n 2 ! n3 ! 2 ! 5! 3!
dizilebilir.
Sra Sizde 2
Seilen rencilerin sras nemli deildir. Bu nedenle
yaplabilecek seim says;
5 C3
5!
5!
120
=
=
= 10
3!(5 3)! 3!2 ! 6 2
=120
z=0
110
z=-2.38
128
z=1.90
olur.
z alt =
Sra Sizde 3
a) P (A B) = P( A ) + P( B) P( A B)
3 5 1 263
= + =
,
8 9 5 360
3 5
b) P( A ) = 1 P ( A ) = 1 = ,
8 8
c) P (A B) = P( A ) + P( B) P( A B)
= P( A ) + P( B) P( A ) P( A B)
5 1 29
= P( B) + P ( A B) = 1 + =
9 5 45
z st =
x alt
x st
110 120
= 2, 38 ,
4, 2
128 120
= 1, 90
4, 2
Buna gre arl 110 ile 128 gr. arasnda bulunan flifle
oran % 96,26 ve says: 6.000 (0,9626) 5.776 flifle olacaktr.
5 1 16
d) P( A B) = P ( B) P ( A B) = =
9 5 45
Sra Sizde 4
A = {Kiflinin Saysal Loto ekiliflinde bir kolonda 6 rakamdan birini bilmesi}, B = { Kiflinin Sper Loto ekiliflinde bir kolonda 6 rakamdan birini bilmesi } olarak tanmlandnda, bu A ve B olaylar bamsz olaylardr.
Buna gre istenen olaslk;
P(AB) = P(A) P(B) = (0,41) (0,40) = 0,164
olacaktr.
Sra Sizde 5
Burada olasl arafltrlan deneme bir Binom denemesidir ve p = 0,60 , n = 10 ve x = 8 deerleri Binom
dalmnda yerine konulduunda istenen olaslk bulunabilir.
P(X=8)=10C8 (0,60)8 (0,40)10-8 = 45 (0,0168) (0,16) 0,12
1 90
0
Yararlanlan Kaynaklar
Esin, A., Ekni, M., Gamgam H. (1997). Salk Bilimlerinde statistik, Ankara: Gazi niversitesi Fen-Edebiyat Fakltesi Yaynlar.
Freund, J.E. (1992). Mathematical Statistics, Prentice
Hall, Inc., USA.
Grimmett, G.R., Stirzaker, D.R. (2001). Probability and
Random Processes, Oxford University Press.
nal, H.C., Gnay, S. (1999). Olaslk ve Matematiksel
statistik, Ankara: H.. Fen Fakltesi Yaynlar.
Kan, ., Glesen, . (1982). Biyoistatistik, Ankara: T.C.
Uluda niversitesi Yaynlar.
Ott, L. (1988). An Introduction To Statistical Methods And Data Analysis, PWS-Kent Publishing
Company, Boston.
Serper, . (2000). Uygulamal statistik I, Bursa: Ezgi
Kitabevi.
Yzer, A.F. (1996). Olaslk ve statistik, Eskiflehir:
Anadolu niversitesi Fen Fakltesi Yaynlar.
85
BYOSTATSTK
5
Amalarmz
N
N
N
N
N
N
N
N
Anahtar Kavramlar
rnekleme
Ana ktle
rneklem
Tam saym
rnekleme Oran
rnekleme erevesi
Ana Ktle Birimi
rnekleme Birimi
statistik
Tahminci
rneklem Hacmi
Sistematik Hata
Rassal Hata (rnekleme Hatas)
Standart Hata
Olaslkl rnekleme
Basit Rassal rnekleme
erik Haritas
Biyoistatistik
rnekleme
rnekleme
RNEKLEMEYE LfiKN TEMEL TANIM VE
KAVRAMLAR
Bu nitede, daha nceki nitelerde ksaca ana ktlenin tamamna ulafllamadnda, bu ana ktleden rneklem seme sreci olarak tanmlanan rnekleme kavram ayrntl olarak incelenecektir.
Seilen rneklem yardmyla ana ktleye iliflkin olarak genelleme yani rnekleme yapldnda, hata yapma olasl da mevcuttur. Ancak hata yapma olasl
bulunmasna ramen rnekleme ou durumda tercih edilir. nk, ana ktledeki tm birimlere ulaflarak arafltrmay gereklefltirmek, fiziksel imkanlarn yeterli
olup olmamasna baldr. Ana ktlenin tamamna ulafllamad durumlarda, rneklem seme yoluna gidilmesi zorunludur.
ncelenen zellikleri ynnden genellemeler yaplmas istenen bir ana ktleden, belli yntemlerle rneklemin seilmesi ve bu rneklemin incelenmesi sonucunda hesaplanan istatistiklerin genelleme amacyla kullanlmas ifllemlerinden
oluflan srece rnekleme ad verilir.
Birinci nitede, ana ktle, rneklem, parametre ve istatistik kavramlar verilmiflti. fiimdi ise, rneklemeyle ilgili dier temel tanm ve kavramlar inceleyelim.
Tam Saym
lgilenilen sonlu ana ktlenin btn birimlerine iliflkin bilgilerin sistemli olarak elde edilmesi ve kaydedilmesi srecine tam saym denilir. Tam saym sonucunda elde edilen bilgiler, veri derleme hatas ifllenmedii takdirde kesin bilgilerdir. rnein, bir biskvi fabrikasnda bir gn ierisinde retilen tm rnlerin ortalama arl belirlenmek istenildiinde, btn biskvilerin tartlmas gerekir. Dolaysyla, tam
saym yaplmfl olur. rneklemeye tam saym yaplamad durumlarda baflvurulur.
rnekleme Oran
Seilen rneklemdeki birim saysnn (rneklem hacminin), ana ktledeki birim san
ysna oranna rnekleme oran ad verilir ve f = eflitlii ile hesaplanr.
N
rnekleme erevesi
rneklemin ekildii sonlu bir ana ktledeki birimlerin yer ald listeye rnekleme
erevesi ad verilir. rnein, byk bir firmada alflan tm elemanlar arasndan bir
rneklem ekmek istenildiinde, firmann telefon rehberinde yazl isimler arasndan
seim yaplyor ise bu telefon rehberi rnekleme erevesi olacaktr. rnekleme erevesinin tanmlanan ana ktledeki birimleri olabildiince iermesi gerekir.
88
Biyoistatistik
rnekleme Birimi
Ana ktleden seilen rneklemi oluflturan elemanlara rnekleme birimi ad verilir.
rnekleme birimi bir tek ana ktle biriminden oluflabilecei gibi, birden ok ana
ktle biriminden de oluflabilir. rnein, Trkiyede okul baflna dflen retmen
says tahmin edilmek istendiinde, ana ktle birimi olarak okullar, rnekleme birimi olarak iller alnabilir. Bu durumda rneklem seme ifli iller zerinden yaplarak istenen tahmin yaplr.
Gzlem Birimi
Bilgilerin elde edildii ve istatistiklerin derlendii birime gzlem birimi ad verilir.
rnekleme birimi ile gzlem birimi ayn olabilecei gibi, farkl da olabilir. rnein, ilkretim rencileri zerine yaplacak bir arafltrmada bilgiler rencilerden
toplanyorsa, her bir renci bir gzlem birimidir. Bu arafltrma iin gerekli bilgiler
rencilerden deil de snf retmenlerinden elde ediliyorsa, her bir snf retmeni bir gzlem birimi olur.
Tahminci
Bir ana ktle parametresinin olas deerinin belirlenmesinde kullanlan rneklem
istatistiine tahminci ad verilir. Her tahminci bir rassal deiflkendir. rnein, ana
ktle aritmetik ortalamasnn tahmincisi olarak rneklem aritmetik ortalamas kullanlabilir.
RNEKLEMENN AVANTAJLARI
rneklemenin, tam sayma gre eflitli avantajlar bulunur. Veriler ana ktlenin kk bir blm olan rneklemden elde edildiinde, yaplan harcamalar tamsayma
gre daha dflk olacaktr. Dolaysyla rnekleme, arafltrmann maliyetini azaltr.
rneklem seildiinde, veriler tam sayma gre daha ksa bir zamanda toplanabilir ve zetlenebilir. zellikle bilgiye acilen gereksinim duyulduunda, bu durum ok byk nem kazanr. Yani rnekleme, tam sayma gre zaman tasarrufu da salar.
Tam saym yaplmasnn mmkn olmad durumlarda, rnekleme yapmaktan
baflka bilgi elde etme yolu yoktur. Baflka bir ifadeyle, arafltrmada incelenen birimden bilgi edinilebilmesi iin bu birimin tahrip edilmesi gerekiyorsa ya da incelenen
ana ktle sonsuz ana ktle ise rneklemeye baflvurmak zorunludur. rnein, herhangi bir kiflinin kolesterol lmnn yaplabilmesi iin kan tahlili yaplmas gerekiyor ise, bu kiflinin tm kan alnamaz. Ya da, bir fabrikada retilen gda rnlerinin dayankllk sresi test edilecek ise, btn rnlerin dayanma sresinin beklenmesi sz konusu deildir. Byle durumlarda, rnekleme yaplmas zorunludur.
rnekleme, arafltrlan konuya iliflkin daha ayrntl bilgi edinilmesini salar. ncelenen kifli says az olduunda, arafltrmac her bir kifliye daha fazla zaman ayrarak genifl kapsaml bir alflma yrtebilir. Bylece, konuyla ilgili ayrntl bilgi
edinilebilir. Ancak bu, rneklem ne kadar kk olursa o kadar iyidir anlamna
gelmemektedir. Dorusu, bunun tam tersidir. Genellikle, doru rnekleme yntemi kullanldnda, byk hacimli rneklem ile ana ktleye iliflkin daha gvenilir
bilgi edinilebilir.
Ayrca, rnekleme tam saym kadar ve hatta bazen tam saymdan daha fazla
doru bilgi elde etme imkan verir. nk, rneklem seildiinde veri derleme
hatalar tam sayma gre genellikle daha az olur.
5. nite - rnekleme
Sistematik Hata
Bilindii gibi rneklemden hesaplanan istatistik, genellikle ana ktle parametresinden farkl deerler alr. Hesaplanan rneklem istatistikleri, ana ktle parametresinden ya hep daha kk, ya da hep daha byk olarak belirleniyorsa, yani hesaplanan bu deerler ana ktle parametresinden her zaman tek bir ynde farkllk
89
90
Biyoistatistik
RNEKLEME YNTEMLER
rneklemenin en nemli aflamalarndan birisi; incelenen ana ktleyi iyi temsil
edebilecek bir rneklemin seilmesidir. Bir dier deyiflle, temsili rneklemden hesaplanan rneklem istatistikleri, ana ktle parametresine yakn deerler almaldr.
Bunun gereklefltirebilmesi iin, ana ktlenin yapsna en uygun rnekleme ynteminin belirlenmesi gerekir.
rneklem yntemleri genel olarak olaslkl ve olaslkl olmayan rnekleme
yntemleri olmak zere iki snfa ayrlr. Olaslkl rnekleme yntemlerinin bilimsel arafltrmalarda ok daha fazla kullanlmas nedeniyle, arlk olaslkl rnekleme yntemlerine verilecek, olaslkl olmayan rnekleme yntemlerinden en sk
kullanlanlar ksaca tanmlanacaktr.
Olaslkl (Rassal)
rnekleme: Ana ktledeki
her rnekleme birimi iin
seilecek rneklemde yer
alma olaslnn
belirlenebildii rnekleme
yntemine olaslkl
rnekleme ad verilir.
5. nite - rnekleme
91
l rnekleme yntemleri ile, seilen rneklemin ana ktleyi ne kadar temsil edebildii tespit edilebilir. Seilen rneklemin ana ktleyi iyi temsil edebilmesi, dolayl
olarak rassal seim yapma yoluyla salanr. Bunun yannda, rneklemin ana ktleyi ne kadar temsil edebildiinin belirlenmesi, ncelikle hangi olaslkl ya da rassal rnekleme ynteminin seileceine ve ne kadarlk bir rneklem hacmi gerektiine karar verilmesine baldr.
Bu blmde, uygulamalarda en sk kullanlan olaslkl rnekleme yntemlerine deinilecektir.
RNEK 5.1
92
Biyoistatistik
Ana ktledeki birimler 1den 500e kadar numaralandrlr. Tablodan rassal olarak satr ve stun seilir. rnein, 4. stun ve 7. satr bafllang noktas olarak belirlemifl olalm ve rneklem birimlerini seebilmek iin bu noktadan afla doru
ilerleyelim. Bu satr ve stuna karfllk gelen ilk haneli rakam 398dir. n=10 hacminde rneklem oluflturmak iin aflaya doru 500 gemeyen 10 adet say belirlenir. Tablo 5.1.de nite sonunda verilen rassal saylar tablosunun ilgili ksm
grlmektedir. Buna gre, seilen rnekleme birimi numaralar;
398, 227, 121, 272, 423, 180, 472, 228, 4, 274
olacaktr. Stunda ilerlerken bir say birden ok grlyorsa bu say dikkate
alnmayarak, izleyen saydan devam edilir.
Tablo5.1
rnek 5.1. in
Rassal Saylar
Tablosu Yardmyla
Seilen rneklem
Birimleri
3982
2272
5816
8326
5421
1216
9653
2728
9478
4236
9252
9108
1802
9220
4724
2286
7349
0042
2744
Sistematik rnekleme
Sistematik rnekleme (S):
Ana ktle birimleri belli bir
dzende sralanabildiinde,
rneklemde yer alacak ilk
birim, ana ktledeki ilk k
birim arasndan rassal
olarak seilip, bundan sonra
gelen her kinci birimin
rnekleme alnd ynteme
denir.
93
5. nite - rnekleme
lk k birim arasndan rassal olarak seilen birim, rnekleme alnacak ilk birim
olur. Bundan sonra gelecek ikinci birim, ilk birimin sra numarasna k says eklenerek elde edilir. Bu ifllem n byklnde rneklem elde edilinceye dek srdrlr. Dolaysyla rnekleme seilen ilk birim btn rneklemi belirlemifl olur. k
says tamsay olabilecei gibi, kesirli bir say olarak da hesaplanabilir. Bu durumda k says yuvarlanr. Ayrca verilen bilgilere gre, S ynteminde seilebilecek
olas rneklem says k olacaktr.
Ana ktledeki birim says N= 70, seilecek rneklem hacmi de n= 10 ise, S yntemine gre rnekleme alnacak birim numaralarn belirleyiniz.
RNEK 5.2
N 70
=
= 7 olur. rnekleme alnacak ilk birim, ilk 7 birim arasndan
n 10
rassal olarak belirlenir. Ana ktlede yer alan nc birim rnekleme alnacak ilk
birim olarak belirlenmifl olsun. Bu durumda, rnekleme girecek birim numaralar
afladaki gibi belirlenir.
3, 10, 17, 24, 31, 38, 45, 52, 59, 66
Bylece 10 birimlik rneklem sistematik olarak seilmifl olur.
k=
Tabakal rnekleme
D fi N E L M
Uygulamalarda ok sk kullanlan bir dier olaslkl rnekleme
yntemi de Tabakal rnekleme (T)dir. Bu yntem, ana ktlenin arafltrmann konusunu olufltuO R U
ran bir ya da daha fazla deiflken bakmndan eflitli alt gruplaraS blnmesi
ve her
bir alt gruptan ayr ayr rneklem ekilmesi fleklinde uygulanr. Buradaki her alt
grup tabaka adn almaktadr. Tabakalar oluflturan birimler kendi ilerinde inceleDKKAT
nen deiflken ynnden ortak zelliklere sahip olmakla birlikte, dier tabakalardaki birimlerden belirgin biimde farkllk gstermelidir. Ayrca, ana ktlede yer alan
SIRA SZDE
tm birimler tek bir tabakada yer alacak ve hi bir ana ktle birimi
dflarda kalmayacak biimde tabakalanmaldr. Bu durumda, her bir tabaka ayr ayr ana ktlelermifl gibi dflnlerek, bu tabakalara en uygun rnekleme yntemi
uygulanabilir.
AMALARIMIZ
Dolaysyla T, bilinen rnekleme yntemlerin tabakalara uygulanmas olarak ifade edilebilir. Ana ktlede oluflturulan btn tabakalara BR ynteminin uyguland tabakal rnekleme trne Tabakal Rassal rnekleme (TR)
K T ad
A Pverilir.
rnein, bir markette satfla sunulan tm gda rnleri incelenecek ana ktleyi
oluflturuyor ise, bu ana ktle, et rnleri, st rnleri, biskvi ve flekerleme, iecekler, hazr gdalar, kuruyemifller vb. gibi tabakalara ayrlarak
rT E Lher
E V Ztabakadan
YON
neklem seme yoluna gidilebilir.
Dolaysyla, Tde seilecek rneklem, her tabakadan ayr ayr ve birbirinden
bamsz olarak seilen rnekleme birimlerinden oluflur.
N T E R Nolan
E T deiflken
T yntemi, genellikle incelenecek ana ktle arafltrma konusu
ya da deiflkenler ynnden heterojen olduunda baflvurulan bir yntemdir. Heterojen olan bir ana ktlede tahmin edilecek parametrelerin standart hatalar byk kar. Ana ktle birimleri, kendi iinde homojen tabakalara ayrldnda, ana
ktle daha kk standart hatal alt ana ktlelerin birleflimi olarak kabul edilebilir.
Bylece seilecek rneklemin ana ktleyi temsil yetenei daha fazla olur.
T yntemi iin bir dier nemli konu da belirlenecek tabaka saysdr. rnekleme yntemleri belirlenirken ana ktlenin yapsna en uygun olan yntemin se-
SIRA SZDE
D fi N E L M
S O R U
DKKAT
N N
SIRA SZDE
AMALARIMIZ
Tabakal rnekleme
K T(T):
A P
Ana ktlenin arafltrmann
konusunu oluflturan
deiflken ya da deiflkenler
bakmndan tabakalara
TELEVZYON
ayrlarak, her tabakadan
ayr ayr rneklem ekildii
rnekleme yntemine denir.
Tabakal Rassal rnekleme
N T Eyer
R Nalan
ET
(TR): Ana ktlede
her bir tabakaya BR
yntemi uygulanyor ise, bu
ynteme tabakal rassal
rnekleme ad verilir.
94
Biyoistatistik
Kme rneklemesi
Ana ktleden seilen rnekleme birimlerinin, bir tek ana ktle biriminden oluflabilecei gibi, birden ok ana ktle biriminden de oluflabilecei belirtilmiflti. flte,
rnekleme birimlerinin birden ok ana ktle biriminden olufltuu olaslkl rneklemeye Kme rneklemesi (K), her bir rnekleme birimine de bir kme ad
verilir. K ynteminde, seilen kmeler eflit ya da farkl sayda ana ktle birimi
ierebilir. Bu yntemde ana ktle alt gruplara blnr ve bu gruplar zerinden rneklemeye geilerek rnekleme giren gruplarn tamam alnr. ekilen kmelerin
ierdii ana ktle birimleri rneklemi oluflturaca iin, kmelerin en uygun flekilde elde edilmesi gerekir.
K yntemi BR yntemine kyasla, arafltrmann maliyetini dflrmek ve zaman kstnn etkisini azaltmak amacyla uygulanr. Bu yntemde ana ktle birimlerinin tamamnn listelenmesi gerekmez. Bu listeleme ifllemi genifl apl arafltrmalarda byk bir mali kaynak ve genifl bir zaman gerektirir. Arafltrma iin mali kaynaklar yeterli olmadnda ve/veya kstl bir zaman ierisinde arafltrmann tamamlanmas gerektiinde, ana ktlenin tamamnn listelenerek BR ynteminin uygulanmas imkanszlaflr. Dier taraftan, K ynteminde sadece seilmifl olan kmelerde yer alan ana ktle birimleri belirlenerek listelenir.
Btn ana ktle birimlerinin yer ald bir liste oluflturulsa bile, kme hacmi byk tutularak BRye gre maliyet dflrlebilir. rnein, belli bir ilde yaflayan insanlarn gda hijyeni konusuna verdikleri nemi tespit etmek amacyla genifl apl bir
arafltrma planlanmfl olsun. BR yntemi kullanlarak belirlenen 5.000 kiflilik bir rneklem zerinden bu arafltrma gereklefltirilebilir. Ancak, tm ilden rassal olarak seilen 5.000 kifliyi incelemek yerine, her birinde 1.000 kifli bulunan 5 mahalleyi incelemek arafltrmann tamamlanma sresini ve toplam maliyetini azaltacaktr.
Ancak burada seim ifllemi kmeler olan mahalleler zerinden gereklefltirildii iin, her bir mahallenin (yani kmenin) dier mahallelerle gda hijyeni konusuna verdikleri nem ynnden benzefltii ve mahallelerin kendi ierisinde tm ili
iyi temsil edebildii varsaylmfltr. Aslnda bu varsaym yaklaflk olarak geerlidir
ve belirlenen her mahallenin gda hijyeni konusunda kendine zg hareket tarzlar olabilir. Bu nedenle, K ynteminin deiflkenlii ayn il iin uygulanabilecek
BR ynteminden daha fazla olacaktr ve dolaysyla yaplan tahminlerdeki hata
miktar daha yksek olacaktr. Bu olumsuz etkileri azaltmann yolu, rneklem hacminin olabildiince yksek tutulmasdr.
Verilen bilgilerden anlaflld zere, K, incelenecek ana ktle kendi iinde
heterojen, birbirleri arasnda homojen gruplara ayrldnda uygulanan bir rnekleme yntemidir. Bu ynyle T ynteminin tam tersidir. nk, T ynteminde,
ana ktleyi oluflturan tabakalar kendi iinde homojen, birbirleri arasnda heterojen
zellikler gstermektedir. Knde ise, kmeler kendi ilerinde ana ktleyi iyi temsil edecek flekilde olabildiince deiflkenlik gstermelidir. nk seilen kme ne
kadar farkl ana ktle birimlerinden oluflursa, ana ktleyi temsil edebilme zellii
de o lde artar.
95
5. nite - rnekleme
D fi N E L M
SIRA SZDE
D fi N E L M
Ana ktledeki baz birimlerin seilen rneklemde yer alma flansnn bulunmad,
O R U
ya da seilme olaslnn tam olarak belirlenemedii rneklemeS yntemlerine
olaslkl olmayan rnekleme yntemleri ad verilir. Baz arafltrmalarda, ana ktle ok byk ve genifl bir alana yaylmfl olabilir ya da rnekleme
erevesinin haDKKAT
zrlanabilmesi mmkn olmayabilir. rnein, insanlarda obezite problemi zerinde bir arafltrma yapmak istenildiinde, obezite problemi yaflayan kiflilerin listesini
SIRA SZDE
oluflturmak olduka g olabilir. Olaslkl olmayan rnekleme
yntemlerine, genellikle olaslkl rnekleme yntemleri kullanmann mmkn olamad durumlarda baflvurulur.
AMALARIMIZ
Bu yntemlerde, birimlerin seimi rassal olmad iin, rnekleme hatalar belirlenemez. Byle durumlarda seilen rneklem ana ktleye iliflkin olarak snrl
bilgi ierir. rneklem ile ana ktle arasndaki iliflkiye ait bilgilerK snrl
T A olduundan,
P
rneklemden elde edilen tahminlerin ana ktle iin genellenmesi zorlaflr. Bu
olumsuz ynlerinden dolay, uygulamalarda olaslkl olmayan rnekleme yntemlerine, olaslkl rnekleme yntemlerinden ok daha az baflvurulur.
TELEVZYON
S O R U
Olaslkl Olmayan
rnekleme: Ana ktlede yer
alan baz birimlerin seilen
rneklemde bulunma
DKKAT
olaslnn olmad, ya da
tam olarak belirlenemedii
rnekleme yntemine
denir.
SIRA SZDE
N N
AMALARIMIZ
K T A P
TELEVZYON
Kolayda rnekleme
Kolayda rnekleme temsil edebilirlikten ok, uygunluk ilkesine dayal bir rnekT E R N E Tolmayan bir
lem seimi yntemidir. Kolayda rneklemede birimler nceden Nplanl
biimde rnekleme alnr. rnein, alfl-verifl merkezlerindeki herhangi bir maazann nnde duran ve oradan geen insanlara birka soruluk anket uygulayan bir
kimse, kolayda rnekleme yntemi uygulamaktadr.
Kota rneklemesi
Kota rneklemesi, tabakal rneklemenin olaslksal olmayan biimidir. Tabakal
rneklemede olduu gibi, kota rneklemesi de ana ktle ierisinde yafl, rk, sosyal
snf vb. gibi nemli farkllklar bulunduu bilindiinde uygulanan bir yntemdir.
Ana ktle belirlenen deiflkene gre tabakalanr. Daha sonraki admda arafltrmac, tanmlanan her tabaka iin seilen rneklemde kaar birim bulunacan belirten bir kota says belirler. Bu say incelenen deiflkenlerin nem dereceleriyle
orantl olarak belirlenir. Ardndan, arafltrmac her tabaka iin belirledii kota saysna gre kiflisel kararlarn uygulayarak veri toplar. Kota rneklemesinin bu adm karar rneklemesine benzemekle birlikte, karar vericilerin konunun uzman olmamas ve deil genellikle anketi uygulayan kifliler olmas ynyle birbirinden
farkllk gsterir.
NTERNET
96
Biyoistatistik
Kartopu rneklemesi
Baz durumlarda, ana ktlenin kimlerden oluflacan bilmek mmkn olmaz. Kartopu rneklemesinde, ilk nce tanmlanan ana ktlede yer alan bir birim belirlenir.
Bu birim seilecek rneklemdeki ilk birimdir. Daha sonra, bu birime ayn ana ktlede yer alabilecek baflka bir birimin olup olmad sorulur ve var ise bu birime gidilir. Bu da rneklemde yer alan ikinci birim olur. Sre rneklemin tamam elde
edilinceye kadar devam eder. Bylece rneklem, karda yuvarlanarak byyen bir
kartopu gibi byme gsterir. Kartopu rneklemesi genellikle, eflitli sebeplerden
kimliklerini gizli tutmak isteyen birimlerden oluflan ana ktleler zerinde inceleme
yaplaca zaman kullanlr.
Karar rneklemesi
Karar rneklemesi ynteminde, arafltrmacnn kendi kiflisel kararlarna gre rneklem birimleri belirlenir. Bu yntemi uygulayan arafltrmacnn ilgilenilen ana
ktleyi ok iyi tanmas gereklidir. Yani, konusunda uzman bir arafltrmacnn kiflisel kararlar dorultusunda ana ktleyi iyi temsil edebileceini dflnd birimleri seerek rnekleme erevesi oluflturmasna karar rneklemesi ad verilir.
Arafltrmann konusu, ana ktlenin dierlerine gre farkl zellikler gsteren birimlerine iliflkin bilgi toplama olduunda da karar rneklemesi kullanlr. rnein
yaplan arafltrma zengin kiflilerin tkettii gda trlerine iliflkin zel bir arafltrma
ise, rnekleme alnacak birimler yalnzca arafltrmacnn belirleyecei miktara gre
zengin olan kifliler arasndan seilmelidir.
5. nite - rnekleme
97
dir. statistiksel arafltrmalarda tahmini en ok yaplan parametreler ana ktle aritmetik ortalamas ve ana ktle oran dir. Bu nitede, sz konusu iki parametrenin tahmininde kullanlmas gereken rneklem hacmi eflitlikleri en temel rnekleme yntemi olan BR yntemi iin, ana ktlenin sonlu ve sonsuz olmasna gre verilecektir.
rneklem hacminin belirlenmesinde kullanlan dier ller ise, hoflgr miktar d ve yanlma dzeyi dr. Buradaki d deeri, tahmin ile parametre arasndaki hoflgrlebilecek sapma miktarn belirtir. rnein, ana ktlede incelenen olayn ortaya kma oran 0,70 olsun. rnekleme sonucunda bulunacak oran deerinin bu ana ktle deerinden sapma miktarnn 0, 03 (d= 0,03) olmas hoflgrlebiliyor ise, tahmin edilecek oran deerinin 0,67 ile 0,73 aralnda bir deer
almas bekleniyor demektir. Yanlma dzeyi ise, rneklemden yaplan tahminin
ne kadarlk bir yanlma olasl ile belirlenen aralk arasnda yer alacan belirtir. rnein, yanlma dzeyi = 0,05 olarak belirlenirse, elde edilecek deerin %
95 olaslkla snrlar arasnda, % 5 olaslkla bu snrlarn dflnda deer alabilecei belirtilmifl olur.
Tahmin edilecek parametre ana ktle ortalamas olduunda, gerekli rneklem
hacmi;
Nt 2 2
Sonlu ana ktledeki birim says N biliniyor ise; n =
d 2 ( N 1) + t 2 2
t 2 2
Ana ktledeki birim says N bilinmiyor ya da sonsuz ana ktle ise; n =
d2
eflitlikleri ile hesaplanr. Burada;
n: rneklem hacmi,
N: Ana ktledeki birim says,
t: Belirlenen yanlma dzeyine gre, t tablosundan bulunacak teorik tablo
deeri ,
: Ana ktle standart sapmas,
d: Hoflgr miktar (rneklem ortalamas ile ana ktle ortalamas arasndaki
hoflgrlebilecek sapma miktar)
olarak tanmlanr.
Yemeklerinde hayvansal ya kullanan 5.000 kiflilik bir kyde kiflilerin kanlarndaki kolesterol miktar ortalamas tahmin edilmek istenmektedir. Bu ana ktle iin
yaplan nceki alflmalardan kandaki kolesterol miktarna iliflkin ana ktle standart sapmas deerinin 31 mg. olduu bilinmektedir. Yaplacak tahminin 5 mg.lk
snrlar arsnda kalmas hoflgrlebileceine gre, % 5 yanlma dzeyi ile ekilmesi gereken rassal rneklem ka birimden oluflmaldr?
Soruda verilen bilgiler;
N= 5.000 kifli, = 31 mg., d= 5 mg., = 0,05
Burada, = 0,05 iin t tablosu deeri elde edilirken serbestlik derecesine
ve /2 olaslna gre t deeri belirlenir. Buna gre, tablo deeri olarak t0,05/2=
t0,025= 1,96 deeri kullanlr. Btn deerler ilgili eflitlikte yerine konulursa, rneklem hacmi,
n=
Nt 2 2
d 2 ( N 1) + t 22
(,
1 + 1 96
)2 ( ) 2
31
143
RNEK 5.3
98
Biyoistatistik
olarak bulunur. Buna gre, 5.000 kiflilik kyden 143 kiflilik bir rneklem seilirse,
bu rneklemden yaplacak kandaki kolesterol miktar ortalamas tahmini, % 95
olaslkla + 5 mg.lk snrlar arasnda, % 5 olaslkla bu snrlar dflnda deerler
alacaktr.
Tahmin edilecek parametre ana ktle oran olduunda, gerekli rneklem hacmi;
Nt 2 (1 )
Sonlu ana ktledeki birim says N biliniyor ise; n =
d 2 ( N 1) + t 2(1 )
Ana ktledeki birim says N bilinmiyor ya da sonsuz ana
t 2(1 )
ktle ise; n =
eflitlikleri ile hesaplanr. Burada;
d2
: Ana ktlede incelenen olayn grlme oran,
d: Hoflgr miktar (rneklem oran ile ana ktle oran arasndaki hoflgrlebilecek sapma miktar) olarak tanmlanr.
RNEK 5.4
Eskiflehir ilinde st rnleri retimi yapan bir firma, rettii krem peynirinin Eskiflehir ilindeki kullanm orann belirlemek istemektedir. Firma yetkilisi, bu arafltrmay yaptraca arafltrma flirketine % 4lk bir hatay hoflgrebileceini belirtmifltir. Firma ayn alflmay bir nceki ylda da yaptrmfl ve o alflmada retilen krem peynirini kullananlarn orann %32 olarak tahmin etmifltir. Buna gre, %5 yanlma dzeyi ile gereklefltirecek arafltrma iin ka birimlik bir rneklem seilmelidir?
Ana ktlede ka birimin yer ald bilinmedii durumda ana ktle oran tahmini iin gerekli rneklem hacmi elde edilmelidir. Bir nceki yl yaplan alflmadan
krem peynirini kullananlarn oran belli olduu iin deeri yerine bu deer kullanlabilir. Soruda verilen bilgiler;
d= 0,04, = 0,32, = 0,05, t= 1,96
Arafltrma iin gerekli rneklem hacmi,
n=
t 2(1 )
d2
522
olarak hesaplanr. Buna gre, ana ktleden 522 kiflilik bir rneklem seilirse, bu rneklemden yaplacak krem peynirini kullanm oran tahmini, % 95 olaslkla % 28 ile
% 36 arasnda (0,32 0,04), % 5 olaslkla bu araln dflnda bir deer alacaktr.
Grld gibi, ana ktle ortalamas tahminine iliflkin gerekli rneklem hacminin belirlenebilmesi iin ana ktle standart sapmasnn, ana ktle oran tahminine
iliflkin gerekli rneklem hacminin belirlenebilmesi iin ise olayn ana ktlede meydana gelme orannn bilinmesi gereklidir. Ana ktleye iliflkin bu deerler bilinmedii takdirde rneklem hacminin belirlenebilmesi iin, ayn konuda daha nce yaplmfl olan benzer alflmalardan yararlanlarak parametreler tahmin edilebilir ya
da konu uzman kiflilerden ana ktlenin yapsna iliflkin bilgi alnarak istenen deerler kullanlabilir. Yine de gerekli parametreler elde edilemiyor ise, nce kk
apl bir n rneklem belirlenip bu rneklemden sz konusu parametreler tahmin
edilir ve ardndan bu deerler kullanlarak asl n deeri hesaplanr. Bu yntemlerden baflka, ana ktle oran deerinini = 0,50 olduu varsaylarak, olabilecek en
byk rneklem hacmi elde edilebilir. Ana ktlede ye iliflkin herhangi bir bilgi
elde edilemiyor ise bu varsaym kullanlmal, fakat arafltrma maliyetini ok fazla
arttrp arttrmadna da dikkat edilmelidir.
5. nite - rnekleme
99
C c0
ct
statistiksel bir arafltrma iin ayrlan toplam rnekleme btesi 20.000 TL.dir.
Ana ktlede yer alan bir rnekleme biriminin incelenmesi iin harcanmas gereken miktarn 3TL. ve sabit rnekleme maliyetinin 11.000 TL. olduu bilindiine
gre, bu arafltrma iin seilebilecek rneklem hacmi ne kadar olamaldr?
RNEK 5.5
Verilen bilgilere gre, C= 20.000 TL., ct= 3 TL. ve c0= 11.000TLdir. Buna gre
rneklem hacmi;
C c0 20.000 11.000
n=
=
= 3.000 kifli olmaldr.
3
ct
RNEKLEME DAILIMLARI
Bir ana ktleden seilebilecek tm n birimlik olas btn rneklemler ekilip
hepsinden ayr ayr istatistik hesaplandnda, sz konusu istatistiklerin dalmna,
hesaplanan istatistiin rnekleme dalm ad verilir.
statistikte, gzlem deerlerinin ana ktle ortalamas etrafndaki deiflkenlii ile
ilgilenilmesinin yan sra ana ktleden seilen rneklemlerin ortalamalarnn dalm da nemli bir konudur.
N hacimli bir ana ktleden n birimlik 100 adet rneklem seilmifl olsun. Bu 100
rneklemin her biri iin ayn X deiflkenine ait aritmetik ortalamalar hesaplansn.
x1 , x2 , , x100 rneklem ortalamalar, ortalamann rnekleme dalmn oluflturur.
Ortalamann rnekleme
Dalm: N hacimli bir ana
ktleden seilebilecek tm
n hacimlik olas btn
rassal rneklemlerden
hesaplanan aritmetik
ortalamalar kullanlarak
oluflturulan dalma
ortalamann rnekleme
dalm ad verilir.
100
Biyoistatistik
Eer rneklemler eflit olaslkl ve rassal olarak seilmifl ise, rneklem ortalamalarnn alaca deerler ana ktle ortalamasndan bir miktar farkllk gsterir. Bu
farkllklar rnekleme hatasndan kaynaklanr.
Ana ktleden n hacimlik olas btn rneklemler iadeli seim yntemi ile ekildiinde, bir dier deyiflle seilen birim yerine konularak seim yapldnda, belirlenen deiflken iin rneklem ortalamalarnn dalmnn iki nemli zellii bulunur:
rneklem ortalamalarnn ortalamas ana ktle ortalamasna eflittir.
rneklem ortalamalarnn standart sapmasnn deeri, ana ktle standart sapmasndan kktr ve ana ktle standart sapmasnn rneklem hacminin karekkne blnmesiyle hesaplanr.
RNEK 5.6
Drt adet baharat pofletinin arlk deerleri; 4,8,12 ve 16 gr. olarak verilsin. Bu
ana ktleden seilebilecek iki birimlik olas tm rneklemleri iadeli seim yntemi
ile belirleyerek ortalamann rnekleme dalmn oluflturunuz ve yukarda belirtilen iki zelliin salandn gsteriniz.
Ana ktle drt birimden oluflmaktadr. Buna gre iadeli seim yntemi ile birimlik olas btn rneklemleri oluflturalm. Sonular Tablo 5.2.de verilmektedir.
Tablo5.2.
rnek 5.6. in Olas
rneklem Birimleri
rneklem No
rneklem Deerleri
rneklem Ortalamas
(4;4)
(4;8)
(4;12)
(4;16)
10
(8;4)
(8;8)
(8;12)
10
(8;16)
12
(12;4)
10
(12;8)
10
11
(12;12)
12
12
(12;16)
14
13
(16;4)
10
14
(16;8)
12
15
(16;12)
14
16
(16;16)
16
4 + 8 + 12 + 16 40
=
= 10 olarak bulunur.
4
4
4 + 6 + + 16 160
=
= 10 dur.
16
16
5. nite - rnekleme
101
x =
4, 472
(1 )
n
ile hesaplanr. rneklem hacmi n bydke, rneklem oran pnin rnekleme dalm ana ktle oran etrafnda daha fazla younlaflr ve bu dalm Normal dalma yaklaflr.
z=
102
Biyoistatistik
fiekil 5.1
ok Sayda
rneklem in
rneklem
Ortalamalarnn
Dalm
%34,13 %34,13
%13,59
%13,59
%2,28
- 3x
%2,28
- 2x - x
+ x + 2x
+ 3x
Merkezi limit teoremi kullanldnda, dikkat edilmesi gereken iki nokta afladaki gibidir.
1- ncelenen deiflken Normal dalml olduunda, herhangi bir n rneklem
hacmi iin, rneklem ortalamalarnn dalm da Normal dalmdr.
2- ncelenen deiflkenin dalm belli deil ise, rneklem ortalamalarnn dalmnn Normal dalma yaklaflabilmesi iin rneklem hacmi n 30 olmaldr.
rneklem ne kadar bykse, yaklaflm o kadar iyi olur.
RNEK 5.7
Bir meflrubat otomat makinesinde hazrlanan meflrubat miktar rassal deiflkeninin aritmetik ortalamasnn 300 ml. ve standart sapmasnn 40 ml. olduu bilinmektedir. Bu makinede hazrlanan 64 adet meflrubattan oluflan olas tm rneklemler iin ortalama meflrubat miktarnn en az 305 ml. olmas olasl nedir?
Ana ktle aritmetik ortalamas; = 300 ml., ana ktle standart sapmas; = 40
ml. ve rneklem hacmi; n= 64 adet meflrubat olarak verilmifltir.
Merkezi limit teoremine gre, x nn dalm; aritmetik ortalamas = 300ml.
x
40
= 5 ml. olan normal dalmdr. Soruda istenen ola
ve standart sapmas x =
64
slk iin grafiksel gsterim fiekil 5.2.de grlmektedir.
103
5. nite - rnekleme
fiekil 5.2
F (x)
rnek 5.7. in
Olasl
=300 305
z=0 z=1
305 300
= 1 olaAritmetik ortalama iin hesaplanmas gereken z deeri; z =
5
rak bulunur. Buna gre istenen olaslk; deerinin sanda kalan alan olacaktr.
elde edilir. Sonu olarak 64 birimlik olas tm rneklemler iin, hazrlanan ortalama meflrubat miktarnn en az 305 ml. olmas olasl % 15,87 olarak belirlenir.
Ana ktle ok byk ya da sonsuz ana ktle olduunda, bu ana ktleden iadeli ya da iadesiz seim yntemiyle seilen rneklemler iin ortalamann standart hata eflitlii / n ile verilir. Uygulamalarda iadeli seimli rnekleme ok fazla uygulanmadndan, sonlu bir ana ktleden iadesiz seimle ekilen rneklemler iin
ortalamann ya da orann standart hatas hesaplanrken, dzeltme terimi ad verilen bir ifade kullanlr. N; ana ktle hacmi ve n; rneklem hacmi olmak zere dzeltme terimi,
Nn
N 1
biiminde hesaplanr.
Dzeltme terimi, kk bir ana ktleden nispeten byk bir rneklem ekildiinde kullanlr. nk bu durumda rneklem ortalamas ana ktle ortalamasna
daha yakn sonular verecei iin, yaplan tahmindeki hata miktar daha dflk
olacaktr. Dolaysyla, ortalamann standart hatas dzeltme terimi ile arpldnda,
kk bir ana ktleden seilen byk hacimli rneklemler iin bir dzenleme yaplmfl olur. Bu durumda ortalamann standart hatas,
x =
Nn
N 1
z=
Nn
N 1
olarak belirlenir.
104
Biyoistatistik
(1 ) N n
n
N 1
biiminde hesaplanr.
Ana ktle byk ve rneklem kk olduunda, dzeltme teriminin deeri 1e
ok yakn olaca iin genellikle kullanlmaz.
5. nite - rnekleme
105
zet
N
A M A
N
A M A
N
AM A
N
A M A
Ana ktle parametresi ile rneklem istatistii arasnda belli miktarda ortaya kan farka rassal hata ya da rnekleme hatas ad verilir. rneklem
istatistii ile ana ktle parametresi arasndaki
farklarn alabilecei deerlerin ortalamas hesaplanrken kareli ortalamadan yararlanlr. Hesaplanan bu deere de, rneklem istatistiinin standart hatas ad verilir.
N
AM A
106
N
AM A
Biyoistatistik
aritmetik ortalamalar kullanlarak oluflturulan dalma ortalamann rnekleme dalm ad verilir. rneklem ortalamalarnn ortalamas ana ktle ortalamasna eflittir ( x = ).
rneklem ortalamalarnn standart sapmasnn
deeri, ana ktle standart sapmasnn rneklem
hacminin karekkne blnmesiyle hesaplanr
( x = / n ).ki sonulu bir ana ktleden eflit
hacimli olas tm rassal rneklemler seilerek
her rneklem iin oran hesaplandnda, bu oranlardan oluflan dalma oranlarn rnekleme dalm ad verilir ve bu dalmn aritmetik ortalamas p= , standart sapmas ise
Nt 2 2
2
d ( N 1) + t 2 2
2 2
Nt 2(1 )
2
d ( N 1) + t (1 )
t 2(1 )
C c0
N
A M A
N
AM A
ile hesaplanr.
z deeri;
ct
(1 )
eflitlii ile hesaplanr.
n
p =
Nn
eflitlii ile hesaplanr. Buna gre
N 1
z=
N n olarak belirlenir. Bu
N 1
(1 ) N n
biiminde hesaplanr.
n
N 1
5. nite - rnekleme
107
Kendimizi Snayalm
1. Hakknda arafltrma yaplacak sonlu ana ktlede yer
alan btn birimlerin elde edilmesi ve kaydedilmesi ifllemine ne ad verilir?
a. rnekleme
b. Tahmin
c. Veri Derleme
d. Tam saym
e. rnekleme Oran
2. Afladakilerden hangisi rneklemenin avantajlarndan biri deildir?
a. Maliyetinin tam sayma gre daha dflk olmas
b. Daha ayrntl bilgi elde etme imkn salamas
c. Sonsuz ana ktlelere uygulanabilmesi
d. Tam sayma gre daha ksa zamanda uygulanabilmesi
e. rnekleme seilen birimin tahrip edilebilmesi
3. Afladaki ifllemlerden hangisi sonlu bir evrenden
basit rassal rneklem seimi srecinin dflndadr?
a. Gncel rnekleme erevesinin hazrlanmas
b. Gerekli rneklem hacminin belirlenmesi
c. rnekleme girecek birimlerin seilmesi
d. Gerekli parametrelerin tahmin edilmesi
e. Ana ktlenin bir takm alt gruplara blnmesi
4. rneklemden rnekleme deiflen deerler alan istatistiklerin ana ktle parametre deerlerine gre gsterdikleri sapmalara ne ad verilir?
a. Yanlma Dzeyi
b. Rassal Hata
c. Standart Sapma
d. Sistematik Hata
e. Standart Hata
5. Afladakilerden hangisi olaslkl rnekleme yntemlerinden biridir?
a. Kartopu rneklemesi
b. Kota rneklemesi
c. Tabakal rnekleme
d. Kolayda rnekleme
e. Karar rneklemesi
108
Biyoistatistik
Yaflamn inden
1. d
2. e
3. e
4. b
5. c
6. b
7. a
8. c
9. d
10. a
Yantnz yanlfl ise, rneklemeye liflkin Temel Tanm Ve Kavramlar konusunu yeniden
gzden geiriniz.
Yantnz yanlfl ise, rneklemenin Avantajlar
konusunu yeniden gzden geiriniz.
Yantnz yanlfl ise, rnekleme Srecinin
Admlar konusunu yeniden gzden geiriniz.
Yantnz yanlfl ise, rneklemede Hata Kavram konusunu yeniden gzden geiriniz.
Yantnz yanlfl ise, rnekleme Yntemleri
konusunu yeniden gzden geiriniz.
Yantnz yanlfl ise, rnekleme Yntemleri
konusunu yeniden gzden geiriniz.
Yantnz yanlfl ise, rnekleme Yntemleri
konusunu yeniden gzden geiriniz.
Yantnz yanlfl ise, rneklem Hacminin Belirlenmesi konusunu yeniden gzden geiriniz.
Yantnz yanlfl ise, rnekleme Dalmlar
konusunu yeniden gzden geiriniz.
Yantnz yanlfl ise, Merkezi Limit Teoremi
konusunu yeniden gzden geiriniz.
109
5. nite - rnekleme
5653
8775
1891
7666
6483
9711
6941
8092
3875
2887
7703
5709
8586
4686
4015
3181
7891
3022
8858
6412
3965
3793
7646
1109
5628
9454
1014
3073
8030
4941
7376
4964
0670
9937
7260
3916
0226
9190
1654
0646
6931
2433
5267
8507
0133
1633
4398
1762
5252
7556
9697
6520
6868
6097
9046
6337
1034
4104
8501
0935
8997
9710
0076
3982
4994
1589
6065
5703
9168
7381
1108
5273
6485
2272
8516
1597
7628
4195
0033
4969
8041
4662
2632
5816
8876
5432
0637
4645
2895
6460
4970
3373
7157
8326
1925
8621
6460
1101
8670
9305
3644
5919
9951
5421
3748
1860
2292
6834
3902
3988
1126
6892
8114
1216
3764
6148
2169
7776
3300
8934
1912
8376
3511
9653
0476
6310
9368
5242
7320
7729
0326
4536
1517
2728
7958
3898
7352
6372
4841
8675
5129
7078
2478
9478
6417
3223
9552
8779
1430
9598
7751
1465
7649
4236
1133
2389
3201
6048
9144
2209
0114
0496
9756
9252
8344
4508
7278
1036
2670
3049
3623
3681
1176
9108
6760
0115
6477
2133
7229
7759
8892
1775
0447
1802
9484
7144
8763
0604
4933
0350
8026
7474
1885
9220
6439
9868
2926
9014
7736
4632
7969
4106
2604
4724
6710
6669
2155
6663
4847
6573
9808
0596
9227
2286
5487
9587
4027
0997
4721
6882
7773
0837
2847
7349
1065
5348
8774
0299
5286
9398
1219
8269
6108
0042
8883
7085
0848
7494
8861
6127
3916
4217
8981
2744
1233
4324
9241
5513
4501
5474
0479
7261
2187
2383
9656
9763
6702
6730
3689
2800
4086
9297
0622
3737
8300
9717
0806
4395
7684
6178
7116
4101
6963
3596
6065
0944
9342
7211
2285
6860
9299
6097
5355
3461
4340
7796
1987
6349
2247
2176
1339
2589
9138
2519
4433
1136
7221
4090
7695
7359
5304
3513
1231
8870
0540
4342
4717
0386
1410
8568
6648
0524
2897
8484
9165
6283
8968
0751
0102
6030
1046
4434
1956
0083
2053
5305
2903
4755
2326
4463
8062
8080
9943
3387
7052
5162
0212
0290
4444
8938
1368
3131
9715
3567
2374
7696
6282
6219
6558
5520
7712
7981
4215
3067
8883
6908
9982
2039
9240
6740
4216
4606
6074
6122
9547
2462
8106
1967
1506
5719
7698
6564
5528
3403
5862
3522
6740
0488
1759
2172
9704
8262
0954
3517
2273
3572
5365
9548
5512
4689
9561
3177
1414
2414
9158
7656
1933
9867
0904
9973
8565
9658
6165
6083
6210
8700
8263
3990
8317
8552
9827
4033
0959
8017
2206
8403
4148
7607
2669
5012
1786
5057
9128
4229
8387
0087
9352
5347
0865
9284
0293
4436
9319
0854
7662
3165
9468
3804
6231
6974
3025
6865
1977
5705
7156
9130
1666
7048
7865
5169
7600
2092
5821
2433
7408
6690
6189
5683
3958
2725
8129
7502
8509
5889
7783
0340
2114
4590
5401
4403
6296
6865
2457
4443
0772
5916
0494
2336
5585
4059
4920
4863
3574
3312
9625
5935
0745
8097
1990
9291
0714
8222
5070
7515
6971
3120
6006
9956
5774
110
Biyoistatistik
Yararlanlan Kaynaklar
Bluman, A.G. (2004). Elemantary Statistics: A Step
by Step Approach, McGraw-Hill, New York.
Cochran, W.G. (1977). Sampling Techniques, John
Wiley & Sons, Inc., New York.
ng, H. (1994). rnekleme Kuram, Ankara: H..
Fen Fakltesi Yaynlar.
Esin, A., Ekni, M., Gamgam H. (1997). Salk Bilimlerinde statistik, Ankara: Gazi niversitesi Fen-Edebiyat Fakltesi Yaynlar.
Frankfort-Nachmias, C. (1997). Social Statistics For A
Diverse Society, Pine Forge Press, California.
Freund, J.E. (1992). Mathematical Statistics, Prentice
Hall, Inc., USA.
Kan, ., Glesen, . (1982). Biyoistatistik, Ankara; T.C.
Uluda niversitesi Yaynlar.
McIntyre, L.J. (2005). Need To Know: Social Science
Research Methods, McGraw-Hill, New York.
zmen, A. (2000). Uygulamal Arafltrmalarda rnekleme Yntemleri, Eskiflehir: T.C. Anadolu niversitesi Yaynlar.
Serper, . (2000). Uygulamal statistik II, Bursa: Ezgi Kitabevi.
Wonnacott, T.H., Wonnacott, R.J. (1990). Introductory
Statistics For Business And Economics, John Wiley & Sons, Inc., USA.
Yzer, A.F. (2007). statistik, Eskiflehir: Anadolu niversitesi Akretim Fakltesi Yayn No:771.
BYOSTATSTK
Amalarmz
N
N
N
N
N
N
Anahtar Kavramlar
Tahminleme
Nokta Tahmini
Aralk Tahmini
Yanszlk
En Kk Varyans
Tutarllk
Yeterlilik
Gven Aral
Gven Dzeyi
Student-t Dalm
Serbestlik Derecesi
Birlefltirilmifl rneklem Varyans
erik Haritas
Biyoistatistik
Nokta ve Aralk
Tahminlemesi
TAHMNLEMEYE GRfi
NOKTA TAHMNLEMES
NOKTA TAHMNCLERNN
ZELLKLER
ARALIK TAHMNLEMES
ANA KTLE ARTMETK
ORTALAMASI N GVEN
ARALIKLARI
ANA KTLE ORANI N GVEN
ARALIKLARI
Nokta ve Aralk
Tahminlemesi
TAHMNLEMEYE GRfi
ncelenecek birim saysnn fazla olduu, zaman ya da mali kaynaklarn yetersiz
kald ya da gerekli iflgcnn bulunmad, ksacas tam saym yapmann mmkn olamad arafltrmalarda rneklemeye baflvurmann zorunlu olduunu nceki nitelerde belirtmifltik. rneklemenin temel amac, incelenen ana ktle iin tanmlanan bir veya daha fazla rassal deiflkenin zeliklerine iliflkin doru bilgi elde
edebilmektir. rneklem birimlerinden elde edilen veriler genellikle, sz konusu
rassal deiflkenin ald saysal deerlerdir. Dolaysyla rneklemede ana ktle parametreleri, rneklemden hesaplanan istatistikler yardmyla tahmin edilir.
statistiksel karm problemleri tahminleme ve hipotez testleri olmak zere iki
ksmda incelense de, temelde bunlarn btn karar alma problemini oluflturur.
Bu iki sre arasndaki temel fark; tahminleme probleminde parametrenin ya da
parametrelerin ald deerlerinin belirlenmesinin gereklilii, hipotez testlerinde
ise parametrelerin ald belirli deerleri kabul ya da reddetme kararnn verilmesi
gerekliliidir. Hipotez testleri konusu sonraki nitede incelenecektir.
Bir rneklemden elde edilen bilgiden yararlanarak parametrenin ald deeri
tahmin etme sreci olan tahminleme, karmsal istatistiin nemli bir blmn
oluflturur. rnein, lkretim rencilerinin aylk yumurta tketimi ortalamas 15
adettir. veya Eskiflehir halknn % 74 pastrize st rnlerini tercih etmektedir.
gibi ifadeler birer ana ktle parametresi tahminini belirtir. Bu rnekler iin tanmlanan ana ktleler ok byk olduundan, hesaplanan deerler rneklemden elde edilen tahmin deerleridir.
rneklem istatistikleri yardmyla ana ktle parametrelerinin tahmin edilmesi,
nokta tahminlemesi ve aralk tahminlemesi olmak zere iki flekilde gereklefltirilir.
NOKTA TAHMNLEMES
Bir ana ktle parametresinin tahmininde kullanlan istatistik deeri nokta tahmini olarak adlandrlr. rnek olarak, bir ana ktle aritmetik ortalamas tahmin
edilmek istendiinde seilen rassal rneklemin ortalamas olarak x kullanlyorsa,
ana ktlenin ortalama oran tahmin edilmek istendiinde gzlenen rneklem
oran pden yararlanlyorsa, ya da ana ktle varyans 2nin tahmininde rneklemden hesaplanan s2 deeri kullanlyorsa, sz konusu parametrelerin nokta tahminleri yaplyor demektir. Bu tahminlere nokta tahmini denilmesinin nedeni, parametre tahminini belirten tek bir say deeri biiminde olmalardr.
Tahminleme: rneklem
seimi sonucunda
hesaplanan istatistik
aracl ile ana ktle
parametresinin ald deer
olarak kabul edilen bir aralk
ya da bir say elde etme
ifllemine tahminleme ad
verilir.
114
Biyoistatistik
Bununla birlikte, tanmlanan istatistikler nokta tahmincileri adn alrlar. rnein, nn nokta tahmincisi olarak x deeri ya da medyan deeri, 2nin nokta
tahmincisi olarak s2 deeri kullanlabilir. Tablo 6.1.de baz nemli nokta tahminlerinin hesaplanmasnda kullanlacak eflitlikler grlmektedir.
Tablo 6.1.
Baz nemli Nokta
Tahminleri
i = 1 xi
N
Varyans:
i = 1 ( xi x ) 2
n
s =
2
i = 1 xi
n 1
Tablo 6.2.
iftlikte retilen
Yumurtalardan
Seilen rneklem
Bilgileri
i = 1 ( xi )2
Oran:
i = 1 xi
n
x=
RNEK 6.1
Nokta Tahmini
i = 1 xi
n
p=
Bir tavuk iftlii sahibi, iftlikte retilen yumurtalarn ortalama arln, varyansn, ayrca beyaz renkte retilen yumurta orann tahmin etmek istemektedir.
Bu amala, retilen yumurtalardan 20 tanesi rassal olarak seilmifl ve bu yumurtalarn arlklar ile renkleri kaydedilmifltir. Seilen rnekleme ait bilgiler Tablo
6.2.de verilmektedir. Buna gre, iftlikte retilen tm yumurtalar iin ortalama
arl, varyans ve beyaz yumurta orann tahmin ediniz.
Yumurta No:
Arlk (gr.):
42 39 36 44 41 38 36 48 43 39 40 36 42 37 35 44 42 39 45 40
Renk:
9 10 11 12 13 14 15 16 17 18 19 20
Seilen 20 yumurtadan oluflan rneklemin aritmetik ortalamas ve varyans, iftlikte retilen tm yumurtalardan oluflan ana ktle aritmetik ortalamas ve varyans
iin bir nokta tahmini olacaktr. Ayn flekilde, seilen yumurtalarn renkleri bilgisinden yararlanarak, ana ktle ierisindeki beyaz yumurta orannn nokta tahmini de
yaplabilir.
X: Yumurtalarn arlklar,
Y: Yumurtalarn renkleri
olarak tanmlansn.
Buna gre, tavuk iftliinde retilen yumurtalarn ortalama arlk tahmini;
i = 1 xi i = 1 x i
n
x=
20
20
42 + 39 + ... + 45 + 40 806
=
= 40
20
20
Varyans tahmini;
i =1 ( xi x )2 i =1 ( xi 40, 3)2
n
s2 =
20
n 1
19
i =1 yi i =1 yi
n
p=
20
20
12
= 0, 6
20
olacaktr.
Tahminciler ayn zamanda rassal deiflken olduklar iin, nokta tahmininin en
nemli sorunlarndan biri, bu tahmincilerin rnekleme dalmlarnn incelenmesidir. rnein, bir ana ktlenin varyans rassal bir rneklem aracl ile tahmin edilirken, elde edilen s2 deerinin gerekte 2ye eflit olmasn ya da bu deere yakn
bir deer olmasn bekleriz. Ayrca, bir ana ktle ortalamasnn tahmininde rneklem aritmetik ortalamasnn m yoksa rneklem medyannn m kullanlacana karar verme zorunluluu var ise, bu iki tahminden hangisinin ana ktle ortalamasna
daha yakn olduunu bilmek daha da nem kazanacaktr.
Yanszlk
En Kk Varyans
Belirli bir parametresinin yansz tahmincilerinden hangisinin seilecei karar verilirken, rnekleme dalmnn varyans en kk olan tahminci genellikle tercih
edilir. Bu durum, varyans kk olan tahmincinin dierlerine gre daha etkin bir
tahminci olduunu gsterir. Dolaysyla en iyi tahminci, yansz olmasnn yan sra
en kk varyansa da sahip olmaldr.
Tutarllk
n rneklem hacmi bydke $ tahmincisinin deeri parametresine yaklaflyorsa, bu $ tahmincisine tutarl tahminci ad verilir. Tutarllk, tahmincinin asimptotik bir zelliidir. Bu da, rneklem hacmi yeterli bykle sahip olduunda, tahmin sonucunda oluflan hata olaslnn nceden belirlenen ok kk bir pozitif
saydan daha kk olduu anlamna gelir.
Yeterlilik
Bir $ tahmincisinin deeri belirlenirken, seilen rneklemdeki tm bilgiden yararlanlyor ise, bu $ tahmincisi yeterli tahminci adn alr. Bir baflka ifadeyle, $ istatistiinin tm deerleri iin, ekilen rassal rneklemin $ bilindiindeki koflullu
olaslk dalm parametresinden bamsz ise, $ istatistii parametresinin ye-
115
116
Biyoistatistik
terli tahmincisidir. rnein, rneklem aritmetik ortalamas, rneklemdeki tm deerler dikkate alnarak hesaplanr. Bu durumda, x deeri, iin yeterli bir tahmincidir. Ancak rneklemin medyan deeri ana ktle ortalamas iin yeterli bir
tahminci olmayacaktr. nk, medyan hesabnda rneklemdeki tm deerler deil, sadece en ortadaki terim ya da terimler dikkate alnmaktadr.
Nokta tahminlemesinde, tahmincilerin rneklemden rnekleme farkl deerler
almas sonucunda rnekleme hatas taflmalar nedeniyle, ana ktle parametresinin
saysal deerinin tahmini iin rneklem istatistii kullanldnda, bu deerin parametreye ne kadar yakn bir deer olduu hi bir zaman bilinemez.
ARALIK TAHMNLEMES
Nokta tahmini, ana ktle parametresine iliflkin tahminde bulunmada genel bir yntem olmasna karfln, bir ok sorunu da beraberinde getirir. rnein nokta tahmini sonucunda, tahminin gerek parametre deerine ne kadar yakn bir deer olduuna ya da tahmin sonucunda oluflacak olas hata miktarna iliflkin herhangi bir
bilgi edinilemez. Bu nedenle, tahminin parametreye yaknlk derecesinin belirlenmesi iin nokta tahmini yerine aralk tahminlemesi yntemi tercih edilebilir. Ana
ktledeki tm birimleri incelemenin mmkn olmad arafltrmalarda ana ktle
parametresi hesaplanamadndan, rneklem bilgilerinden yararlanarak ana ktle
parametrelerinin iinde yer ald aralk deerleri belli olaslk dzeylerinde tahmin
edilebilir. Aralk tahminlemesi yntemi ile ana ktle parametresinin ierisinde yer
alabilecei bir aralk belirlenir. Bu deerler aralna ana ktle parametresinin gven aral ad verilir. Sonu olarak, ana ktle parametresinin tahmininde tek bir
deer kullanlacana, parametrenin hangi aralkta yer alaca hesaplanmfl olur.
Ana ktle parametresinin tahmininde gven aralklar kullanldnda, bu tahminin doruluk derecesi, verilen herhangi bir araln parametreyi iermesi olaslnn incelenmesi yoluyla belirlenebilir. Bu olaslk, gven dzeyi olarak adlandrlr. Tahminin yanlma pay; ile gsterilirken, gven dzeyi; 1 - ile belirtilir. Gven aralklar, gven dzeylerine iliflkin olarak belirlenir. Bylece, % 95 gven dzeyi seildiinde, belirlenen araln ana ktle aritmetik ortalamasn iermesi olaslnn 0,95 olduu belirtilmifl olur. Gven aralklar herhangi bir gven
dzeyi iin oluflturulabilir. Ancak uygulamalarda en sk kullanlan gven dzeyleri 0,90, 0,95 ve 0,99 deerleridir.
Bir parametresinin aralk tahmini genel olarak;
alt
< < $
st)
=1-
117
Nokta tahminlemesi ile aralk tahminlemesi arasndaki fark nedir? SIRA SZDE
D fi N E L M
Normal dalma sahip ana ktleler iin nn iyi bir nokta tahmincisinin x olduS Ogerek
R U
unu belirtmifltik. Ancak rneklemden hesaplanan x deerinin
ana ktle
ortalamasndan bir miktar az ya da bir miktar fazla olmas kanlmazdr. Bu nedenle, yaplan tahminin doruluundan emin olunmak istendii takdirde, nn
DKKAT
gzlenen x deerine tam olarak eflit olduu sylenemez. Bunun yerine,
= x " rnekleme hatas
SIRA SZDE
K T A P
= x " z 2
S O R U
DKKAT
N N
fleklinde bir aralk tahmini ya da gven aral oluflturulmaldr. Buradaki nemli sorun, rnekleme hatasnn byklnn ne olacadr. Bu sorunun
cevab, x nn
AMALARIMIZ
ne kadar deiflim gsterdiine bal olarak deiflir.
olarak verilir.
fiimdi bu eflitliin olaslksal olarak ne anlama geldiini inceleyelim. % 95lik bir
gven dzeyi iin, x nn normal dalm altndaki % 95lik alan kapsayan en kk aralk seilir. Bu aralk, flekilde gri renkle belirtilen blgeyi ifade eder. Geri kalan % 5lik ksm her iki kuyrukta yer alr. Dolaysyla, bu blgelerin alanlar % 2,5
olacaktr. Standart normal dalm tablosundan, aralk iin gerekli z/2 deeri 1,96
SIRA SZDE
SIRA SZDE
AMALARIMIZ
K T A P
fiekil 6.1
rneklem
TELEVZYON
Ortalamalarnn
% 95inin Yer
Ald Aralk
NTERNET
118
Biyoistatistik
olarak elde edilir. Bu da, ortalamadan + ve - ynde 1,96 standart hata kadar
ilerlenecei anlamn taflr. Bu durum genellefltirilerek formle edildiinde,
P( z 2 < x < + z 2 ) = 1
x
eflitlii ortaya kar. Bu eflitlii szel olarak ifade edersek; x nn den uzaklnn " z/2 x snrlar ierisinde yer almas olasl 1 - dr. Eflitlikte parantez
ierisindeki eflitsizlikler iin zldnde, ana ktle aritmetik ortalamas iin
gven aralnn olaslksal forml ortaya kar.
P( x z 2 < < x + z 2 ) = 1
x
x =
eflitlii kullanlr. Ana ktle standart sapmas bilinmiyor ise rneklem standart sapmasndan yararlanlarak;
s =
x
s
n
= x " z 2
s
n
olacaktr.
RNEK 6.2
Bir firma bulyon tabletleri retmektedir. Bir market sahibi, bu rnlerden 80 adet
siparifl vermifl ve bulyon tabletlerinin ortalama arln 14,2 gr. ve standart sapmasn 2 gr. olarak hesaplanmfltr. Bu firmann rettii bulyon tabletlerinin ortalama arl iin aralk tahminini % 95 gvenle yapnz.
n = 80 adet bulyon tableti,
x = 14,2 gr.,
s = 2 gr.
Gven dzeyi 1 - = 0,95 olarak verildiinden, = 0,05 yanlma pay iin standart normal dalm tablosundan z/2 = z0,05/2 = z0,025 = 1,96 deeri elde edilir. Ana
ktle standart sapmas bilinmediinden, rneklem standart sapmasndan yararlanlr. Deerler gven aral eflitliinde yerlerine koyulursa,
119
= x " z
s
2
80
= 14, 2 " (1, 96)(0, 224)
= 14, 2 " 0, 44
ya da
P( x z 2s < < x + z 2s ) = 1
x
D fi N E L M
S O R U
S O R U
Yaplan uygulamalarn bir ounda ana ktle standart sapmasnn gerek deeri bilinmez. nn bilinmedii durumda eer rneklem hacmi yeterince byk (n 30)
DKKAT
ise rneklemden elde edilen s deeri kullanlarak normal dalm yaklaflm ile aralk tahmini yaplabilir. Ancak, rneklemden hesaplanan s deerinin kullanm, rSZDEortaya kaneklem hacmi yeterince byk deilse (n < 30 ise) olumsuz birSIRA
durum
rr. 1 - gven dzeyinin korunmas iin araln geniflletilmesi gerekir. Bu ifllem,
standart normal dalmdan elde edilen z/2 deeri yerine, yine srekli bir dalm
AMALARIMIZ
olan Student-t dalmndan elde edilen t/2 deeri kullanlarak gereklefltirilir. Sonuta kullanlan t/2 deeri, z/2den byk olduu iin aralk geniflleyecektir.
Bu bilgiler dorultusunda, kk rneklemlerde ana ktle
ortalamas iin
K T A P
gven aral eflitlii,
DKKAT
N N
SIRA SZDE
TELEVZYON
SIRA SZDE
AMALARIMIZ
K T A P
TELEVZYON
olarak elde edilir. Eflitlikteki t/2 deeri, eflitli serbestlik dereceleri (s.d.) iin veri N T E R N E T derecesi,
len Student-t dalm tablosundan elde edilir. Genel olarak serbestlik
bir istatistik hesaplanrken deiflebilen deerlerin says olarak tanmlanr. Tabloda
kullanlacak serbestlik derecesi, s2nin hesaplanmasnda kullanlan bilgi miktarn
belirtir.
N T E R(s.d.):
NET
Serbestlik Derecesi
Bir istatistiin
hesaplanmasnda kullanlan
deiflebilen deerlerin
saysdr.
120
Biyoistatistik
RNEK 6.3
Bir gda boyas reticisi, yeni rettii toz gda boyalar iin ortalama saklama srelerini belirlemek istemektedir. Bu amala, 10 adet toz gda boyas rneinden ortalama saklama sresini 48,6 gn ve standart sapmay 6,16 gn olarak hesaplamfltr. % 99 gven dzeyinde, ana ktle ortalamas iin gven araln oluflturunuz.
n = 10 adet toz gda boyas,
x = 48,6 gn,
s = 6,16 gn.
1 - = 0,99 ise, = 0,01 yanlma pay ve s.d. = n -1 = 10 -1 = 9 serbestlik derecesi iin Student t-tablosu deeri; t/2, (n -1) = t0,005, 9 = 3,25 deeri elde edilir. Deerler gven aral eflitliinde yerlerine koyulursa,
= x " t / 2,( n 1)
= 48, 6 " (3, 25)
n
6,16
10
= 48, 6 " 6, 33
ya da
P( x t / 2,( n 1)s < < x + t / 2,( n 1)s ) = 1
x
6,16
10
P( 42, 27 < < 54, 93) = 0, 99
6, 16
) = 0, 99
10
elde edilir. retilen toz gda boyalarnn ortalama dayanma sresi % 99 olaslkla 42,27 gn ile 54,93 gn aral ierisinde, % 1 olaslkla bu araln dflnda yer
almaktadr.
rneklem hacmi ok kk olduu iin bulunan aralk genifl bir aralktr. Daha dar bir aralk istenirse ya rneklem hacmi arttrlmal, ya da gven dzeyi azaltlmaldr.
x2
12
n1
22
n2
eflitliiyle hesaplanr.
Buna gre nceki bilgilerimizi de kullanarak, birbirinden bamsz iki rneklem ortalamas yardmyla, ana ktle ortalamalar arasndaki fark iin oluflturulabilecek gven aral eflitlii;
1 2 = ( x x ) " z / 2
1
12
n1
22
n2
1
1
+
n1 n 2
olacaktr.
olur. Burada, her iki ana ktlenin de ayn 2 varyansna sahip olmas nedeniyle,
her iki rneklemden elde edilen bilgiler birlefltirilerek spnin deeri elde edilebilir.
2
Dolaysyla tahmin edilen s p deeri, birlefltirilmifl rneklem varyans olarak adlandrlr. ki rneklemden elde edilen varyanslar birlefltirilip, iki rneklemin toplam
serbestlik derecesine, yani (n1 - 1) + (n2 - 1) = n1 + n2 - 2ye blndnde,
s 2p =
( n1 1) s12 + ( n 2 1) s 22
n1 + n 2 2
deerine ulafllr.
121
122
RNEK 6.4
Biyoistatistik
Bir salatalk bahesinden rassal olarak seilen olgunlaflmfl 10 adet hormonlu salataln boy ortalamas 12,3 cm., standart sapmas 0,7 cm. ve 8 adet hormonsuz
salataln boy ortalamas 11,2 cm., standart sapmas ise 0,9 cm. olarak bulunmufltur. Rassal rneklemlerin eflit varyans ile normal dalma sahip bir ana ktleden ekildii varsayldnda, % 95 gven dzeyi ile hormonlu ve hormonsuz yetifltirilen salatalklarn boy uzunluklar arasndaki fark iin gven araln oluflturunuz.
Birinci rneklem iin, n1 = 10 adet hormonlu salatalk, x1 = 12,3 cm., s1 = 0,7 cm.
kinci rneklem iin, n2 = 8 adet hormonsuz salatalk, x2 =11,2 cm., s2 = 0,9 cm.
ncelikle birlefltirilmifl rneklem varyans deerini bulalm.
s2p =
( n1 1) s12 + ( n 2 1) s22
n1 + n 2 2
1
1
1 2 = ( x1 x2 ) " t / 2,( n + n 2) s p
+
1
2
n1 n 2
1 2 = (12, 311, 2) " ( 2, 12)(0, 794)
1 1
+
10 8
1 2 = 1,1 " 0, 8
elde edilir. Buna gre,
P(0,3 < 1 - 2 < 1,9) = 0,95
olur. Sonu olarak, hormonlu salatalklarn boy uzunluu ortalamas ile hormonsuz salatalklarn boy uzunluu ortalamas arasndaki fark % 95 gven ile 0,3 cm.
ile 1,9 cm. arasnda, % 5 olaslkla bu araln dflnda deerler alabilir.
p =
(1 )
n
123
sp =
p(1 p)
n
olarak hesaplanr.
Bu yaklaflm rneklem hacmi arttka sfra yaknsayan baflka bir hata kaynan ortaya karr. Dolaysyla, byk rneklem hacmi iin ana ktle oran nin
gven aral;
= p " z / 2
p(1 p)
n
olur. Bu eflitliin iyi bir yaklaflm olabilmesi iin, rneklem hacminin yeterince byk (n 30) olmas gereklidir.
Eskiflehir ilinde yaplan bir arafltrmada, rassal olarak seilen 200 kifliye yaptklar market alfl-verifllerinde satn aldklar rnlerin son kullanma tarihlerini kontrol edip etmedikleri soruluyor. 200 kifliden 132 tanesi satn aldklar rnlerin
son kullanma tarihlerini her zaman kontrol ettiklerini, 68 tanesi de bu konuda ihmalkar davrandklarn belirtmifllerdir. Eskiflehir ilinde, marketten satn ald
rnlerin son kullanma tarihlerini her zaman kontrol eden mflterilerin oran
iin aralk tahminini % 95 gvenle yapnz.
n = 200 kifli,
p=
132
= 0, 66
200
1 - = 0,95, = 0,05, z/2 = z0,025 = 1,96 deerleri gven aral eflitliinde yerlerine koyulursa,
= p " z / 2
p(1 p)
n
RNEK 6.5
124
Biyoistatistik
elde edilir. Eskiflehir ilinde, marketten satn ald rnlerin son kullanma tarihlerini her zaman kontrol eden mflterilerin oran % 95 olaslkla % 59,5 ile % 72,5 aral ierisinde, % 5 olaslkla bu araln dflnda deerler alr.
1 2 = ( p1 p2 ) " z / 2
p1 (1 p1 )
n1
p2 (1 p2 )
n2
RNEK 6.6
Yaplan bir arafltrmada, bir iflte alflan 240 bayandan 163 tanesinin dondurulmufl hazr gdalar dzenli olarak tkettii ve herhangi bir iflte alflmayan 180 bayandan 74 tanesinin dondurulmufl hazr gdalar dzenli olarak tkettii belirlenmifltir. % 99 gven dzeyi ile alflan ve alflmayan bayanlarn dondurulmufl
hazr gda tketim oranlar arasndaki fark iin gven araln oluflturunuz.
163
= 0, 68,
240
74
= 0, 41
alflmayan bayanlar iin, n2 = 180 bayan, p2 =
180
1 - = 0,99, = 0,01, z/2 = z0,005 = 2,58 deerleri gven aral eflitliinde yerlerine koyulursa,
1 2 = ( p1 p2 ) " z / 2
p1 (1 p1 )
n1
p (1 p2 )
+ 2
n2
1 2 = 0, 27 " 0,12
elde edilir. Buna gre,
P(0, 15 <1 2 < 0, 39) = 0, 99
zet
N
A M A
N
A M A
N
A M A
i = 1 xi
n
x=
ile verilir. Ana ktle varyans 2nin nokta tahmininde rneklem varyans kullanlr ise, kullanlacak eflitlik,
i = 1 ( xi x ) 2
n
s =
n 1
olur. Ana ktle oran nin nokta tahmininde rneklem oran deerinden yararlanlr ise, kullanlacak eflitlik,
i = 1 xi
n
p=
N
A M A
N
AM A
125
olacaktr.
Nokta tahmincilerinin taflmas gereken zellikleri tanmlamak.
yi bir tahminci, yanszlk, en kk varyansllk,
tutarllk ve yeterlilik zelliklerini salamaldr.
Bir tahmincinin rnekleme dalmnn ortalamas ana ktle parametresine eflit ise, o tahminci
yansz tahmincidir. Yansz tahminciler arasnda
rnekleme dalmnn varyans en kk olan
tahminci en iyi tahmincidir. rneklem hacmi arttka tahmincinin deeri ana ktle parametresine
yaklaflyorsa, bu tahminci tutarl tahminci adn
alr. Bir tahmincinin deeri belirlenirken, seilen
rneklemdeki tm bilgiden yararlanlyor ise, bu
tahminciye yeterli tahminci denilir.
= x " z / 2
olur.
n 30 iken, ana ktle standart sapmas bilinmiyor ise rneklem standart sapmasndan yararlanlabilir. Bu durumda iin gven aral eflitlii,
= x " z / 2
olacaktr.
s
n
126
Biyoistatistik
Ana ktle oran ve iki ana ktle oran arasndaki farka iliflkin aralk tahminlerini yapmak.
n 30 ise, ana ktle oran iin gven aral,
= p " z / 2
12
1 2 = ( x1 x2 ) " z / 2
n1
1 2 = ( x1 x2 ) " z / 2
n2
1
1
+
n1 n 2
+ n2 2 )
sp
1
1
+
n1 n 2
olur.
2
Burada, s p deerine, birlefltirilmifl rneklem varyans olarak denilir ve
2
( n1 1) s1 + ( n 2 1) s 2
n1 + n 2 2
1 2 = ( p1 p2 ) " z / 2
olacaktr.
Ana ktle standart sapmas bilinmiyor ise, sp deerinden yararlanlr. ki ana ktlenin varyanslar eflit iken, ortalamalar arasndaki fark iin gven aral,
1 2 = ( x1 x2 ) " t / 2, ( n
p(1 p)
22
ile hesaplanr.
AM A
ile verilir.
Ana ktle standart sapmalar 1 ve 2 biliniyor
ise, iki ana ktle ortalamas arasndaki fark iin
gven aral eflitlii,
s 2p =
p1 (1 p1 )
n1
p 2 (1 p2 )
n2
127
Kendimizi Snayalm
1. Hesaplanan bir rneklem istatistiinden yararlanarak, ana ktle parametresinin alabilecei deerin belirlenmesi ifllemine ne ad verilir?
a. Yanlma dzeyi
b. rnekleme
c. Tahminleme
d Gven dzeyi
e. Tahminci
6. Gda hijyeni ile ilgili hammadde retilen bir fabrikada belirli bir hammaddenin gnde ortalama ka kg. retildii tahmin edilmek istenmektedir. Bu amala hammaddenin 81 gnlk retimi incelenmifl ve ortalama
retimin 892 kg., standart sapmasnn ise 27 kg. olduu
belirlenmifltir. Buna gre, % 95 gven dzeyi iin istenen gven aral afladakilerden hangisidir?
a. 876,15 - 896,88
b. 886,12 - 897,88
c. 898,12 - 989,88
d. 912,15 - 926,10
e. 985,10 - 986,18
7. Normal dalma sahip bir ana ktleden rassal olarak seilen 225 birimlik bir rneklemin ortalamas 16,
standart sapmas ise 4 olarak hesaplanmfltr. Buna gre, %99,3 gven dzeyinde ana ktle ortalamas hangi
aralkta deerler alr?
a. 14,28 - 17,72
b. 14,48 - 17,52
c. 15,28 - 16,72
d. 15,31 - 16,69
e. 15,48 - 16,52
8. n = 8 gzlemden oluflan bir rassal rneklemden elde edilen deerler; Xi : 8, 6, 7, 3, 12, 4, 2, 14 olarak verilmektedir. Bu rneklemin ekildii ana ktle iin, %
95 gven dzeyi ile ortalama tahmininin gven aralnn alt snr afladakilerden hangisidir?
a. 2,35
b. 3,69
c. 4,25
d. 9,75
e. 10,31
128
Biyoistatistik
9. Bir blgede yaflayan ocuklardan rassal olarak seilen 8 erkek ocuun aylk st tketimi ortalamas 12,8
lt. ve standart sapmas 1,2 lt., 12 kz ocuun aylk st
tketimi ortalamas 9,6 lt. ve standart sapmas 1,8 lt.
olarak hesaplanmfltr. Rassal rneklemlerin eflit varyans ile normal dalml bir ana ktleden ekildii varsaymyla, % 99 gven dzeyi ile bu blgede yaflayan
erkek ve kz ocuklarn aylk st tketimi ortalamalar
arasndaki fark iin gven aral afladakilerden hangisidir?
a. 1,1 - 5,3
b. 1,5 - 4,9
c. 1,8 - 4,6
d. 2,1 - 4,3
e. 2,5 - 3,9
Yaflamn inden
Bir Veteriner Kontrol Arafltrma Enstits, 2009 yl ierisinde enstitye gelen kesilmifl tavuklardan hastalkl
tavuk oranna iliflkin tahminleme yapmak istemektedir.
Bu amala rassal olarak 540 adet kesilmifl tavuk seilmifl ve hastalkl tavuk oran 0,14 olarak hesaplanmfltr.
Bu deerler kullanlarak kesilmifl hastalkl tavuk oran
tahmin edilebilir mi?
540 birimlik rassal rnekten elde edilen oran deeri,
ana ktle orannn bir nokta tahmini olduu iin, kesilmifl hastalkl tavuk oranna iliflkin nokta tahmini % 14
olacaktr. Bu nokta tahminlemesiyle, ancak ana ktle
oran nin gerekte 0,14e yakn bir deer olduu yorumu yaplabilir.
Nokta tahmini yerine % 95 gven dzeyi ile aralk tahmini yaplrsa, 0,14 " 0,03 sonucuna ulafllacaktr. Yani, enstitye gelen kesilmifl tavuklarn hastalkl olanlarnn oran % 95 olaslkla 0,11 ile 0,17 deerleri arasnda, % 5 olaslkla bu araln dflnda yer alacaktr.
129
1. c
Sra Sizde 1
Nokta tahminlemesinde, parametre tahmini olarak tek
bir say deeri hesaplanr. Bu nedenle, nokta tahminlemelerinde, yaplan tahminin parametreye ne kadar yakn bir deer olduu ya da tahmin sonucunda oluflacak
olas hata miktarna iliflkin herhangi bir bilgi edinilemez. Aralk tahminlemesinde ise, tahminin parametreye yaknlk derecesi belirlenebilir. Aralk tahminlemesi
ynteminde parametre tahmini tek bir say deeri olarak deil, ana ktle parametresinin belli bir olaslkla
ierisinde yer alabilecei bir aralk fleklinde belirlenir.
2. e
3. b
4. b
5. e
6. b
7. c
8. b
9. a
10. d
Sra Sizde 2
n = 50 adet bakteri,
x = 54 sn.,
s = 8 sn.
s =
x
s
n
= 1, 13 sn,
50
P ( x z / 2 s < < x + z / 2 s ) = 1
x
130
Biyoistatistik
Yararlanlan Kaynaklar
Bluman, A.G. (2004). Elemantary Statistics: A Step
by Step Approach, McGraw-Hill, New York.
Esin, A., Ekni, M., Gamgam, H. (1997). Salk Bilimlerinde statistik, Ankara: Gazi niversitesi Fen-Edebiyat Fakltesi Yaynlar.
Freund, J.E. (1992). Mathematical Statistics, Prentice
Hall, Inc., USA.
Groeneveld, R.A. (1988). Introductory Statistical Methods, PWS-Kent Publishing Company, Boston.
nal, H.C., Gnay, S. (1999). Olaslk ve Matematiksel
statistik, Ankara: H.. Fen Fakltesi Yaynlar.
Wonnacott, T.H., Wonnacott, R.J. (1990). Introductory Statistics For Business And Economics,
John Wiley & Sons, Inc., USA.
BYOSTATSTK
Amalarmz
N
N
N
N
N
Anahtar Kavramlar
Hipotez
statistiksel Hipotez
Sfr Hipotezi
Karflt Hipotez
Tek ynl test
ift ynl test
1. Tip Hata ( Hatas)
2. Tip Hata ( Hatas)
Anlam Dzeyi
Gven Dzeyi
Testin Gc
Red Blgesi
Kritik Deer
Test statistii
z-testi
t-testi
Tek ynl Varyans Analizi
F-testi
Varyans Analizi Tablosu
erik Haritas
Biyoistatistik
statiksel Hipotez
Testleri ve Varyans
Analizi
Hipotez (Varsaym):
nceden yaplan gzlemlere
ya da tecrbelere dayal
olarak ortaya atlan ve
doruluu bilimsel
arafltrmalarla snanmaya
alfllan nermeye denir.
134
Biyoistatistik
Genel olarak hipotez kavram aklandktan sonra, flimdi istatistiksel hipotezlerin zelliklerini inceleyelim. statistiksel hipotez, bir ya da daha fazla ana ktleye iliflkin olarak ileri srlen ve teorik bir dalm varsaym altnda, parametrik deerin belirli bir deere eflit olduunu veya iki ya da daha fazla ana ktle parametresinin birbirlerine eflit olduunu belirten ve geerlilii istatistiksel testlerle denetlenen bir nermedir. Bu tanma gre, yukardaki rneklerde kurulan hipotezlerin
hepsinin doruluu istatistiksel testlerle denetlenebilir.
rnein, herhangi bir tavuk iftliinde alflan bir arafltrmac iftlikte yetifltirilen tavuklar suni yemle beslendiinde, elde edilen yumurtalarn protein deeri
azalmaktadr. fleklinde bir hipotez ileri srmfl olsun. Arafltrmac, bu iddiasn istatistiksel olarak test etmek amacyla, suni yemle beslenen tavuklardan elde edilen
yumurtalardan n = 100 yumurtalk rassal bir rneklem belirlensin ve bu yumurtalarn protein deeri ortalamasn, x = 5,6 gr. olarak bulmufl olsun. iftlikte organik
yemle beslenen tavuklardan elde edilen yumurtalarn ortalama protein deerinin
= 6 gr. olduu biliniyor ise, x - = 5,6 - 6 = -0,4 gr. lk bir fark sz konusu olur.
Acaba 0,4 gr. lk bu fark istatistiksel olarak nemli bir fark mdr? Yani, iftlikte yetifltirilen tavuklarn suni yemle beslenmesinden dolay m bu kadarlk bir protein
fark ortaya kmfltr? Yoksa, sadece tesadfn etkisiyle mi 0,4 gr. lk bir azalma
gzlenmifltir? Bu ana ktleden 100 yumurtalk baflka rassal bir rneklem belirlenmifl olsun. Bu rneklemin ortalama protein deeri de x = 5,96 gr. olarak bulunmufl olsun. Bu kez, x - = 5,96 - 6 = -0,04 gr. lk bir fark ortaya kar. Bir baflka
100 birimlik rassal bir rneklemin ortalama deeri x = 5,992 gr. olarak gzlensin.
Bu kez de, x - = 5,992 - 6 = -0,008 gr. lk bir fark ortaya kar. Oluflan bu farklar gerekte sadece bu rneklemlere zg deerler olabilir mi? Acaba suni yemle
beslenen tavuklardan elde edilen yumurtalardan oluflan daha da baflka rassal rneklemler belirlense, 6 gr. dan yksek deerler de bulabilir miyiz?
flte, istatistiksel hipotez testleri ortaya kan bu farklarn tesadfi mi, nemli mi
veya anlaml m olduunu ortaya koyan bir sretir. Bu nitede incelenecek olan
testler; tek ana ktle parametresinin belli bir deere eflit olup olmadna iliflkin hipotez testleri ve iki ana ktleye ait parametrelerin birbirlerine eflit olup olmadna iliflkin hipotez testleridir. Bu testlerin tamam parametrik testlerdir.
135
Sfr hipotezi, ana ktle parametresinde herhangi deiflim ya da farklln olmad kavram zerine kurulur. Eflitlik, benzerlik, farkszlk, parametreler arasndaki
farkn sfr olduu gibi kavramlar ileri sren bir istatistiksel hipotezdir ve ile gsterilir. statistiksel hipotez testlerinde, test edilecek olan hipotezi ifade eder. Sfr
hipotezleri genellikle ispatlanmak istenenin tam tersini belirtecek flekilde kurulur.
rnein, bir snftaki rencilerin not ortalamasnn 50 den yksek olduu iddia edilsin. Bu durumda sfr hipotezi; Snftaki rencilerin not ortalamas 50 ye
eflittir. biiminde kurulur. Bir snftaki rencilerin not ortalamasnn baflka bir snftaki rencilerinkinden daha yksek olduu ileri srldnde ise, sfr hipotezi
ki snf arasnda not ortalamas ynnden fark yoktur. biiminde oluflturulmaldr.
Sfr hipotezi, istatistiksel hipotez testlerinin temelini oluflturur ve afladaki biimde kurulur.
Tek ana ktle parametresinin belli bir deere eflit olup olmadna iliflkin hipotez testlerinde;
a. Ana ktle aritmetik ortalamas iin, H0 : = 0 (veya - 0 = 0): Ana kt
le aritmetik ortalamas 0 deerine eflittir.
b. Ana ktle oran iin, H0 : = 0 (veya - 0 = 0): Ana ktle oran 0
deerine eflittir.
ki ana ktleye ait parametrelerin birbirlerine eflit olup olmadna iliflkin hipotez testlerinde;
a. Ana ktle aritmetik ortalamalarnn karfllafltrmas iin, H0 : 1 = 2 (ve
ya 1 - 2 = 0): ki ana ktle ortalamas arasnda fark yoktur.
b. Ana ktle oranlarnn karfllafltrmas iin, H0 : 1 = 2 (veya 1 - 2 = 0):
ki ana ktle oran arasnda fark yoktur.
Burada dikkat edilmesi gereken nemli nokta; herhangi bir ana ktle parametresine iliflkin hipotez, ana ktle parametresinin belirli bir deere sahip olduu fleklinde ifade edildikten sonra, rneklem istatistiine dayal olarak test edilir.
Eflit olmama, farkllk, belirli bir deerden daha byk olma, belirli bir deerden
daha kk olma, parametreler arasndaki farkn sfr olmad gibi kavramlar ileri sren bir istatistiksel hipotezdir H1 ve ile gsterilir. statistiksel hipotez testlerinde karflt hipotezler, test edilecek olan sfr hipotezinin tersi olan iddia ne srlerek oluflturulur ve genellikle ispatlanmak istenen durum bu hipotezde belirtilir.
Yukarda verdiimiz sfr hipotezi rneklerinin karflt hipotezlerini oluflturmak
istediimizde, snftaki rencilerin not ortalamasnn 50 ye eflit olduu fleklinde
kurulan sfr hipotezinin karflt hipotezi Snftaki rencilerin not ortalamas 50
den yksektir. biiminde kurulmaldr. nk, iddiay ortaya atan kiflinin ispatlamak istedii durum snf ortalamasnn 50 den yksek olduudur. kinci rnekteki sfr hipotezinde ise, iki snf arasnda not ortalamas ynnden farkn bulunmad belirtilmiflti. Burada arafltrmac snflardan birinin not ortalamasnn dierinden daha yksek olduunu ispatlamaya alflt iin kurulmas gereken karflt hipotez; Birinci snftaki rencilerin not ortalamas, dier snftaki rencilerin not
ortalamasndan yksektir. olacaktr.
Sfr ve karflt hipotez kavramlarn tanmlaynz.
SIRA SZDE
SIRA SZDE
D fi N E L M
D fi N E L M
S O R U
S O R U
DKKAT
DKKAT
136
Biyoistatistik
Sfr hipotezine karfl olarak ileri srlebilecek tr karflt hipotez bulunmaktadr. Bu hipotezler afladaki biimde kurulur.
Tek ana ktle parametresinin belli bir deere eflit olup olmadna iliflkin hipotez testlerinde;
a. Ana ktle aritmetik ortalamas iin,
(1) H1 : 0 (veya - 0 0): Ana ktle aritmetik ortalamas 0 deerinden farkldr.
(2) H1 : > 0 (veya - 0 > 0): Ana ktle aritmetik ortalamas 0 deerinden byktr.
(3) H1 : < 0 (veya - 0 < 0): Ana ktle aritmetik ortalamas 0 deerinden kktr.
b. Ana ktle oran iin,
(1) H1: 0 (veya - 0 0): Ana ktle oran 0 deerinden farkldr.
(2) H1: > 0 (veya - 0 > 0): Ana ktle oran 0 deerinden byktr.
(3) H1: < 0 (veya - 0 < 0): Ana ktle oran 0 deerinden kktr.
ki ana ktleye ait parametrelerin birbirlerine eflit olup olmadna iliflkin hipotez testlerinde;
a. Ana ktle aritmetik ortalamalarnn karfllafltrmas iin,
(1) H1: 1 2 (veya 1 - 2 0): ki ana ktlenin ortalamalar arasnda fark vardr.
(2) H1: 1 > 2 (veya 1 - 2 > 0): Birinci ana ktle ortalamas, ikinci ana
ktle ortalamasndan byktr.
(3) H1: 1 < 2 (veya 1 - 2 < 0): Birinci ana ktle ortalamas, ikinci
ana ktle ortalamasndan kktr.
b. Ana ktle oranlarnn karfllafltrmas iin,
(1) H1: 1 2 (veya 1 - 2 0): ki ana ktlenin oran arasndaki
fark vardr.
(2) H1: 1 > 2 (veya 1 - 2 > 0): Birinci ana ktle oran, ikinci ana
ktle oranndan byktr.
(3) H1: 1 < 2(veya 1 - 2 < 0): Birinci ana ktle oran, ikinci ana
ktle oranndan kktr.
Grld gibi, her test iin eflitlik zerine kurulabilecek tek bir tane sfr hipotezi bulunmasna karfllk olarak, eflit olmama, byk olma ve kk olma biiminde kurulabilecek adet karflt hipotez bulunmaktadr. Tek bir parametrenin
belli bir deerden byk (>) veya kk (<) olduu ya da iki ana ktleye ait
parametrelerden birinin dierinden byk veya kk olduu fleklinde kurulan
karflt hipotez tek ynl karflt hipotez olarak adlandrlrken, tek bir parametrenin
belli bir deerden farkl () olduu ya da iki ana ktleye ait parametrelerin birbirinden farkl olduu fleklinde kurulan karflt hipotez ift ynl karflt hipotez olarak adlandrlr.
Bu karflt hipotezlerden hangisinin seilecei hipotez testlerinde ok nemli bir
durumdur. nk, karflt hipotezin tek ya da ift ynl olufluna gre test sonucunda verilecek kabul ya da red karar bile deiflebilmektedir. Tek ya da ift ynl
karflt hipotezlerden birine karar verme ifllemi arafltrmacnn neyi ispatlamak istedii ile ilgilidir. rnein arafltrmac, sadece snf ortalamasnn 50 olup olmamas
ile ilgileniyorsa, kuraca karflt hipotez ift ynl yani, Snftaki rencilerin not
ortalamas 50 den farkldr. biiminde olmaldr. Eer arafltrmacnn iddias, snf
137
ortalamasnn 50 den yksek olduu fleklinde ise, bu iddiay test etmek iin kurmas gereken karflt hipotez tek ynl yani, Snftaki rencilerin not ortalamas
50 den yksektir. biiminde olacaktr.
Bir ekmek frnnda piflirilen ekmeklerde rope bakterisinin oluflmamas iin gn
ierisindeki ortalama scakln 0 = 20 C olmas gerekmektedir. Frnn bu koflullar salayp salamadn denetleyebilmek amacyla, gn ierisinde on adet deiflik zamanda scaklk lmleri yaplmfl ve afladaki sonular elde edilmifltir.
X: Scaklk (C): 17 22 18 20 21 23 19 19 17 13
Buna gre rneklem ortalamas x = 18,9 C olarak bulunur. Aradaki farkn istatistiksel olarak anlaml bir fark olup olmadn test edebilmek amacyla kurulmas gereken hipotezleri belirtiniz.
RNEK 7.1
D fi N E L M
Hipotez testlerinde ana ktle parametresinin, rneklem istatistiinden edinilen bilgiye dayal olarak test edildii belirtilmiflti. rneklemden elde edilen istatistikler,
O R U seilen bir
rneklemden rnekleme deiflen deerler aldklar iin, rassalS olarak
rneklemden hesaplanan istatistik kullanlarak hipotez testi gereklefltirildiinde
afladaki drt durumdan birisi gerekleflir:
DKKAT
1. H0 gerekte dorudur ve rneklem istatistiine gre kabul edilmifltir.
2. H0 gerekte dorudur fakat rneklem istatistiine gre reddedilmifltir.
SIRA SZDE
edilmifltir.
3. H0 gerekte yanlfltr fakat rneklem istatistiine gre kabul
4. H0 gerekte yanlfltr ve rneklem istatistiine gre reddedilmifltir.
Birinci durumda, yani sfr hipotezi gerekte doru iken test sonucunda kabul
AMALARIMIZ
edilmifl ise ya da drdnc durumda, yani sfr hipotezi gerekte yanlfl iken test
sonucunda reddedilmifl ise, doru karar verilmifl olur. kinci durumda, yani sfr hipotezi gerekte doru iken test sonucunda reddedilmifl ise ya da nc durumK T A P
da, sfr hipotezi gerekte yanlfl iken test sonucunda kabul edilmifl ise hata yaplmfl demektir.
N N
SIRA SZDE
D fi N E L M
S O R U
DKKAT
SIRA SZDE
AMALARIMIZ
K T A P
TELEVZYON
TELEVZYON
NTERNET
NTERNET
138
Biyoistatistik
Tablo 7.1
Hipotez Testi Sonucu
Karfllafllabilecek
Durumlar
Test sonucu
H0 kabul edildi
H0 reddedildi
H0 doru
Doru karar
(1 - )
1. tip hata
()
H0 yanlfl
2. tip hata
()
Doru karar
(1 - )
Gerek Durum
SIRA SZDE
D fi N E L M
S O R U
Red Blgesi: Test
istatistiinin rnekleme
dalm zerinde bulunan,
D K K A T reddedildii
H0hipotezinin
blgeye red blgesi ad
verilir. Tek ynl hipotezi
HSIRA
SZDE red
1kurulduunda,
blgesinin bykl
kadar, ift ynl H1 hipotezi
kurulduunda, red
AMALARIMIZ
blgesinin bykl her iki
alt kuyrukta /2 kadardr.
Test istatistiinin rnekleme dalm zerinde, H0 hipotezini reddetmek zere taS O R U red blgesi ad verilir. Red blgesinin bykl anlam dnmlanan blgeye
zeyine eflittir. Dalm zerindeki konumu ise kurulan karflt hipotezin tek ya da
ift ynl olufluna
D K K A Tgre deiflmektedir. Eer H1 hipotezi tek ynl ve ana ktle parametresinin test edilecek deerden byk olduu fleklinde kurulmufl ise red blgesi dalmn sa alt kuyruk blgesinde, kk olduu fleklinde kurulmufl ise daSIRA SZDE
lmn sol alt kuyruk blgesinde yer alr ve bu blgenin bykl kadardr.
Eer H1 hipotezi ift ynl, yani ana ktle parametresinin test edilecek deerden
farkl olduu
fleklinde kurulmufl ise, red blgesi dalmn her iki alt kuyruunda
AMALARIMIZ
da yer alr ve bu iki blgenin toplam bykl, /2 si sa alt kuyrukta ve /2 si
sol alt kuyrukta olmak zere kadardr.
Kurulabilecek
hipotez trlerine gre, hipotezlerinin red blgeleri fiekil
K T A karflt
P
7.1., 7.2. ve 7.3. te gri renkle belirtilen blgelerdir.
N N
K T A P
TELEVZYON
TELEVZYON
NTERNET
NTERNET
139
fiekil 7.1
H1 Hipotezi Tek
Ynl ve H1: > 0
Olarak
Kurulduunda H0
n Red Blgesi
H0 n Kabul Blgesi
1
H 0 n Red Blgesi
Kritik Deer
fiekil 7.2
H1 Hipotezi Tek
Ynl ve H1: < 0
Olarak
Kurulduunda H0
n Red Blgesi
H 0 n Kabul Blgesi
1
H n Red Blgesi
0
Kritik Deer
fiekil 7.3
H1 Hipotezi ift
Ynl (H1: 0)
Olarak
Kurulduunda H0
n Red Blgesi
H0 n Kabul Blgesi
1
H0 n Red Blgesi
H 0 n Red Blgesi
/2
/2
0
Kritik Deer
Kritik Deer
140
Biyoistatistik
Test edilecek istatistiin rnekleme dalmnda, H0 hipotezinin red blgesinin belirlenmesinde kullanlan tablo deerlerine kritik deer ad verilir. Dalm zerindeki red blgesi, kritik deerin mutlak deerinden byk olan deerlerin yer ald blgedir ve bu blgenin bykl, kritik deerden itibaren dalm erisinin
altnda kalan alana eflittir.
Aritmetik ortalama ve oranlar iin gereklefltirilen hipotez testlerinde, rneklem
hacminin yeterli byklkte (n 30) olduu durumlarda kritik deerlerin bulunabilmesi iin standart normal dalm tablosundan, yeterli byklkte olmad (n <
30) durumlarda ise Student-t tablosundan yararlanlr. Kritik deerin alaca deer,
testin anlam dzeyine ve H1 hipotezinin tek ya da ift ynl olufluna gre deiflir.
H1 hipotezi tek ynl olduunda deeri iin gerekli tablo deerine baklrken,
H1 hipotezi ift ynl olduunda /2 deeri iin gerekli tablo deeri kullanlr. rnein, testlerde en sk kullanlan z deerleri;
H1 hipotezi tek ynl olarak kurulduunda; = 0,05 iin z0,05 = 1,64 ve
= 0,01 iin z0,01 = 2,33
deerleri kullanlrken,
H1 hipotezi ift ynl olarak kurulduunda; = 0,05 iin z0,025 = 1,96 ve
= 0,01 iin z0,005 = 2,58
deerleri kullanlr.
141
z=
x 0
z=
x 0
s
n
t=
x 0
s
n
olur ve yaplan bu teste ise student-t testi ad verilir. statistiksel kararn verilmesi
admnda, hesaplanan bu t deerinin mutlak deeri, karflt hipotez tek ynl olarak kurulduunda t,(n-1) tablo deeri ile karfllafltrlrken, ift ynl olarak kurulduunda t/2,(n-1) deeri ile karfllafltrlr.
Eskiflehir de yetiflkin bir insann gnlk ekmek tketimi ortalamasnn 200 gr. olduu bilinmektedir. Rassal olarak seilen 100 kiflinin gnlk ekmek tketimi ortalamas 230 gr., standart sapmas ise 80 gr. olarak bulunmufltur. Eskiflehir de yetiflkin bir insann gnlk ortalama ekmek tketiminin artp artmadna % 95 gven dzeyi ile karar veriniz.
RNEK7.2
142
Biyoistatistik
Ana ktle aritmetik ortalamasnn bilinen deeri; 0 = 200 gr. Seilen rneklem
bilgileri: n = 100 kifli, x = 230 gr., s = 80 gr. dr. stenilen kararn verilebilmesi iin
hipotez testi admlarn uygulayalm.
1-) Hipotezlerin kurulmas
H0 : = 200gr. (ya da - 200 = 0)
Yani, Eskiflehir de yetiflkin bir insann gnlk ortalama ekmek tketimi artmfl
deildir. 200 ile 230 gr. arasndaki 30 gr.lk fark tketim artflndan deil, tamamen
tesadfn etkisiyle gzlenen bir farktr. Bu kadarlk bir fark istatistiksel olarak
nemli ya da anlaml bir fark deildir.
Belirtilen bu sfr hipotezine karfl kurulacak karflt hipotez tek ynl olmaldr.
nk soruda arafltrmac, Eskiflehir de yetiflkin bir insann gnlk ortalama ekmek tketiminin artp artmadyla ilgilenmektedir. Ortalama ekmek tketiminin
200 gr. da kalp kalmadyla ilgilenilseydi, karflt hipotezin ift ynl olarak kurulmas gerekirdi. Dolaysyla, karflt hipotez belirlenirken soruda neyin test edildiine dikkat edilmelidir. Buna gre karflt hipotez,
H1 : > 200gr. (ya da - 200 > 0)
olur. Yani, Eskiflehir de yetiflkin bir insann gnlk ortalama ekmek tketimi iin
seilen rneklemin ortalamas ile ana ktleye ait ortalama arasndaki 30 gr. lk fark
istatistiksel olarak nemli ve anlaml bir farktr. Byle bir farkn tesadfle aklanmas olasl ok kktr. Bu fark ekmek tketiminin artfln gsteren bir deer
olarak kabul edebiliriz.
2-) Anlam dzeyinin seilmesi
Soruda testin gven dzeyi 1 - = 0,95 olarak verildiine gre anlam dzeyi;
= 0,95 olarak belirlenir.
3-) Red blgesinin belirlenmesi
Karflt hipotez tek ynl ve byktr fleklinde kurulduu iin red blgesi normal dalm erisinin sa alt kuyruunda olacak ve = 0,05 olarak belirlendiinden dolay red blgesinin bykl 0,05 olacaktr. Bu duruma gre red blgesi
fiekil 7.4. te grlmektedir.
fiekil 7.4
rnek 7.2 in Red
Blgesi
H 0 n Kabul Blgesi
0,95
H 0 n Red Blgesi
0,05
0
Z
1,64
z=
x 0 230 200 30
=
=
= 3, 75
s
80
8
n
100
olarak hesaplanr.
6-) statistiksel kararn verilmesi
fiekil 7.4. e bakldnda, hesaplanan test istatistiinin deeri kritik deerden
byk olduundan gri renkle belirtilen red blgesinde yer almaktadr. Buna gre,
z = 3,75 > z0,05= 1,64 olduundan H0 hipotezi reddedilir.
Dolaysyla H1 hipotezi kabul edilmifl olur. Sonu olarak, yetiflkin kifli baflna
200 gr. olarak bilinen ekmek tketimi ortalamasnn artt % 95 gvenle sylenebilir. 200 gr. ile 230 gr. arasndaki fark tesadf ile aklanamayacak kadar byk,
anlaml ve nemli bir farktr. Byle bir farkn tesadfen oluflmas olasl % 5 ten
de kktr.
z=
x1 x2
12
2
+ 2
n1 n 2
z=
x1 x2
s12
s2
+ 2
n1 n 2
olacaktr.
143
144
Biyoistatistik
2
2
Ana ktle varyanslar 1 ve 2 nin bilinmediinde, rneklem hacimleri yeterli byklkte deil ise (n1 < 30 ve n2 < 30 ise), normal dalm yaklaflm kullanlamaz. Bu durumda, normal dalma sahip iki ana ktleden seilen bamsz rassal rneklemler ayn bilinmeyen 2 varyansna sahip olduunda kullanlacak test
istatistiinin eflitlii,
t=
x1 x2
( n1 1)s12 + ( n 2 1)s 22 1
1
+
n1 n 2
n1 + n 2 2
olacaktr. statistiksel kararn verilmesi admnda, hesaplanan bu t deerinin mutlak deeri, karflt hipotez tek ynl olarak kurulduunda t,( n + n 2) tablo deeri
1
2
ile karfllafltrlrken, ift ynl olarak kurulduunda t / 2, n + n 2 deeri ile karfl(1 2 )
lafltrlr.
RNEK7.3
Ar kesici zellii olan iki ila etki sreleri bakmndan karfllafltrmak isteniyor.
Bu amala 30 hastada kullanlan birinci ila 18 dk.da ary keserken ve standart sapmas da 4,6 dk. iken, 40 hastada kullanlan ikinci ila ary 15 dk.da kesiyor ve standart sapmas 5,4 dk. olarak bulunuyor. Buna gre, iki ilacn etki sreleri bakmndan birbirinden farkl olup olmadna % 99 gvenle karar veriniz.
Seilen rneklem bilgileri: Birinci ila iin, n1 = 30 hasta, x1 = 18 dk., s1 = 4,6
dk. ve ikinci ila iin n2 = 40 hasta, x2 = 15 dk., s2= 5,4 dk. olarak verilmektedir.
1-) Hipotezlerin kurulmas
H0 : 1 = 2
H1 : 1 2 (ya da 1 - 2 0)
2-) Anlam dzeyinin seilmesi
Testin gven dzeyi 1- = 0,99 olduu iin anlam dzeyi; = 0,01 olarak
belirlenir.
3-) Red blgesinin belirlenmesi
Karflt hipotez ift ynl olarak kurulduu iin red blgesi normal dalm erisinin hem sa hem de sol alt kuyruunda olacak ve = 0,01 olarak belirlendiinden dolay red blgelerinin byklkleri 0,005 olacaktr. Bu durumda red blgesi fiekil 7.5. te grld gibidir.
fiekil 7.5
rnek 7.3 in Red
Blgesi
H 0 n Kabul Blgesi
0,99
H0 n Red Blgesi
H0 n Red Blgesi
0,005
- 2,58
0,005
0
2,58
145
z=
x1 x2
s12
s2
+ 2
n1 n 2
18 15
(4, 6)
30
(5, 4)
3
= 2, 5
1, 2
40
olarak hesaplanr.
6-) statistiksel kararn verilmesi
z = 2,5 < z0,005 = 2,58 olduundan H0 hipotezi kabul edilir.
Dolaysyla, iki ilacn ortalama etki sreleri arasndaki fark % 99 gven dzeyinde istatistiksel olarak anlaml deildir.
z=
p 0
0 (1 0 )
n
27
= 0, 09
300
RNEK7.4
146
Biyoistatistik
H 0 n Kabul Blgesi
0,99
H0 n Red Blgesi
0,01
Z
- 2,33
z=
p 0
0 (1 0 )
n
0, 09 0,15
0, 15(1 0, 15)
0, 06
= 2, 91
0, 0206
300
olarak hesaplanr.
6-) statistiksel kararn verilmesi
z =2,91 > z0,01 = 2,33 olduundan H0 hipotezi reddedilir.
Dolaysyla % 99 gvenle firmann iddiasnn doru olduu sylenebilir.
147
Nitel verilerden oluflan bir ana ktleden seilen bamsz iki rassal rneklem
ayn zelliin grlme oran bakmndan karfllafltrlmak istendiinde, bu rneklemlerin 1 ve 2 bilinmeyen parametreli Binom dalmna sahip ana ktlelerden
ekildii varsaylr. Birinci rneklemdeki birim says n1 ve ikinci rneklemdeki birim says n2 yeterli byklkte olduunda (n1 30, n2 30) Binom dalmnn Normal dalma yaknsad varsaym kullanlarak, H0 : 1 = 2 hipotezine karfllk,
H1 : 1 2 karflt hipotezi test edilmek istendiinde, red blgesi z z/2
olarak belirlenir.
H1 : 1 > 2 olarak kurulduunda, red blgesi z z olarak belirlenir.
H1 : 1 < 2 olarak kurulduunda ise, red blgesi z -z olarak belirlenir.
Buradaki test istatistii;
z=
p1 p 2
p1 (1 p1 )
n1
p2 (1 p2 )
n2
z=
p1 p2
p1 (1 p1 )
n1
p (1 p2 )
+ 2
n2
0, 07
= 2, 33
0, 03
olarak hesaplanr.
=
0,14 0, 21
(0,14)(1 0
0, 14) (0, 21)(1 0, 21)
+
250
400
RNEK7.5
148
Biyoistatistik
H0 n Kabul Blgesi
0,95
H0 n Red Blgesi
H0 n Red Blgesi
0,025
- 1,96
0,025
0
1,96
VARYANS ANALZ
nceki blmlerde, tek ana ktle ortalamasnn belirlenen deerle karfllafltrlmasna iliflkin hipotez testleri ile, iki ana ktle ortalamasnn karfllafltrlmasna iliflkin
hipotez testleri incelenmiflti. Bu blmde ise, ikiden fazla ana ktle ortalamasnn
karfllafltrlmasnda kullanlan yntem, yani Varyans Analizi konusu ksaca aklanmaya alfllacaktr. Varyans analizi ile, dalmlarn toplam deiflkenliini eflitli bileflenlere ayrma yntemi yardmyla bamsz deiflkenlerin baml deiflkenler zerindeki etkileri incelenebilmektedir.
Bu blmde, uygulamalarda ok sk kullanlan Tek Ynl Varyans Analizi
yntemi aklanmaya alfllacaktr.
Tek Ynl Varyans Analizinde, gzlem deerleri tek bir baml deiflkene gre gruplandrlr ve bu gruplara iliflkin ana ktle aritmetik ortalamalar karfllafltrlr. kiden fazla ana ktle ortalamasnn karfllafltrlmasnda z ya da Student- t testleri kullanlamamakla birlikte, bu karfllafltrma iin F-testinden yararlanlr. F-testinde kullanlan F-istatistii, ayn varyansn iki ayr birbirinden bamsz tahmininin
birbirine oran olarak tanmlanr. Bu oran, yani F-istatistiinin rnekleme dalm
da F-dalm olarak bilinir.
Varyans analizinde, genellikle deiflkenliin bileflenlere ayrlmasyla birlikte,
deiflim kaynann bulunmasyla da ilgilenilir. Deiflkenliin ayrfltrlmas ifllemi,
kareler toplamlar ve kareler oranlarnn hesaplanmas yoluyla gereklefltirilir. Dolaysyla F-testi uygulanmas sonucu, deiflim yani model denklemi kaynaklara ayrlmfl olur. Deiflkenlik, hatadan ya da gruplardan kaynaklanabilir.
Toplam Deiflkenlik = Grup Etkisi + Hata
Toplam deiflkenlik iin kurulabilecek model;
Yij = + j + ij
olarak verilir. Burada;
Yij : Yant Deiflkeni, (j-inci denemedeki i-inci birimin ald deerdir.)
ya da
ya da
GKT =
nj
Yij2
T..2
j=1 i=1
T. 2j
GAKT =
j=1
k
GKT =
nj
nj
T..2
n
Yij
j=1 i=1
j=1
T. 2j
nj
Burada,
Genel Deiflim = Gruplar Aras Deiflim + Gruplar i Deiflim
olduundan,
GKT = GAKT + GKT
iliflkisi mevcuttur.
149
150
Biyoistatistik
GKT
: Gruplar i Kareler Ortalamas (Gruplar ii varyans tahmini,
nk
Hata Kareler Ortalamas),
GAKO
: Test istatistii.
GKO
Deiflim
Kayna
Serbestlik
Derecesi
Kareler
Toplam
Kareler
Ortalamas
Gruplar Aras
k-1
GAKT
GAKO
Gruplar i
n-k
GKT
GKO
Genel
n-1
GKT
F-deeri
F=
GAKO
GKO
F-test istatistii, (k-1) ve (n-k) serbestlik dereceli F-dalmna sahiptir. F-istatistiinin anlamll belirlenirken, F(k-1);(n-k) dalmnn kritik deerlerinden (F;(k1);(n-k)) yararlanlr.
Afladaki karfllafltrma yaplarak test iin karar verilir:
F < F;(k-1);(n-k) ise H0 hipotezi kabul edilir. Aksi halde reddedilir.
RNEK7.6
Tablo 7.3
Fabrikalardan
Seilen
rneklemlerdeki
Yasz Sr Eti
Miktarlar
T.j
51
50
57
56
53
51
52
53
48
51
40
51
45
46
49
44
47
54
49
51
52
53
52
423
50
43
467
358
T.. = 1.248
% 95 gven dzeyinde, bu fabrika arasnda retilen sucuklarn ierdii yasz sr eti miktar ortalamalar bakmndan fark olup olmadn test ediniz.
Hipotezler;
H0 : 1 = 2 = 3
H1 : En az bir ortalama dierlerinden farkldr.
fleklinde kurulduktan sonra Varyans Analizi iin gerekli hesaplamalar yapalm.
151
nj
Yij2
GKT =
j=1 i=1
GAKT =
j=1
T. 2j
nj
T..2
n
= 62.686
1.2482
= 385, 84
25
=
+
+
= 184, 01
8
n
25
10
7
T..2
GKT = GAKT + GKT olduundan, GKT = GKT - GAKT eflitlii ile hesaplanabilir.
GKT = 385,84-184,01 =201,83
Buna gre, Varyans Analizi Tablosu Tablo 7.4 te grlmektedir:
Deiflim
Kayna
Serbestlik
Derecesi
Kareler
Toplam
Gruplar Aras
184,01
Gruplar ii
22
201,83
Genel
24
385,84
Kareler Oran
F-oran
184, 01
= 92, 01
2
201, 83
92, 01
GIKO =
= 9,17
F=
= 10, 03
9, 17
22
GAKO =
Tablo 7.4
rnek 7.6 iin
Varyans Analizi
Tablosu
152
Biyoistatistik
zet
N
A M A
N
A M A
N
A M A
t=
z=
x 0
z=
x 0
s
n
x1 x2
12
2
+ 2
n1 n 2
2
z=
x1 x2
s12
s2
+ 2
n1 n 2
2
x1 x2
t=
+ ( n 2 1)s 22 1
1
+
n1 + n 2 2
n1 n 2
( n1 1)s12
ile verilir.
N
AM A
z=
z=
s
n
x 0
p 0
0 (1 0 )
n
ile verilir. Ana ktle oranlar arasndaki farka iliflkin hipotez testlerinde, n1 30 ve n2 30 ise,
kullanlacak test istatistii,
z=
p1 p2
p1 (1 p1 )
n1
ile hesaplanr.
p2 (1 p2 )
n2
N
A M A
153
154
Biyoistatistik
Kendimizi Snayalm
1. Bir veya birden fazla ana ktle parametresine iliflkin
olarak ileri srlen hipotezlerin test edilmesi srecine
ne ad verilir?
a. ift ynl test
b. statistiksel hipotez testi
c. Testin gc
d. Tek ynl test
e. Varyans Analizi
2. I. Kritik deerin belirlenmesi
II. statistiksel kararn verilmesi
III. Hipotezlerin ifade edilmesi
IV. Test istatistiinin hesaplanmas
V. Anlam dzeyinin seilmesi
Yukarda verilen bir hipotez testi srecinin admlar afladakilerden hangisinde doru olarak sralanmfltr?
a. III-II-I-V-IV
b. III-V-I-IV-II
c. II-III-I-IV-V
d. II-V-I-III-IV
e. I-III-V-IV-II
3 - 6. sorular afladaki bilgilere gre cevaplandrlacaktr.
Bir gdann 450 saat olan dayanma sresini artrmak
amacyla, yeni bir koruyucu maddenin kullanm dflnlmektedir. Bu madde kullanlarak 225 adet gda rn retilmifl ve ortalama dayanma sresi 462 saat ve
standart sapmas 72 saat olarak hesaplanmfltr. Yeni
koruyucu maddenin, gdann dayanma sresini artrp
artrmad % 95 gvenle test edilecektir.
3. Bu Bilgilere gre, sfr hipotezi afladakilerden hangisidir?
a. 450
b. < 462
c. = 450
d. = 462
e. > 450
4. Yukardaki bilgilere gre, sfr hipotezi iin red blgesi afladakilerden hangisidir?
a. Sa alt kuyrukta %2,5 lik alan
b. Her iki alt kuyrukta %5 erlik alan
c. Sa alt kuyrukta %5 lik alan
d. Sol alt kuyrukta %5 lik alan
e. Her iki alt kuyrukta %2,5 erlik alan
155
Yaflamn inden
Bir Veterinerlik Fakltesi nde, kanatl iflletmelerinden
toplanan ve 3 ayr Salmonella tipi var olduu saptanan
(S.Gallinaru, S.Enteritidis ve S.Typhimurium) tavuklar
zerinde, Trimetophrim-Sulfamethoxasol antibiyotiinin etkisi bakmndan farkllk olup olmad arafltrlmak istenmektedir.
Bu amala, ilgili tavuk rneklerine Trimetophrim-Sulfamethoxasol antibiyotii uygulanmfltr. Uygulama sonucunda elde edilen deerler kayt altna alnmfl ve bu
deerler zerinden Trimetophrim-Sulfamethoxasol antibiyotii bakmndan S.Gallinaru, S.Enteritidis ve
S.Typhimurium arasnda % 99 gven dzeyi ile fark
bulunmad Tek Ynl Varyans Analizi yntemi ile ortaya konmufltur.
4. c
5. d
6. b
7. e
8. a
9. d
10. e
156
Biyoistatistik
Yararlanlan Kaynaklar
Sra Sizde 1
Sfr hipotezi, belirlenen deer ile ana ktle parametresinin deeri arasnda fark olmadn ya da iki ana ktle parametresi arasnda fark bulunmadn belirten hipotezdir. Karflt hipotez ise, belirlenen deer ile ana
ktle parametresinin deeri arasnda belli miktarda bir
fark olduunu ya da iki ana ktle parametresi arasnda
fark bulunduunu belirten hipotezdir.
Sra Sizde 2
Hipotez testinde, ana ktle parametresinin belli bir deerden byk ya da kk olduu iddia ediliyor ise tek
ynl karflt hipotez kurulmaldr. Byklk ya da kklk nemli deil ise, yani ana ktle parametresinin
belirlenen deere eflit olup olmad ile ilgileniliyor ise,
ift ynl karflt hipotez kurulmaldr.
Sra Sizde 3
1. tip hata olasl ile, 2. tip hata olasl ile, testin
gven dzeyi 1 - ile ve testin gc 1 - ile belirtilir.
BYOSTATSTK
Amalarmz
N
N
N
Anahtar Kavramlar
Korelasyon
Regresyon
Korelasyon Analizi
Pearsonn Korelasyon Katsays
Belirlilik Katsays
Korelasyon Katsays Anlamllk
Testi
erik Haritas
Biyoistatistik
Korelasyon ve
Regresyon Analizi
KORELASYON VE REGRESYON
KORELASYON ANALZ
BAST DORUSAL REGRESYON
ANALZ
OKLU DORUSAL REGRESYON
ANALZ
Korelasyon ve Regresyon
Analizi
KORELASYON VE REGRESYON
ki ya da daha fazla deiflken arasndaki iliflkinin genel doasnn tanmlanmasna
regresyon analizi ad verilir. Deiflkenler arasndaki iliflkinin derecesinin tespiti ifllemine ise korelasyon analizi ad verilir. Sir Francis Galton 1800l yllarda bir deiflken zerinde meydana gelen deiflimin baflka bir ya da daha fazla deiflken tarafndan aklanp aklanamayacan alflan ilk arafltrmaclardandr. Galton babalarn boylar ile oullarnn boylar arasndaki iliflkiyi arafltrmfltr. Arafltrmalar
sonucunda ortalamaya doru bir eilimin varln fark etmifltir. ok ksa boylu babalarn oullarnn boylarnn ortalama deerler etrafnda (babalarndan daha uzun
gibi) toparlandn gzlerken bu durumun tersinin de doru olduunu (uzun boylu babalarn oullar da ortalama boyda bulunmaktadr) fark etmifltir. Galton oullarn boylarnn ortalamaya doru ynlendiini (ngilizce karfll regressed olmak zere) belirterek regresyon kelimesinin temelini de atmfltr. Gnmzde regresyon kelimesi iki ya da daha fazla deiflken arasndaki iliflkinin modellenmesi ifllemlerinin tmn ieren genifl bir anlama sahiptir.
Regresyon analizi alflmalarnda iki farkl deiflken tanmlamasna ihtiya duyulmaktadr. Bunlar srasyla baml ve bamsz deiflken kavramlardr. Baml
deiflken arafltrmacnn zerinde alflt deiflken olup bu deiflken zerinde
meydana gelen deiflimlerin ya da bu deiflkenin toplam deiflkenliinin aklanlmasna alfllmaktadr. rnein rencilerin final snav sonucu baml deiflken
olarak ele alnabilir. Bamsz deiflken ya da deiflkenler ise ilgilenilen baml
deiflkende meydana gelen deiflim ya da toplam deiflkenliinin zerinde etkisi
olabilecei dflnlen deiflken ya da deiflkenlerdir. rnein baml deiflken final snav sonucu ise bamsz deiflkenler rencinin snava alflma sresi, vize snavnda ald sonu ve snava hazrlanma sresi olabilir. Regresyon analizinde bir
ya da daha fazla bamsz deiflken olabilir. Bu nite ierisinde tek bamsz deiflken olmas durumu basit dorusal regresyon analizi olarak ele alnrken birden
fazla bamsz deiflken olmas durumu oklu dorusal regresyon analizi olarak
ele alnacaktr.
lgilenilen iki deiflken arasndaki iliflkinin derecesi iin korelasyon analizi kullanlr. Burada dikkat edilmesi gereken nokta, korelasyon analizinin deiflkenler
arasndaki iliflkinin yanlzca derecesini gstermesidir. ki deiflken arasnda yksek
korelasyon olmas bu iki deiflkenden birinin dierinin nedeni olabileceini gstermez. Korelasyon analizi iki deiflken arasndaki nedensellik iin kullanlmaz.
Nedensellik arafltrmas iin farkl istatistik tekniklerinin kullanlmas gerekir.
160
Biyoistatistik
KORELASYON ANALZ
Korelasyon analizi en genel tanm ile deiflkenler arasndaki iliflkilerin incelenmesidir. Deiflkenler arasnda var olabilecek iliflkinin derecesinin tespit edilebilmesi
amac ile eflitli teknikler kullanlabilir. En basit flekli ile iki deiflken arasndaki
iliflkiyi gzlemlemek iin bu deiflkenlerin salm grafikleri izilebilir. fiekil 8.1.de
iki deiflken arasnda gzlemlenebilecek 4 farkl durum rneklenmifltir.
fiekil 8.1
ki Deiflken in
Farkl Salm
Grafikleri
10
10
y
4
0
0
10
(a)
10
10
(b)
10
10
6
y
6
y
4
2
4
2
0
0
x
(c)
10
x
(d)
fiekil 8.1. (a) ve (b) grafiklerinde yer alan iki deiflken arasndaki iliflkinin derecesi birbirine eflittir, fakat iki deiflken arasndaki iliflkinin yn farkldr. Dikkat
edilirse fiekil 8.1. (a)da x deiflkenin deeri artarken y deiflkenin deeri de artmaktadr. Ancak fiekil 8.2. (b)de x deiflkenin deeri artarken y deiflkenin deeri azalmaktadr.
fiekil 8.1. (c) ve (d) grafiklerinde yer alan iki deiflken salm grafikleri incelendiinde 8.1. (c) grafiinde yer alan deiflkenler arasndaki iliflkinin rassal olduu gzlemlenmektedir. Dolaysyla bir korelasyon hesab yapldnda aralarnda
bir iliflki kmayacaktr. 8.1. (d) salm grafiinde ise iki deiflken arasndaki iliflkinin erisel olduu grlmektedir.
Deiflkenler arasndaki iliflkinin yanlzca grafikler ile incelenmesi yeterli olmayacaktr. liflkinin derecesini gsteren istatistiklere ihtiya duyulmaktadr. zleyen blmde iliflkinin derecesi iin hesaplanacak Pearson korelasyon katsays incelenmifltir.
161
fiekil 8.2
Pearson Korelasyon Katsays liflki Yn ve Dereceleri
x ve y deiflkenleri arasndaki Pearson korelasyon katsays, xin standart sapmas sx ve ynin standart sapmas sy olmak zere,
i=1 ( x i -x )( yi -y)
n
r=
( n-1)s x s y
eflitlii yardmyla hesaplanr. Bu eflitliin hesaplanabilmesi iin deiflkenlerin aritmetik ortalamalarnn ve standart sapmalarnn hesaplanmas gerekmektedir. Bu
hesaplamalarn yrtlmesi zaman alacandan Pearson korelasyon katsays ortalama ve standart sapmalara ihtiya duyulmakszn,
r=
n
n
n
n i=1 x i yi - i =1 x i i=1 yi
n
2
n
n i =1 x i2 - i =1 x i
n
2
n
n i=1 y2i - i=1 yi
eflitlii yardmyla da hesaplanabilir. Her iki eflitlikte ayn sonucu verecektir. Orijinal verinin var olmas durumunda verilen ikinci eflitlik hesaplama kolayl salamaktadr.
162
Biyoistatistik
RNEK 8.1
Tablo 8.1.
Bir Aylk Ziyaret ve
Satfl Saylar.
Bir firma piyasaya yeni srd rnn tantm ve satfl ifllemleri iin on adet pazarlamac grevlendirmifltir. Bu pazarlamaclarn farkl kurulufllara yaptklar
toplam ziyaret saylar ile yaplan satfl says arasnda bir iliflkinin varl dflnlmektedir. Bu amala son bir ay ierisinde pazarlamaclarn gereklefltirdikleri
ziyaret saylar ve satfl saylar Tablo 8.1.deki gibi verilmifltir.
Pazarlamac
10
Ziyaret Says
20
40
30
45
25
50
45
25
30
50
Satfl Says
40
65
45
40
35
40
40
30
35
35
Pazarlamac
Ziyaret
Says (x)
Satfl
Says (y)
xi2
yi2
xiyi
20
40
400
1.600
800
40
65
1.600
4.225
2.600
30
45
900
2.025
1.350
45
40
2.025
1.600
1.800
25
35
625
1.225
875
50
40
2.500
1.600
2.000
45
40
2.025
1.600
1.800
25
30
625
900
750
30
35
900
1.225
1.050
10
50
35
2.500
1.225
1.750
Toplam
360
405
14.100
17.225
14.775
r=
=
2
1950
.
.
14 100 8 225
= ,
0 201
1 ( . )-(
)
10 17 225
405
olacaktr. Korelasyon deerine gre; iki deiflken arasnda zayf ayn ynl korelasyon olduu sylenebilir.
10(14.100) - (360)
SIRA SZDE
SIRAveri
SZDE
Tablo 8.2.deki
seti iin Pearson korelasyon katsaysn ortalama ve standart sapmalar yardmyla hesaplaynz.
D fi N E L M
D fi N E L M
S O R U
S O R U
DKKAT
DKKAT
163
Belirlilik Katsays
rnek 8.1.in verilerinden faydalanarak satfl says deiflkeninin ne kadarlk ksmnn pazarlamaclarn yapt ziyaret saylar ile aklanabileceini hesaplaynz.
RNEK 8.2
t=
r n-2
1 - r2
istatistii hesaplanlarak tablodan elde edilen kritik deer ile karfllafltrlr. Eer hesaplanan t deeri t tablosu yardmyla belirlenen kritik deer (-kritik deer, + kritik deer) aralnda yer alyor ise H0 hipotezi, bu aralk dflnda yer alyor ise H1
hipotezi kabul edilir.
rnek 8.1.de tanmlanan problem iin ana ktle korelasyon deeri sfra eflit midir? %5 Anlam dzeyine gre test ediniz.
lk olarak hipotezleri yazalm.
H0: = 0 (Ana ktle korelasyonu 0dr.)
H1: 0 (Ana ktle korelasyonu 0 deildir.)
RNEK 8.3
164
Biyoistatistik
fiekil 8.3
Korelasyon Katsays Anlamllk Testi Kabul ve
Red Blgeleri
Sfr Hipotezi
Red Blgesi
-2.306
Sfr Hipotezi
Kabul Blgesi
0
Sfr Hipotezi
Red Blgesi
2.306
t=
r n-2
1 - r2
0, 201 10 - 2
1 - (0, 201)2
0,55685
= 0, 5803
0, 9796
165
(a)
(b)
i=1 ( x i -x )( yi -y)
n
i=1 ( x i -x )2
n
b=
ve
a = y - bx
eflitlikleri kullanlr. Parametre tahminleri yardmyla basit dorusal regresyon
denklemi,
y = a + bx
olarak yazlr. Arafltrmada ilgilenilen x ve y deiflkenlerinin standart sapmalarnn
bilinmesi durumunda b iin,
b=r
sy
sx
eflitlii de kullanlabilir. Parametre deerleri belirlendikten sonra x ve y deiflkenleri iin regresyon dorusu salm grafiinde gsterilir. Regresyon denklemi yar-
166
Biyoistatistik
parametresi regresyon
dorusunun y eksenini
kesim noktasn gsterirken
parametresi dorunun
eimini gstermektedir.
b iin bir baflka eflitlikte
b=
n x i y i - x i y i
2
( )
n x i - x i
olarak yazlabilir.
RNEK 8.4
Tablo 8.3.
Regresyon Denklemi
in Gzlemler
dmyla arafltrmac gzlemledii herhangi bir x deeri iin ynin alaca deeri tahmin edebilir. Denklemde x yerine ilgilendii deeri yazan arafltrmac ynin modele gre beklenen deerini hesaplamfl olur. Benzer flekilde ynin bir deeri iin xin
modele gre beklenen deeri de hesaplanabilir.
Yaplan hesaplamalarn doru ve uygun olmas iin regresyon analizinde uyulmas gereken 5 adet varsaym bulunmaktadr. Bu varsaymlar
rassal deiflkeni xin deerlerinden istatistiksel olarak bamszdr,
rassal deiflkeni normal dalma sahiptir,
rassal deiflkeninin 0 aritmetik ortalamaya sahiptir,
i ve j gibi birbirinden farkl iki hatann istatistiksel olarak bamsz olmaldr,
i rassal deiflkenleri xilerin tm deerleri iin sabit bir varyansa sahiptir,
olarak sralanrlar.
Bir arafltrmada elde edilen, x bamsz deiflken ve y baml deiflken olmak zere, gzlem deerleri Tablo 8.3.deki gibidir. Basit dorusal regresyon denklemini elde ederek grafiini iziniz.
Gzlem
ncelikle ilgilenilen her iki deiflken iin aritmetik ortalama deerlerini hesaplayalm.
x=
i=1 x i
y=
i=1 yi
3+ 6+...+ 2+1 45
=
=5
9
9
4+5+...+ 4+ 3 45
=
=5
9
9
ve
n
fiimdi bu ortalamalar kullanarak gerekli hesaplamalar yapalm. Hesap deerleri Tablo 8.4.dedir.
Tablo 8.4.
Regresyon Denklemi
Hesaplamalar
Tablosu.
Gzlem
Numaras
( x i -x )
( yi -y)
( x i -x )( yi -y)
( x i -x )2
-2
-1
-1
16
-3
-1
-4
-2
16
Toplam
45
45
26
60
167
i=1 ( x i -x )( yi -y)
n
i=1 ( x i -x )2
n
b=
26
= 0, 433
60
ve
a = y - bx = 5 - (0,433)(5) = 2,835
deerlerine eflittir. Bu deerler yardmyla basit dorusal regresyon denklemi
tahmini,
fiekil 8.5
y = 2, 835 + 0, 433x
fleklinde yazlr. Regresyon denklemi yardmyla arafltrmac gzlemledii herhangi bir x deeri iin ynin
alaca deeri tahmin edebilir. rnein x=12 olarak
gzlemlenmifl ise ynin tahmini,
yazlabilir. Toplam deiflim iin oluflturulan bu yap fiekil 8.6.da sekiz birimlik bir
regresyon problemi kullanlarak grafik zerinde gsterilmifltir.
168
Biyoistatistik
fiekil 8.6
Aklanan ve
Aklanamayan
Deiflim
37
Gzlem=37
36
Aklanamayan deiflim
35
34
33
Aklanabilen
deiflim
Ortalama y 32,63
32
31
30
29
28
50
52
54
56
58
60
62
64
i=1
i=1
i=1
( yi -y)2 = ( yi -y i )2 + ( y i -y)2
eflitlikleri yardmyla oluflturulur. Bu eflitliin sol taraf toplam deiflkenlik ya da
genel kareler toplam (GKT) olarak ifade edilir. Eflitliin sa tarafnda yer alan ilk
toplam deeri aklanamayan deiflkenliktir ve hata kareler toplam (HKT) olarak
adlandrlr. Eflitliin son bilefleni ise aklanan deiflkenliktir ve regresyon kareler
toplam (RKT) olarak adlandrlr. Bu ifadeleri kullanarak toplam deiflkenlik,
GKT = HKT + RKT
fleklinde ifade edilebilir. Toplam deiflkenliin bileflenlerine ayrlmasnn en byk
faydas hata kareler toplam bykl bakmndan gzlemlenen ve model yardmyla hesaplanan deerler arasndaki uyumun iyiliine bakabilmesidir. Eer mkemmel uyum var ise HKT=0 olacaktr.
Regresyon denklemi iin hesaplanacak olan regresyon denklemi deiflkenlii
hata kareler toplam deerinin serbestlik derecesine blnmesi ile elde edilecektir.
y iin tahmin deerleri belirlenmeden nce modelde yer alan iki parametrenin tahmin edilmesi gerektiinden burada serbestlik derecesi n-2 olacaktr. Tahminin
standart hatas,
se =
1
n-2
( yi -y i )2
i=1
HKT
n-2
rimlerin %68,30u aritmetik ortalamadan bir standart sapma uzaklkta yer alacaklardr. Bu bilgi kullanlarak veri ile hesaplanan regresyon dorusu hakknda karsama yaplabilir. Eer ayn veri seti iin iki adet regresyon dorusu hesaplanlmfl ise
bu dorulardan daha kk standart hataya sahip olan kullanlmaldr.
n
( x -x )2
i =1 i
eflitlii yardmyla hesaplanr. Sfr hipotezini test etmek iin hesaplanacak olan t
istatistii,
t=
b - 0
sb
n-2 serbestlik derecesi ile belirli anlam dzeyine gre tablodan tespit edilen kritik
deer ile karfllafltrlacaktr.
nn 0a eflitliinin test edilmesinde kullanlabilecek bir baflka teknikte varyans
analizi tablosu kullanmdr. Aklanan ve aklanamayan deiflim deerleri kullanlarak test ifllemi yrtlebilir. Bu tekniin en byk faydas birden fazla bamsz deiflken olmas durumuna kolaylkla genellenebilmesidir. Daha nce detaylar verilen kareler toplamlar yardmyla varyans analizi tablosu oluflturulur. Varyans
analizi tablosu bileflenleri Tablo 8.5.deki gibidir.
169
170
Tablo 8.5
Basit Dorusal
Regresyon Varyans
Analizi Tablosu
Biyoistatistik
Deiflkenlik
Kayna
Serbestlik
Derecesi
Kareler
Toplam
Kareler
Ortalamas
Regresyon
RKT = i =1( y i -y )2
RKO=RKT/1
Hata
n-2
HKT =
Toplam
n-1
GKT = i =1( y i -y )2
i=1( yi -y i )2
n
HKO=HKT/(n-2)
F statistii
F=
RKO
HKO
H0 : = 0 hipotezinin testinde Tablo 8.5.de gsterilen varyans analizi tablosundan faydalanlr. Regresyon kareler ortalamas ile hata kareler ortalamas oran 1 ve
n-2 serbestlik dereceleri ile F dalmna sahiptir. Dolaysyla Tablo 8.5.deki gibi
bir tablonun kurulduu regresyon problemlerinde belirli bir anlam dzeyi ve tabloda belirtilen serbestlik dereceleri iin F dalm kritik deerler tablosundan elde
edilecek kritik deer ile varyans analizi tablosundan hesaplanan F istatistii karfllafltrlr. Varyans analizi tablosundan hesaplanan F istatistii deeri F tablosundan
elde edilen kritik deerden daha byk ise H0 hipotezi red edilir. F dalm tablosu farkl anlam dzeyleri iin kitap sonunda yer alan eklerde verilmifltir.
Kurulan regresyon modelinin baml deiflkenin ne kadarlk bir ksmn akladn belirlemek amac ile belirlilik katsays (R 2) hesaplanabilir. Bu durumda
belirlilik katsays varyans analizi tablosu yardmyla,
i=1 ( y i -y)2
n
i=1 ( yi -y)2
n
R =
RKT
GKT
eflitliiyle hesaplanr. Toplam deiflimin aklanamayan ksm ise belirsizlik katsays olarak adlandrlr ve 1-R2 ile hesaplanr. Belirsizlik katsays yardmyla denklemde yer almayan deiflkenlerin baml deiflkenin ne kadarlk bir orann aklad gzlemlenebilir.
nn 0a eflit olup olmadnn test edilmesine ek olarak iin gven aral da
tespit edilebilir. Regresyon katsays b iin n-2 serbestlik derecesi ve sb standart
sapmas ile t dalm uyumu bilindiine gre ana ktle regresyon dorusu eimi
nn gven aral,
b-t
( , n 2 )
2
sb b + t
( , n2 )
2
sb
yardmyla hesaplanr.
RNEK 8.5
Bir iflletmede retilmekte olan 50 cm.lik tahta paralarnn krlma gleri (y) ile
tahta zerine uygulanan g (x) miktar arasndaki iliflki arafltrlmaktadr. Bu
amala seilen 10 tahta paras iin lmler alnarak regresyon modeli oluflturulmufltur. Model iin hesaplanan varyans analizi tablosu Tablo 8.6.da verilmifltir. Basit dorusal regresyon modeli anlamlln test ederek modelin aklama derecesini bulunuz. Anlamllk dzeyi olarak %5 alnz.
171
Deiflkenlik
Kayna
Serbestlik
Derecesi
Kareler
Toplam
Kareler
Ortalamas
Regresyon
4,4278
4,4278
Hata
10-2=8
0,8825
0,1103
Toplam
10-1=9
5,3103
F statistii
F=
4, 4278
= 40,14
0,1103
Tablo 8.6.
Tahta Krlma ve
G Miktar
Regresyon Denklemi
Varyans Analizi
Tablosu
i=1 ( y i -y)2
n
i=1 ( yi -y)2
n
R2 =
RKT
4, 4278
=
= 0, 8338
GKT
5, 3103
olarak bulunur. Baml deiflkende meydana gelen deiflimin %83,38i kurduumuz model yardmyla aklanabilmektedir.
Tablo 8.7.de bir basit dorusal regresyon analizi iin varyans analizi
tablosu
SIRA
SZDE verilmifltir.
Belirlilik katsaysn hesaplaynz.
Kareler D fi N E L M
F statistii
Ortalamas
Deiflkenlik
Kayna
Serbestlik
Derecesi
Kareler
Toplam
Regresyon
264,35
264,35
Hata
48
4102,30
85,46
Toplam
49
4366,65
S O R U
DKKAT
Tablo 8.7. D fi N E L M
Varyans Analizi
Tablosu
F=3,09
N N
AMALARIMIZ
Baml deiflkenin daha iyi tahmin edilmesi ya da aklanabilmesi
iin birden daha fazla bamsz deiflken tanmlanabilir. Bir baml ve birden daha fazla bamsz deiflkenin bulunduu regresyon analizi problemlerine oklu regresyon analiK T A P
zi ad verilir. Bu nite de oklu dorusal regresyon analizi detaya inilmeden genel
hatlar ile incelenecektir. Ayrntl bilgiler iin ileri regresyon analizi kitaplarna
(Myers (1986) vb.) baflvurulmaldr.
VZYON
n adet gzleme sahip bir veri setinde y baml deiflken veT EkL Eadet
bamsz deiflken olmak zere lm sonular yer alabilir. lm sonular Tablo 8.8.de
gsterildii gibi bir araya getirilebilirler.
NTERNET
SIRA SZDE
S O R U
SIRA SZDE
DKKAT
SIRA SZDE
AMALARIMIZ
K T A P
TELEVZYON
NTERNET
x2
.....
xk
y1
x11
x21
.....
xk1
y2
x12
x22
.....
xk2
.....
xkn
yn
x1n
x2n
x1
Tablo 8.8
oklu Dorusal
Regresyon Analizi
Veri Seti
Biyoistatistik
172
Veri dizininin her bir satr bir gzlem deerine karfllk gelmektedir. Eer yrtlen arafltrmada xler ile y deiflkeni arasnda dorusal bir ilfliki arafltrlyor ise
oklu dorusal regresyon modeli,
y i = 0 + 1x1i + 2x2i + ... + kxki + i
(i = 1,2,...,n; n k + 1)
y=
y1
y2
M
yn
X=
1 x11
1 x12
M M
1 x1n
M
M
M
x2 n L xkn
x21 L xk1
x22 L xk 2
M
k
M
n
Serbestlik
Derecesi
Kareler
Toplam
Kareler
Ortalamas
Regresyon
4.684,7
936,9
Hata
34
20.989,4
617,3
Toplam
39
25.674,1
F
statistii
F=1,52
ncelikle modelin anlamllk testi iin hesaplanan F deerinin 5 ve 34 serbestlik dereceleri iin F tablosundan tespit edilen teorik kritik deer ile karfllafltrlmas gerekmektedir. Anlamllk dzeyi %5 olarak alnrsa istenen teorik kritik deer
tablodan 2,45 olarak tespit edilir. Varyans analizi tablosunda hesaplanan F deeri
1,52 tablodan tespit edilen kritik deer 2,45den kk olduu iin modelin anlaml olmad sylenir. Dolaysyla insanbilimcilerin modelde yer alan deiflkenlerden
hangilerinin anlaml hangilerinin anlamsz olduunu test etmeleri ve modellerini
tekrar tahmin etmelidirler. Verilen varyans analizi tablosu yardmyla model belirlilik katsays da (4684,7 / 25674,1) =0,18 olarak bulunur. Grld gibi bu model yardmyla sistolik kan basncndaki toplam deiflkenliin ancak %18i modelde yer alan deiflkenler ile aklanabilmektedir. Ssitolik kan basncndaki deiflkenliin aklanamayan oran 1-0,18=0,82 olduu iin modelde yer almas beklenen baflka deiflkenler olabilecei sylenir.
173
RNEK 8.6
Tablo 8.9
Peru Gmenleri
Sistolik Kan Basnc
in Regresyon
Modeli Varyans
Analizi Tablosu
174
Biyoistatistik
zet
N
A M A
N
A M A
N
A M A
175
Kendimizi Snayalm
1. Bir arafltrma da ilgilenilen deiflkenlerden birinin
deeri artarken dierinin de deeri artmaktadr. Bu alflma da korelasyon katsays hesaplanrsa sonu afladaki seeneklerden hangisi olabilir?
a. -1
b. -0,9
c. -0,5
d. 0
e. 0,9
2. Afladaki grafiklerden hangisinde korelasyon katsays -1e eflittir?
10
8
a.
6
4
0
0
10
10
8
6
b.
4
2
0
0
10
70
60
50
c.
40
30
20
20
40
60
80
100
120
140
50
60
70
70
60
d.
50
40
30
20
10
20
30
40
58.0
57.5
57.0
e.
56.5
56.0
55.5
55.0
85
90
95
100
105
176
Biyoistatistik
47
47
Hata
209
26,125
Toplam
256
Bu
a.
b.
c.
d.
e.
F=1,799
75
75
Hata
10
125
12,50
Toplam
11
200
Bu
a.
b.
c.
d.
e.
F=6
Yaflamn inden
Darpito (1999) evresel temizliin insanlar ve evre arasndaki karmaflk etkileflimlerin sonucu olarak ortaya karak insan saln etkilediini belirtmektedir. alflmasnda Endonezya rneini ele alarak fakirlik ile evre temizlii arasndaki korelasyonu, hijyene bakfl as
ile evre temizlii arasndaki iliflki ve son olarak insanlarn bulunduklar corafya ile evre temizlii arasndaki iliflki arafltrlmfltr. alflma btn olarak korelasyon
alflmas olarak ele alnmfltr. Veri toplama sahada yaplmfl ve bir ok veri gzleme dayal olarak elde edilmifltir. Fakirlik ve evresel temizlik arasndaki iliflki basit dorusal regresyon yardmyla modellenmifl ve -0,83
korelasyon deeri hesaplanmfltr. Hijyene bakfl as
ve evre temizlii arasndaki iliflki iinde basit dorusal
regresyon modeli kurulmufl, korelasyon deeri 0,38 olarak hesaplanmfltr. Her iki modelinde istatistiksel anlamll %5 anlam dzeyi kullanlarak test edilerek modeller istatistiksel olarak %95 gvenle anlamldr kararna varlmfltr. alflma elde edilen bu sonularn Endonezya iin anlamnn deerlendirilmesi ve sorunlarn
zmnde paydafllara dflen ifllemler iin neriler ile
sonlandrlmfltr.
Kaynak: Darpito, H. (1997). Sanitation, hygienic attitude and poverty, 23rd WEDC Conference, Water
and Sanitation for All: Partnerships and Innovations,
Durban, South Africa.
2. b
3. b
4. a
5. e
6. b
7. a
8. c
9. c
10. b
177
Yararlanlan Kaynaklar
Sra Sizde 1
ncelikle deiflkenlerin ortalama ve standart sapmalar
hesaplanr. Bu hesaplamalar yaplmadan nce nite
3n tekrar edilmesi faydal olacaktr. lgilenilen deiflkenlerin ortalama ve standart sapmalar,
x1 =36, 00
x 2 = 40, 50
s1 =11, 25 s 2 =9, 56
20
40
40
30
45
25
( y i -y ) ( x i -x )( y i -y )
-16
-0,50
65
24,50
98
45
-6
4,50
-27
40
-0,50
-4,50
35
-11
-5,50
60,50
50
40
14
-0,50
-7
45
40
-0,50
-4,5
25
30
-11
-10,50
115,50
30
35
-6
-5,50
33
10
50
35
14
-5,50
-77
Toplam
360
405
195
Korelasyon katsays,
i=1( x i -x )( yi -y)
n
r=
( n-1)s x s y
195
= 0, 201
9(11, 25)(9, 56)
olarak hesaplanr.
Sra Sizde 2
Problem de verilen varyans analizi afladaki tabloda
grlmektedir.
Deiflkenlik Serbestlik Kareler
Kareler
F
Kayna
Derecesi Toplam Ortalamas statistii
Regresyon
264,35
264,35
Hata
48
4.102,30
85,46
Toplam
49
4.366,65
F=3,09
BYOSTATSTK
9
Amalarmz
N
N
N
N
Anahtar Kavramlar
Binom Testi
flaret Testi
Mann-Whitney U Testi
Kruskall-Wallis H Testi
McNemar Testi
erik Haritas
Biyoistatistik
Parametrik
Olmayan statistik
PARAMETRK OLMAYAN
STATSTK
Y UYUM TESTLER
BNOM TEST
fiARET TEST
MANN-WHITNEY U TEST
KRUSKALL-WALLIS H TEST
MCNEMAR TEST
Parametrik Olmayan
statistik
PARAMETRK OLMAYAN STATSTK
Parametrik olmayan istatistiksel teknikler, dalma bal olmayan teknikler olarak
da adlandrlr. Bir ok istatistik tekniinde ilgilenilen deiflkenin Normal dalma
sahip olduu varsaylarak ifllem yrtlr. Ancak parametrik olmayan tekniklerde
Normal dalm varsaym zerinde durulmaz. Parametrik olmayan istatistiksel teknikler, parametrik istatistiksel tekniklere gre daha az varsayma dayanarak veri
analizi yaplmasna olanak tanr. Hem kategorik hem de sralayc lek ile lmlenmifl deiflkenlerin analizinde kolaylkla uygulanabilen ve yorumlanabilen teknikler grubu, parametrik olmayan teknikleri oluflturmaktadr.
yi Uyum Testleri
Arafltrmalarda gzlemlenen sonularn daha nceden zellikleri bilinen bir olaslk dalmna olan uyumunu tespit etmek amac ile iyi uyum testleri yrtlr. Baz durumlarda ise elde edilen iki rassal rneklemlerin dalmlarnn ayn olup olmad da test edilebilir.
2 ( m1s.d ) =
180
Biyoistatistik
RNEK 9.1
Bir yumurta reticisi yl boyunca her ay satfln yaptklar yumurta paleti saysnn eflit olduunu dflnmektedir. Her yumurta paletinde ilerinde altflar yumurta bulunan 50 kutu bulunmaktadr. zleyen tabloda aylara gre satlan yumurta
paleti says verilmifltir.
Tablo 9.1
Aylara Gre Satlan Yumurta Paleti Says
Ocak fiubat Mart Nisan Mays Haziran Temmuz Austos Eyll Ekim Kasm Aralk Toplam
Beklenen
Satfl
Gzlemlenen
Satfl
115
115
115
115
115
115
115
115
115
115
115
115
1.380
110
120
80
90
105
95
120
150
120
125
145
120
1.380
Gerekleflen satfllarn aylara gre dalm birbiri ile ayn mdr? %5 anlam dzeyine gre test ediniz.
ncelikle hipotezler kurulur.
H0: Aylara gre dalm frekanslar eflittir.
H1: Aylara gre dalm frekanslar eflit deildir.
Bu problemde anlam dzeyi =0,05 olarak verilmifltir. 12 adet ay bulunduundan kategori says m= 12dir. Serbestlik derecesi m-1= 12-1= 11 olur. Ki-kare kritik deerler tablosu yardmyla test iin kullanlacak kritik deer 11 serbestlik derecesi ve =0,05 anlamllk dzeyine gre 19,675 olarak tespit edilir. fiimdi rnein 2 istatistiini hesaplayarak bu kritik deer ile karfllafltralm.
2 =
2= 40,8967
Hesaplanan 40,8967 deeri, ki-kare kritik deerler tablosundan elde edilen
19,675 deerinden daha byk olduu iin Aylara gre eflit sayda yumurta satlmaktadr. sfr hipotezi red edilir. Aylara gre eflit sayda yumurta paleti satlmamaktadr. alternatif hipotezi kabul edilir.
181
Smirnov testi teorik ve gzlemlenen kmlatif frekans dalmlarnn karfllafltrlmasn ifllemini iermektedir. Bu karfllafltrmay yapmak iin veri en kkten en bye sralanabilecek flekilde snflar (kategoriler) dzenlenir. Teorik dalmn kmlatif oransal frekanslar Fi, rneklemden elde edilen sonularn teorik dalma
karfllk gelenleri de Si ile gsterilirse; Kolmogorov-Smirnov testi iin Fi ile Si arasndaki mutlak farklardan en byne baklacaktr. Eer bu fark deerini D ile gsterirsek, (Enb= En byk olmak zere), Kolmogorov-Smirnov D istatistii
Kolmogorov-Smirnov Testi:
lgilenilen deiflkenin en az
sralayc lek ile
lmlendii problemlerde
uyum iin uygulanr.
D= Enbi Fi Si
eflitlii yardmyla hesaplanr. Dnin byk deerleri iin dalmlarn ayn olduu
sfr hipotezi red edilir. Red karar verilmesi iin gerekli Kolmogorov-Smirnov D
kritik deerleri tablosu farkl olaslk deerleri iin dzenlenerek nite sonunda
verilmifltir. Kolmogorov-Smirnov testi iki rneklem kmlatif oransal frekans dalmlarnn karfllafltrlmasnda da kullanlabilir. Bu kullanm trnde teorik dalmdan elde edilmesi gereken deerlerin yerini rneklemlerden bir tanesinin deerleri alacaktr.
RNEK9.2
Bir arafltrmac ilgilendii deiflkenin teorik dalmnn istatistiksel olaslk dalmlarndan olan Poisson dalmna 7,60 ortalama ile uyduunu dflnmektedir. Arafltrmacnn veri kmesinde 14 kategoride toplam 3.366 deer bulunmaktadr. Bu deerler srasyla 5, 14, 24, 57, 111, 197, 278, 378, 418, 461, 433, 413,
358, 219 olarak verilmifltir. Poisson dalmna uyumu %5 anlam dzeyinde
arafltrnz?
ncelikle Poisson dalm olaslk younluk fonksiyonu, ortalama olmak zere,
f (x) =
e x
x!
fleklinde yazlabilir. Veri setinde toplam 3.366 adet gzlem bulunmaktadr. Si deerleri, herhangi bir kmlatif frekansn toplam frekansa blnmesi ile bulunacaktr.
Benzer flekilde herhangi bir xi deeri iin kmlatif oransal frekans, Poisson olaslk younluk fonksiyonu yardmyla hesaplanabilir. rnein xi = 4 iin bu deer
F( 4) =
e7 ,60 4
= 0,125
4!
10
11
12
13
14
Gzlem
14
24
57
111
197
278
378
418
461
433
413
358
219
Kmlatif
xi
19
43
100
211
408
686
S(xi)
0,001 0,005 0,012 0,029 0,062 0,121 0,204 0,316 0,440 0,577 0,705 0,828 0,935
F(xi)
0,004 0,009 0,055 0,125 0,231 0,365 0,510 0,648 0,765 0,854 0,915 0,954 0,976 0,989
0,003 0,014 0,043 0,096 0,169 0,244 0,306 0,332 0,325 0,277 0,210 0,126 0,041 0,011
1,0
182
Biyoistatistik
1, 36
Afladaki tabloda
bir lokantann gnlk mflteri saylar son bir ay iin haftann gnleriSIRA SZDE
ne gre dzenlenmifltir. Bu lokantaya gelen mflterilerin dalm dzgn dalma uygun
mudur? Gerekirse anlam dzeyini %5 alnz.
D fi N E L M
D fi N E L M
Tablo 9.3.
Haftann Gnlerine
S O Mflteri
R U
Gre
Dalm
Pazartesi
Gzlemlenen
Satfl
Sal
Toplam
S O R U
165
170
160
165
163
145
138
1.106
DKKAT
DKKAT
BNOM TEST
SIRA SZDE
AMALARIMIZ
K T A P
TELEVZYON
NTERNET
N N
SIRA SZDE
Belirli bir zellii
taflyan/taflmayan birimlerin belirlenmesi ve saysnn belirlenmesi gereken durumlarda kulanlr. rnein retim hattndan alnan bir rn iyi ya
da kt olarak snflanabilir, insanlar hasta veya salkl olarak snflanabilir. BunAMALARIMIZ
lara benzer flekilde sonular iki kategoride toplanan deiflkenler ile alfllrken Binom dalmndan faydalanlr. Arafltrmada ilgilenilen deiflkende ortaya kan bu
ikili sonular,
sayma yoluyla belirlenerek edilerek, oranlar fleklinde ifade edilirler.
K T A P
Deiflkenin alabilecei en fazla iki adet sonu olduu iin bu oranlarn toplam 1e
eflit olur. Arafltrmada deiflkenin ilgilenilen sonucunun ortaya kma olasl p, dier sonucun ortaya kma olasl ise q (q= 1 - p) ile ifade edilir. n adet lm soTELEVZYON
nucunda x adet istenen durum ortaya kmas olasln hesaplayabilmek iin, Binom dalmnn olaslk fonksiyonu kullanlr. Buna gre, bir X rassal deiflkeni
Binom dalmna sahip ise, bu deiflken iin olaslk fonksiyonu;
NTERNET
183
n 25 in Binom Testi
Arafltrmada elde edilen rneklem bykl 25 ya da daha az gzlemden olufluyor ise ve ilgilenilen deiflken sonucu olasl 0,50 ise nite sonunda yer alan binom dalm tablosu yardmyla olaylarn ortaya kfl olaslklar hesaplanabilir.
Eer bir arafltrmada 12 gzlem var ve ilgilenilen deiflken sonucundan 4 veya daha az gzlenme olaslnn bulunmas isteniyor ise xin 0,1,2,3,4 iin ald deerler Binom olaslk fonksiyonu yardmyla hesaplanarak toplanacaktr. Bu zaman
alc bir ifllemdir. Bu hesaplamalarn yerine n 25 olduu durumlar iin olaslk deerleri hesaplanarak nite sonunda yer alan Binom dalm tablosunda sunulmaktadr. Tablodaki olaslklar yardmyla hipotez testi yaplabilir. lgilenilen deiflken
zerinde herhangi bir faktrn etkisinin olup olmad hipotez testi Binom dalm yardmyla yaplabilir. Arafltrma probleminden elde edilen olaslk deeri arafltrmac tarafndan belirlenen anlam dzeyi () ile karfllafltrlr. Anlam dzeyi
problem iin hesaplanan olaslktan kk ise ilgilenilen faktrn etkisinin olmad, anlam dzeyi problem iin belirlenen olasla eflit veya daha byk ise ilgilenilen faktrn etkili olduu kararna varlr.
Bir ikolata fabrikas yeni retmeye bafllad ikolata paketlerinin rengini belirlemek istemektedir. Bu amala bir ilkretim okulundan 15 renci rassal olarak
belirlenmifltir. Yneticiler rencilerin krmz renkli paketleri tercih edeceini dflnmektedir. Krmz ve mavi renkli iki paket hazrlatlarak rencilere gsterilmifltir. rencilerden 9 tanesi krmz renkli paketi seerken 6 tanesi mavi paketi
semifltir. Buna gre mavi renkli paket seimi oran krmz renkli paket seimi
oranndan kk mdr? %5 anlam dzeyinde istatistiksel karar veriniz.
Bu problemde mavi ve krmz renkli paketler olmak zere 2 sonu bulunduundan Binom testi ile aranan sonu arafltrlr. zm iin hipotez testi izleyen
admlarla yrtlr.
Adm 1. Hipotezlerin ifade edilmesi:
H0: Paket rengi rencilerin tercihini etkilememektedir.
H1: Mavi renkli paket seim oran (p) krmz renkli paket seim oranndan (q)
kktr. Aradaki fark rencilerin renk tercihi ile aklanabilir.
Adm 2. statistiksel test: Arafltrmadaki veriler sayma yolu ile elde edilmifl ve iki
grupta toplanmfltr. Binom dalmna uygun dalm gstermektedir.
Adm 3. Anlamllk dzeyi: Anlamllk dzeyi =0.05 olarak verilmifltir, ayrca
n=15 olarak belirlenmifltir.
Adm 4. rnekleme dalm: Her ne kadar olaslk deerleri Binom dalm
fonksiyonu yardmyla hesaplanabilirse de burada Binom dalm tablosu kullanlarak hesaplanacaktr.
Adm 5. Red blgesi: Bu problemde tek tarafl bir red blgesi sz konusudur.
Adm 6. fllem ve karar. Binom dalm tablosunda rneklemde yer alan birim
says olan n=15 ile mavi renkli paket says olan x=6 deerlerinin kesiflim noktasnda yer alan deer, ilgilenilen olaslk deeridir. Tablo yardmyla bu deer
p=0,3036 olarak bulunur.
Tablo deeri p=0,3036 > =0.05 olduundan H0 hipotezi kabul edilir. Bunun
iflletme iin anlam, paket renginin rencilerin seimi zerinde bir etkisinin olmaddr. Bu kararn (=0.05 olduundan) %95 gven ile verildii sylenir.
RNEK 9.3
184
Biyoistatistik
z=
( x 0, 50) np
npq
RNEK 9.4
rnek 9.3.de rneklemde yer alan renci saysnn 110 renciye karld varsaylsn. Bu rencilerden 51 tanesi mavi paketi geriye kalan 59 tanesi de krmz
paketi seerse mavi renkli paket seimi oran krmz renkli paket seimi oranndan kk mdr? %5 anlam dzeyinde istatistiksel karar veriniz.
Adm 1. Hipotezlerin ifade edilmesi:
H0: Paket rengi rencilerin tercihini etkilememektedir.
H1: Mavi renkli paket seim oran (p) krmz renkli paket seim oranndan (q)
kktr. Aradaki fark rencilerin renk tercihi ile aklanabilir.
Adm 2. statistiksel test:
Arafltrmadaki veriler sayma yolu ile elde edilmifl ve iki grupta toplanmfltr. Binom dalmna uygun dalm gstermektedir. Ancak birim says 25den byktr. Dolaysyla Normal dalm yaklaflm kullanlr.
Adm 3. Anlamllk dzeyi:
Anlamllk dzeyi =0.05 olarak verilmifltir, ayrca n=110 olarak belirlenmifltir.
185
51, 50 55
= 0, 67
5,, 244
olarak hesaplanr. Daha sonra bu z deerine karfllk gelen olaslk deeri Normal
dalm tablosundan elde edilir. Normal dalm tablosuna gre znin -0,67 ya da
daha dflk bir deer alma olasl, 0,50-0,2486=0,2514 olur. Hesaplanan bu olaslk deeri anlamllk dzeyi %5den daha byk olduu iin paket renginin rencilerin tercihini etkilemediini belirten H0 hipotezi kabul edilir.
fiARET TEST
flaret Testi ilgilenilen deiflkenin dalmnn medyan deerinin belirli bir deere
eflit olup olmadnn testinde kullanlr. flaret testi;
Tek rneklem t testi yerine,
Efllenmifl t testi yerine,
Saysal bir leklemenin mmkn olmad ancak gzlemlerin bir flekilde
sralanabildii kategorik verilerde kullanlabilir.
n birimlik bir rneklemin gzlem deerleri x1,x2,.......xn olsun. Oluflturulacak
sfr hipotezi, ana ktle medyan deerinin M gibi bir deere eflit olmasdr. Bu veri setinde M medyan deerinden byk m+ adet gzlem deeri ve M medyan deerinden kk m- adet gzlem deeri olduu varsaylsn. Gzlem deerlerinden
ana ktle medyan deerine eflit olanlar bu hesaplamalarn dflnda tutulurlar. Dolaysyla m++m- toplamnn sonucu rneklemde bulunan birim says olan nden
kk olabilir, bu toplam deeri n* gibi bir baflka simge ile gsterilebilir. Sfr hipotezine gre gzlem deerlerinin yarsnn medyandan daha fazla dier yarsnndan medyandan daha dflk deer almasn beklenir. Bu nedenle sfr hipotezine
gre m+ ve m-nin her ikisi de p= 0,50 ve n=n* parametreleri ile Binom dalmna
sahip olacaktr. flaret testi iin afladaki admlara gre test ifllemi yrtlr.
1. Ana ktle medyan deeri belirlenir.
2. Ana ktle medyan deerinden daha az (m-) ve daha fazla (m+) birim saylar belirlenir (eer veri kkten bye sral deil ise bu aflamada sralanmas hesaplama kolayl salayabilir).
3. Alternatif hipotezin ynne gre test istatistii belirlenir.
Eer alternatif hipotez ana ktle medyan sfr hipotezinde verilen deere
eflit deildir fleklinde iki ynl olarak tanmlandysa test istatistii iin m- ve
m+ deerlerinden kk olan;
Eer alternatif hipotez ana ktle medyan sfr hipotezinde verilen deerden
kktr olarak tanmlandysa test istatistii olarak m+;
186
Biyoistatistik
Eer alternatif hipotez ana ktle medyan sfr hipotezinde verilen deerden
byktr olarak tanmlandysa test istatistii olarak m- deeri seilir.
4. Admda belirlenen test istatistii deeri nite sonunda verilen iflaret testi kritik deerleri tablosundan arafltrmadaki anlam dzeyine gre belirlenen deerden
kk ise sfr hipotezi red edilir.
flaret testi iki dalmn medyanlar arasndaki farkn istatistiksel olarak anlaml
bir fark olup olmadnn belirlenmesinde de kullanlr. Bu tr problemlerde iki rneklemde yer alan birimler her biri bir ana ktleden ekilecek flekilde iftler halinde elde edilir. Her gzlem ifti ayn koflullar altnda elde edilmelidir, ancak farkl iftlerin ayn koflullarda elde edilmesi zorunluluu yoktur. ki gzlem arasndaki farkn
+ ya da - olaca konusunda bir fikir elde edilebiliyor ise gzlem birimi iin gerek
bir lm deerine de gerek kalmayabilir. ncelikle gzlem iftleri arasndaki farklarn iflaretleri belirlenir. lgilenilen test istatistii en az ortaya kan iflaret tipinin saysdr. Eer bu deer nite sonunda verilen iflaret testi kritik deerinden kk ise
iki anaktle medyan deeri eflittir olarak tanmlanan sfr hipotezi red edilir.
RNEK 9.5
Bir iflletmede gnlk retilen hatal rn says medyan deeri 7 olarak bilinmektedir. flletme kalite kontrol flefi son 15 gn ierisinde hatal rn saysn belirlemifltir. Son 15 gn ierisinde hatal rn saylar (4, 5, 1, 10, 5, 6, 12, 9, 8, 10, 11,
11, 2, 2, 3) olarak gerekleflmifltir. Sistemin hatal rn medyan deerinde bir deiflim meydana gelmifl midir? %5 anlam dzeyinde istatistiksel karar veriniz.
Problemde ana ktle medyan deeri olarak 7 verilmifltir. Son 15 gnlk kaytlara gre medyandan az m-= 8, medyandan fazla m+= 7 gzlem deeri bulunmaktadr. n* Deeri 15 ve ift ynl bir hipotez sz konusudur. Hipotezler,
H0: M = 7 (Gnlk retilen hatal rn says medyan deeri 7ye eflittir.)
H1: M 7 (Gnlk retilen hatal rn says medyan deeri 7den farkldr.)
olarak yazlr. nite sonunda yer alan iflaret testi ksritik deerleri tablosunda iki
ynl test ve %5 anlam dzeyi iin rneklem bykl 15e gre kritik deer 9
olarak elde edilir. Bu kritik deeri m- ve m+ deerlerinden kk olannn deeri
olan 7 den byk olduu iin sfr hipotezi kabul edilir.
SIRA SZDE
D fi N E L M
D fi N E L M
Tablo 9.4.
Bamsz
S O R U ki
rneklem in
Gzlem Deerleri
DKKAT
SIRA SZDE
NTERNET
rneklem 1
rneklem 2
10
10,40
11,15
10,44
11,25
12,44
13,10
11,12
10,78
11,45
11,45
10,48
11,25
10,21
11,55
10,50
12,78
11,89
11,02
11,99
12,05
S O R U
DKKAT
MANN-WHITNEY
U TEST
SIRA SZDE
N N
TELEVZYON
Afladaki tabloda
bir arafltrma sonucu iki ayr ana ktleden elde edilen birbirinden baSIRA SZDE
msz iki rneklemin gzlem deerleri verilmifltir. Bu iki rneklemin belirlendikleri ana
ktlelerin medyanlarnn eflit olduu hipotezini %5 anlam dzeyinde snaynz.
NTERNET
187
rin tek bir rneklem olarak ele alnarak birimlerin kkten bye sralanmas ifllemidir. Eer iki rneklem ayn ana ktleden gelmiyor ise rneklemlerden elde
edilen birimler bu yeni veri setinin bir blgesinde toparlanacaktr (rnein bir grup
st uta yer alrken dier grup alt uta yer alacaktr). U istatistii hesaplamas iin
bir rneklemden elde edilen deerlerin dier rneklemden elde edilen deerden
ka kez daha az deer aldnn saylmas gerekir. Eer sayma sonucu, sfr hipotezinde belirtilen deerden ok daha dflk veya ok daha byk ise bu rneklemlerin farkl ana ktlelerden geldikleri istatistiksel karar verilecektir.
rnein, bir iflletmede yeni oluflturulan yemek tarifi ierisinde iki farkl gizli
materyal kullanlmfltr. Bu materyallerin yemein lezzetini farkllafltrd dflnlmektedir. A ve B yemek uzmanlarndan oluflan iki farkl grup bu yemekleri tatmfl
ve yemein lezzeti iin 100 zerinden bir deerlendirme yapmfltr. Tablo 9.5.de
sonular verilmifltir.
1
10
11
12
Grup A
55
59
61
64
64
70
73
75
76
82
83
95
Grup B
65
77
80
80
84
86
88
91
91
93
Tablo 9.5.
Gizli Yemek Bilefleni
Lezzet Deerleri
U istatistiini hesaplayabilmek iin A grubunda yer alan bir gzlemin B grubundaki bir gzlemden ka kez daha az deer aldn tespit etmek gerekir. Bu sayma
sonucunu TA olarak adlandralm. Bu ifllemi gereklefltirebilmek iin iki rneklem
tek rneklem gibi bir tabloda birlefltirilerek her gzlemin altna ait olduklar grup ve
sra numaras deerleri yazlr. lgili deerler Tablo 9.6.da oluflturulmufltur.
Sra No
10
11
Lezzet puan
55
59
61
64
64
65
70
73
75
76
77
Grup
Sra No
12
13
14
15
16
17
18
19
20
21
22
Lezzet puan
80
80
82
83
84
86
88
91
91
93
95
Grup
Tablo 9.6.
Mann-Whitney U
Testi in Veri
Sralamas
188
Biyoistatistik
yyecektir. Unun deeri yanlzca iki grupta yer alan puanlarn srasna bal olacandan Unun farkl deerleri iin olaslklar belirlenebilir. nite sonunda kk
rneklemler iin hazrlanmfl Mann-Whitney U testi iin kritik deer tablolar bulunmaktadr. Bu aflamaya kadar ele aldmz rnek olayda Mann-Whitney U istatistii deeri (98,22) ikilisinden kk olan 22ye eflittir. Birinci grupta 12 ve ikinci
grupta 10 birim iin %5 anlam dzeyine gre kritik U deeri 29a eflittir. Hesaplanan 22 deeri kritik deer olan 29 deerinden daha kk olduu iin sfr hipotezi red edilir. ki grubun verdii puanlar arasnda fark vardr alternatif hipotezi kabul edilir.
Bu aflamaya kadar ele alnan ifllemlerde dikkat edilirse rneklemlerde yer alan
birim saylar kk deerlerdir. rneklemler de yer alan birim says arttnda ifllemlerde zorluklar ortaya kmaktadr. Bu zorluklarla bafla kabilmek iin tm (nA
+ nB) gzlemlerinin birlefltirilmifl sra numaralar ile ifllemler yrtlebilir. Eer rA,
A grubunun sra deerleri toplam ve rB de B grubunun sra deerleri toplam ise,
TA = n A n B +
ve
n A ( n A + 1)
2
rA ,
TB = n A n B TA
(12) (13)
100 = 98
2
TB = (12) (10) 98 = 22
TA = (12) (10) +
ve
n n
E U = A B
2
n n
E U = A B
2
eflitlikleri ile hesaplanr. Hesaplanan z istatistii Normal eri altnda kalan alan tablosu yardmyla bulunan kritik deer ile karfllafltrlarak karar verilir.
Genetik olarak zerinde deneyler yrtlen bir bitkinin yaprak byklkleri gnefl fl altnda ve glgede byyen bitkiler kullanlarak llmfltr. Gnefl fl altnda ya da glgede byme arasnda bir fark olup olmadn %5 anlam dzeyinde test ediniz.
5,70
5,00
5,05
5,40
4,90
4,95
Glge (G)
5,25
4,85
4,80
5,20
5,35
4,70
RNEK 9.6
Tablo 9.7.
Gneflte ve Glgede
Bitki Yaprann
Bykl
189
lm sonularnn ana ktle bilgisi bulunmamaktadr ve rneklem byklmzde kktr. Dolaysyla bu problemde Mann-Whitney U testini kullanlmas mmkndr. ncelikle veriyi tek bir tabloda toplayarak sra numaralarn
oluflturalm.
Sralama
10
11
12
Yaprak Genifllii (cm) 4,70 4,80 4,85 4,90 4,95 5,00 5,05 5,20 5,25 5,35 5,40 5,70
U Test Sra No
10
11
12
Grup
GI
GI
GI
GI
GI
GI
Tablo 9.8.
Bitkinin Yaprak
Byklklerinin Sra
Nolar
fiimdi sra says toplamlarn hesaplayalm. Gnefl fl deerlerine gre ifllemleri yrtebiliriz. Tablo 9.8. yardmyla,
rGI = 4 + 5 + 6 + 7 + 11 + 12 = 45
ve
TGI = nGI nG +
nGI ( nGI + 1)
2
6( 6 + 1)
45 = 12
2
TG = (6) (6) 12 = 24
olarak hesaplanr. Mann-Whitney U testi kritik deerler tablosundan %5 anlam dzeyine gre hesaplanan kritik deer 5e eflittir. Hesaplanan (12,24) ikilisinden kk olan 12 deeri kritik deer olan 5ten daha byktr. Dolaysyla sfr hipotezi kabul edilir. Yaprak boylarnda bitkinin bulunduu ortamdaki flk durumunun
bir etkisi bulunmamaktadr.
KRUSKALL-WALLIS H TEST
Kruskall-Wallis H Testi sklkla parametrik tek ynl varyans analizinin parametrik olmayan teknikler arasndaki karfll olarak grlr. Her iki teknikte de bir ka
grup arasndaki farkllklarn karfllafltrlmas sz konusudur. Parametrik tek ynl
varyans analizi alflmalarnda lmlenen deiflkenin en az aralkl lek ile lmlenmifl olmas istenir. Bu varsaymn salanmad durumlarda Kruskall-Wallis
H testi kullanlabilir. Ayrca parametrik varyans analizinin normallik ve varyanslarn eflit olmas varsaymlarnn karfllanamad durumlarda da uygulanr. Arafltrmann yrtlmesi iin sfr hipotezi rneklemlerin ayn ana ktleden geldiini belirtirken, alternatif hipotez rneklemlerin farkl ana ktlelerden elde edildiini ifade etmektedir.
Kruskall-Wallis H Testi:
Parametrik tek ynl
varyans analizinin
parametrik olmayan
teknikler arasndaki karfll
olarak grlr.
190
Biyoistatistik
H testinin yrtlebilmesi iin ncelikle farkl gruplar iin elde edilen rneklem sonular tek rneklem gibi ele alnarak kkten bye sralanr. Bu sralama srasnda gzlem deerleri birbirine eflit olan birimlerin sra numaralarnn aritmetik ortalamas kullanlr. rnein ilgilenilen veri setinde 8, 9 ve 10uncu srada
yer alan birimlerin hepsinin deeri 5 ise sra numaras olarak bu deere sra numaralarnn ortalamas olan 9 verilir ((8+9+10)/3). kinci aflamada her grup iin ayr ayr sra numaralar toplamlar belirlenir.
k tane grubun olduu bir problemde Rj (j=1,...,k) jinci grubun/rneklemin sra
numaras toplam, nj (j=1,...,k) jinci grubun/rneklemin birim says ve Nde arafltrmada yer alan toplam birim says ise H istatistii,
k R2
12
j
3 ( N + 1)
H =
N ( N + 1) n j
j=1
RNEK 9.7
Tablo 9.9.
Gurmelere Gre
Deerlendirme
Puanlar
Bir biskvi reticisi yeni bir biskviyi pazara srmek istemektedir. Biskvinin 3
farkl tarife gre hazrlanmas sz konusudur. Hangi tarife gre retilen biskvinin pazara sunulacann belirlenmesi istenmektedir. Fabrika ynetimi ncelikle
farkl tariflere gre retilen biskvilerin mflteride farkl alglara yol ap amayacan tespit etmek amac ile gurmelerden oluflan 3 farkl grup oluflturmufl ve kendilerine sunulan biskvileri genel zellikleri (koku, tad, yumuflaklk, vb..) ile deerlendirerek 0 ile 100 arasnda puanlamalar istenmifltir. Sonular Tablo 9.9.da
verilmifltir. Farkl tariflere gre retilen biskviler gurmelere gre birbirinden farkl mdr? %5 anlam dzeyinde istatistiksel karar veriniz.
Puanlar
Gurme Grubu A
80
85
85
95
Gurme Grubu B
90
85
95
90
Gurme Grubu C
95
90
90
ncelikle veriyi kkten bye doru sralayalm. Sralanmfl yeni veri iin
sra numaralarn belirleyelim. Sra numaras verirken ayn deere sahip birimler
iin sra numaralar ortalama deerinin kullanlaca unutulmamaldr. Sonular
Tablo 9.10.da verilmifltir.
Tablo 9.10.
Dzenlenmifl
Deerlendirme
Puanlar
Sralama
10
11
Puan
80
85
85
85
90
90
90
90
95
95
95
H Test
Sra No
6,50
6,50
6,50
6,50
10
10
10
Grup
191
fiimdi sras ile her grup iin sra says toplamlarn belirleyelim.
RA = 1 + 3 + 3 + 10 =17
RB = 3 + 6,50 + 6,50 + 10 = 26
RC = 6,50 + 6,50 + 10 = 23
Bu bilgiler sonucunda H istatistii afladaki gibi hesaplanabilir.
2
k R2
12
12
262 232
j
17
(
)
+
+
H =
N
+
=
3
1
3(11+ 1) = 1, 958
(
)
(
+
)
N
N
+
n
1
11
11
1
4
4
3
j
1
j
=
McNEMAR TEST
Baz durumlarda zerinde alfllan sistem zerinde deifliklikler gereklefltirilebilir. Birimlerin deiflim ncesi ve sonrasnda nasl etkilendiklerini gstermek amac
ile McNemar testi uygulanr. nce (+) olguya sahip iken sonra (-) olguya sahip
olan birimlerin ya da bunun tersinde meydana gelen deiflimin istatistiksel olarak
anlaml bir farkllk olup olmadn gstermek amac ile bu test kullanlr. Test iin
derlenen veriler 2x2lik kontenjans tablolarnda sunulur. Arafltrmada yer alan 2
adet deiflken vardr ve bu deiflkenler snflayc lee gre lmlenirler. Eer
X, snflayc lee gre iki sonucu olan bir deiflken ise Y deiflkeni X deiflkenin sistemde herhangi bir deifliklik yapldktan sonra ya da bir deney yrtldkten sonraki durumunu temsil eder. Tablo 9.11.de McNemar testi iin oluflturulacak
kontenjans tablosu bileflenleri sunulmaktadr.
Y deiflkeni Snflar
X Deiflkeni
Snflar
Yi = 0
Yi = 1
Xi = 0
a
(Xi = 0 ve Yi = 0 ikili says)
b
(Xi = 0 ve Yi =1 ikili says)
Xi=1
c
(Xi=1 ve Yi = 0 ikili says)
d
(Xi = 1 ve Yi = 1 ikili says)
Tablo 9.11.
Mcnemar Testi in
2x2 lik Kontenjans
Kablosu Bileflenleri
192
Biyoistatistik
bestlik derecesi ile Ki-Kare dalm olacaktr. T2nin dalm ise p = 0,50 ve
n= b + c olacak flekilde Binom dalmdr. Test yrtlrken sistemde meydana
gelen deiflimin etkili olmad sfr hipotezi oluflturulur. Alternatif hipotez ise ortaya kan deiflimin etkili olduu fleklinde ift ynl olarak kurulur. Eer n= b +
c 20 ise binom dalm tablosu yardmyla hesaplamalar yrtlr. Binom dalm tablosundan elde edilen deer ile T2 deeri karfllafltrlr. Eer T2 deeri tablodan elde edilen deerden byk ise deiflikliin fark yaratmad sfr hipotezi
red edilir. n= b + c > 20 ise Ki-Kare dalm kritik deerler tablosu kullanlr. Bu
durumda hesaplanan T1 deeri Ki-Kare dalm iin 1 serbestlik derecesine gre
arafltrmada istenen anlamllk dzeyine gre ki-kare kritik deerler tablosundan
elde edilen kritik deerle karfllafltrlr. Eer T1 deeri kritik deerden byk ise
deiflikliin fark yaratmad sfr hipotezi red edilir.
RNEK 9.8
Bir yemek firmas mensne zeytinyal yer elmas yemei eklemek istemektedir.
Bu amala arafltrma yapan firma bafl ahs iki farkl tarif bulmufltur. Tarifleri inceleyen bafl ah iki tarif arasnda sadece bir noktann farkl olduunu grmfltr.
Hangi tarifin menye ekleneceine karar vermek amac ile mflterilerinden 100
tanesine ncelikle birinci tarife gre yaplan yemei yedirmifltir. Yemei beenip
beenmediklerini renerek kayt etmifltir. 1. tarife gre mflterilerden 60 tanesi yemei beenirken 40 tanesi beenmemifltir. Bir hafta sonra yine ayn mflterilerine
bafl ah ikinci tarif ile piflirilen zeytinyal yer elmas yemei sunarak yemek hakknda mflterilerin grfllerini almfltr. 1. Tarife gre yaplan yemei beenen
mflterilerden 45 tanesi ikinci tarifide beenirken birinci tarife gre yemei beenmeyen mflterilerden 38 tanesi ikinci tarife gre yaplan yemei beenmifltir. Elde
edilen sonular Tablo 9.12.de verilmifltir. Mflterilerin grfllerinin yemek tarifindeki bir tek deifliklik ile deiflip deiflmediini %5 anlam dzeyinde test ediniz?
Tablo 9.12
Mflterilerden Elde
Edilen Sonular
2. Tarif
memnuniyet
1. Tarif
memnuniyet
Beendim
Beenmedim
lk Toplam
Beendim
45
15
60
Beenmedim
38
40
193
zet
N
A M A
N
AM A
N
AM A
N
A M A
Sistemlerde meydana gelen deiflimin nceki duruma gre sistemin deiflimine etkisini tespit etmek.
kili sonularn olduu durumlarda zellikle seme ve seim tr snflayc lek ile lmlenen
kategorik deiflkenlerin olduu problemlerde sistemde meydana gelen bir deiflim ya da sisteme
yaplan bir mdahalenin nceki tercihleri nasl
etkiledii gzlemlenmek istenebilir. rnein 20
yldr ayn forml ile retilen yourdun znde
meydana getirilen deiflimin mflteri memnuniyeti zerindeki etkisi arafltrlabilir. Daha nceki
formlden menun olan ve olmayan mflteriler
belirlenerek yeni forml zerlerinde denenebilir
ve fikirlerindeki deiflim test edilir. Bu tr durumda da parametrik olmayan istatistik tekniklerine baflvurulur.
194
Biyoistatistik
Kendimizi Snayalm
1. Afladakilerden hangisi
testlerden biri deildir?
a. Ki-Kare iyi uyum testi
b. Salm grafii testi
c. Binom testi
d. Mann-Whitney U testi
e. McNemar testi
parametrik
olmayan
2. Bir iflletme aylk satfllarnn eflit olduunu dflnmektedir. Bu grfllerini test etmek amac ile
afladakilerden hangisi kullanlr?
a. Ki-Kare iyi uyum testini
b. Salm grafii testini
c. Binom testini
d. Mann-Whitney U testini
e. McNemar testini
3. lgilenilen deiflken en az sralayc lek ile lmleniyor ise bu deiflkenin uygunluk gsterdii dalm
bulmak iin afladakilerden hangisi kullanlr?
a. Mann-Whitney U testi
b. Tek ynl varyans analizi
c. Mc-Nemar testi
d. Ki-Kare iyi uyum testi
e. Kolmogorov-Smirnov testi
4. Bir arafltrmada aylk satfl deerleri eflit ve 5 olarak
bilinmektedir. Son 4 ayda elde edilen satfl deerleri 3, 4,
6 ve 4 olarak gerekleflmifltir. Buna gre Ki-Kare iyi uyum
testi iin hesaplanacak 2 istatistiinin deeri katr?
a. 1,40
b. 1,60
c. 3,10
d. 4,25
e. 6,20
5. Bir Binom testinde 18 birim bulunmaktadr. Arafltrmada ilgilenilen deiflken sonucundan 7 tane tespit
edilmifltir. %5 anlam dzeyinde testin tamamlanmas
iin gereken teorik deer katr?
a. 0,0577
b. 0,4073
c. 0,2403
d. 0,0078
e. 0,4159
8. Bu
a.
b.
c.
d.
e.
Toplam
Memnun
15
105
125
Memnun deil
70
75
195
1.
2.
3.
4.
5.
6.
b
a
e
a
c
b
7. d
Yaflamn inden
8. c
9. d
Kaynak: Sherwin, C.M. (2004), Mirrors as potential environmental enrichment for individually housed laboratory mice, Applied Animal Behav. Sci. 87: 95-103.
10. a
olacaktr. Bu problemde anlam dzeyi =0,05 olarak verilmifltir. 7 adet gn bulunduundan kategori says
m=7dir. Serbestlik derecesi olur. Ki-kare kritik deerler
tablosu yardmyla test iin kullanlacak kritik deer 6
serbestlik derecesi ve =0,05 anlamllk dzeyine gre
12,592 olarak tespit edilir. Hesaplanan 2= 5,32 deeri
tablo deeri olan 12,592den daha kktr. Sfr hipotezi kabul edilir. Gnlere gre gelen mflteri says dzgn
dalmaktadr.
196
Biyoistatistik
Sra Sizde 2
ncelikle orijinal deerleri kullanarak rneklem deerleri arasndaki pozitif ve negatif iliflkileri arafltralm. Bu amala veri tablosuna bir satr daha ekleyerek birinci rneklem ile ikinci rneklem deerleri arasndaki farklarn iflaretlerini yazalm. Hesaplama sonucu afladaki tabloda sunulmufltur.
1
10
rneklem 1
10,40
11,15
10,44
11,25
12,44
13,10
11,12
10,78
11,45
11,45
rneklem 2
10,48
11,25
10,21
11,55
10,50
12,78
11,89
11,02
11,99
12,05
flaret
Bu aflamada (-) ve (+) iflaret saylarn belirleriz. Tabloya gre (-) deer says 7 ve (+) deer says da 3 olarak gerekleflmifltir. Gzlem birimi says 10 iin ve %5 anlamllk dzeyine gre iflaret testi kritik r deeri tablodan 1 olarak elde edilir. (-) ve (+) iflaretli birim saylarndan k olan 3 deeri tablo deerinden daha byk olduu iin
sfr hipotezi red edilir.
197
198
Biyoistatistik
199
200
Biyoistatistik
201
202
Biyoistatistik
Yararlanlan Kaynaklar
Cankyer, E. ve Aflan, Z. (2005). Parametrik Olmayan
statistiksel Teknikler, T.C. Anadolu niversitesi
Yaynlar, Eskiflehir.
Conover, W.J. (1999). Practical Nonparametric Statistics, John Wiley & Sons, Inc.
Freund, J.E. (1992). Mathematical Statistics, Prentice
Hall International.
Gamgam, H. (1989). Parametrik Olmayan statistiksel
Teknikler, T.C. Gazi niversitesi Yaynlar, Ankara.
Higgins, J.J. (2004). Introduction to Modern Nonparametric Statistics, Brooks/Cole-Thomson Learning.
Kanji, G.P. (1993). 100 Statistical Tests, Sage Publications.
Kvam, P.H. ve Vidakovic, B. (2007). Nonparametric
Statistics with Applications to Science and Engineering, John Wiley & Sons, Inc.
McDonald, J.H. (2008). Handbook of Biological Statistics, Sparky House Publishing.
Manoukian, E.B. (1986). Mathematical Nonparametric
Statistics, Gordon and Breach Science Publishers.
Neave, H.R. (1978). Statistical Tables, London: george
Allen and Unwin.
Rohlf F.J. ve Sokal R.R. (1981). Statistical Tables, Second Edition, New York: W. H. Freeman and Company.
Sprent, P. ve Smeeton, N.C. (2001). Applied Nonparametric Statistical Methods, Chapman and
Hall/CRC.
Wasserman, L. (2006). All of Nonparametric Statistics,
Springer Science+Business Media, Inc.
10
BYOSTATSTK
Amalarmz
N
N
N
Anahtar Kavramlar
Kalite
Kalite Kontrol
Kontrol Grafii
Pareto Grafii
Sebep-Sonu (Balk Kl)
fiemas
erik Haritas
Biyoistatistik
Kalite Kontrol
Kalite Kontrol
KALTE VE KALTE KONTROL
Gnlk hayatta alflverifl srasnda alnan rnlerin paketleri incelendiinde paket
ierii ile ilgili detayl bilgilere yer verilmektedir. rnein, alnan bir besin maddesinin ka kalori olduu paket zerinde belirtilmifltir. Paket zerinde verilen kalori
miktar ortalama bir miktar gsterir. Tketicilerin beklentileri, bu kalori miktarn
temin ettikleri rnden elde edebilmeleridir. reticilerde, tketicinin bu beklentisini karfllamak durumundadr. Burada zerinde durulmas gereken konu, reticinin paket zerinde belirtilen kalori miktarn uzun dnemde nasl yerine getireceidir. reticiler rettikleri rnlerin bir ksmn retim hattndan alarak testlere tabii tutarlar ve testlerin sonularna gre paket zerinde yer alan deerleri tketicilere bildirirler.
En basit anlam ile kalite, bir mal veya hizmetin mflteri beklenti ve gereksinimlerini karfllayabilme yeteneidir. Genellikle tketicilerin genel beklentilerine bal olarak kalite kavram topluma, toplumun genel kltrel geliflimine, beeni ve
alflkanlklarna gre deiflebilen bir kavramdr. Mflteri gereksinimlerini ve beenilerini en iyi flekilde irdeleyerek her zaman bir ncekine gre daha iyi rn pazara srmek ve rakiplerin sunduklarn mal ya da hizmetlerden daha iyisini sunmak, genel amac oluflturmaktadr. Uluslararas Standartlar Enstits (International
Organization for Standardization) kaliteyi tanmlamak iin Kalite, bir mal ya da
hizmetin belirli bir gereksinimi karfllayabilme yeteneklerini ortaya koyan karakteristiklerin btndr. ifadesini kullanmaktadr. Kalite kontrol ise, kalite isteklerini salamak iin kullanlan operasyonel teknikler ve faaliyetlerdir (DIN ISO
8402/04.1989). Kalite kontrol, iflletmelerin retim biriminde hatalar saptamak ve
bu alandaki trendleri grmek amac ile kullanlan teknikler ve aralardr.
Bir rn veya hizmetin, verilen kalite taleplerini karfllayabilecek, yeterli dzeyde gvenin salanmas iin gerekli, planlanmfl ve sistematik faaliyetlerin btn
ise kalite gvencesini oluflturur (DIN ISO 8402/04.1989). Kalite politikasn tespit
eden ve gereklefltiren, genel ynetim grevinin bakfl as da kalite ynetimi olarak adlandrlmaktadr (DIN ISO 8402/04.1989). Kalite ynetimi, belirlenmifl ve
tm ilgililer tarafndan kabul gren bir kalite politikasnn var olmas durumunda
ve bu politikann uygulanmas amacyla gerekli olan tm ifllemlerin gereklefltirilmesi ifllemidir. Bu politikann uygulanabilmesi iin gerekli tm teknik ara ve gerelerinin temini ile olas tedbirlerin alnmfl olmas gerekir. Kalite sistemi, kalite
ynetiminin gerekleflebilmesi iin bir ara olarak kullanlmaktadr. Kalite sistemi-
206
Biyoistatistik
nin iki ana blm olduu sylenebilir. Bunlardan ilki organizasyonel yap ve bu
yap ierisinde yer alan tm birimlerin sorumluklar iken, ikincisi belirlenen sorumluluklarn ve faaliyetlerin yrtlebilmesi iin gerekli aralar ve oluflturulan
dkmantasyondur.
Dr. Aramand V. Feigenbaum, bir iflletmedeki deiflik gruplarn kalite gelifltirme,
kaliteyi koruma ve kalite iyilefltirme abalarn mflteri tatminini de gz nnde tutarak retim ve hizmeti en ekonomik dzeyde gereklefltirebilmek iin birlefltirilen
sisteme toplam kalite kontrol adn vermektedir. Toplam kalite kontrol; pazarlama,
tasarm, imalat, muayene ve ykleme blmleri dahil olmak zere btn blmlerin katlmn gerektirir. 2. Dnya Savaflndan sonra neredeyse retim kapasiteleri tamamen yok olan Japonya, Dr. W. Edwards Deming ile eski retim teknikleri
yerine yepyeni bir sistemin oluflturulmasna yardmc olmas iin anlaflmfltr. Japon
yneticiler ile bir dizi seminerde bir araya gelen Deming daha sonralar Demingin
14 noktas olarak bilinen genel bir filozofi zerinde durmufltur. Deming kalitenin
ncelikle sistemin kendisinin gelifltirilmesinden getiini yalnzca son noktada yaplan kontroln yeterli olmad ve kalitenin mflteriler tarafndan belirlendiinin
zerinde durmufltur. Deming, reticilerin pazar arafltrmalar yardmyla mflterilerin ihtiyalarn karfllayabilir olmas gerektiini belirtmifltir. Demingin Japon endstrisi iin nemle zerinde durduu konu ise iflletmede yer alan her bireyin iflletmenin uzun dnemli geliflimine katkda bulunmas zorunluluudur. Demingin
iflletmelerde paket halinde uygulanmasn istedii noktalar 14 bafllk halinde afladaki gibi sralanabilir.
1. Bir plan yaparak, amacn tutarlln salayn.
2. Yeni kalite felsefesini benimseyin.
3. Kitle denetimine bal kalmayn.
4. Tedarikileri yalnzca fiyata gre seme alflkanlndan vazgein.
5. Problemleri saptayn ve sistemi srekli iyilefltirmeye alfln.
6. Modern ifl baflnda eitim metodlarn benimseyin.
7. retim rakamlarna ( miktar) deil, kaliteye arlk verin.
8. Korkuyu uzaklafltrn.
9. Blmler aras engelleri krn.
10. Baflarmak iin yntemler salamadan, daha iyi verimlilik talep etmeyi
brakn.
11. Saysal kotalar ngren ifl standartlarn kaldrn.
12. fl yapma onurunu engelleyen bariyerleri kaldrn.
13. ok sk bir eitim ve retim sistemi kurun.
14. st ynetimde, yukardaki bu on maddeyi her gn vurgulayacak bir yap oluflturun.
Demingin 14 noktas istatistiksel kalite kontroln nemini de gz ard etmemifltir. statistiksel kalite kontrolnde genel ama, hizmet ya da rn retim srecinin tm aflamalarnn gzlem altnda tutulmasdr. statistiksel kalite kontrolnde
sistemin kontrol altnda olup olmadn gzlemleyebilmek iin kontrol grafiklerinden yararlanlr. Eer rn ile ilgili olarak belirlenen standartlarn dflna bir kfl
sz konusu ise sistemin kontrol dflna kt sylenerek gerekli dzeltmeler iin
nerilen ifllemler yerine getirilir. Gda maddeleri iin eflitli muayene ve analiz
yntemleriyle saptanan deerler objektif kalite olarak adlandrlr ve fiziksel kalite,
kimyasal kalite, mikrobiyolojik kalite, hijyenik kalite ve besleme deeri kategorilerinde ele alnr. Gda sektrnde kalite kontrol alflmalarnn bafllca amalar,
Tan Grafikleri
Kalite kontrol alflmalarnda kalitenin arttrlmas ya da ortaya kan problemlerin
zm iin hangi noktalara baklmas gerektiini ortaya karabilmek amac ile
tan grafikleri oluflturulurlar.
Pareto Grafii
Pareto grafikleri nceliklerin belirlenmesinde yardmc olan grafiklerdir. eflitli
problemlerin ya da problem kaynaklarnn oransal nemlerini gsterebilmek amac ile oluflturulurlar. lgilenilen deiflkenin leine bal olarak dfley eksende frekanslar, zaman ve maliyet deerleri yer alrken yatay eksende aldklar deere gre bykten ke sralanmfl olarak farkl zellikler, problemler/problem kaynaklar yer alr. Ayrca grafiin sa tarafnda yer alan dfley eksende oransal frekans deerleri iin kullanlr. Problem kayna ile ilgili oransal frekans deerleri bu
eksene gre efllefltirilerek ortaya kan noktalar izgi yardmyla birlefltirilir. Yatay
eksen zerinde yer alan etiketlerde hem problem kaynaklar hem de oransal frekanslar ve kmlatif oransal frekanslarna yer verilir. Pareto grafii oluflturmak iin
207
208
Biyoistatistik
problem kaynaklar bir frekans tablosunda, lm deiflkeninin deerine gre bykten ke sralanacak flekilde toplanr ve oransal frekanslar hesaplanr. Daha
sonra da frekanslar iin stun grafii izilir. Ayn grafik zerinde oransal frekans
problem kayna iliflkisi iinde salm grafii gsterilir.
RNEK 10.1
Tablo 10.1.
Mflteri fiikayetleri
Frekans Tablosu
Bir lokanta yneticisi son bir yl ierisinde 100 mflteriden gelen flikayetleri Tablo
10.1.deki gsterildii gibi dzenlemifltir. Pareto grafii yardmyla lokantann kalitesini ykseltmesi iin zerinde durmas gereken bafllca konular nelerdir inceleyelim.
fiikayet Tr
Frekans
Oransal Frekans
55
55 / 100 = 0,55
25
25 / 100 = 0,25
10
10 / 100 = 0,10
6 / 100 = 0,06
4 / 100 = 0,04
Toplam
100
Lokanta yneticisi gelen flikayetleri bykten ke sralanmfl olarak Tablo10.1.de dzenlediinden bu bilgileri kullanarak stun grafii izebiliriz. Daha
sonra stun grafiine oransal frekanslarda salm grafii fleklinde eklenir. fiekil
10.1.de lokanta flikayet tr iin Pareto grafii yer almaktadr.
fiekil 10.1
Lokanta fiikayet
Pareto Grafii
209
Bir lokantada yemein kalitesi zerinde durulmaktadr. Yemek kalitesini arttrma arafltrmasna yardmc olmas amac ile fiekil 10.3.de verilen balk kl flemas, alflanlar ve yneticilerin bir araya geldii bir toplantda oluflturulmufltur. Daha sonra bu flema kullanlarak alnabilecek nlemler ayrntlar ile tartfllmfltr.
RNEK 10.2
210
Biyoistatistik
fiekil 10.3
Yemek Kalitesi Balk Kl fiemas
Kontrol Grafikleri
nitenin giriflinde de ele alnd gibi gnlk yaflamda edindiimiz paketli rnlerin
zerinde bu rnle ilgili eflitli bilgiler yer almaktadr. Bu bilgiler besin deerleri olabilecei gibi rnn arlk veya boyut gibi zellikleri de olabilmektedir. eflitli
rnler iin genel standartlar olmakla beraber her lkenin kendi standartlar gelifltirilmifltir. Pazara srlen rnlerin bu standartlar taflmas istenir. reticiler daha retim aflamasnda iken rnn eflitli zelliklerini kontrol ederek pazara en iyi rn
srmek isterler. Kontrol grafikleri rnn ilgilenilen zelliinin nceden belirlenen
snrlar ierisinde yer alp almadn gzlemleme flans verir. Eer ilgilenilen zellik
istenen snrlar iinde ise sistem kontrol altnda kabul edilir. Fakat ilgilenilen zelliin ald deer daha nceden belirlenen snrlarn dflna kyor ise sistem kontrol
altnda deildir. Sistemin kontrol dflna kmasna sebep olan neden bulunarak elimine edilmelidir. Temel olarak kontrol grafii bir salm grafiidir. ekilen farkl rneklemeler iin elde edilen istatistik deerleri bir salm grafiinde izilir. Daha sonra bu grafie eflitli teknikler yardmyla belirlenen limit noktalar izgi fleklinde eklenir. ki tr kontrol grafii vardr. Bu kontrol grafikleri rn arl, boyutlar gibi
lm sonularna gre oluflturulan deiflken kontrol grafikleri ve rn ya da servisin kabul edilir olup olmad snflamasnn yapld zellik kontrol grafikleridir.
fiekil 10.4
Kontrol Grafii
Bileflenleri
eflitlii yardmyla hesaplanr. Hesaplanan bu genel ortalama ( x ), kontrol grafiinin orta izgisi olarak kullanlacaktr. Kontrol limitlerini oluflturabilmek iin ana
ktle standart sapmas nin tahminine ihtiya duyulur. nn tahmini deiflim aral kullanlarak hesaplanabilir. Deiflim aral R bir rneklemde yer alan en byk deer ile en kk deer arasndaki farktr. Deiflim aral R ile gsterilirse,
sistemden elde edilecek m tane rneklemin her biri iin deiflim aralk deerleri
hesaplanarak R1 , R2 ,..., Rm serisi oluflturulabilir. Bu deerlere gre ortalama deiflim aral deeri,
R + R2 + ... + Rm
R= 1
m
KL = x + A2 R
Merkez = x
AKL = x A2 R
211
212
Biyoistatistik
eflitlikleri yardmyla hesaplanr. Eflitlikler de yer alan A2 katsaysnn deeri farkl rneklem byklkleri iin dzenlenen ve nite 10un sonunda verilen katsaylar tablosu yardmyla elde edilecektir.
lgilenilen retim srecinin ilgili deiflken bakmndan deiflkenlii de deiflim
aral kontrol grafii ( R kontrol grafii) yardmyla izlenir. Deiflim aral kontrol
grafii oluflturmak iin gerekli olan limit deerleri (KL, st kontrol limiti ve AKL,
alt kontrol limiti olmak zere)
Deiflim Aral Kontrol Grafii Kontrol Limitleri
KL = D4 R
Merkez = R
AKL = D3 R
eflitlikleri yardmyla hesaplanr. Eflitlikler de yer alan D4 ve D3 katsaylar deerleri farkl rneklem byklkleri iin dzenlenen ve nite 10un sonunda verilen
katsaylar tablosu yardmyla elde edilecektir.
RNEK10.2
Tablo 10.2.
Gn Boyu Tavuk
Fileto lmleri
Bir iflletmede 500 gr.lk paketler halinde tavuk filetosu paketlenmektedir. retim
flefi gn boyunca her saat ierisinde 5er rnei rassal olarak belirleyerek paketlerin arlklarn lmfltr. lm yaplan gnde 8 saatlik retim olduu iin 8
farkl rneklem oluflturulmufltur. lm sonular 10.2.de sunulmufltur.
rneklem Sra No
x1
x2
x3
x4
x5
497
495
501
501
499
502
501
505
496
498
485
490
492
505
495
489
507
506
502
505
500
494
497
499
504
504
506
498
493
499
499
493
507
502
497
495
499
497
507
510
rneklem Sra No
x1
x2
x3
x4
x5
497
495
501
501
499
498,60
502
501
505
496
498
500,40
485
490
492
505
495
493,40
20
489
507
506
502
505
501,80
18
500
494
497
499
504
498,80
10
504
506
498
493
499
500,00
13
499
493
507
502
497
499,60
14
495
499
497
507
510
501,60
15
3.994,20
105
Toplam
xi
Ri
R + R2 + ... + Rm 105
R= 1
=
= 13, 125
8
m
olarak hesaplanr. fiimdi kontrol limitlerini nite 10 sonunda yer alan katsaylar
tablosunu da kullanarak hesaplayalm.
Ortalama Kontrol Grafii Kontrol Limitleri
213
Tablo 10.3.
Ortalama Kontrol
Grafii statistikleri
214
Biyoistatistik
fiekil 10.5
Tavuk Fileto Paket
Arlklar Ortalama Kontrol Grafii
fiekil 10.5.de yer alan kontrol grafii incelendiinde oluflturulan 8 rneklem ortalamasnn kontrol snrlar ierisinde olduu grlmektedir. Ancak dikkat edilirse 3 sra numaral rneklem ortalamas dier ortalamalara gre daha dflk bir deer olarak ortaya kmfltr. Her ne kadar retim kontrol altnda gibi grnse de
retim flefinin bu retim saati ierisinde sistemde bir deifliklik olup olmadn
kontrol etmesi tavsiye edilir.
RNEK 10.3
Tablo 10.4.
retimden 2 Saat
Sonra rn Arlndaki Deiflim
(gr.)
Bir iflletmede retilen rnlerin retimden sonra arlklarnda azalmalar meydana gelmektedir. retim flefi son 4 saat ierisinde retim hattndan rassal olarak
3er rneklem oluflturmufltur. Bu rnler 2 saat bekletilmifl ve ilk arlklar ile son
arlklar arasndaki farklar hesaplanarak Tablo 10.4.de sunulmufltur.
rneklem Sra No
x1
x2
x3
215
rneklem Sra No
x1
x2
x3
Ri
Toplam
Tablo 10.5.
Deiflim Aral
Kontrol Grafii
statistikleri
14
olarak hesaplanr. fiimdi kontrol limitlerini nite 10un sonunda verilen katsaylar
tablosu yardmyla bulunan deer ve eflitlikler yardmyla hesaplayalm.
Deiflim Aral Kontrol Grafii Kontrol Limitleri
KL = D4 R = 2, 575 x 3, 50 = 9, 01
Merkez = 3, 50
AKL = D3 R = 0 x 3, 50 = 0
216
Biyoistatistik
Herhangi bir rneklem deiflim aral deeri, tespit edilen snrlar dflnda gerekleflmediinden sistem deiflkenliinin kontrol altnda olduu sylenir.
SIRA SZDE
D fi N E L M
S O R U
SIRA SZDE
Bir kalite kontrol
alflmasnda rnn boyutlar cm. cinsinden kaydedilmektedir. retim
flefi her gn retilen rnlerden 6 tanesini rnek olarak semektedir. Son 7 gnde elde
edilen rassal rneklemler iin lm sonular aflada sunulmufltur. Ortalama kontrol
D fi N E L M
grafiini iziniz?
O R No
U
rneklem SSra
x1
x2
x3
x4
x5
x6
60
61
61
60
60
59
64
65
64
62
63
63
3SIRA SZDE
59
60
61
58
61
60
58
59
59
60
59
60
5AMALARIMIZ
60
60
62
61
60
60
59
59
61
59
61
60
7K T A P
60
62
60
59
59
60
DKKAT
SIRA SZDE
AMALARIMIZ
K T A P
N N
DKKAT
NTERNET
Kalite kontrol
rnler ile ilgili bilgiler her zaman lme yardmyla elde
T E L E V yaplan
ZYON
edilmeyebilir. Kimi durumlarda belirli bir zellie sahip rn says sayma yolu ile
elde edilebilir. rnein flifle st retimi yapan bir iflletmede retim hattnn son
noktasnda kapa kapanmamfl flifle says kayt altna alnabilir. Yllanmas iin
N T E R Nfliflelerinden
ET
bekletilen flarap
bazlarnn eflitli sebepler ile darbe alarak iindeki
rnler bozulabilir. Bozulan rn says ya da bozulan rnlerin btn ierisindeki oran ile ilgilenildiinde zellik/Nitel Kontrol Grafikleri oluflturulur.
p=
Kusurlu rn says
Toplam rneklem birim says
sp =
p (1 p )
n
217
KL = p + 3
p (1 p )
n
Merkez = p
AKL = p 3
p(1 p )
n
KL = np + 3 np(1 p )
Merkez = np
AKL = np 3 np(1 p )
eflitlikleri kullanlr. Eer eflitliklerde yer alan p iin nceden belirlenen bir deer
verilmemifl ise kusurlu oran kontrol grafiinde kullanlan p hesaplanr.
Bir tavuk yumurtas iftliinde yumurtalar 12flerli olarak kutulanmaktadr. Daha sonra bu kutular 50flerli olarak paketlenmektedir. Kalite kontrol flefi son 6 saatte paketlenen yumurtalardan her saat iin 1 paketi rassal olarak seerek ierisinde krk yumurta bulunan kutu saysn kaydetmifltir. Krk yumurta kutu saylar
Tablo 10.6.da sunulmufltur.
rneklem Sra No
x1
x2
x3
x4
x5
x6
Krk kutu
RNEK10.4.
Tablo 10.6.
Krk Yumurta
Kutusu Says
218
Biyoistatistik
Tablo 10.7.
Gerekli statistikler
rneklem Sra No
x1
x2
x3
x4
x5
x6
Krk kutu
Krk Oran
1+ 5 + 4 + 2 + 3+ 6
21
=
= 0, 07
50 + 50 + 50 + 50 + 50 + 50 300
sp =
0, 07(1 0, 07)
= 0, 036
50
LK = p + 3
p (1 p )
= 0, 07 + 3 x 0, 036 = 0, 178
n
Merkez = 0, 07
AKL = p 3
p(1 p )
= 0, 07 + 3 x 0, 036 = 0, 038 (0 olarak al
n
nr)
219
Merkez = 3, 50
AKL = np 3 np(1 p ) = 50(0, 07 ) 3 50(0, 07 )(1 0, 07 )
= 1.912(0 olarak alnr )
olarak hesaplanr. lgili kusurlu says kontrol grafii fiekil 10.8.de gsterilmifltir.
fiekil 10.8
Kusurlu Says
Kontrol Grafii
ISO Standartlar
Uluslararas Standartlar Organizasyonu (ISO) retimin eflitli aflamalar iin kalite
ynergeleri yaynlamakta ve bu ynergeleri uygulayan firmalara kalite belgeleri
sunmaktadr. Gda sektr iin yaynlanan ISO22000:2005 standartlar gda zincirinde yer alan bir flirketin gda gvenliini tehlikeye atacak nedenleri kontrol altnda tutarak yiyecein tketildii anda tketici iin gvenli olmasn salayacak sis-
220
Biyoistatistik
HACCP
HACCP, Tehlike Analizi ve Kritik Kontrol Noktalar ifadesinin ngilizce karfllnn (Hazard Analysis and Critical Control Point) ksaltmasdr. lk olarak Amerikan uzay programnda kullanlan gdalarn mikrobiyolojik gvenilirlii zerinde gven salamak amac ile gelifltirilmifltir. Tekniin gda iflletmelerinde daha genifl bir perspektif iinde kullanlabileceini grmek uzun srmemifl ve
retim, datm, servis ve satfl aflamalarnda da uygulanabilirlik alflmalar yrtlmfltr. Bu sistem, tketicilere sunulan rnlerin genel gvenliini tehdit
edecek tehlikelerin nceden belirlenmesi ve mmkn olan en iyi boyutta kontrol altna alnmasn salayan sistematik bir yaklaflmdr. Dnya Salk rgt
(WHO) gda kaynakl hastalklarn nlenmesi iin HACCP yaklaflmnn benimsenmesi gerekliliini Amerikan gda ve ila idaresi ile yrttkleri ortak bir alflmada vurgulayarak (FAO/WHO 1983), gdalarn gvenlik garantilerinin oluflturulabilmesi iin yrtlecek testlerde bu yaklaflmn benimsenmesine karar
vermifltir. zleyen yllarda bir ok kurulufl bu sisteme uyumlu ynergeler oluflturmufltur.
lkemizde HACCP sisteminin uygulanmas gerekliliini vurgulamak amac ile
bir ynetmelik 1998 ylnda yrrlle girmifltir. Daha sonra 2002 ylnda ynetmelikte geniflletmeler yaplarak gda retiminde bulunan iflletmelerin HACCP uygulamalarna kademeli olarak gemeleri belirtilmifltir. HACCP sisteminin uygulanfl ak bir flekilde 12 maddede belirtilmifltir. HACCP sisteminin 7 temel prensibi
bulunmaktadr. Bu temel prensipler aflada sralanmfltr.
1.
2.
3.
4.
5.
221
222
Biyoistatistik
fiekil 10.9
Tamime Vd.
(1999)A Gre
Doal Yourt in
Tipik HACCP
fiemas
223
224
Biyoistatistik
zet
N
A M A
N
A M A
N
A M A
225
Kendimizi Snayalm
1. Kalite isteklerini salamak iin kullanlan operasyonel teknikler ve faaliyetlere ne ad verilir?
a. Kalite
b. Kalite Kontrol
c. Tan Grafii
d. ISO
e. HACCP
5.
226
Biyoistatistik
Yaflamn inden
Kalite kontrol grafikleri gerek yaflamda iflletmelerde
sklkla kullanlmaktadr. Her gn alflverifl merkezlerinden temin ettiimiz rnler kalite kontrol grafiklerinin
de kullanld kontrol testlerinden sonra elimize ulaflmaktadr. Kalite kontrol grafikleri ok daha farkl bir
yapda, bir spor oyununda, oyunculara rflvet verilerek
sonulara etki yapldn ispatlamak iin kullanlmfltr.
Amerika Birleflik Devletleri Florida eyaletinde blge
mahkemesi jai alai oyununda yer alan oyuncularndan
bazlarna rflvet vererek oyunun sonucunu etkilediini
kontrol grafikleri yardmyla ispatlama abasna girmifltir. Rflvet verilerek nasl bir tavr taknaca bilinen
oyuncunun oyununda rakip zerine iddiaya girilerek
haksz kazan elde edildiinin gsterilmesi iin kalite
kontrol grafiklerinden yardm alnmfltr. Normalden daha yksek iddia oranlarna sahip oyunlarn belirlenerek
o oyunlar zerinde incelemeler yaplmas ve bu incelemeler iin kalite kontrol grafiklerinin kullanlabilecei
dava sonucunda ortaya kmfltr. Jai alai raket ile oynanan bir oyundur ve karfllkl iki kifli ya da iki takm arasnda oynanr. Duvara vurulan toplar karan kifli sayy kaybetmifl saylr ve yerine takmdan dier kifli geer.
Takmlardan ya da oyunculardan birisi nceden belirlenen galibiyet saysna ulafltnda oyun sonlanr.
Kaynak: Charnes, J.M. ve Gitlow, H.S. (1995). Using
Control Charts to Corroborate Bribery in Jai Alai. The American Statistician, USA.
227
b
a
e
a
e
a
d
8. c
9. d
10. a
x1
x2
x3
x4
x5
x6
xi
Ri
60
61
61
60
60
59
60,17
64
65
64
62
63
63
63,50
59
60
61
58
61
60
59,83
58
59
59
60
59
60
59,17
60
60
62
61
60
60
60,50
59
59
61
59
61
60
59,83
60
62
60
59
59
60
60,00
Sra No
x + x2 + ... + xm 423
x= 1
=
= 60, 429
m
7
R + R2 + ... + Rm 17
R= 1
=
= 2.429
7
m
olarak hesaplanabilir. Kontrol limitleri,
228
Biyoistatistik
Yararlanlan Kaynaklar
Kontrol Grafikleri in Katsaylar Tablosu
rneklemdeki
Birim Says,
n
Ortalama
Kontrol
Grafii
A2
D3
D4
1,880
3,267
1,023
2,575
,729
2.282
,577
2,115
,483
2,004
,419
,076
1,924
,373
,136
1,864
,337
,184
1,816
10
,577
,223
1,777
11
,285
,256
1,744
12
,266
,284
1,716
13
,249
,308
1,692
14
,235
,329
1,671
15
,223
,348
1,652
0,4750
0
1,96
229
230
Biyoistatistik
0
Kritik Nokta
231
F
Kritik Nokta
1
232
Biyoistatistik
F
1
Kritik Nokta
Szlk
233
Szlk
A
Birim: Bir arafltrmada hakknda bilgi edinmek istenilen, zerinde zellikleri ile ilgili lm, saym ya da gzlemlerin
rine denir.
Biyoistatistik: statistiksel yntemlerin, biyolojik ve salk olgular ile ilgili problemlerin zmnde kullanlmasdr.
C-
Chebyshev Teoremi: Herhangi bir veri kmesinde, ilgilenilen deiflkenin frekans dalmnn flekline bakmakszn
ine denir.
ise, olur.
D
Deiflim Aral: Bir serideki en byk deer ile en kk
deer arasndaki farka denir.
Deiflken: Birimlerin sahip olduklar ve birbirlerinden ayrt
edilmelerini salayan zelliklere denir.
B
Bamsz Olaylar: A ve B gibi herhangi iki olaydan birinin ger-
Deiflkenlik Katsays: Bir serinin standart sapmasnn aritmetik ortalamasna blnmesi sonu elde edilir.
E
Eiklik Katsays: lgilenilen deiflkenin frekans dalmnn
simetri derecesini tespit etmek amac ile eiklik katsay-
temlerinin temelini oluflturan olaslkl rnekleme yntemi, Basit Rassal rnekleme (BR) yntemidir.
Basit Seri: Deney ve arafltrma sonucunda elde edilen ve ilgi-
s hesaplanr.
En Kk Varyans: Belirli bir parametresinin yansz tahmincilerinden hangisinin seilecei karar verilirken, r-
duunu gsterir.
F
Frekans: Frekans serilerinde birbirinden farkl olarak ortaya
kan sonularn tekrar saylarna frekans ad verilir.
Frekans Serisi: Herhangi bir arafltrma da elde edilen sonularn, ilgilenilen deiflkenin ald birbirinden farkl deerlerinin tekrarlanma saylarn da gsterecek flekilde
dzenlenmifl haline frekans serisi ad verilir.
234
Biyoistatistik
Karflt Hipotez: Tek bir ana ktle parametresinin belli bir deerden farkl olduunu ( eflit olmadn, > byk
Gven Dzeyi: Belli bir araln ana ktle parametresini iermesi olaslna gven dzeyi denilir.
belirtilebilen deiflkenlerdir.
uygulamaktadr.
Kolmogorov-Smirnov yi Uyum Testi: lgilenilen deiflke-
nermedir.
Histogram: eflitli snflar ya da aralklarda yer alan gzlem
saylarnn stunlar yardmyla gsterimine histogram ad
verilir.
oluflturulurlar.
Korelasyon Analizi: Deiflkenler arasndaki iliflkinin derecesinin tespiti ifllemine ise korelasyon analizi ad verilir.
Koflullu Olaslk: B olaynn gereklefltii bilindiinde, A ola-
I-
hi-
olarak grlr.
Kme rneklemesi: rnekleme erevesinin, birden ok
ana ktle biriminden oluflan kmelerden meydana gel-
lanlr.
M
Mann-Whitney U Testi: Mann-Whitney U testi parametrik
testlerden olan iki rneklem Student-t testinin parametrik olmayan teknikler arasndaki karfll olarak yer almaktadr. Elde edilen birbirinden bamsz iki rassal rneklemin ayn ana ktleden ekilmifl rneklemler olup
olmadklarnn testinde Mann-Whitney U Testi kullanlr.
Szlk
McNemar Testi: Birimlerin deiflim ncesi ve sonrasnda na-
235
rnekleme Birimi: Ana ktleden seilen rneklemi oluflturan elemanlara rnekleme birimi ad verilir.
vesi ad verilir.
dalma yaklaflr.
Mod: Bir seride en ok tekrarlanan terimin deerine mod denir.
rnekleme Oran: Seilen rneklemdeki birim saysnn (rneklem hacminin), ana ktledeki birim saysna oranna
Nicel Deiflken: Belli bir deiflkenin ortaya kfl biimi rakamla ifade edilemeyen deiflkenlere denir.
Nitel Deiflken: Belli bir deiflkenin ortaya kfl biimi ra-
P
Parametre: Herhangi bir deiflken incelenirken, ana ktledeki btn birimlerin ele alnarak, ilgilenilen deiflkenin
deerlere denir.
O-
Parametrik Olmayan Teknikler: Parametrik olmayan istatistiksel teknikler, dalma bal olmayan teknikler olarak da adlandrlr.
ler arasndaki iliflkinin derecesini belirlemek iin Pearson korelasyon katsays kullanlr.
R
Rassal Deiflken: X; S rneklem uzaynn elemanlarna iliflkin olarak tanmlanan gerek deerli bir fonksiyon ise,
bu X deiflkenine rassal deiflken ad verilir.
Ortalama Sapma: Ana ktle ya da rneklemde yer alan terimlerin aritmetik ortalama ya da medyandan ortalama olarak
ne kadar saptklarn gstermek amac ile oluflturulur.
lme: Birimlerin sahip olduu zelliklerin derecesinin belirlenerek, sonularn saysal olarak ifade edilmesine lme ad verilir.
rneklem: Bir ana ktledeki btn birimlere ulafllamadn-
rneklem Uzay: Bir denemenin olas tm sonularnn oluflturduu kmeye rneklem uzay denir.
rnekleme: rneklem seme amacyla uygulanan yntemler
topluluuna ya da bu amala izlenen srecin btnne
denir.
kadardr.
Regresyon Analizi: ki ya da daha fazla deiflken arasndaki
iliflkinin genel doasnn tanmlanmasna regresyon analizi ad verilir.
236
Biyoistatistik
S-fi
farkl
yolla, ikincisi farkl yolla gerekleflmek zere iki admdan olufluyorsa, srecin tamam farkl yolla gerekleflir.
ad verilir.
Tahminleme: rneklem seimi sonucunda hesaplanan istatistik aracl ile ana ktle parametresinin ald deer
olarak kabul edilen bir aralk ya da bir say elde etme ifl-
sfr olduu gibi kavramlar ileri sren bir istatistiksel hipotezdir ve ile gsterilir.
Snflayc lek: Birimlerin sahip olduklar zelliklere iliflkin
lek trdr.
Sistematik Hata: Hesaplanan rneklem istatistikleri, ana ktle parametresinden ya hep daha kk, ya da hep daha
V
Varsaym: Kuramsal olarak varsaylan ve nceden yaplmfl
bir dizi gzleme ya da tecrbeye dayanarak ortaya at-
ktledeki ilk k birim arasndan rassal olarak seilip, bundan sonra gelen her kinci birimin rnekleme alnd
ynteme denir.
Standart Hata: rneklem istatistii ile ana ktle parametresi
arasndaki farklarn alabilecei deerler negatif, sfr ya
lanrken aritmetik ortalamadan yararlanlmaz, kareli ortalamadan yararlanlr. Hesaplanan bu deere de, rneklem istatistiinin standart hatas ad verilir.
Standart Normal Dalm: Ortalamas
ve varyans
normal dalmdr.
kan deere denir.
Sturges Kural: Sturges kural gruplandrlmfl frekans serisi
snf aral hesabnda kullanlr.
Srekli Deiflken: Say dorusu zerinde kesirli ondalk saylar halinde ifade edilebilen deiflkenlerdir.
fik: Belli bir deiflkenin ortaya kfl biimlerine denir.
T
Tabakal rnekleme: Ana ktlenin arafltrmann konusunu
oluflturan deiflken ya da deiflkenler bakmndan tabakalara ayrlarak, her tabakadan ayr ayr rneklem ekildii rnekleme yntemine denir.
ki etkileri incelenebilmektedir.
Veri: Arafltrma biriminden elde edilen saysal gzlem deerleridir.
olan
tahmincisine tu-
Y
Yanszlk: Bir
Dizin
237
Dizin
A
Gven Aral 112, 116, 117, 118, 119, 120, 121, 122, 123,
Anlam Dzeyi 132, 137, 138, 140, 142, 144, 146, 147, 152
Aralk Tahminlemesi 113, 116, 117, 125
Aralkl lek 8, 10
Asimetri 36, 51
Hipotez 132-153
I-
statistik 7, 10
Birim 2, 4-8, 10
Biyoistatistik 10
C-
Kesikli Deiflken 5, 11
Kesikli Rassal Deiflken 69, 70, 73, 81
Kolmogorov-Smirnov yi 180
Dairesel Permtasyon 59
Deiflim Aral 45
Deiflken 2, 3, 5-7, 10
M
Mann-Whitney U Testi 186-189
Frekans 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 30
238
Biyoistatistik
S-fi
Sfr Hipotezi 132, 135-137, 140, 142, 149
Salm Grafii 28, 29, 30
Saymann Temel Prensibi 57, 60, 80
Serbestlik Derecesi 112, 119, 120, 121, 122
Nicel Deiflken 5, 10
Nitel Deiflken 5
Snflayc lek 8, 10
Sralayc lek 8, 10
O-
Srekli Deiflken 5, 6
Srekli Rassal Deiflken 69, 70, 74-76, 81
Stun Grafii 14, 23, 24, 27, 30
fik 2, 6
T
Tabakal rnekleme 93, 95, 105
Tabakal Rassal rnekleme 93, 105
Tahminci 88, 105
Tahminin Standart Hatas 158, 167, 168
Tahminin Yanlma Pay 116
Tahminleme 112, 113, 125
Parametre 2, 3, 6, 7, 10
R
Rassal Deiflken 56, 68-77, 81
Rassal Hata 89, 90, 105
Rassal Olay 56, 63, 64, 80
Rassal Saylar Tablosu 91, 92, 109
Red Blgesi 132, 138- 48, 152
Regresyon 158, 159, 164-167, 170-172, 174
V
Varsaym 133, 134, 138, 147, 149, 152, 153
Varyans 46-48
Varyans Analizi 132, 148-151, 153
Veri 4, 6, 10
Y
Yanszlk 112, 115, 125
Yeterlilik 112, 115, 125