Güvenirlik Ve Geçerlik

 Bir test veya ölçekten elde edilen puanlar
ne zaman hatalıdır?
› Hemen her zaman!
 Hiç bir ölçme aracı tamamen güvenilir veya geçerli
sonuçlar vermez, ölçme sonuçlarına hemen her zaman
hata karışır.
 Ölçmeye karışan çeşitli hatalar nedeniyle gözlenen bir
özelliğin gerçek değeri doğrudan elde edilemez.
 Hatanın miktarı arttıkça elde edilen değer bireyin
gerçek değerinden (gerçek başarı, yetenek, bilgi düzeyi
vb.) uzaklaşır.
 Gözlenen değer = Gerçek değer ± Hata değeri
 Elde edilen puanın yönü iki taraflı olabilir yani olması
gerekenden fazla veya az olabilir.
➢ Bazı maddelerin cevabının diğer maddelerde gizli olması
durumunda elde edilecek puan gerçekte alınacak
puandan fazla olacaktır.
➢ Testteki maddelerin anlaşılmaz olması cevapların yanlış
olmasına yol açarak elde edilen puanın gerçek değerinden
az olmasına yol açacaktır.
 Hataya sebep olan etkenlerin farkında olmak,
ölçme işlemine karışan hataları azaltmaya
yardımcı olur.
 Ölçümlerdeki hatanın mümkün olduğunca
azaltılması, ölçülen özelliğin miktarı hakkında
doğru bilgi edinebilmek ve bunun sonucunda
doğru kararlar verebilmek açısından önemlidir.
HATA TÜRLERİ
Tesadüfi
Sabit Sistematik
(Rastgele)
Hatalar Hatalar
Hatalar
 Sabit Hata: Bir ölçmeden diğerine miktarı ve yönü
değişmeyen, kaynağı belirlenebilen hatalardır.
➢ Sınav sonuçlarını düşük bulan bir öğretmenin tüm
öğrencilerin puanına 5 puan ilave etmesi
➢ Bir öğretmenin yaptığı bir yazılı yoklama sınavında az süre
vermesi nedeniyle öğrencilerin tamamının son soruyu
yanıtlayamaması
Bu durumlarda ölçme sonuçları gerçek durumu

yansıtmaz.
 Sistematik Hata: Bir ölçmeden diğerine miktarı ve
yönü değişen, kaynağı belirlenebilen hatalardır.
➢ Bir öğretmenin yazısı güzel öğrencilere yazısı güzel
olmayan öğrencilere nazaran daha yüksek puan vermesi
➢ Bir yabancı dil sınavında okuyucunun yanlış söylemesi
nedeniyle öğrencilerin bir kelimeyi yanlış yazmaları ve bu
kelimenin metnin içinde birden fazla geçmesi
Not: Sabit ve sistematik hatalarda, ölçme
sonuçlarına karışan hatanın miktarı, yönü ve
kaynağı bellidir.
 Tesadüfi (Rastgele, Rastlantısal) Hata: Ölçme
sonuçlarına gelişi güzel karışan, sabit ve sistematik
hatanın aksine bir ölçmeden diğerine miktarı ve
yönü değişen, kaynağı belirlenemeyen hatalardır.
 Bireyin puanını pozitif veya negatif yönde
etkileyebilirler.
 Eğitimde en çok karşılaşılan ve en büyük sorun olan
hata türüdür.
➢ Test sırasında bir öğrencinin yanlışlıkla yanındaki öğrencinin
cevabını görmesi
 Bireyin test sırasındaki yorgunluğunun, test ortamının
gürültüsünün bireyde dikkatsizliğe yol açmasından,
puanlayıcının dikkatsizliğinden kaynaklanabilir.
HATA KAYNAKLARI
Ölçmenin yapıldığı bireyden

kaynaklanan hatalar
Ölçme aracından
kaynaklanan hatalar
Ölçmeyi yapan bireyden

kaynaklanan hatalar
Ölçmenin yapıldığı ortamdan

kaynaklanan hatalar
HATA KAYNAKLARI
Ölçmenin yapıldığı bireyden

kaynaklanan hatalar
➢ Bireyin ölçme işlemi yapılırken içinde bulunduğu motivasyon,

heyecan, stres, uykusuzluk, yorgunluk, hastalık, dikkat dağınıklığı,
vb.
➢ Bireyin ölçme işlemi yapılmadan önce geçirdiği kaza, tartışma,
vb.
 Ölçmenin yapıldığı gruba ait bireylerde gözlenen geçici ve
önceden tahmin edilemeyen değişiklikler bu tür hata
kaynaklarıdır.
 Bireylerin test maddelerini cevaplarken yaptıkları gerçek
hatalar değil, zaman içerisinde önceden kestirilemeyen
biçimde değişen ve bu nedenle ölçmede tutarsızlığa ve
hataya yol açan faktörlerdir.
HATA KAYNAKLARI
Ölçme aracından
kaynaklanan hatalar
➢ Ölçme aracını oluşturan maddelerin kapsamı yeterince temsil

etmemesi
➢ Ölçme aracındaki maddelerin iyi ifade edilememesi
➢ Çoktan seçmeli sorulardan oluşan ölçme araçlarında doğru
yanıtın tahmin yoluyla bulunması
➢ Ölçme aracının uzunluğu, ölçme aracındaki madde sayısı
 Bir test oluşturulurken gözlenmek istenen davranışların çok iyi
tanımlanması, maddelerin anlaşılır olması madde sayısının ve
uygulama süresinin uygun biçimde belirlenmesi, bu tür hata
kaynaklarının azalmasını sağlayacaktır.
HATA KAYNAKLARI
Ölçmeyi yapan bireyden

kaynaklanan hatalar
➢ Ölçmeyi yapan kişinin, puanlama yaparken yorgun olması,

dikkatsizliği
➢ Puanlayıcının, cevapları kendi bakış açısına ve anlayışına göre
değerlendirmesi
➢ Puanlamanın bilgisayar ile yapıldığı durumlarda cevap
anahtarındaki cevaplardan bazılarının silik olması nedeniyle optik
okuyucu tarafından okunmaması
 Puanlamanın nesnel olmadığı, öznel kanılara dayandığı
durumlarda, puanlar bir puanlayıcıdan diğerine veya
puanlama zamanına göre değişecektir.
HATA KAYNAKLARI
Ölçmenin yapıldığı ortamdan

kaynaklanan hatalar
➢ Testin yapıldığı ortamın sıcaklığı

➢ Işığın yetersiz olması
➢ Gürültü düzeyi
 Testin yapıldığı ortam testi alan tüm bireyler tarafından aynı
olmalıdır. Aksi takdirde, testten yüksek puan alan bireyler
testle ölçülmek istenen özelliğe en çok sahip olan değil, testi
en iyi koşullar altında alanlar olacaktır.
 Aynı özelliği ölçen iki test uygulanacaksa, benzer koşullar
altında uygulanmalıdır.
 Ölçmede hataya neden olan bu 4 faktör, bireyin
test sonucu elde ettiği puanla gerçekte alması
gereken puan arasındaki farkı artırır.
 Hata = Gözlenen puan – Gerçek puan
 Ölçme aracından, ölçmeyi yapan bireyden ve
ölçmenin yapıldığı ortamdan kaynaklanan hatalar
azaltılabilir ancak tamamen ortadan kaldırılamaz.
 Ölçmenin yapıldığı bireyden kaynaklanan hataları
ise kontrol altına almak oldukça zordur.
Ölçme Araçlarında Bulunması
Gereken Nitelikler
Güvenirlik Geçerlik Kullanışlılık

Güvenirlik
 Güvenirlik kavramı, aynı gruba birbiri ardına
yapılan uygulamalarda bireylerin grup içindeki
sıralamalarının uygulamadan uygulamaya
değişmemesi olarak tanımlanabilir. Bu açıdan
güvenirlik ölçme sonuçlarının tutarlılık derecesini
ifade eder.
 Ölçme sonuçlarının birbiriyle tutarlı olması,
ölçme aracının ölçülen özelliği kararlı bir şekilde
ölçtüğünün göstergesidir.
 Bir testin güvenilir olmaması, ölçme hatalarının
bir göstergesidir. Bu açıdan güvenirlik, ölçme
sonuçlarının ölçme hatalarından arınıklık
derecesi olarak tanımlanabilir.
 Bir ölçme aracının aynı gruba tekrar tekrar
uygulanması sonucu elde edilen sonuçların aynı ya
da benzer olabilme derecesine tutarlılık anlamında
güvenirlik denir.
 Ölçme sonuçlarının birbiriyle tutarlı olması, ölçme
aracının ölçülen özelliği kararlı bir şekilde
ölçtüğünün göstergesidir. Bir ölçme aracının aynı
gruba zaman aralıklarıyla tekrar tekrar uygulanması
sonucu elde edilen sonuçların zamana rağmen
aynı ya da benzer olabilme derecesine kararlılık
anlamında güvenirlik denir.
 Bir ölçme aracının biriminin olabildiğince hassas,
küçük olmasının derecesine duyarlılık anlamında
güvenirlik denir.
➢ Ölçüt: Bir sınıfta, matematiksel hesaplamalar
konusunda hedeflenen davranışların %80ìni
gösteren başarılıdır.
➢ Testten elde edilen puanların güvenirliği düşükse,
bireylerin çoğu yanlış yerleştirilecektir.
➢ Gerçekte hedeflenen davranışların %80 ve üstünü
gösteren bireylerden bazılarının test puanları %80ìn
altında olacaktır ve yanlışlıkla başarısız olmuşlardır
şeklinde değerlendirileceklerdir.
➢ Gerçekte hedeflenen davranışların %80 altını gösteren
bireylerden bazılarının test puanları %80ìn üstünde
olacaktır ve yanlışlıkla başarılı olmuşlardır şeklinde
değerlendirileceklerdir.
 Çeşitli yöntemlerle hesaplanan güvenirlik değeri
(güvenirlik katsayısı) 0 ile 1 arasında değişen
değerler alır.
› Güvenirlik katsayısının 1 olması mükemmel bir güvenirliği,
dolayısıyla hatasız bir ölçmeyi ifade eder. Bu durumda
elde edilen ölçme sonuçları, ölçülen özelliğin gerçek
değerini verir.
› Güvenirlik katsayısının 0 olması ise tamamen güvenilir
olmayan, tümüyle hatalardan oluşan bir ölçmeyi ifade
eder. Bu durumda ölçme sonuçları, gerçek değeri hiçbir
şekilde yansıtmamaktadır.
 Çalışmalar genellikle 0.70 ve üzerinde olan
güvenirlik değerinin güvenirlik için yeterli olduğunu
belirtirler.
Güvenirlik
Belirleme Yolları
Birden Fazla Tek Uygulamaya

Puanlayıcı
Uygulamaya Dayalı Dayalı Yöntemler
Güvenirliği
Yöntemler (İç Tutarlılık)
KR-20, KR-21
Test Tekrar Test Eşdeğer Formlar Eşdeğer Yarılar Ve Cronbach Alfa
Güvenirliği Güvenirliği Metodu Yöntemleri
 Test-Tekrar Test Güvenirliği
› Bir testin, aynı gruba, farklı zamanlarda
uygulanması sonucu elde edilen puanlar
arasındaki korelasyon ile hesaplanır. Elde edilen
güvenirlik katsayısı kararlılık katsayısı olarak
adlandırılır.
› Örnek:
Öğrenci 1. Uygulama 2. Uygulama
Puanları Puanları
1 75 78
2 50 62
3 93 91
4 80 77
5 67 66
6 88 88
 Test-Tekrar Test Güvenirliği
› Eğer ölçmeye karışan hatalar gerçekten
tesadüfiyse, aynı hatalar birden fazla
tekrarlanmayacaktır. Böylece iki farklı
uygulamadan elde edilecek benzer sonuçlar
ölçümlere tesadüfi hatanın pek karışmadığının
göstergesi olacaktır.
 Bu yöntemin dezavantajı, ikinci uygulamada bireylerin
soruları hatırlayıp ona göre cevap verecek olmalarıdır.
İki uygulama arasındaki süre uzatıldığında ise ölçülmek
istenen özellikler diğer faktörlerin etkisiyle değişecektir.
 Uygulamalar arasındaki zaman bireylerin yaptıklarını
hatırlayamayacakları kadar uzun, bireylerde ölçülen
özellikte değişiklik olmayacak kadar kısa olmalıdır.
 Genel olarak, test ve tekrar test arasındaki zaman aralığı
arttıkça, güvenirlik katsayısının değeri düşecektir.
 Uygulamalar arasındaki zaman arttıkça test tekrar test
yöntemiyle elde edilen kararlılık katsayısı da
azalacaktır. Ölçülen değişkende zaman içinde
değişmenin az olacağı düşünülüyorsa bu yöntem ile
güvenirlik hesaplanabilir.
3 Ocak 3 Şubat
Zaman aralığı Test A Test A
testin güvenirliğini yansıtır.
Kararlılık Katsayısı = 0.90
3 Ocak 3 Haziran
Zaman aralığı testin güvenirliğinin Test A Test A
yanı sıra bireyin ölçülmek istenen
özelliğindeki bilinemeyen
değişiklikleri de yansıtır. Kararlılık Katsayısı = 0.50
 Eşdeğer (Paralel) Formlar Güvenirliği
› Test tekrar test güvenirliğinde uygulamalar arasındaki
zaman farkından kaynaklanacak testteki maddelerin
hatırlanması gibi dezavantajları gidermek için iki
eşdeğer test formu aynı gruba uygulanabilir.
› İki değişik ama birbirinin eşdeğeri olan test formu aynı
gruba uygulanarak alınan puanlar arasındaki
korelasyon hesaplanır. Elde edilen güvenirlik katsayısı
eşdeğerlik katsayısı olarak adlandırılır.
 Uygulamalar arasındaki zamanın belirlenmesi bu
yöntemde de önem taşır. Uygulamalar arasındaki
zaman bireylerde bıkkınlık, motivasyon eksikliği,
yorgunluk ve bunlara bağlı olarak oluşacak dikkatsizlik
yaratmayacak kadar uzun, bireylerde ölçülen özellikte
değişiklik olmayacak kadar kısa olmalıdır.
 Bu yöntemin dezavantajı birbirinin eşdeğeri olan iki
form geliştirmektir. Geliştirilen iki form mümkün
olduğunca eşit şartlar altında uygulanmalıdır.
3 Haziran 3 Haziran,
Sabah Oturumu Öğleden Sonra Oturumu
Test A (Form X) Test A (Form Y)
Eşdeğerlik Katsayısı = 0.80

 İç Tutarlılık Yöntemleri
› Eğer test tek bir yapıyı ölçüyorsa, testteki bir
maddeye doğru yanıt veren bireylerin diğer
benzer maddelere de doğru yanıt vermesi
beklenir.
› Diğer bir ifade ile, testteki maddeler birbirleriyle
ilişkili olmalılar ve testin iç tutarlılığı olmalıdır.
› Böyle bir durumda, test puanlarının güvenirliği iç
tutarlılık yöntemleri ile hesaplanabilir:
 Eşdeğer Yarılar Metodu
 Kuder-Richardson Metodları
 Cronbach Alfa Metodu
 Eşdeğer Yarılar (Testi Yarılama) Metodu
› Tek bir test uygulanarak test eşit iki yarıya
bölünür, böylece bir bireye ait iki puan elde
edilmiş olur.
 İki yarıya bölünen testin her iki yarısının kapsam ve
istatistiksel özellikler bakımından eşit olduğu varsayılır.
 Testteki maddelerin güçlükleri birbirine yakınsa testteki
maddelerin sıra numaraları baz alınarak, tek sayılı maddeler
bir yarıyı, çift sayılı maddeler ise diğer yarıyı oluşturacak
şekilde test iki yarıya bölünebilir. Diğer bir yöntem de
maddeler tesadüfi çekilmek suretiyle iki eşdeğer yarı
oluşturulabilir.
 Madde zorluklarının farklı olması durumunda maddeler
güçlüklerine göre sıralanıp tek sayılı-çift sayılı maddeler
yöntemi uygulanabilir.
 Bireylerin testin iki yarısından elde edilen puanları
arasındaki korelasyon (r12) yarıların eşdeğerlik katsayısını
verir.
 Daha sonra testin tümüne ilişkin güvenirlik değeri
hesaplanır. Elde edilen güvenirlik katsayısı iç tutarlılık
katsayısı olarak adlandırılır.
rxx = 2r12/1+r12
 rxx : tüm testin güvenirliği,
 r12: eşdeğer yarıların güvenirliği
Test A Test A
(Çift Sayılı Maddeler) (Tek sayılı Maddeler)
Eşdeğerlik Katsayısı = 0.80

İç tutarlık Katsayısı = 0.89
 KR-20, KR-21 ve Cronbach Alfa Yöntemleri
› Her maddenin birbiriyle kapsam ve istatistiksel
özellikler bakımından birbirine benzer olduğu
varsayılarak geliştirilmiştir.
 Bir test ne kadar homojense, maddeler birbiriyle o
derece yüksek ilişkili olacak, dolayısıyla maddeler
arasındaki tutarlılık da o derece yüksek olacaktır.
 Testi oluşturan maddeler heterojenleştikçe, maddeler
arası tutarlılık azalacak ve test puanlarını yorumlamak
zorlaşacaktır.
› Genel olarak bu yöntemler, eşdeğer yarılar
metoduna göre daha düşük ancak test-tekrar test
veya eşdeğer formlar yöntemlerine göre daha
yüksek güvenirlik değerleri sağlar.
› KR-20 yöntemi, test iki kategorili puanlanan
maddelerden oluştuğunda yani testteki maddeler
doğru yanıta 1, yanlış yanıta 0 puan vermek suretiyle
puanlandığında kullanılabilir.
› KR-21, KR-20`nin özel bir formudur. Testi oluşturan
maddelerin güçlükleri birbirine eşit olduğunda
kullanılır. Madde güçlüklerinin birbirine eşit olması
durumunda, KR-21 ve KR-20 birbirine eşittir, eşit
olmaması durumunda ise KR-21 değeri, KR-20
değerinden düşük çıkacaktır.
› Cronbach alfa ise test iki kategorili veya çok kategorili
puanlanan maddelerden oluştuğunda kullanılabilir.
Güvenirlik
 KR-20 Güvenirliği
 K

K 
 
i =1
Pi (1 − Pi ) 

KR − 20 = 1 − 
K −1  SY2 
 
 
Güvenirlik
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Pi 0,70 0,80 0,30 0,40 0,60 0,30 0,70 0,60 0,50 0,20
1-Pi 0,30 0,20 0,70 0,60 0,40 0,70 0,30 0,40 0,50 0,80
Pi(1-Pi) 0.21 0.16 0.21 0.24 0.24 0.21 0.21 0.24 0.25 0.16 2,13
10  2.13 
KR − 20 = 1 − 2 
10 − 1  SY 
Güvenirlik
10  2.13 
KR − 20 = 1 −  = 0.87
10 − 1  9.88 
Güvenirlik
 KR-21 Güvenirliği
K  X (k − X ) 
KR − 21 = 1 − 
K −1 2
kSY 
Güvenirlik
10  5.10(10 − 5.10) 
KR − 21 = 1 − 
10 − 1  10(9.88) 
10  24.99 
KR − 21 = 1 −  = 0.83
10 − 1  98.8 
 İç tutarlılık yöntemleri tek bir uygulamaya
dayanmalarından dolayı kullanışlı ve
yaygındırlar. Ancak bu yöntemlerin de
bazı dezavantajları vardır:
› Eğer tüm test aynı özelliği ölçüyorsa
kullanılmalıdırlar. Testin tek bir özelliği ölçmesi
durumunda bir maddeyi doğru cevaplayan
bireylerin diğer maddeleri de doğru
cevaplayacağı varsayılır. Bu durumda
testteki maddelerin birbiriyle ve testin
tümüyle tutarlı olması gerekir.
 Puanlayıcı Güvenirliği
› Açık uçlu soruların puanlanmasına öznel etkiler
karışabilir. Bu durumda, bir testteki maddeler iki veya
daha fazla puanlayıcı tarafından puanlanabilir.
› Puanlayıcı hatalarının olmadığını söyleyebilmek için,
puanlayıcıların madde ve test puanlarının aynı olması
gerekir.
› Puanlayıcı güvenirliğini hesaplamak için iki veya
daha fazla puanlayıcının aynı bireylere ait testleri
birbirlerinden bağımsız olarak puanlamaları ve bu
puanlar arasındaki ilişkinin hesaplanmasıyla elde
edilir.
 Ölçme Sonuçlarının Standart Hatası (SEM)
› Ölçme hatası, ölçülen özelliğin bireyde var olan
gerçek değeri ile ölçme ile ölçülen özelliğin gözlenen
değeri arasındaki fark olarak ifade edilir.
 E=X-T
E = Ölçme hatası
X = Gözlenen değer
T = Gerçek değer
 Bir ölçme aracından elde edilen her ölçme sonucunda
bir miktar hata (tesadüfi hata) vardır. Bu hataların
standart bir miktarını elde edebilmek için kullanılan
eşitliğe ölçme sonuçlarının standart hatası adı verilir.
SEM = S X 1 − rxx
SEM: Ölçmenin standart hatası

Sx: Testin standart sapması
rxx: Testin güvenirliği
 Ölçmenin standart hatasının az olması için,
standart sapmasının az, güvenirliğinin yüksek
olması gerekmektedir.
› Ölçmenin standart hatasi azaldikca, testin güvenirliği
artar.
 Ölçme sonuçlarına karışan hata miktarının artı ya
da eksi yönlü olduğu bilinmediğinden hesaplanan
standart hata miktarı elde edilen ölçme
sonuçlarına bir eklenip bir de çıkarılarak bir aralık
değeri elde edilir. Bu aralığa güven aralığı adı
verilir.
 Belirli olasılık değerlerine karşılık gelen farklı güven
değerleri hesaplanmaktadır.
 Ölçme hatalarına ait dağılımın normal olduğu
varsayılır.
› Bir bireyin gerçek değeri %68 olasılıkla
 X + 1SEM > T > X – 1SEM sınırları arasındadır.
Örnek:
X (Bir bireyin test puanı) = 60
SEM = 5
Bireyin gerçek puanı %68 olasılıkla
60 + (1x 5) > T > 60 – (1x5) (65 > T > 55)
60 + (2x 5) > T > 60 – (2x5) (70 > T > 50)
60 + (3x 5) > T > 60 – (3x5) (75 > T > 45)
Örnek:
Ortalaması 60, standart sapması 8 ve güvenirliği 0.90 olan
bir testten 70 alan bir ogrencinin %95 olasılıkla puan
aralığını hesaplayınız.
 Bir Ölçme Aracının Güvenirliğini Artırmanın
Yolları
› Güvenirliği artırmada en etkili yol, soru sayısını
artırmaktır. Böylece birimin değeri küçülerek duyarlılık
artar. Ölçmeyi yapan kişi, ölçülen özellik açısından
bireyler arasındaki farkları ne kadar ince ve duyarlı
tespit edebilirse, o kadar hatasız ölçmeler elde eder.
› Öğrencilerin sınava güdülenmesi
› Ölçme aracında oluşturan maddelerin baskı
hatalarının olmaması, okunaklı olması vb.
› Maddelerin açık ve anlaşılır yazılması
› Maddelerin uygun büyüklükte puntoyla yazılması
› Testin tek bir özelligi ölçmesi
› Sınav süresinin yeterli verilmesi,
› Sınav ortamının temiz, yeterli düzeyde
ısınması, aydınlık olması,
› Sınav ortamının gürültülü bir ortamda
olmaması
› Puanlamanın objektifliği
 Geçerlik, ölçme aracının ölçülmek istenen
özelliği başka özelliklerle karıştırmadan
ölçebilme derecesidir.
➢ Eğer bir test 3. sınıftaki öğrencilerin aritmetik
yeteneklerini ölçmek için hazırlanmışsa, 5. sınıf
matematik yeteneğini veya okuma yeteneğini
ölçmemelidir.
➢ Eğer bir test bireylerin çoktan seçmeli soru
hazırlama yeteneğini ölçmek için geliştirilmişse,
bu yeteneği ölçmeli, kötü yazılmış soruları tanıma
yeteneğini ölçmemelidir.
 Bir ölçme aracının ölçülmek istenen özelliği
ölçüp ölçmediği hakkında karar vermek için
birden fazla kanıta ihtiyaç vardır. Bu yönüyle
geçerlik, ölçme aracını kullanan kişinin ölçme
sonuçlarından çıkarılacak yorumları ve ölçme
sonuçlarının kullanımını desteklemek için
topladığı kanıtlar olarak tanımlanabilir.
 Bu açıdan bakıldığında, geçerlik tek bir
katsayıyla ifade edilmek yerine testin geliştirilme
ve kullanılış amacına hizmet eden kanıtların
toplanmasıyla yorumlanabilir.
 Bir test, ölçme sonuçlarının yorumlanma ve
kullanılış amacına bağlı olarak farklı
geçerliklere sahip olabilir.
Not: Güvenirlik geçerlik için ön şarttır ancak
yeterli değildir. Güvenirliği yüksek olan
testler her zaman geçerli olmayabilir.
➢ Bir sözel yetenek testinin güvenirliği yüksek olabilir
ancak bu test öğrencilerin sayısal yeteneklerini
belirlemek ve onları bu özelliklerine göre
sıralamak amacıyla kullanılamaz.
Geçerlik Türleri
Kapsam Ölçüt Dayanaklı

Yapı Geçerliği
Geçerliği Geçerlik
Yordama Zamandaş
Geçerliği Geçerliği
 Yapı Geçerliği
› Bireylerde var olduğu kabul edilen ancak gözle
görülemeyen özellikler yapı olarak adlandırılır.
 Zeka, tutum, ,ilgi, kaygı, vb.
› Yapı geçerliği, bir ölçme aracının teoride var olduğu
düşünülen, gözle görülemeyen yapıları pratikte ölçebilme
derecesine denir.
➢ Bir test, öğrencilerin aritmetik problem çözme yeteneklerini
ölçmek için hazırlanmışsa, testi oluşturan maddelerin
öğrencilerin sadece aritmetik problem çözme yeteneğini
ölçüp ölçmediğine, her maddenin öğrencileri sadece belirtilen
özellikleri açısından ayırıp ayırmadığına dair kanıtlar
toplanmalıdır.
➢ Aritmetik problem çözme yeteneğini ölçen maddeler, büyük
ölçüde bireyin okuma yeteneği, kelime bilgisi, problem çözme hızı
gibi özelliklere de bağlıysa, test puanları öğrencilerin sadece
aritmetik problem çözme yeteneklerini yansıtıyor şeklinde
yorumlanamaz.
➢ Bir başka test,öğrencilerin sözel, sayısal ve analitik yeteneklerini
ölçmek için hazırlanmışsa, öğrencilerin sözel, sayısal ve analitik
puanları birbirinden anlamlı bir şekilde farklı olmalıdır.
› Yapı geçerliği ile ilişkili kanıtlar elde etmek
için çeşitli yöntemler kullanılabilir.
 Faktör Analizi: Ölçme aracının ölçtüğü özelliklerin sayısı
ve herbir özelliğin toplam puana katkısı hesaplanır.
Böylece ölçme aracının ölçtüğü yapı veya yapılar
ortaya çıkarılarak yapı geçerliğine ilişkin kanıt elde
edilebilir.
 Madde Puanı ile Toplam Puan Arasındaki Korelasyon:
Ölçme aracını oluşturan maddelerin puanı ile toplam
puan arasındaki ilişkinin derecesini belirten korelasyon
katsayısı ölçme aracının homojenliğine dolayısıyla yapı
geçerliğine ilişkin bir kanıt olarak kullanılabilir.
 Kapsam Geçerliği
› Kapsam geçerliği, bir ölçme aracının oluşturan
maddelerin ölçülmek istenen davranışları ne
derece kapsadığıyla ilgili olup ölçme aracının
kapsamı ne derece temsil ettiğiyle belirlenir.
› Kapsam geçerliğini sağlamak için belirtke
tablosu hazırlanabilir.
 Belirtke tablosu bir tarafında alana ait içerik, diğer
tarafında hedeflenen davranışları içeren bir
tablodur.
› Kapsam geçerliği belirlenirken en çok kullanılan
yöntem uzman kanılarına başvurmaktır.
› Kapsam geçerliği, testin geçerli görünüp
görünmediği hakkında bilgi verir, ancak
testin yüksek bir okuma seviyesi gerektirip
gerektirmediği veya test maddelerinin iyi
ifade edilip edilmediği hakkında bilgi vermez.
› Bu nedenle bir test kapsam bakımından
geçerli görünebilir ancak ölçmek istenenden
farklı yetenekleri ölçebilir: tahmin yeteneği,
okuma yeteneği, vb.
 Ölçüt Dayanaklı Geçerlik (Ölçüt Geçerliği)
› Ölçüt dayanaklı geçerlik, hazırlanan ölçme
aracından elde edilen puanlar ile ölçüt kabul
edilen diğer bir ölçme aracından elde edilen
puanlar arasındaki korelasyon katsayısı
hesaplanarak bulunur. (Ölçüt olarak seçilen
ölçme aracının güvenilir ve geçerli olması
gerekmektedir.)
➢ Bir okula öğrenci alınırken okulun ya da bölümün
gerektirdiği yetenek ve bilgi düzeyine sahip bireyleri
seçme-yerleştirme için kullanılan testlerin geçerliği, aynı
özelliği ölçen testlerden elde edilen puanlarla, ölçüt
puanlarla karşılaştırılıp puanlar arasındaki korelasyon
hesaplanır.
› Bu geçerlik türü, ölçüt olarak seçilen ölçme
aracının hazırlanan ölçme aracından önce veya
sonra uygulanmasına göre yordama geçerliği
ve zamandaş geçerliği olmak üzere ikiye ayrılır.
Ölçüt
Dayanaklı
Geçerlik
Yordama Zamandaş
Geçerliği Geçerliği
 Yordama (Tahmin) Geçerliği: Ölçüt olarak
seçilen ölçme aracından elde edilen puanlar,
hazırlanan ölçme aracından elde edilen
puanlardan daha sonra elde edilmişse, bu
puanlar arasındaki ilişkiye dayalı geçerliliğe
yordama (tahmin) geçerliği adı verilir.
 Hazırlanan ölçme aracıyla elde edilen puanlar
gelecekteki bir durumu tahmin etmekte
kullanılabilir.
➢Bir KPSS hazırlık dershanesinde, öğrencilerin bir
deneme sınavından aldıkları puanlar (yordayıcı,
tahmin edici) ile asıl sınavdan aldıkları (ölçüt puanlar)
arasındaki korelasyon hesaplanırsa, elde edilecek
değer dershanenin deneme sınavının yordama
geçerliğinin ölçüsünü verir.
 Zamandaş Geçerliği: Ölçüt olarak seçilen ölçme
aracından elde edilen puanlar, hazırlanan ölçme
aracından elde edilen puanlardan aynı zamanda
veya daha önceden elde edilmişse, bu puanlar
arasındaki ilişkiye dayalı geçerliliğe zamandaş
geçerliği adı verilir.
 Hazırlanan ölçme aracının, ölçülen özelliğin var
olan durumu uygun bir şekilde ölçüp ölçmediğini
belirlemek için kullanılabilir.
➢ÖSS sınavının zamandaş geçerliğini belirlemek için
bireylerin ortaöğretim kurumlarındaki derslere ait başarı
puanları ortalaması (OÖBP) ölçüt olarak kullanılabilir.
 Geçerliği Düşüren Faktörler
Güvenirliği düşüren bütün faktörler geçerliği de
düşürür.
› Soruların dersin konularını yeterince kapsamaması
› Soruların birden fazla davranışı ölçmesi
› Soru sayısının azlığı
› Sınavın uygulama koşullarının olumsuzluğu
› Sınav süresinin yetersizliği
› Kopya
› Sınav stresi ve güdülenme yetersizliği
› Puanlama hatası
› Sınavın çok zor veya çok kolay olması
› Ölçüt puanların güvenirliği
 Ölçme aracının kullanışlılığı,o ölçme
aracının hazırlanmasının, uygulanmasının ve
puanlanmasının ekonomik ve pratik olma
derecesidir.
 Ölçme aracının kullanışlılığı, güvenirliği ve
geçerliği artırıcı yönde rol oynamalıdır.

Güvenirlik Ve Geçerlik

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Güvenirlik Ve Geçerlik

Uploaded by

Copyright:

Available Formats

 Bir test veya ölçekten elde edilen puanlar

Bu durumlarda ölçme sonuçları gerçek durumu

Ölçmenin yapıldığı bireyden

Ölçmeyi yapan bireyden

Ölçmenin yapıldığı ortamdan

Ölçmenin yapıldığı bireyden

➢ Bireyin ölçme işlemi yapılırken içinde bulunduğu motivasyon,

➢ Ölçme aracını oluşturan maddelerin kapsamı yeterince temsil

Ölçmeyi yapan bireyden

➢ Ölçmeyi yapan kişinin, puanlama yaparken yorgun olması,

Ölçmenin yapıldığı ortamdan

➢ Testin yapıldığı ortamın sıcaklığı

Güvenirlik Geçerlik Kullanışlılık

Birden Fazla Tek Uygulamaya

Kararlılık Katsayısı = 0.90

Eşdeğerlik Katsayısı = 0.80

Eşdeğerlik Katsayısı = 0.80

SEM: Ölçmenin standart hatası

Kapsam Ölçüt Dayanaklı

You might also like