Professional Documents
Culture Documents
ne zaman hatalıdır?
› Hemen her zaman!
Hiç bir ölçme aracı tamamen güvenilir veya geçerli
sonuçlar vermez, ölçme sonuçlarına hemen her zaman
hata karışır.
Ölçmeye karışan çeşitli hatalar nedeniyle gözlenen bir
özelliğin gerçek değeri doğrudan elde edilemez.
Hatanın miktarı arttıkça elde edilen değer bireyin
gerçek değerinden (gerçek başarı, yetenek, bilgi düzeyi
vb.) uzaklaşır.
Gözlenen değer = Gerçek değer ± Hata değeri
Elde edilen puanın yönü iki taraflı olabilir yani olması
gerekenden fazla veya az olabilir.
➢ Bazı maddelerin cevabının diğer maddelerde gizli olması
durumunda elde edilecek puan gerçekte alınacak
puandan fazla olacaktır.
➢ Testteki maddelerin anlaşılmaz olması cevapların yanlış
olmasına yol açarak elde edilen puanın gerçek değerinden
az olmasına yol açacaktır.
Hataya sebep olan etkenlerin farkında olmak,
ölçme işlemine karışan hataları azaltmaya
yardımcı olur.
Ölçümlerdeki hatanın mümkün olduğunca
azaltılması, ölçülen özelliğin miktarı hakkında
doğru bilgi edinebilmek ve bunun sonucunda
doğru kararlar verebilmek açısından önemlidir.
HATA TÜRLERİ
Tesadüfi
Sabit Sistematik
(Rastgele)
Hatalar Hatalar
Hatalar
Sabit Hata: Bir ölçmeden diğerine miktarı ve yönü
değişmeyen, kaynağı belirlenebilen hatalardır.
➢ Sınav sonuçlarını düşük bulan bir öğretmenin tüm
öğrencilerin puanına 5 puan ilave etmesi
➢ Bir öğretmenin yaptığı bir yazılı yoklama sınavında az süre
vermesi nedeniyle öğrencilerin tamamının son soruyu
yanıtlayamaması
Ölçme aracından
kaynaklanan hatalar
Ölçme aracından
kaynaklanan hatalar
KR-20, KR-21
Test Tekrar Test Eşdeğer Formlar Eşdeğer Yarılar Ve Cronbach Alfa
Güvenirliği Güvenirliği Metodu Yöntemleri
Test-Tekrar Test Güvenirliği
› Bir testin, aynı gruba, farklı zamanlarda
uygulanması sonucu elde edilen puanlar
arasındaki korelasyon ile hesaplanır. Elde edilen
güvenirlik katsayısı kararlılık katsayısı olarak
adlandırılır.
› Örnek:
Öğrenci 1. Uygulama 2. Uygulama
Puanları Puanları
1 75 78
2 50 62
3 93 91
4 80 77
5 67 66
6 88 88
Test-Tekrar Test Güvenirliği
› Eğer ölçmeye karışan hatalar gerçekten
tesadüfiyse, aynı hatalar birden fazla
tekrarlanmayacaktır. Böylece iki farklı
uygulamadan elde edilecek benzer sonuçlar
ölçümlere tesadüfi hatanın pek karışmadığının
göstergesi olacaktır.
Bu yöntemin dezavantajı, ikinci uygulamada bireylerin
soruları hatırlayıp ona göre cevap verecek olmalarıdır.
İki uygulama arasındaki süre uzatıldığında ise ölçülmek
istenen özellikler diğer faktörlerin etkisiyle değişecektir.
Uygulamalar arasındaki zaman bireylerin yaptıklarını
hatırlayamayacakları kadar uzun, bireylerde ölçülen
özellikte değişiklik olmayacak kadar kısa olmalıdır.
Genel olarak, test ve tekrar test arasındaki zaman aralığı
arttıkça, güvenirlik katsayısının değeri düşecektir.
Uygulamalar arasındaki zaman arttıkça test tekrar test
yöntemiyle elde edilen kararlılık katsayısı da
azalacaktır. Ölçülen değişkende zaman içinde
değişmenin az olacağı düşünülüyorsa bu yöntem ile
güvenirlik hesaplanabilir.
3 Ocak 3 Şubat
Zaman aralığı Test A Test A
testin güvenirliğini yansıtır.
3 Ocak 3 Haziran
Zaman aralığı testin güvenirliğinin Test A Test A
yanı sıra bireyin ölçülmek istenen
özelliğindeki bilinemeyen
değişiklikleri de yansıtır. Kararlılık Katsayısı = 0.50
Eşdeğer (Paralel) Formlar Güvenirliği
› Test tekrar test güvenirliğinde uygulamalar arasındaki
zaman farkından kaynaklanacak testteki maddelerin
hatırlanması gibi dezavantajları gidermek için iki
eşdeğer test formu aynı gruba uygulanabilir.
› İki değişik ama birbirinin eşdeğeri olan test formu aynı
gruba uygulanarak alınan puanlar arasındaki
korelasyon hesaplanır. Elde edilen güvenirlik katsayısı
eşdeğerlik katsayısı olarak adlandırılır.
Uygulamalar arasındaki zamanın belirlenmesi bu
yöntemde de önem taşır. Uygulamalar arasındaki
zaman bireylerde bıkkınlık, motivasyon eksikliği,
yorgunluk ve bunlara bağlı olarak oluşacak dikkatsizlik
yaratmayacak kadar uzun, bireylerde ölçülen özellikte
değişiklik olmayacak kadar kısa olmalıdır.
Bu yöntemin dezavantajı birbirinin eşdeğeri olan iki
form geliştirmektir. Geliştirilen iki form mümkün
olduğunca eşit şartlar altında uygulanmalıdır.
3 Haziran 3 Haziran,
Sabah Oturumu Öğleden Sonra Oturumu
Test A (Form X) Test A (Form Y)
Test A Test A
(Çift Sayılı Maddeler) (Tek sayılı Maddeler)
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Pi 0,70 0,80 0,30 0,40 0,60 0,30 0,70 0,60 0,50 0,20
1-Pi 0,30 0,20 0,70 0,60 0,40 0,70 0,30 0,40 0,50 0,80
Pi(1-Pi) 0.21 0.16 0.21 0.24 0.24 0.21 0.21 0.24 0.25 0.16 2,13
10 2.13
KR − 20 = 1 − 2
10 − 1 SY
Güvenirlik
10 2.13
KR − 20 = 1 − = 0.87
10 − 1 9.88
Güvenirlik
KR-21 Güvenirliği
K X (k − X )
KR − 21 = 1 −
K −1 2
kSY
Güvenirlik
10 5.10(10 − 5.10)
KR − 21 = 1 −
10 − 1 10(9.88)
10 24.99
KR − 21 = 1 − = 0.83
10 − 1 98.8
İç tutarlılık yöntemleri tek bir uygulamaya
dayanmalarından dolayı kullanışlı ve
yaygındırlar. Ancak bu yöntemlerin de
bazı dezavantajları vardır:
› Eğer tüm test aynı özelliği ölçüyorsa
kullanılmalıdırlar. Testin tek bir özelliği ölçmesi
durumunda bir maddeyi doğru cevaplayan
bireylerin diğer maddeleri de doğru
cevaplayacağı varsayılır. Bu durumda
testteki maddelerin birbiriyle ve testin
tümüyle tutarlı olması gerekir.
Puanlayıcı Güvenirliği
› Açık uçlu soruların puanlanmasına öznel etkiler
karışabilir. Bu durumda, bir testteki maddeler iki veya
daha fazla puanlayıcı tarafından puanlanabilir.
› Puanlayıcı hatalarının olmadığını söyleyebilmek için,
puanlayıcıların madde ve test puanlarının aynı olması
gerekir.
› Puanlayıcı güvenirliğini hesaplamak için iki veya
daha fazla puanlayıcının aynı bireylere ait testleri
birbirlerinden bağımsız olarak puanlamaları ve bu
puanlar arasındaki ilişkinin hesaplanmasıyla elde
edilir.
Ölçme Sonuçlarının Standart Hatası (SEM)
› Ölçme hatası, ölçülen özelliğin bireyde var olan
gerçek değeri ile ölçme ile ölçülen özelliğin gözlenen
değeri arasındaki fark olarak ifade edilir.
E=X-T
E = Ölçme hatası
X = Gözlenen değer
T = Gerçek değer
Bir ölçme aracından elde edilen her ölçme sonucunda
bir miktar hata (tesadüfi hata) vardır. Bu hataların
standart bir miktarını elde edebilmek için kullanılan
eşitliğe ölçme sonuçlarının standart hatası adı verilir.
SEM = S X 1 − rxx
Örnek:
Ortalaması 60, standart sapması 8 ve güvenirliği 0.90 olan
bir testten 70 alan bir ogrencinin %95 olasılıkla puan
aralığını hesaplayınız.
Bir Ölçme Aracının Güvenirliğini Artırmanın
Yolları
› Güvenirliği artırmada en etkili yol, soru sayısını
artırmaktır. Böylece birimin değeri küçülerek duyarlılık
artar. Ölçmeyi yapan kişi, ölçülen özellik açısından
bireyler arasındaki farkları ne kadar ince ve duyarlı
tespit edebilirse, o kadar hatasız ölçmeler elde eder.
› Öğrencilerin sınava güdülenmesi
› Ölçme aracında oluşturan maddelerin baskı
hatalarının olmaması, okunaklı olması vb.
› Maddelerin açık ve anlaşılır yazılması
› Maddelerin uygun büyüklükte puntoyla yazılması
› Testin tek bir özelligi ölçmesi
› Sınav süresinin yeterli verilmesi,
› Sınav ortamının temiz, yeterli düzeyde
ısınması, aydınlık olması,
› Sınav ortamının gürültülü bir ortamda
olmaması
› Puanlamanın objektifliği
Geçerlik, ölçme aracının ölçülmek istenen
özelliği başka özelliklerle karıştırmadan
ölçebilme derecesidir.
➢ Eğer bir test 3. sınıftaki öğrencilerin aritmetik
yeteneklerini ölçmek için hazırlanmışsa, 5. sınıf
matematik yeteneğini veya okuma yeteneğini
ölçmemelidir.
➢ Eğer bir test bireylerin çoktan seçmeli soru
hazırlama yeteneğini ölçmek için geliştirilmişse,
bu yeteneği ölçmeli, kötü yazılmış soruları tanıma
yeteneğini ölçmemelidir.
Bir ölçme aracının ölçülmek istenen özelliği
ölçüp ölçmediği hakkında karar vermek için
birden fazla kanıta ihtiyaç vardır. Bu yönüyle
geçerlik, ölçme aracını kullanan kişinin ölçme
sonuçlarından çıkarılacak yorumları ve ölçme
sonuçlarının kullanımını desteklemek için
topladığı kanıtlar olarak tanımlanabilir.
Bu açıdan bakıldığında, geçerlik tek bir
katsayıyla ifade edilmek yerine testin geliştirilme
ve kullanılış amacına hizmet eden kanıtların
toplanmasıyla yorumlanabilir.
Bir test, ölçme sonuçlarının yorumlanma ve
kullanılış amacına bağlı olarak farklı
geçerliklere sahip olabilir.
Not: Güvenirlik geçerlik için ön şarttır ancak
yeterli değildir. Güvenirliği yüksek olan
testler her zaman geçerli olmayabilir.
➢ Bir sözel yetenek testinin güvenirliği yüksek olabilir
ancak bu test öğrencilerin sayısal yeteneklerini
belirlemek ve onları bu özelliklerine göre
sıralamak amacıyla kullanılamaz.
Geçerlik Türleri
Yordama Zamandaş
Geçerliği Geçerliği
Yapı Geçerliği
› Bireylerde var olduğu kabul edilen ancak gözle
görülemeyen özellikler yapı olarak adlandırılır.
Zeka, tutum, ,ilgi, kaygı, vb.
› Yapı geçerliği, bir ölçme aracının teoride var olduğu
düşünülen, gözle görülemeyen yapıları pratikte ölçebilme
derecesine denir.
➢ Bir test, öğrencilerin aritmetik problem çözme yeteneklerini
ölçmek için hazırlanmışsa, testi oluşturan maddelerin
öğrencilerin sadece aritmetik problem çözme yeteneğini
ölçüp ölçmediğine, her maddenin öğrencileri sadece belirtilen
özellikleri açısından ayırıp ayırmadığına dair kanıtlar
toplanmalıdır.
➢ Aritmetik problem çözme yeteneğini ölçen maddeler, büyük
ölçüde bireyin okuma yeteneği, kelime bilgisi, problem çözme hızı
gibi özelliklere de bağlıysa, test puanları öğrencilerin sadece
aritmetik problem çözme yeteneklerini yansıtıyor şeklinde
yorumlanamaz.
➢ Bir başka test,öğrencilerin sözel, sayısal ve analitik yeteneklerini
ölçmek için hazırlanmışsa, öğrencilerin sözel, sayısal ve analitik
puanları birbirinden anlamlı bir şekilde farklı olmalıdır.
› Yapı geçerliği ile ilişkili kanıtlar elde etmek
için çeşitli yöntemler kullanılabilir.
Faktör Analizi: Ölçme aracının ölçtüğü özelliklerin sayısı
ve herbir özelliğin toplam puana katkısı hesaplanır.
Böylece ölçme aracının ölçtüğü yapı veya yapılar
ortaya çıkarılarak yapı geçerliğine ilişkin kanıt elde
edilebilir.
Madde Puanı ile Toplam Puan Arasındaki Korelasyon:
Ölçme aracını oluşturan maddelerin puanı ile toplam
puan arasındaki ilişkinin derecesini belirten korelasyon
katsayısı ölçme aracının homojenliğine dolayısıyla yapı
geçerliğine ilişkin bir kanıt olarak kullanılabilir.
Kapsam Geçerliği
› Kapsam geçerliği, bir ölçme aracının oluşturan
maddelerin ölçülmek istenen davranışları ne
derece kapsadığıyla ilgili olup ölçme aracının
kapsamı ne derece temsil ettiğiyle belirlenir.
› Kapsam geçerliğini sağlamak için belirtke
tablosu hazırlanabilir.
Belirtke tablosu bir tarafında alana ait içerik, diğer
tarafında hedeflenen davranışları içeren bir
tablodur.
› Kapsam geçerliği belirlenirken en çok kullanılan
yöntem uzman kanılarına başvurmaktır.
› Kapsam geçerliği, testin geçerli görünüp
görünmediği hakkında bilgi verir, ancak
testin yüksek bir okuma seviyesi gerektirip
gerektirmediği veya test maddelerinin iyi
ifade edilip edilmediği hakkında bilgi vermez.
› Bu nedenle bir test kapsam bakımından
geçerli görünebilir ancak ölçmek istenenden
farklı yetenekleri ölçebilir: tahmin yeteneği,
okuma yeteneği, vb.
Ölçüt Dayanaklı Geçerlik (Ölçüt Geçerliği)
› Ölçüt dayanaklı geçerlik, hazırlanan ölçme
aracından elde edilen puanlar ile ölçüt kabul
edilen diğer bir ölçme aracından elde edilen
puanlar arasındaki korelasyon katsayısı
hesaplanarak bulunur. (Ölçüt olarak seçilen
ölçme aracının güvenilir ve geçerli olması
gerekmektedir.)
➢ Bir okula öğrenci alınırken okulun ya da bölümün
gerektirdiği yetenek ve bilgi düzeyine sahip bireyleri
seçme-yerleştirme için kullanılan testlerin geçerliği, aynı
özelliği ölçen testlerden elde edilen puanlarla, ölçüt
puanlarla karşılaştırılıp puanlar arasındaki korelasyon
hesaplanır.
› Bu geçerlik türü, ölçüt olarak seçilen ölçme
aracının hazırlanan ölçme aracından önce veya
sonra uygulanmasına göre yordama geçerliği
ve zamandaş geçerliği olmak üzere ikiye ayrılır.
Ölçüt
Dayanaklı
Geçerlik
Yordama Zamandaş
Geçerliği Geçerliği
Yordama (Tahmin) Geçerliği: Ölçüt olarak
seçilen ölçme aracından elde edilen puanlar,
hazırlanan ölçme aracından elde edilen
puanlardan daha sonra elde edilmişse, bu
puanlar arasındaki ilişkiye dayalı geçerliliğe
yordama (tahmin) geçerliği adı verilir.
Hazırlanan ölçme aracıyla elde edilen puanlar
gelecekteki bir durumu tahmin etmekte
kullanılabilir.
➢Bir KPSS hazırlık dershanesinde, öğrencilerin bir
deneme sınavından aldıkları puanlar (yordayıcı,
tahmin edici) ile asıl sınavdan aldıkları (ölçüt puanlar)
arasındaki korelasyon hesaplanırsa, elde edilecek
değer dershanenin deneme sınavının yordama
geçerliğinin ölçüsünü verir.
Zamandaş Geçerliği: Ölçüt olarak seçilen ölçme
aracından elde edilen puanlar, hazırlanan ölçme
aracından elde edilen puanlardan aynı zamanda
veya daha önceden elde edilmişse, bu puanlar
arasındaki ilişkiye dayalı geçerliliğe zamandaş
geçerliği adı verilir.
Hazırlanan ölçme aracının, ölçülen özelliğin var
olan durumu uygun bir şekilde ölçüp ölçmediğini
belirlemek için kullanılabilir.
➢ÖSS sınavının zamandaş geçerliğini belirlemek için
bireylerin ortaöğretim kurumlarındaki derslere ait başarı
puanları ortalaması (OÖBP) ölçüt olarak kullanılabilir.
Geçerliği Düşüren Faktörler
Güvenirliği düşüren bütün faktörler geçerliği de
düşürür.
› Soruların dersin konularını yeterince kapsamaması
› Soruların birden fazla davranışı ölçmesi
› Soru sayısının azlığı
› Sınavın uygulama koşullarının olumsuzluğu
› Sınav süresinin yetersizliği
› Kopya
› Sınav stresi ve güdülenme yetersizliği
› Puanlama hatası
› Sınavın çok zor veya çok kolay olması
› Ölçüt puanların güvenirliği
Ölçme aracının kullanışlılığı,o ölçme
aracının hazırlanmasının, uygulanmasının ve
puanlanmasının ekonomik ve pratik olma
derecesidir.
Ölçme aracının kullanışlılığı, güvenirliği ve
geçerliği artırıcı yönde rol oynamalıdır.