You are on page 1of 10

09.04.

2018

Ölçme aracında bulunması


gereken özellikler
EĞİTİMDE ÖLÇME VE
DEĞERLENDİRME 1. Güvenirlik
2. Geçerlik
BÖLÜM III 1. Kapsam Geçerliği
Ölçme Aracında Bulunması 2. Bir Ölçüte Dayalı Geçerlik
Gereken Özellikler 3. Yapı Geçerliği
4. Görünüş Geçerliği
Dr. Aylin ALBAYRAK SARI 3. Kullanışlılık
Hacettepe Üniversitesi
Eğitim Fakültesi

Korelasyon katsayısının
Korelasyon yorumlanması-1
İki değişken arasındaki ilişkinin miktarını ve Korelasyon katsayısını yorumlarken işaretten bağımsız
yönünü tanımlayan istatistiksel bir tekniktir. İki olarak önce rakama bakarız, işarete ikinci aşamada
ya da daha çok değişkenin birlikte değişiminin bakarız.
ölçüsü korelasyon olarak tanımlanır. Korelasyon katsayısının mutlak değeri
düşünüldüğünde; değer arttıkça iki değişken
arasındaki ilişki artar.
Korelasyon katsayısı (r), ilişkinin miktarını
sayısal olarak ifade eden istatistiksel değerdir. DİKKAT: Korelasyon katsayısının değeri -1 ile +1
arasındadır. Korelasyon katsayısı -1’den küçük +1’den
büyük değer alamaz.

Korelasyon katsayısının Korelasyon katsayısının


yorumlanması-2 yorumlanması-3
Korelasyon katsayısının pozitif olması, iki değişkenin birlikte arttığını Korelasyon katsayısı;
gösterir. Doğru orantıya benzer.
(Örn: Zeka ile başarı arasında hesaplanan korelasyon katsayısı 0,85 bulunsun. Bu katsayı  + 1,00’e yaklaştıkça aynı yöndeki ilişki artar.
bireylerin zeka düzeyi arttıkça başarılarının da arttığını anlamına gelmektedir.)
Korelasyon katsayısının negatif olması, değişkenlerden birisi artarken,  – 1,00’e yaklaştıkça ters yönde ilişki artar.
diğerinin azaldığını ya da tam tersini gösterir.  0,00 ise arada ilişki yoktur.
(Örn: Sigara içme ile sağlıklı olma durumu arasındaki ilişkide korelasyon katsayısı -0,75
bulunsun. Bu katsayı sigara içme davranışı arttıkça sağlık düzeylerinin düştüğü anlamına
gelmektedir.)
Korelasyon katsayısının başındaki işaret (-, +) bize sadece ilişkinin yönünü
Korelasyon katsayısının mutlak değerinin sıfıra yakın olması, iki değişken belirtir.
arasında ilişki olmadığını ya da çok zayıf bir ilişki olduğunu gösterir.
Güçlü bir ilişkiyi bu katsayının (- veya +) 1,00 yakın olmasından anlarız.
Örn: Boy ile akademik başarı arasındaki ilişki katsayısı 0,05 bulunsun. Bu değer boy ile
akademik başarı arasında neredeyse hiç ilişki olmadığını gösterir. 0,00’a yaklaşması ilişkinin zayıf olduğuna işarettir.

1
09.04.2018

ÖRNEK SORU (KPSS-2004) ÖRNEK SORU (KPSS-2004)


Negatif korelasyon, değişkenlerden biri artarken diğerinin değerinde Negatif korelasyon, değişkenlerden biri artarken diğerinin değerinde
azalma olduğunu gösterir. azalma olduğunu gösterir.
Buna göre, aşağıdakilerden hangisinde verilen iki değişken arasında Buna göre, aşağıdakilerden hangisinde verilen iki değişken arasında
hesaplanacak korelasyonun negatif olması beklenir? hesaplanacak korelasyonun negatif olması beklenir?

A) Düzenli çalışma- başarı düzeyi A) Düzenli çalışma- başarı düzeyi


B) Gelir düzeyi- satın alma düzeyi B) Gelir düzeyi- satın alma düzeyi
C) İlgi-olumlu tutum C) İlgi-olumlu tutum
D) Zeka-yaratıcılık D) Zeka-yaratıcılık
E) Yorulma- öğrenme hızı E) Yorulma- öğrenme hızı

ÖRNEK SORU (KPSS-2008) ÖRNEK SORU (KPSS-2008)


Bir araştırmada X ve Y değişkenleri arasında sıfıra yakın bir ilişki Bir araştırmada X ve Y değişkenleri arasında sıfıra yakın bir ilişki
bulunmuştur. bulunmuştur.
Bu değişkenler aşağıdakilerin hangisinde verilenler olabilir? Bu değişkenler aşağıdakilerin hangisinde verilenler olabilir?

X Y X Y
A) Doğum yeri Doğum yılı A) Doğum yeri Doğum yılı
B) Boy Kütle B) Boy Kütle
C) Yaş Eğitim düzeyi C) Yaş Eğitim düzeyi
D) Kaygı düzeyi Başarı D) Kaygı düzeyi Başarı
E) Spor yapma Sağlık E) Spor yapma Sağlık

ÖRNEK SORU (KPSS-2006) ÖRNEK SORU (KPSS-2006)


Bir grup öğrencinin tarih, coğrafya, felsefe ve yabancı dil testlerinden aldıkları puanlar Bir grup öğrencinin tarih, coğrafya, felsefe ve yabancı dil testlerinden aldıkları puanlar
arasındaki korelasyonlar aşağıdaki tabloda gösterilmiştir. arasındaki korelasyonlar aşağıdaki tabloda gösterilmiştir.
Ders Tarih Coğrafya Felsefe Yabancı Dil Ders Tarih Coğrafya Felsefe Yabancı Dil
Tarih 1,00 0,60 0,85 -0,35 Tarih 1,00 0,60 0,85 -0,35
Coğrafya 0,60 1,00 0,40 -0,25 Coğrafya 0,60 1,00 0,40 -0,25
Felsefe 0,85 0,40 1,00 0,30 Felsefe 0,85 0,40 1,00 0,30
Yabancı Dil -0,35 -0,25 0,30 1,00 Yabancı Dil -0,35 -0,25 0,30 1,00
Bu tablodaki bilgiye dayanarak aşağıdaki sonuçlardan hangisine varılabilir? Bu tablodaki bilgiye dayanarak aşağıdaki sonuçlardan hangisine varılabilir?

A) Yabancı dil testi en düşük ortalamaya sahiptir. A) Yabancı dil testi en düşük ortalamaya sahiptir.
B) Öğrenciler tarih ve coğrafya derslerinde çok başarısızdırlar. B) Öğrenciler tarih ve coğrafya derslerinde çok başarısızdırlar.
C) Felsefe ve yabancı dil testleri çok farklı özellikleri ölçmektedir. C) Felsefe ve yabancı dil testleri çok farklı özellikleri ölçmektedir.
D) En yüksek ilişki felsefe ile tarih puanları arasındadır. D) En yüksek ilişki felsefe ile tarih puanları arasındadır.
E) En düşük ilişki tarih ile yabancı dil puanları arasındadır. E) En düşük ilişki tarih ile yabancı dil puanları arasındadır.

2
09.04.2018

Y Y
Korelasyonun Korelasyonun
Grafiğinin Grafiğinin
Yorumlanması-1 X Yorumlanması-2
rxy=+1,00 X
rxy=-1,00
Mükemmel pozitif
Mükemmel negatif ilişki
ilişki
Y
Y
POZİTİF DOĞRUSAL İLİŞKİ NEGATİF İLİŞKİ
(Aynı Yönde) (Ters Yönde)
Birinci değişken azalırken ikinci değişken azalır Birinci değişken azalırken ikinci değişken artar
rxy=+0,70
X
ya da yada X
Orta düzeyde pozitif rxy=-0,70
Birinci değişken artarken ikinci değişken artar. ilişki Birinci değişken artarken ikinci değişken azalır.
Orta düzeyde negatif ilişki
Y
(ÖRN: * Düzenli çalışma ve başarı, (ÖRN: * Enflasyon ve alım gücü, Y
* Yemek yeme ve kilo alma) * Araba kullanma süresi ve dikkat)

rxy=+0,10
X
Zayıf pozitif
X
ilişki rxy=-0,10
Zayıf negatif ilişki

Korelasyonun
Grafiğinin GÜVENİRLİK
Yorumlanması-3
Güvenirlik nedir?
Y Herhangi bir ölçme araç veya yönteminin ölçtüğü değişkeni
NÖTR KORELAYON ne derece duyarlıkla ölçebildiği veya ölçme aracının
tesadüfi hatalardan ne derece arınık olduğudur. Güvenirlik;
İki değişken arasında hiçbir ilişki birbiri ardına yapılan denemelerden aynı sonucun elde
yoktur. rxy=0,00
X edilmesidir.
İlişki yok (Sıfır
ilişki)
(ÖRN: Boy uzunluğu ve zeka, Bir ölçme aracının, ölçme sonuçlarına hata karıştırmadan
Sarışın olma ve akademik başarı) ölçme yapabilmesi güvenirliktir. Güvenirlik, hatasızlık
miktarını gösterir.

Bir ölçme aracı, aynı özelligi her uygulandığında aynı


sonucu verecek tarzda ölçebiliyorsa güvenilirdir.
16

Ölçmede Güvenirlik Ölçmede güvenirlik


Güvenirliğin 4 anlamı vardır; 3. Kararlılık, ölçülen özellikte zamana bağlı olarak değişme
1.Duyarlılık, ölçme aracının birimi ile ilgilidir. Ölçmenin meydana gelmemesi, bir özelliğin aynı ölçme aracıyla
hassasiyeti anlamına gelir. Ölçmede birim küçüldükçe farklı zamanlarda ölçülmesi durumunda aynı ölçme
sonuçlarının elde edilebilmesidir. (Test tekrar test yöntemi)
duyarlılık artar. (ÖRN: tartı-kuyumcu terazisi).
 Bir ölçme aracı her defasında aynı özelliği benzer ölçüyorsa ölçme
 Ölçme sonuçlarının duyarlılığı artarsa ölçmeye karışan hatalar azalacağı için güvenirlik artar.
sonucuna karışan hatanın az olduğu, ölçme sonuçlarının güvenilir
ÖRN: Yazılı sınav yaparken 50şer puandan 2 soru sormak; 20şer puandan 5 soru sormak?
olduğu anlamına gelir.
2.Tutarlılık, aynı özelliği farklı araçla yada farklı kişilerle 4. İç tutarlılık, bir ölçme aracının kendi içindeki
ölçülmesi sonucunda ölçme sonuçlarının benzer olması birimlerinin tutarlı sonuçlar vermesine iç tutarlılık denir.
durumuna tutarlılık denir. (Eşdeğer iki test hazırlama, testi iki  Testin iç tutarlılığı testteki soruların birbiriyle tutarlılığı, soruların
eşdeğer yarıya bölme, bütün soruların birbiriyle uyumuna bakma) birbiriyle uyumlu olması anlamına gelir.
 Ölçme sonuçlarının tutarlı olması hataların az olduğu güvenirliğin yüksek olduğu anlamına
gelir.

17 18

3
09.04.2018

Güvenirlik hesaplama (KARARLILIK)


yöntemleri Test-tekrar test yöntemi
Güvenirliğin anlamı Güvenirlik yöntemi Güvenirliği hesaplanacak test, aynı gruba belli aralıklarla iki
Duyarlılık Yöntem yok kez uygulanır. İki uygulamanın sonuçları arasındaki pearson
Kararlılık Test-tekrar test momentler çarpım korelasyon katsayısı bulunur.
Tutarlılık Eşdeğer testler
İç tutarlılık Eşdeğer yarılar Sonucun 1’e yakın olması, iki uygulamadan elde
İç tutarlılık KR-20, KR-21,Cronbach edilen puanların birbirine yakın olduğunu gösterir.
Alfa Bu değerin yüksek olduğunu söyleyebilmek için
Tutarlılık Puanlayıcılar arası 0,70’den yüksek olmalıdır.
güvenirlik
NOT: Bu güvenirlik, kararlılık anlamında güvenirliktir.

19 20

(KARARLILIK) (TUTARLILIK)
Test-tekrar test yöntemi Paralel (Eşdeğer) Formlar
İki uygulama arasındaki zaman ne çok uzun ne de çok Yöntemi
kısa tutulmalıdır. (NOT: Ortalama 20 gün (3 hafta)
tekrar test uygulamak için ideal süredir.) Farklı sorulardan oluşan fakat aynı davranışları ölçen iki
eşdeğer test aynı gruba, aynı anda yada ölçülen özellikte
Bu yöntem daha çok kısa zamanda değişmeyen bir değişme olmayacak kadar kısa bir zaman aralığı
psikolojik özellikleri ölçen testlerin güvenirliklerini
bulmak için kullanılır. bırakılarak uygulanır, iki testten elde edilen puanlar
arasındaki korelasyon katsayısı hesaplanır.
NOT: Eğitimde uygulanan testlerde başarı kısa
zamanda farklılık arz edebileceği için bu yöntemde Bulunan katsayı eşdeğerlilik katsayısı olarak bilinir. Bu
sürenin biraz daha kısa tutulması (7-10 gün) uygun katsayının yüksek oluşu her iki testin güvenirliğinin
kabul edilir.
yüksek olduğunu gösterir.
NOT: Bu güvenirlik, tutarlılık anlamında güvenirliktir.

21 22

(TUTARLILIK) (TUTARLILIK)
Paralel (Eşdeğer) Formlar Paralel (Eşdeğer) Formlar
Yöntemi Yöntemi
İki uygulamadan elde edilen puanlar arasındaki korelasyon  Test-tekrar testte araya zaman girmesi (az ya
katsayısı, iki uygulamanın ne derece tutarlı olduğunu gösterir.
Bu amaçla hesaplanan pearson çarpım momentleri da çok) ile ortaya çıkan zafiyeti gidermek için
korelasyonuna güvenirlik katsayısı (eşdeğerlik katsayısı) denir.
alternatif bir güvenirlik kestirme yöntemidir.
Korelasyon katsayisi (- 1, 00) ile (+1, 00) arasında
değişmekle birlikte, güvenirlik değeri (0) ile (+1) arasında  Pratikte iki testin eşdeğerliğinin sağlanması
değişir.
zordur. Bu zorluktan dolayı, bu yöntemle
güvenirliğin hesaplanması yoluna çok fazla
başvurulamamaktadır.

23 24

4
09.04.2018

(İÇTUTARLILIK)
İÇTUTARLILIK GÜVENİRLİĞİ Eşdeğer Yarılar (İki Yarı) Yöntemi
 Sadece bir defa uygulanan testlerin güvenirliğinin Bu yöntem bir testin bir defa uygulanmasına
hesaplanmasında kullanılır. dayalıdır.
 Testi oluşturan maddelerin birbiriyle olan uyumuna bakılır. 1. Hazırlanan test önce bir grup öğrenciye uygulanır.
Daha sonra test maddeleri ikiye bölünür.
2. Genelde tercih edilen ayırma işlemi, tek numaralı
İÇ TUTARLILIK YÖNTEMLERİ: (1,3,5,…) ve çift numaralı (2,4,6,…) maddeler
1- Yarıya bölme (Eşdeğer Yarılar) şeklinde olur. Bu iki yarı ayrı ayrı puanlanır.
2- KR 20 / KR 21 3. Her öğrencinin iki testten aldığı puan hesaplanır. İki
testmiş gibi kabul edilen bu iki yarı arasındaki
3- Cronbach-Alfa korelasyon hesaplanır.

NOT: Bulunan katsayı iç tutarlılık anlamındadır.

25 26

(İÇTUTARLILIK) (İÇTUTARLILIK)
Eşdeğer Yarılar (İki Yarı) Yöntemi Eşdeğer Yarılar (İki Yarı) Yöntemi
Tüm testin güvenirliği ise; Spearman Brown sıra farkları
korelasyon katsayısı formülüyle hesaplanır.
Elde edilen değer test yarıya bölündüğü için, testin bir
rx = testin güvenirliği
yarısının güvenirliği hesaplanmış olur.
r1,2 = iki yarı puanları
arasındaki korelasyon sayısı

DİKKAT: Yarılar arasında hesaplanan korelasyon testin


bütününün değil sadece yarısının güvenirlik katsayısıdır. ÖRN: 100 soruluk fizik testinin test yarılama yöntemiyle
İPUCU: Testin bütününün güvenirliği daima iki yarı güvenirliği 0.50 olarak bulunmuştur. Bu testin gerçek
arasında hesaplanan korelasyon katsayısından büyüktür. güvenirliği kaçtır?

27 28

Kuder Richardson / KR-20 ve KR- (İÇTUTARLILIK)


21 Formülleri KR-20 Güvenirliği
Kuder ve Richardson tarafından bulunan iç tutarlılık güvenirliğini KR-20 güvenirlik katsayısı formülü:
hesaplamak için kullanılan formüllerdir. Bu formüllerle elde edilen
katsayı yüksekse; test maddeleri birbirleriyle tutarlıdır, uyumludur,
korelasyonu yüksektir. Yani test içinde ilgisiz, hatalı soru
bulunmamaktadır.
K: testte bulunan madde sayısı
p: madde güçlük indeksi
Kullanım koşulları;
q: 1-p
1.Testin ölçtüğü özellik açısından homojen olması (yani aynı özelliği S2x : test puanları dağılımı varyansı (standart sapmanın karesi)
ölçüyor olması) ve madde güçlük indeksinin belirli olması,
2.Testteki soruların ikili puanlanması (doğruysa 1, yanlışsa 0 şeklinde) NOT: Ağırlıklı / çoklu puanlanabilen maddelerden oluşan veya şans başarısı
gerekir. için puanları düzeltilmiş bir test için kullanılması uygun değildir.
DİKKAT: Eğitimde çoktan seçmeli testler, doğru-yanlış testleri, kısa cevaplı
testlerde kullanılabilir.

29 30

5
09.04.2018

(İÇTUTARLILIK) (İÇTUTARLILIK)
KR-21 Güvenirliği KR-21 Güvenirliği
KR-21, KR-20’nin özel bir hali gibidir. Madde KR-21 güvenirlik katsayısı formülü: KR-20 formülü:
güçlük indekslerinin hesaplanamadığı durumlarda
testteki tüm maddelerin güçlük derecelerinin birbirine
yakın ya da eşit olduğu varsayımıyla bu formül
kullanılır. K: testte bulunan madde sayısı
X: test puanlarının aritmetik ortalaması
Madde güçlük indeksleri bilinmediğinde testin S2x : test puanları dağılımı varyansı (standart sapmanın karesi)
aritmetik ortalamasına dayalı olarak hesaplanır.
NOT: KR-21 her zaman KR-20’den küçüktür ve güvenirliğin alt sınırıdır. Bunun
İPUCU: Madde güçlük indekslerinden nedeni; testi oluşturan madde güçlükleri arasındaki farklılıklara duyarlı
bahsedilmemiş testin ortalamasından söz ediliyor ve olmamasıdır.
güvenirlik hesaplama yöntemi soruluyorsa cevap KR- Sadece testteki tüm soruların güçlük düzeyi eşitse, KR-20 KR-21e eşit olur.
21 yöntemidir.
31 32

(İÇTUTARLILIK) (İÇTUTARLILIK)
KR-20 ve KR-21 katsayısı Cronbach ALFA Yöntemi
yorumu;
Cronbach-alfa güvenirlik hesaplama
KR-20 ve KR-21 katsayıları yüksek ise;
yöntemi de, KR-20’nin özel bir hali gibidir.
Puanlamanın 1-0 dışında olduğu
* Uygulanan test hatalardan arınıktır. durumlarda (Örn: dereceleme ölçeğine
* Testi oluşturan maddeler homojendir. göre hazırlanmış ölçekler, kısa cevaplı
* Ölçülen değişken tek boyutludur. testler) güvenirlik tahmini için kullanılır.
* Grup heterojendir.
* Testin yapı geçerliği yüksektir. NOT: Psiko-motor becerilerin ve tutum ölçeklerinin
puanlanmasında dereceleme ölçeği kullanılır.

33 34

(İÇTUTARLILIK)
(TUTARLILIK)
Cronbach ALFA Yöntemi
Puanlayıcılar arası güvenirlik
Cronbach alfa güvenirlik katsayısı formülü:
 Bazı durumlarda birden çok puanlayıcı,
puanlama yapabilir (Örn: bir resmin puanlanması,
spor bilimleri sınavında performansın puanlanması, bir
yazılı yoklamanın okunması)
K: testte bulunan madde sayısı
Bu noktada karşımıza puanlayıcı güvenirliği
S2j : madde varyansı
S2x : test puanları dağılımı varyansı çıkar. O da, birden fazla puanlayıcının farklı
bireylere vermiş oldukları puanlar arasındaki
tutarlılığın derecesidir.

35 36

6
09.04.2018

(TUTARLILIK)
Ölçmenin Standart Hatası
Puanlayıcı güvenirliği
Ölçmecinin objektif/tarafsız olması, kişisel amaçlarından ve
duygularından uzak durması ve tarafsız davranması Güvenirlik katsayısı hangi yöntemle hesaplanırsa
puanlayıcı güvenirliğini artırır. hesaplansın bir güvenirlik katsayısıdır.
(Hatırlatma: güvenirlik asla korelasyon gibi eksi (–) değer almaz.)
Puanlamada objektifliği sağlamak için;
Güvenirlik katsayısının 0,95 olması demek ölçme
 Birden fazla gözlem yaparak sonuçların ortalamasını
almak.
sonuçlarının gerçek puana yakın olduğu yada ölçme
sonucuna karışan hataların az olduğu anlamına gelir.
Birden fazla kişinin gözlemlerinin ortalamasını almak.
(Ölçme sonuçlarının %95 doğru, %5 yanlış olduğu anlamına
Cevaplandırma anahtarıyla puanlama yapmak. kesinlikle gelmez).

Gerçek puan= Ölçme sonucu + Standart hata


37 38

Ölçmenin Standart Hatası Ölçmenin Standart Hatası


 Ölçülen özelliğin gerçek değeri ile gözlenen değeri arasındaki Hesaplanan standart hataya dayalı olarak gerçek puan tahmin edilir.
farkın yani yapılan hatanın miktarıdır. Test puanlarına karışan hatanın yönü bilinmediği için gerçek puan
(Gerçek puan= Ölçme sonucu + Standart hata) bir aralık olarak hesaplanır.
 Ölçmenin standart hatası hesaplanarak gerçek puan
bulunabilir. %68 olasılıkla: öğrencinin puanı ±1 Se
 Standart hatanın formülü: %95 olasılıkla: öğrencinin puanı ± 2 Se
%99 olasılıkla: öğrencinin puanı ± 3 Se

Se : Standart hata
S: Standart sapma
rx: Testin güvenirlik katsayısı

SORU: Güvenirlik katsayısı 0,75 olan bir testin, standart sapması 4


ise ölçmenin standart hatası kaçtır?
39 40

Ölçmenin Standart Hatası Ölçmenin Standart Hatası


SORU: Güvenirlik katsayısı 0,75 olan bir testin, standart sapması 4 ise bu SORU: Güvenirlik katsayısı 0,75 olan bir testin, standart sapması 4 ise bu
testten 70 puan alan bir kişinin puanı %68, %95 ve %99 olasılıkla kaçtır? testten 70 puan alan bir kişinin puanı %68, %95 ve %99 olasılıkla kaçtır?

Se : Standart hata
S: Standart sapma
rx: Testin güvenirlik katsayısı

%68 olasılıkla: öğrencinin puanı ± 1 Se = 70 ± 2


%95 olasılıkla: öğrencinin puanı ± 2 Se = 70 ±4
%99 olasılıkla: öğrencinin puanı ± 3 Se = 70 ± 6

41 42

7
09.04.2018

Ölçme Aracının Güvenirliğini Ölçme Aracının Güvenirliğini


Arttırmak İçin Alınması Arttırmak İçin Alınması Gereken
Gereken Önlemler-1 Önlemler-2
 Bir testteki soru sayısının artması aracın  Öğrencilerin, sınavı cevaplamaya motive
duyarlılığını arttıracağından güvenirlik artar. edilmesi, öğrencilerin gerçek bilgilerini
 Soruların açık ve anlaşılır bir dille yazılması
güvenirliği artırır. yansıtmalarını sağlayacağından güvenirliği
 Sınav süresinin uygun olarak verilmesi gerekir. arttırır.
 Soruların zorluk seviyesinin orta düzeyde olması  Sınavın puanlamasının objektif olması
gerekir.
güvenirliği artırır.
 Testteki soruların dil seviyesinin, herkesin
anlayabilmesi için uygulanacak grubun dil  Sınav ortamının, ısı ve diğer koşulların uygun
seviyesinin altında olması gerekir. bir şekilde düzenlenmesi güvenirliği arttırır.
43 44

Ölçme Aracının Güvenirliğini


Arttırmak İçin Alınması Gereken KPSS- 2001
Önlemler-3 Aşağıdakilerden hangisi testin güvenirliğini
düşürücü bir etken değildir?
 Sınavda kaç soru bulunduğu, sınavın nasıl
puanlanacağı gibi özelliklerin yönergeyle A) Cevaplama süresinin kısa olması
öğrencilere verilmesi, güvenirliği artırır. B) Sorularda yoruma açık ifadeler kullanılması
 Soruların teste konuluş sırası da güvenirliği artırır. C) Puanların bir puanlayıcıdan diğerine
Sınav kolay sorularla başlarsa öğrencinin değişebilmesi
motivasyonu artacağından güvenirlik artar.
 Testin yapısı, yazı karakteri büyüklüğünün teste
D) Puanlama şeklinin öğrenciye önceden
bildirilmesi
girecek grubun uygun olması güvenirliği artırır.
E) Soruların çok zor olması
 Şans başarısının azalması güvenirliği arttırır.
 Öğrencilerin sınava karşı tutumları güvenirliği
etkiler.
45 46

Geçerlik Geçerlik Türleri


Geçerlik: Bir ölçme aracı veya yönteminin onunla 1. Kapsam Geçerliği
ölçülmek istenen değişkeni ölçüp ölçmediği;
ölçebiliyorsa onu başka değişkenlerden ne derece 2. Bir Ölçüte Dayalı Geçerlik
arınık olarak ölçtüğüdür. a) Yordama Geçerliği
Geçerlik, bir ölçme aracının ölçme amacına hizmet b) Uygunluk (Uyum) Geçerliği
etme derecesi olarak tanımlanır. (Örn: Metre ile
ağırlık ölçmek) c) Ölçüt Grup Geçerliği
3. Yapı Geçerliği
Güvenirlik kestirme yöntemlerinde puanların birbirine 4. Görünüş Geçerliği
benzerliği yani tutarlılığı üzerinde durulurken,
geçerlikte ise ölçme aracının ne ölçtüğü yani içerik
önem kazanır.
47 48

8
09.04.2018

Geçerlik Türleri Kapsam Geçerliği


Kapsam geçerliği: Bir ölçme aracının ölçülmek Kapsam geçerliğinin sağlanması ve
istenen konu, ünite ya da davranışları kapsama belirlenmesi için kullanılan yöntemler ;
derecesidir.  a) Uzman kanısına başvurma: Testte yer alan her
Kapsam geçerliğini bozan durumlar; sorunun bu konuda uzman olan kişilere verilerek
1.Konu kapsamındaki davranışları yeterince örnekleyememesi, (örn: ölçme ve onlardan, soruların ölçülmek istenen davranışları
değerlendirme dersi finalinde sadece temel kavramlardan soru sorulması) kapsama derecesini belirtmeleri istenir. Konu alanı
2.Sorunun konu kapsamında ölçülecek bir davranışın dışında başka bir
davranışı ölçmesi, (örn: temel kavramlar konusundan sınav yaparken, ölçme aracında
uzmanlarının yargılarına dayanarak karar verilir.
bulunması gereken nitelikler konusundan da soru sorulması)
 b) Belirtke tablosu: Ölçme araçları geliştirme
3.Konu kapsamında olduğu halde ölçülmek istenmeyen bir davranışı ölçmesi
(örn: ölçmede temel kavramlar konusunda sıcaklığın birimini sormak – kritik davranışlar) sırasında kullanılır. Sütunlarda hedef-davranış,
4.Konu kapsamında yer alan ve ölçme konusu olan davranışı ölçememesi (Örn: satırlarda ise içerik vardır.
kritik davranışın ölçülememesi – sorular var ama ölçemiyor)
49 50

Kapsam Geçerliği Bir ölçüte dayalı geçerlik


 c) Aynı kapsamı ölçen başka testlerle korelasyon: Bir ölçüte dayalı geçerlik: Bir testin geçerli
Eğer elimizde kapsam geçerliği belirlenmiş bir olduğunu ortaya koymak için, başka testler ya da
test varsa, bu teste dayanarak başka bir testin ölçme sonuçları ölçüt olarak kullanılır. Ve bu
kapsam geçerliğini belirleyebiliriz. araçların korelasyonuna bakılır.
Bu tip geçerlik kestirme yolu üç başlık altında
 d) Kapsam geçerliği indeksinin hesaplanması: incelenebilir:
Yine uzman görüşüne dayalı bir yöntemdir. Ölçek a) Yordama Geçerliği: ölçüt olarak kullanılacak ölçüt puanlar geçerliği kanıtlanacak
ve bir değerlendirme formu, alan uzmanlarına test puanlarından daha sonraki bir zamanda elde edilir. (Örn: KPSS-Müfettiş puanları)
b) Uygunluk (Uyum) Geçerliği: Ölçüt olarak kullanılacak puanlar hali hazırda elimizde
(en az 5 en fazla 40) gönderilir. Uzmanların vardır. (Örn: Lisans ders notları-KPSS)
verdikleri cevaplara göre kapsam geçerlik indeksi c) Ölçüt Grup Geçerliği: Ölçüt olarak kullanılacak bir grup seçilir ve puanlar
karşılaştırılır. (Örn: Matematik testi => Matematik grubu ve Fen grubu)
hesaplanır.
51 52

Yapı Geçerliği Görünüş Geçerliği


Testte ölçülmek istenen özellik bir yapıdır ve Bir test ile ölçülmek istenen özelliği ölçüyor
kendi içinde ilişkili öğelerden oluşur. Bu öğeler ise görünmesine görünüş geçerliği denir.
testin maddeleridir.
Yapı geçerliği, testteki soruların birbiri ile
ilişkili olmasını aynı özelliği ölçüyor olmasını ifade Not: Kapağında ölçtüğü özelliğin adı yazılı
eder. olan bir test görünüş geçerliğine sahiptir.
Testin maddelerinin birbiriyle ilişkili (yani
homojen) olması testin yapı geçerliğinin olduğu
anlamına gelir.

53 54

9
09.04.2018

Geçerliği Etkileyen Faktörler GEÇERLİK ve GÜVENİRLİK


 Güvenirliği düşük olan bir testin geçerliği de düşük olur. 1. Güvenirlik geçerlik için ön koşuldur.
 Madde sayısının artması testin özellikle kapsam geçerliği etkileyecektir. (Eğer ölçme sonuçları hatalıysa o test ölçme amacına
 Sınavda kopya çekilmesi geçerliği düşürür. hizmet edemeyeceği için geçerli de olmaz)
 Sabit ve sistematik hatalar geçerliği düşürür.
 Ölçmede yapılan yanlılıklar geçerliği düşürür. 2. Güvenirlik geçerliği garanti etmez.
 Sınav süresinin gereğinden kısa olması kapsam geçerliğini düşürür. (Bir testin güvenilir olması geçerli olacağı anlamına
 Maddelerin güçlük düzeyi geçerliği etkiler. gelmez. Örn: matematik testi- ölçme dersi)
 Soruların ayırt ediciliğinin düşük olması geçerliği düşürür.
 Sınavdan önce soruların öğrencilere verilmesi/soruların derste çözülmesi geçerliği 3. Geçerli olan test güvenilirdir.
düşürür.
 Diğer sorulardaki yada soru kökündeki ipucu geçerliği düşürür.
(Bir testin geçerli olabilmesi için güvenilir olması şarttır. O
 Maddenin ölçülmek istenen değişkeni ölçmemesi, geçerliği düşürür.
zaman bir testin geçerli olduğu söyleniyorsa
55
güvenilirdir.) 56

Kullanışlılık
Araç veya yöntemin uygulanabileceği
eğitim seviyesi, uygulama süresi, ölçmeciden
istediği beceriler, ölçme aracının hazırlanması,
uygulanması, puanlanması ve maliyeti gibi
etkenler bakımından hazırlayana uygulayana
uygulanana puanlayana sağladığı kullanım
kolaylıkları bütününe kullanışlılık denir.

Anahtar Kelimeler: Ekonomiklik, Puanlanabilirlik, Uygulanabilirlik

57

10

You might also like