You are on page 1of 77

ÖLÇME ARAÇLARINDA BULUNMASI İSTENEN ÖZELLİKLER

1. GEÇERLİK(Amaç)

• -1,00 / +1,00 arasındadır.


• Amaca uygunluk/hizmet
• Ayırıcılık. (Bilenin yüksek, bilmeyenin düşük alması)
• Ölçmek istenen özellik dışında başka özellikleri karıştırmamak.

2. GÜVENİRLİK(Sonuç)

• 0,00 / +1,00 arasındadır.


• Tesadüfi hatalardan arınıklık demektir.
• Güvenirlik ile tesadüfi hata arasında negatif korelasyon bulunur.
• Güvenilirliğin 5 anlamı: Tutarlılık, iç tutarlılık, objektiflik, duyarlılık, kararlılık
3. KULLANIŞLILIK(Ekonomiklik)

hazırlanmasının, zaman
Ölçme aracının uygulanmasının, az emek istemesidir.
puanlanmasının, para

• (Ekonomiklik = kolaya kaçmak)


• 40 soru yerine 10 soru hazırlamak, 5 seçenek yerine 2 seçenek koymak.
AŞAĞIDAKİ ÖRNEKLERDE GEÇERLİK ÇALIŞMASI MI GÜVENİRLİK ÇALIŞMASI MI
YAPILMIŞTIR?

EDEBİYAT TESTİ ŞİZOFRENİ ÖLÇEĞİ

SÖZELCİLER SAYISALCILAR HASTALAR SAĞLIKLILAR

SINAV ÖNCESİNDE

IŞIK-SES-NEM-KOKU-HAVALANDIRMA-OTURMA DÜZENİ
  -Güvenirlik,
geçerlik için bir ön koşuldur fakat yeterli değildir. Güvenilir her test geçerli
sonuçlar vermeyebilir.
-Geçerli bir test güvenilirdir.
-Güvenirliği düşüren her faktör geçerliği de düşürür.
-Geçerliği düşüren her faktör güvenirliği düşürmez.
-Güvenirlik, geçerliği sınırlandırır. Geçerlik katsayısı güvenirliğin karekökünü aşamaz.

Maksimum Geçerlik =
 ÖRNEK
Güvenirlik 0,81 ise geçerlik kaç olabilir?
Max geçerlik = =
0,80
0,70
0,91
0,67

ÖRNEK
Güvenirlik 0,49 ise geçerlik kaç olabilir?
Max geçerlik = =
0,70
0,60
0,80
0,75
Ölçme araçlarının güvenirlik ve geçerlikleri arasındaki
ilişki ile ilgili olarak aşağıda verilen bilgilerden hangisi
yanlıştır?

A) Güvenirlik, geçerlik için ön koşuldur.


B) Bir testin geçerliği yüksek ise güvenirliği de belli ölçüde
yüksektir.
C) Sabit hatalar güvenirliği etkilemezken geçerliği olumsuz
yönde etkilerler.
D) Güvenirlik düzeyi yüksek ise geçerlik düzeyi de yüksektir.
E) Bir ölçme aracının geçerlik katsayısı, güvenirlik katsayısının
karekök değerini geçemez.
Aşağıdaki ifadelerden hangisi doğrudur?

A) Geçerlik 0,00 ile +1,00 arasında değer alır.


B) Geçerlik, güvenirlik için ön koşuldur.
C) Güvenilir bir araç kesinlikle geçerlidir.
D) Geçerli bir araç güvenilirdir.
E) Güvenirlik –1,00 ile +1,00 arasında değer alır.
1. GÜVENİRLİK (0,+1)
Ölçme sonuçlarının tesadüfi hatalardan arınıklık derecesidir.
• 0 ile +1 arasında değer alır.
• 0,70 değeri sınır kabul edilir.

• r ile gösterilir.
• Güvenirlik birden çok anlama gelir.
GÜVENİRLİĞİN ANLAMLARI
KARARLILIK
Ölçme sonuçlarının zaman içinde değişmemesidir.

TUTARLILIK(EŞ DEĞERLİK)
Art arda uygulama sonuçlarının benzer olmasıdır.
İÇ TUTARLILIK
Test içindeki maddelerin birbiriyle uyumlu olmasıdır.
Benzer davranışlar
Aynı konu
Homojenlik
Benzeşik olmak

Daha çok psikolojik testlerde önemsenir.

İç tutarlılıktaki artış kapsam daralmasına yol açar.


DUYARLILIK

Hassasiyet, detaycılık, ayrıntıyı ölçmek anlamına gelir.


A = 100 mm
A, B’ye göre daha ayrıntılıdır.
B = 10 cm

• 100’lük sistem 5’lik sisteme göre daha ayrıntılıdır.

• Birim boyunu küçültüp birim sayısını arttırmak duyarlılığı arttırır.

10 cm → 100 mm

• Soru sayısını arttırmak duyarlılığı arttırır.


ÖRNEK

1. test: 10 soru vardı. 40 soru ekledik. Toplam 50 soru oldu.

2. test: 100 soru vardı. 100 soru ekledik. Toplam 200 soru oldu.

Hangi test de duyarlılık daha çok arttı?

Hangi test son durumda daha duyarlıdır?


OBJEKTİFLİK
Ölçme sonuçlarına kişisel kanaatlerin karışmamasıdır.
OBJEKTİFLİĞİ ARTTIRMA YOLLARI

• Puanlama esnasında öğrenci isimlerini gizlemek


• Kişi kişi değil soru soru puanlama yapmak
• Cevap anahtarı veya rubrik kullanma
• Başkasına da puanlatıp karneye ortalamayı verme. (Puanlayıcı güvenirliği)

• Tekrar puanlayıp karneye ortalamayı verme. (Puanlama güvenirliği)


Aşağıdakilerden hangisi güvenirlik anlamına gelmez?

A) Kararlılık
B) Tutarlılık
C) İç tutarlılık
D) Gerçeklilik
E) Duyarlılık
Bir testin araya belli bir zaman konulduktan sonra tekrar
uygulanması test sonuçlarının ---- anlamı hakkında bilgi verirken.
Bir testteki maddelerin birbiriyle uyumu ---- hakkında bilgi verir.

Yukarıdaki boşluklara sırasıyla hangi kelimeler gelmelidir?

A) Kararlılık – İç tutarlılık
B) Tutarlılık – Kararlılık
C) İç tutarlılık – Kararlılık
D) Kararlılık – Tutarlılık
E) Objektiflik – İç tutarlılık
GÜVENİRLİĞİ BELİRLEME YOLLARI
1. TEST TEKRAR TEST YÖNTEMİ
Aynı testin, aynı öğrenci grubuna, benzer şartlarda bir süre sonra tekrar uygulanmasıdır.

• ……………………anlamında güvenirlik araştırılır.


• …………uygulamalı bir yöntemdir.
• En önemli hata kaynağı zamandır.
• Uygulamalar arasında koyulan zaman kısa olursa ……………. riski ortaya çıkar, uzun
olursa özellik değişir veya bireylerde yeni yaşantılar oluşabilir.
• Ortam şartları birbirine .............. olmalıdır.
• Daha çok ………………………özellikleri ölçen testlerde tercih edilir.
• Bilişsel testlerde değişim riski yüksektir. Ancak duyuşsal testlerde değişim
riski daha az olduğundan daha kararlıdır.
2. PARALEL(EŞ DEĞER) FORMLAR YÖNTEMİ
Birbirine benzer iki testin aynı öğrenci grubuna benzer şartlarda uygulanmasıdır.

• …….. uygulamalı bir yöntemdir.


• A testi ile B testi özdeş olmalıdır. (Kapsam, İstatistikler)
• ……………………….anlamında güvenirlik verir.
• Testlerin özdeş olmalarını sağlamak zordur.
• …………………… problemi olmadığı için bilişsel testlerde uygulanabilir.
• Ortam şartları denkleştirilmelidir.
• Eğer uygulamalar arasına zaman koyulursa ………………anlamında güvenirlik elde edilir.
3. TESTİ YARILAMA YÖNTEMİ
Bir testin öğrenci grubuna uygulandıktan sonra ikiye bölünmesidir.
10
SORU

-1-0
-Likert
-Kompozisyon

5 5
SORU SORU

• …… uygulamalıdır. …………………..araştırılır.
• Buradan elde edilen korelasyon testin tamamını değil yarısının güvenilirliğini verir.

Testin tamamının güvenilirliği formülü ile bulunur.


Yarı test güvenilirliği 0,60 olan bir testin tamamının güvenilirliği kaçtır?

40 soruluk bir testin güvenilirliği 0,60’tır. Bu teste 40 soru daha eklersek güvenirlik kaç olur?

A) –0,10
B) 0,60
C) 0,75
D) 1,20
4. FORMÜLLERLE İÇ TUTARLILIK BELİRLEME
KR-20 / KR-21 / Alfa katsayısı formülleriyle güvenirlik belirlenebilir.

Ortak yönleri
• Tek uygulamalı yöntemlerdir.
• İç tutarlılık (madde – madde)
• %90 cevaplanma zorunluluğu (boş bırakanlar az olmalı)
Bu değerleri yüksek bulursak (0,70↑)

• İç tutarlılık yüksektir.
• Sorular homojendir.
• Sorular benzeşiktir
• Aynı (benzer) alandan sorulmuştur.
• Kapsam dardır.
• Test tek boyutludur.
• Güvenirlik yüksektir
• Test tesadüfi hatalardan arınıktır.
• Öğrenciler heterojendir.
Bu özel durum gerçekleşirse KR-20 = KR-21 olur. Bunun dışındaki tüm durumlarda KR-20
daha yüksek bulunur.
Selen Öğretmen, hazırlamış olduğu 30 soruluk testi iki eş parçaya ayırmış ve bu parçalardan elde edilen skorlar
arasındaki korelasyonu hesaplamıştır.

Selen Öğretmen’in kullanmış olduğu güvenirlik belirleme yöntemi aşağıdakilerden hangisidir?

A) Test – tekrar test


B) Eşdeğer formlar
C) KR – 20
D) Testi yarılama
E) Puanlama güvenirliği
I. KR-20 güvenirliğin alt sınırıdır.
II. KR-21 değeri KR-20 değerinden büyük çıkar.
III. Madde analizi yapılamadığı durumlarda KR-21 kullanılır.

KR formülleri ile ilgili olarak verilen bilgilerden hangisi veya hangileri doğrudur?
A) Yalnız I
B) Yalnız III
C) I ve II
D) I ve III
E) I, II ve III
İç tutarlık belirleme yöntemleri ile ilgili olarak aşağıda verilenlerden hangisi doğrudur?

A) KR-20 yönteminde testteki güçlükler birbirine yakın olmalıdır.


B) KR-20 ile KR-21 birbirine eşit olamaz.
C) 1 – 0 tipi testlerde KR-20 ile Cronbach Alfa yaklaşık aynı sonuçları verir.
D) KR-20 güvenirliğin alt sınırıdır.
E) Cronbach Alfa özellikle 1-0 şeklinde puanlanan testler için uygundur.
Beren Öğretmen, hazırlamış olduğu başarı testini aynı sınıfa beş ay arayla iki kere uygulamıştır.
İki uygulama sonuçları arasındaki korelasyon katsayısı 0.13 çıkmıştır.

Bulunan değerin düşük çıkmasının en önemli sebebi aşağıdakilerden hangisidir?

A) Öğrencilerin ilk uygulamadaki cevaplarını hatırlamaları.


B) Uygun güvenirlik belirleme yönteminin tercih edilmemiş olması.
C) Test sonuçlarına sabit hata karışmış olması.
D) Ölçülen özelliğin, bu süreçte değişime uğramış olması.
E) Sınavda objektif bir puanlamanın yapılmış olması.
ÖLÇMENİN STANDART HATASI
Ölçme sonuçlarına karışan tesadüfi hataların bir ölçüsüdür. Eğitimde sınır değerlerde kalan öğrencileri yorumlarken
kullanılır.
Sem: Standart hata
Sx: Standart sapma
r: Güvenirlik

Sem’i yüksek istiyorsak ………………………..


Sem’i düşük istiyorsak…………………………..
Hangisine karışan hata miktarı en fazladır?

KR-20 - Sx
A) 0,36 8
B) 0,36 6
C) 0,64 4
D) 0,75 2
Gerçek Puan Aralığını Hesaplama

Örnek
Standart hata = 4
Mehmet 60 aldı.
Mehmet’in gerçek puanını tüm olasılıklarla bulalım.

%68(…..hata payı)
%95(…..hata payı)
%99(…..hata payı)
KR-20 = 0,75
Sx = 6

Ece bu testten 70 almıştır. Ece’nin gerçek puanı %5 hata payı ile hangi aralıktadır?
Aşağıda bir sınıfa uygulanan 5 farklı teste ait Cronbach Alpha katsayıları ile standart sapma
değerleri verilmiştir.

Cronbach alfa Standart sapma


I. 0,19 9
II. 0,49 6
III. 0,81 2
IV. 0,19 5
V. 0,64 7

Buna göre standart hata miktarı en çok ve en az olan testler aşağıdaki seçeneklerin
hangisinde birlikte verilmiştir?

A) I ve II
B) I ve III
C) IV ve V
D) II ve IV
E) II ve III
Güvenirlik katsayısı 0,64, standart sapması 10 olan bir sınavdan 60 alan bir öğrencinin
gerçek puanı % 99 ihtimalle hangi aralıktadır?

A) 54 – 66
B) 57 – 63
C) 48 – 72
D) 42 – 78
E) 51 – 69
GÜVENİRLİĞİ ARTTIRMA YOLLARI

• Soruları açık, net ve anlaşılır yazmak.


• Soru sayısını arttırmalıyız. (Abartmadan)
• Sınav süresi yeterli olmalıdır.
• Teste yönerge eklenmelidir.
• Sınav ortamı düzenlenmelidir.
• Puanlama objektif yapılmalıdır.
• Test orta zorlukta olmalıdır.
• Sorular homojen ve ayırıcı nitelikte olmalıdır.
• Öğrencileri motive etmek.
• Soruları kolaydan zora dizmek.
• Öğrenciler heterojen ve çok sayıda olmalıdır.
• Kopya ve şans başarısı engellenmelidir.
ŞANS BAŞARISI
Seçeneklerden birini atıp tutturmak.

Azaltma Yöntemleri
-
-
-
Aşağıdaki seçeneklerden hangisi güvenirliği arttırmak için yapılması gerekenlerden biri
değildir?

A) Soruların birbiriyle uyumlu olması


B) Testin ortalama güçlüğünün 0.50 civarında olması
C) Soruların genel olarak zor seviyede tercih edilmesi
D) Sınav süresinin yeterli verilmesi
E) Düzeltme formülü kullanılması
Aşağıdakilerden hangisi güvenirliği arttırıcı yönde etki gösterir?

A) Soruların madde güçlük düzeyinin yüksek olması.


B) Öğrencilerin heterojen nitelikte olması.
C) Soruların farklı anlamlara gelebilecek bir dille yazılmış olması.
D) Sınav süresinin gereğinden fazla verilerek öğrenci motivasyonunun arttırılması.
E) Düzeltme formülü kullanılmaması.
GEÇERLİK (-1,+1)
Ölçme aracının hazırlanış amacına uygun sonuçlar vermesidir.
• Ölçme aracının sahip olması gereken en önemli özelliktir.
• (-1,00) ile (+1,00) arasında değişir.
• 0,30 değeri kritiktir.
• Bir derece sorunudur. Ya hep ya hiç sorunu değildir.
• Geçerliğin var, yok gibi kelimelerle değil düşük, orta, yüksek kavramlarıyla ifade
edilmesi daha doğrudur.
GEÇERLİK TÜRLERİ
Kapsam (İçerik) Geçerliği
Bir testin hazırlanmış olduğu konu alanını (evreni) yeterli ve dengeli bir şekilde
örneklemesi / temsil etmesidir.

• Her konudan soru sorulmalıdır.


• Önemli konulara ağırlık verilmelidir.
• Konu dışından soru sorulmamalı.
• Her soru ölçmek istediği özelliği gerçekten ölçmelidir.
(İşini yapmalı)

Okul testlerinde istenen (en önemli) geçerliktir. (İzleme, başarı)


KAPSAM GEÇERLİĞİ BELİRLEME YOLLARI
Belirtke Tablosu
• En etkili yöntemdir.
• Uygulama gerektirmez.
• Kapsam geçerliğini arttırma konusunda da yardımı olabilir.
• Hazırlanmasında uzmanlardan destek alınabilir.
Uzman Görüşü
Uzman veya uzmanlardan görüş almadır. Uzmanların fikirleri kapsam geçerliği hakkında
bilgi verecektir.
İstatiksel Yol
Önceden kapsam geçerliği ispat edilmiş bir test ile yeni geliştirilen test kıyaslanır.

Kapsam geçerliği Kapsam?


Yüksek
ÖLÇÜT GEÇERLİĞİ
Bir testin geçerliğini belirlerken başka bir puanı ölçüt olarak kullanmaktır.
Yordama (tahmin) geçerliği
Bir testin gelecekteki başarıyı ya da başarısızlığı bugünden tahmin edebilmesidir.

Yordayıcı Ölçüt
LGS Lise başarısı
KPSS Öğretmenlik meslek başarısı
YKS Üniversitedeki akademik ortalaması
İşe giriş sınavı İş performansı
Uygunluk (Uyum/zamandaş) geçerliği

Ölçüt puan geçmişten ya da aynı zaman diliminden seçilir.

Taktik
Testleri sırasıyla yaz. Hangi testi soruyorsa üzerini kapa ve kalan kısma bak.

Görünen kısım gelecekse yordama geçerliği


Görünen kısım geçmişse uyum geçerliği
Örnek:

LGS sonuçları ile bu sınava hazırlıkta kullanılan deneme sınavı sonuçları kıyaslansın.

LGS için hangi geçerlik?

Deneme sınavı için hangi geçerlik?


“Bu testten yüksek puan alan doktor adayları ileri de çok iyi doktorluk yapacaklardır.” diyen bir
uzman geliştirdiği testin hangi özelliğinin yüksek olduğunu
vurgulamaktadır?

A) Görünüş geçerliği
B) Yordama geçerliği
C) Duyarlılık
D) Yapı geçerliği
E) Kapsam geçerliği
Bir Tarih öğretmeni, tarih testi hazırlamıştır. Daha önceden aynı alanla ilgili bir uzman
tarafından hazırlanmış ve geçerlik – güvenirlik çalışmaları yapılmış bir test ile kendi testini
sınıfa uygulamıştır. Her iki testin sonuçlarının yüksek pozitif korelasyon gösterdiğini görmüştür.
Buna göre yeni hazırlanan tarih testinin hangi özelliğinin yüksek olduğu kesinlikle
söylenebilir?

A) Yapı geçerliği
B) Yordama geçerliği
C) Uygunluk geçerliği
D) Kararlılık
E) Tutarlılık
Personel alımında kullanılan Mesleki Yeterlik Envanteri’nin yordama geçerliğine
dair kanıt sağlamak için bireylerden elde edilecek aşağıdaki bilgilerden hangisi
uygun bir ölçüttür? (2016)
A) Lisans ortalamaları
B) İşe alındıktan sonraki performansları
C) Kişilik özellikleri
D) Önceki iş performansları
E) Zekâ düzeyleri
Bir firmaya eleman almak amacıyla yapılan bir sınav için, “Oldukça geçerli bir sınav
yapıldı.” Diyen bir uzman sınavın hangi özelliğini ifade etmektedir? (2006)
A) Zor olduğunu
B) Adayların yeteneklerine uygun olduğunu
C) Objektif olduğunu
D) Kolay olduğunu
E) İşteki başarıyı yansıtacak yapıda olduğunu
 3.Görünüş Geçerliği
Bir testin ölçmek istediği özelliği ölçüyor gibi görünmesidir. Kapak ve içerik uyumudur.

Bir matematik sorusunu “ = ?” şeklinde sorarsak görünüş geçerliği yüksek olur ancak aynı
soruyu “karekök on altı kaçtır?” şeklinde sorarsak görünüşü Türkçe sorusuna benzediği
için görünüş geçerliği düşük olur.

Görünüş geçerliğini çalışmaları veli ve öğrenci görüşlerini anket vasıtasıyla alınarak da


yapılabilir.
Görünüş geçerliği bazı psikolojik testlerde (özellikle kişilik testlerinde) bilerek
düşürülür. Bu düşürme testin kapağının değiştirilmesiyle olur. Bu uygulamanın amacı
cevaplayıcının yanıtlarını manipüle etmesinin önüne geçmek yani bireylerin
hissetmedikleri yanıtları vermesini engellemektir.
4. Sonuçsal Geçerlik
Test sonuçlarının öğrenme üzerinde etkili olmasıdır.

• Özellikle çağdaş yaklaşımlar ölçmenin öğrenme süreciyle aynı anda yapılması


gerektiğini savunurlar.
5. Yapı Geçerliği
Yapı: Birbiriyle ilişkili ögelerin oluşturduğu örüntüdür (bütündür). Soyut ve teoriktir.
Yapı geçerliği: Ölçme aracının ölçmek istediği kuramsal yapıyı araya başka özellikler
karıştırmadan ölçmesidir.

• Yapı geçerliği geçerliğin ta kendisidir.


Örnek:

Saldırganlık davranışını ölçmek için geliştirilmiş olan bir test küfür etme, yumruk atma,
kızma ve bağırma gibi davranışları ölçüyorsa yapı geçerliği yüksek olur. Yapı geçerliğinin
yüksek olması için iç tutarlılığın da yüksek olması önemlidir.

Saldırganlık davranışını ölçmek için geliştirilmiş olan bir testte ben dili kullanma, analitik
düşünme ve çözüm odaklı hareket etme gibi özellikle ölçülmüşse yapı geçerliğinin
düşük olduğu söylenebilir. Yani yüksek yapı geçerliği için kullandığımız sorular birbiriyle
ilişkili ve aynı zamanda ölçülmek istenen teorik yapıyla ilişkili olmalıdır.

Yapı geçerliği sorularını kolaylıkla çözebilmek için ayırıcılık kavramına odaklanmak


gerekir. Çünkü bilenle bilmeyenin ayrımı yapı geçerliğini yükseltir.(Geçerliğin ta kendisinin
yapı geçerliği olduğunu söylemiştik, geçerlik de ayırıcılıkla doğrudan ilişkilidir.)
Ayırıcılığı düşüren durumlar:

12/3 = ?

• 12/3 gibi bir bölme işleminin sorulduğu bir soruda şıklarda 4 varsa öğrenci 3 ile 4 ü
çarpıp 12 elde eder. Ancak bu durumda öğrenci bölmeyi değil çarpmayı kullanmış
olacağından bölme bilenle bilmeyen ayrılamaz. O yüzden şıklar silinmeli test açık uçlu
olmalıdır. Bölme sorusu, bölme dışındaki yapılar kullanılarak çözülebiliyorsa ayırıcılık ve
haliyle yapı geçerliği düşecektir.

• Kopya çekilmesi, doğru yanıta şansla ulaşmak, sorularda ipucu bulunması


• Her yıl aynı soruların kullanılması(ezbere yöneltir.)
• Soruların önceden verilmesi
• Cevap anahtarının örüntülü(desenli) olması.
• Cevapların bir şifresinin olması (Şifre skandalı)

Seçeneklerdeki sayılar küçükten büyüğe doğru seçeneklerin altına yazılıyor.


Hangi seçenekte aynı sayılar alt alta geliyorsa o seçenek doğru yanıt oluyor .
• Yanlılık da ayırıcılığı düşüren bir etmendir. 0,70 değeri sınır kabul edilir.

Örnek:
Eşit başarı düzeylerine sahip kadın ve erkeklerden oluşan
bir gruba sorulan bir soruyu kadınlar yanlış, erkekler
doğru çözüyorsa bu sorunun taraf tuttuğunu, yanlılık
düzeyinin yüksek olduğunu, yansızlık(tarafsızlık)
düzeyinin ise düşük olduğunu söyleyebiliriz.

Yansızlık düzeyi düşük olan bir testin ayırıcılığı da düşüktür, yapı geçerliği de düşüktür.
Örnek:

Bir coğrafya sorusunda keçi yavrusuna “gıdik” deniliyorsa bu kelimeyi o yöreden olmayan
kişiler bilemez. Bu yüzden yöresel kelimeler yanlılığı yükseltir, yansızlığı da düşürür.

Örnek:

Bir soruda çocuk demek yerine “gobel” deniliyorsa bu kelimeyi o yöreden olmayan kişiler
bu kelimeyi anlamadıkları için soruyu çözemezler ve yanlılık ortaya çıkar.
Yapı Geçerliği Belirleme Yolları

1. Faktör analizi (SPSS programı kullanarak)

2. Uzman görüşü

3. Yapı geçerliğini ispatlı bir testle uyumuna bakmak (Referans test)


• Uzman testinin yapı geçerliği yüksek olduğundan yeni geliştirilen test ile uzman testi
arasındaki uyuma bakılır ve bu uyumun yüksek olması geçerliğin yüksek olduğu
anlamına gelir.
4. Testin uzun dönemde kararlı sonuçlar vermesi(uzun dönem test tekrar test)

5. Gruplar arası ayrışma (zıt, karşıt gruplar)


• Şizofrenlikle ilgili bir testte şizofreni tanısı olanlar yüksek sağlıklı kişiler ise düşük puan
almalıdır ki ayırıcılık ve haliyle yapı geçerliği yüksek olsun.
6. Gerçek yaşamda gözlemleme (Otantik gözlem)

• Test sonuçlarının davranışlarla örtüşmesi yapı geçerliğinin yüksek olduğunu


düşündürür.

Örnek:

Cömertlik ölçeğinde cömert çıkanların gerçekte de cömert davranışlar, cimri çıkanlarında


cimri davranışlar göstermesi geçerliğin yüksek olduğunu düşündürür çünkü ayırıcılık
yüksektir. Cömert çıkanların gerçekte cimri davranışlar, cimri çıkanların da gerçekte
cömert davranışlar göstermesi geçerliğin düşük olduğunu ifade eder çünkü ayırıcılık
düşüktür.
Örnek:

Şiddet eğilimi ölçeğinde şiddete eğilimli çıkanların gerçekte de şiddete eğilimli davranışlar göstermesi
geçerliğin yüksek olduğunu, şiddete eğilimli çıkanların gerçekte şiddete eğilimsiz davranışlar göstermesi geçerliğin
düşük olduğunu gösterir.

Kısaca teste verilen yanıtlarla gerçek yaşamdaki davranışlar birbiriyle uyumlu olmalıdır. Tam tersi durumlar ayırıcılığın düşük
olduğunu ifade eder. Gerçekteki davranış modeliyle teste verilen yanıtın uyum içinde olması konusunu unutmamanız size
soru çözmede kolaylık sağlayacaktır.

Ertelemecilik eğiliminin ölçüldüğü bir testte sonuçlar ile anketi geri yollama süreleri karşılaştırıldığında test sonuçları ile gerçek
yaşam davranışları arasındaki uyuma bakılmış olur. Bu uyum yapı geçerliği hakkında bilgi verir.
7. Cevaplayıcıyla görüşme yapmak (“Nasıl çözdün evladım?”  Yöntemi )
Bir çoktan seçmeli test maddesinin öğrencilere verilip öğrencilerden yanıtlarını yazılı ya
da sesli olarak ayrıntılandırılmasının istendiği bir hikaye görürseniz aklınıza yapı geçerliği
gelmelidir. Bu gibi durumlarda öğrencilerin soruları çözerken hangi bilişsel yapıları
kullandıklarının ortaya çıkarılması hedeflenir. Bu da doğrudan yapı geçerliğiyle ilgilidir.
Hangi tip testlerde hangi geçerlik türünün öncelikli olarak önemli olduğu
unutulmamalıdır. Bunu tablolaştıralım.
Sayısal yeteneği ölçmek üzere geliştirilmiş bir test, fen lisesi ve sosyal bilimler lisesi
öğrencilerine uygulanmıştır. Uygulama sonucunda fen lisesi öğrencilerinin ortalamalarının,
sosyal bilimler lisesi öğrencilerinin ortalamalarından oldukça yüksek olduğu gözlemlenmiştir.

Bu durum, belirtilen testin hangi özelliğinin yüksek olduğuyla ilgili kanıt oluşturur?
A) Duyarlılık
B) Yordama geçerliği
C) Objektiflik
D) Yapı geçerliği
E) Kapsam geçerliği
Bir öğretmen, matematik dersi için hazırladığı sınavı daha ilgi çekici hâle getirmek
amacıyla futbol takımları üzerine kurgulanmış maddeler hazırlamış ve sınavında bu
maddeleri kullanmıştır. Maddeleri doğru yanıtlamak için futbol bilgisi gerekmiyor
olmasına rağmen sınav sonunda, futbola ilgi duyan öğrencilerin, duymayan
öğrencilerden daha yüksek puanlar aldığını görmüştür.
Bu durumda, sınavla ilgili aşağıdaki yorumlardan hangisi yapılabilir? (2018)
A) Ölçülmek istenen konu yeterince örneklenememiştir.
B) Maddeler öğrencilerin tümünün başarısını ölçmekte yetersiz kalmıştır.
C) Öğrenci başarısının ölçülmesi için kullanışlı değildir.
D) Öğretmen soruları puanlarken yanlı davranmıştır.
E) Sınavdaki soruların iç tutarlığı düşüktür.
Aşağıda ölçme araçlarına ait bazı özelliklerin açıklamaları
verilmiştir.

●Ölçme aracını oluşturan birimler arası uzaklığın küçükolması


●Testin ölçmek istediği teorik özelliği ölçebiliyor olması
●Testteki her bir maddenin belirtke tablosuna uygun nitelikte hazırlanması
●Birden fazla puanlayıcının testi puanlarken birbiriyle aynı ölçümlere ulaşması.

Buna göre aşağıdaki kavramlardan hangisinin açıklaması bulunmamaktadır?

A) Yapı geçerliği
B) Kapsam Geçerliği
C) Duyarlılık
D) Objektiflik
E) Uyum geçerliği
Bir matematik öğretmeni ilk derste öğrencilerine şu açıklamayı yapmıştır: “Benim dersimde
başarılı olmak istiyorsanız öncelikle kılık kıyafetinize, saygılı olmaya
ve ödevlerinizi düzenli yapmaya özen göstermelisiniz. Karne notunuzu verirken bu
saydıklarımın hepsini dikkate alacağım.”

Öğretmenin bu davranışı yapılan ölçmeye ait en çok hangi özelliğini etkileyecektir?

A) Duyarlılık
B) Tutarlılık
C) Geçerlik
D) Kararlılık
E) İç tutarlılık

You might also like