You are on page 1of 65

Ölçme

ve

Hazırlayan Değerlendirme
Doç. Dr.
H.Hüseyin
ÖZKAN
Ölçme Araçlarının Nitelikleri
(Özellikleri)

• Geçerlik

• Güvenirlik

• Kullanışlılık
Geçerlik (-1,0 – 1,0)

• Geçerlik, bir ölçme aracının ölçmek istediği


değişkeni ölçüp ölçmediği, ölçüyorsa onu
başka değişkenlerden ne derece arınık
olarak ölçtüğüdür. .
• Daha genel anlamda ölçme aracının
amacını gerçekleştirebilme düzeyidir. Ya da
amacına hizmet etme derecesidir.
• Geçerlik katsayısı, -1 ile 1 arasındadır.
Geçerlik Türleri

1) Kapsam geçerliliği,
2) Ölçüt geçerliği
a) Yordama geçerliliği,
b) Uyum (benzer ölçekler) geçerliliği
3) Yapı geçerliliği,
4) Görünüş geçerliliği,
Kapsam geçerliliği

Bir bütün olarak testin amacına hizmet etme


derecesi olarak tanımlanır.
• Test maddelerinin evreni örneklemesi,
• Testin belirtke tablosunu örnekleyebilme
derecesi,
• Test maddelerinin bir konu alanına dengeli
dağılımı,
Kapsam geçerliliği
İki temel şart
• Sınav sorularının ölçmek istediği konu alanını
kapsayıp kapsamadığı kapsam geçerliliğini
gösterir. Soruların konu alanını yeterince kapsayıp
kapsamadığı konu alanı uzmanlarının görüşü
alınarak belirlenebilir.
• Sorular ilgili olduğu davranışı doğru ölçüyor mu?
Hangi öğretim seviyesinde (bilgi, kavrama,
uygulama) o seviyedeki davranışı doğru
ölçmelidir.
Kapsam geçerliliğini belirleme
yolları

• Belirtke tablosunun uyumuna bakarak (mantıksal


ve akılcı yol)
• Uzman görüşüne dayalı yol,
• İstatistiksel yöntem,
BELİRTKE TABLOSU
HEDEFLER Bilişsel Alan
Bilgi Kavrama Uygulam
a
KONULAR
Eğitime ilişkin Program Eğitim
Belirtke Tablosu
Örneği kavramlar geliştirmenin programı
bilgisi planlanmasını na uygun
kavrayabilme plan
hazırlaya
bilme
Eğitimde Temel Kavramlar X
Eğitim: Formal, informal, yaygın, örgün X
eğitim
Öğretim
Öğrenme
Program Geliştirmenin Planlanması X
İhtiyaç belirleme
Çalışma grupları
Program Geliştirme Süreci ve Öğretim X
Planları X
Hedef
İçerik
Uzman görüşüne dayalı kapsam
geçerliliğini belirleme

• Testin ölçtüğü alanla ilgili uzmanlığa sahip olan


insanların görüşlerine dayalı geçerlik belirleme yoludur.
• Testteki maddeler ölçülmek istenilen özelliği yansıtıyor
mu ? sorusu sorulur.
• Geçerli/geçerli değil, uygun/uygun değil gibi madde
formatı kullanılabilir.
• Uzman görüşlerine göre %90 ve üzeri uygunluk gösteren
maddeler testte alınır.
İstatistiki yöntemle geçerlilik
belirleme

Kapsam geçerliği Yeni geliştirilecek


kanıtlanmış test test

Korelasyona katsayısına bak. Korelasyon katsayısı


büyüdükçe testin geçerliği artar.
r=. 90 ve üzeri ise geçerli bir test
Ölçüt Geçerliği

Ölçüt olarak kullanılacak


• Yordama geçerliği puanlar gelecekte
oluşuyorsa….

Ölçüt şimdi, yakın


• Uygunluk geçerliği zamanda ve önceden elde
edilen puanlardan
alınıyorsa
Yordama (tahmin) geçerliliği
• Öğrencileri bir öğretim programına yerleştirmeden önce,
seçme amacıyla yapılan sınavlardaki başarı ölçülerine bakarak,
öğretim programındaki başarılarını kestirmek sınavın yordama
geçerliliğini verir.
• Örnek: Öğrencinin öss başarı puanından, akademik başarısını
kestirmek
• Yapılan bir sınavda; sınavla seçilen öğrenciler, seçilmeyen
öğrencilere göre daha başarılı olacaksa seçmede kullanılan
aracın yordama geçerliliğinin olduğu söylenebilir.
Yordama (tahmin) geçerliliği

Yordayıcı Puan Ölçüt Puan


Üniversitedeki
LYS Testi Öğrencinin Akademik
Başarısı..
Sonra elde edilir
Burada geçerliği belirlenecek test LYS testidir. Daha sonra elde edilen başarılara
göre, eğer LYS de yüksek puan almış öğrencilerin akademik başarıları yüksekse,
testin yordayıcılık özelliği vardır.
Uyum (Uygunluk) geçerliği
• Uyum geçerliği, geliştirmek istediğimiz testin geçerliği ile
geçerliği test edilmiş ölçme aracının korelasyonu
arasındaki geçerliktir.
• Bu korelasyonun yüksek ilişki içermesi gerekir.
Ölçüt Puan Yordayıcı Ouan
Lise mezuniyet notları LYS Testi
Önceden edilen puan Geçerliği belirlenmek
istenen ölçme aracı

• Bu ilişki yüksekse test geçerlidir


Uyum (Uygunluk) geçerli

Uygunluk geçerliği Geçerliği


Öğrencilerin önceki belirlenecek test
akademik başarıları SBS sınavı başarıları
(önceden elde (sonradan elde edilir)
edilmiş)
Burada geçerliği belirlenecek test SBS testidir. Öğrencilerin akademik başarıları ile
SBS’den elde edilen öğrenci başarıları arasında korelasyon yüksekse uygunluk
geçerliği vardır.
Yapı Geçerliği
• Yapı geçerliği, bir ölçme aracının ölçtüğü teorik bir
özelliği ya da yapıyı ölçüyor olmasına denir.
• Bir testteki soruların birbiriyle uyumu da demektir.
Ani sorular aynı tür özellikleri ölçüyor demektir.
• Soruların ve tstin homojenliği anlamına da gelir.
• Çok başarılı denilen öğrencilerin üst düzey
öğrenmelerini ölçüyor olması
Örnek: Sentez yapma başarısını ölçmek gibi.
Yapı geçerliği test etme yolları
• Testte yer alan soruların uzmanlar tarafından
incelenmesi
• Cevaplayıcıların cevaplama süreçlerini gözlemleme
ve bilgi toplama
• Aynı özelliği ölçen geçerli bir testle karşılaştırılması,
• Ölçülen özelliğe sahip oluş dereceleri farklı gruplara
uygulanması,
• Faktör analizi yapma
Görünüş Geçerliği
• Görünüş geçerliği, bir testin üzerinde ya da
yönergesinde ne yazıyorsa o özellikleri ölçme
geçerliğidir.
• Örnek: Ölçme değerlendirme dersinde
dersinde hazırlanmış bir testin okuma gücü ve
yeteneğini ölçmemesi, sadece Ölçme
değerlendirme dersinde dersinin bilgi ve
becerilerini ölçmesi gibi.
Sonuçsal Geçerlik

• Yapılandırmacı anlayışın, öğrenme ve öğretme


süreçleri üzerindeki etkilerine bağlı olarak ortaya çıkan
bir geçerlik türüdür.
• Öğrencinin öğrenme sürecini etkin katılımını, kendi
öğrenme düzeyini sorgulamasını, öğrenme ve
değerlendirme etkinliklerinin iç-içe olmasını sağlayan
alternatif değerlendirme (tamamlayıcı) değerlendirme
anlayışını temele alır.
Sonuçsal Geçerlik

• Bu tür değerlendirme öğrenme süreciyle kaynaşıktır.


Yani öğrenme-öğretme sürecinin bir parçasıdır.
Öğrenci ölçme değerlendirme yoluyla da
öğrenmektedir.
• Tamamlayıcı ölçme değerlendirme araçları
öğrencinin öğrenmesi üzerinde beklenen etkiyi
yapıyorsa, sonuçsal geçerlik vardır.
Geçerliği Etkileyen Faktörler
• Testin amaca uygun sonuçlar vermesi (amaca uygun ölçme araç ya
da yöntemlerinin seçilmesi)
• Testtin ilgili kapsamı örnekleme durumu
• Testte yer alan soruların özellikleri.
a) Soruların dersin konularını yeterince kapsayıp, kapsamaması)
b) Soru sayısı (azlığı, çokluğu, yeterli olması)
c) Soruların ilgili olduğu davranışı ölçüyor olması
d) Bilenle bilmeyeni ayırt etmesi
e) Test maddelerinin belli bir örüntüyle yerleştirilmesi,
f) Soruların seçeneklerinin eleyerek cevaplanması,
g) Soruların açık ve net olmaması,
h) Soruların önceki derslerde çözülmesi
Geçerliği Etkileyen Faktörler

• Test puanları karışan hatalar (her tür hata)


• Sınavın uygulama şartlarının olumsuzluğu
• Sınav süresi
• Sınav stresi ve güdülenme durumu
• Sınavın çok zor ve çok kolay olması
• Aynı soruların sürekli değiştirilmeden kullanılması
• Güvenirlik geçerliği sağlamada tek başına yeterli olmasa
da geçerlik için önemli bir şarttır.
Güvenirlik
Güvenirlik (0-1)

• Bir ölçme aracının güvenirliği, aracın, ölçmek


istediği değişkeni ne derece duyarlıkla
ölçtüğü, ya da ölçme sonuçlarının hatalardan
arınıklık derecesidir.
• Duyarlılık, kararlılık, tutarlılık ve iç tutarlılık
anlamlarına gelir.
• Güvenirlik katsayısı, 0-1 arasındadır
Güvenirlikle ilgili kavramlar
• Gerçek ölçüme yakınlık
• Hatalardan arınıklık
• Duyarlılık
• Tutarlılık
• Kararlılık,
• Objektiflik,
• İç tutarlılık,
• Ayırt edicilik
Ölçmede Hata
• Hata: Ölçme sonuçlarına istenmeyen
değişkenlerin karışmasıdır. Hataların bir kısmı
kontrol dışı olarak ölçme sonuçlarına
karışabilir. Bu nedenle çok iyi sanılan ölçme
araçlarıyla yapılan ölçmelerde bile bir miktar
hata vardır.
• Hata Miktarı: Özellik gerçek mik – özelliğin Ölçülen
mik.. Arasındaki farktır. Bu miktar kullanılan birime bağlı
olarak değişir ve birimin yarısı kadar olabilir.
• Ölçme birimi küçüldükçe hata miktarı azalır.
Hata kaynakları

• Ölçülen özellik
• Ölçülen bireyin özelliği
• Ölçme yapılan ortam
• Ölçme aracı
• Ölçmeyi yapan kişi
Ölçülen özellik

• Ölçülen özelliğin, soyutluğu-somutluğu,


doğrudan ya da dolaylı ölçülmesi, ölçülen
özelliğin kolay değişen bir özellik olması
ölçmeye karışan hatayı etkileyecektir.
Ölçülen bireylerin özelliği

• Öğrenci sayısı
• Ölçülen öğrenci grubunun öğrenme düzeyleri
• Ölçülen bireylerin durumsal, fizyolojik ve
psikolojik özellikleri
Ölçme yapılan ortam

• Ölçmenin yapıldığı sınıf, salon ya da mekanın


durumu. Isı, ışık, havası, gürültü ve kopya
çekmeye uygunluğu önemli hata kaynakları
olabilecektir.
Ölçme aracı

• Test yönergesi,
• Öğrenci seviyesi üzerinde kullanılan dil,
• Soruların öğrenci düzeyine uygun olmaması
• Uygun soruların sorulmaması,
• Soru sayısının uygun olmaması,
• Soruların sıralanışı,
• Test sorulularının aynı tür alan ya da kapsamdan
olmaması
• Şans başarısı durumu
Ölçmeyi yapan kişi

• Ölçmeyi yapan kişinin özellikleri (bilgisi,


becerisi, fizyolojisi, psikolojisi, ilgi ya da
ilgisizliği, dikkatsizliği vb)
• Puanlayıcının kanı ya da yorumları
• Puanlamanın nesnel olmaması
Hata Türleri

1) Sabit hata,
2) Sistematik hata,
3) Tesadüfi hata.
Sabit Hata
• Ölçme sonuçlarını aynı yönde ve türde
etkileyen hatalardır. Kontrol edilen
hatalardandır.
• Örnekler: Öğretmenin her öğrenciye 5 puan
fazla vermesi, bir metrenin bir uzunluğu bir
ölçmede 2 mm eksik ölçmesi vb
• Ölçme aracının geçerliğini etkiler
Sistematik Hata

• Ölçülen büyüklüğe, ölçme yapan kişiye ve ölçme


şartlarına bağlı olarak değişen hatalardır.
• Yanlılık hataları da denir
• Kontrol edilebilir hatalardır
• Örnekler: Öğretmenin sevdiği öğrenciye fazla
puan, sevmediğine az puan vermesi vb
• Ölçme aracının geçerliğini etkiler
Tesadüfi Hata (Şans Hatası)

• Kaynağı belli olamayan, ölçme sonuçlarına


her yönde karışabilen hatalardır.
• Kontrol edilemeyen hatalardır.
• Öğretmenin sınav kağıdına verdiği bir puanı
toplarken görmemesi vb
• Ölçme sonuçlarının güvenirliğini etkiler ancak
geçerliliğini de etkiler
Güvenirlik Hesaplama Yöntemleri

Güvenirliğin anlamı Güvenirlik yöntemi


Duyarlılık Yok
Kararlılık Test-tekrar-test
Tutarlılık Paralel testler
İç tutarlılık Testi yarılama
İç tutarlılık KR-20, KR-21, Alfa güvenirliği

Tutarlılık Puanlayıcı güvenirliği


Test tekrar test yöntemi

• Bir test,
• Aynı gruba,
• İki farklı zamanda uygulanır (10 gün-2 hafta
süre)
• Uygulama sonuçları arasındaki korelasyon
hesaplanır,
• Bu korelasyon testin kararlılık katsayıdır.
Paralel testler yöntemi

• İki farklı test,


• Aynı gruba uygulanır,
• Uygulama sonuçları arasındaki korelasyon
hesaplanır,
• Bu korelasyon testin tutarlılık katsayısıdır.
Testi iki yarıya bölme

• Bir test,
• Aynı gruba uygulanır,
• Test iki yarıya bölünür,
• Her yarıya ilişkin puanlar hesaplanır,
• Bu puanlar arasındaki korelasyon hesaplanır,
• Bu korelasyon testin iç tutarlılık katsayıdır
Testi iki yarıya bölme

Testin İlk yarsı Testin ikinci yarısı


1. 2.
3. 4.
5. 6,
7. 8.
9. 10.
11. sorular 12.
KR-20 formülü yöntemi

• Bu güvenirlik belirleme yöntemi de, iç tutarlık


belirleme katsayısıdır
• Bir uygulama gerektiren durumlarda ve
• Testte yer alan soruların doğru ya da yanlış
olarak puanlanabildiği durumlarda kullanılır.
( doğrular “1”, yanlışlar “0” olarak)
• Bu katsatı yüksekse, test güvenilirdir
Croncbach Alfa Katsayısı

• Duyuşsal özelliklerin ölçülmesinde kullanılan


araçların güvenirliğini belirlemede kullanılır
• Testler doğru ve yanlış değil, dereceleme
ölçeği niteliğinde puanlanıyorsa kullanılır
Puanlayıcı Güvenirliği

• Cevap kağıtlarının birden fazla


puanlayıcıya puanlattırılarak
güvenirlik hesaplanmasına puanlayıcı
güvenirliği denir
Test Güvenirliğini Etkileyen Faktörler

• Testin uzunluğu, (kapsamının fazla olması)


• Testin uygulandığı öğrenci grubunun ranjı,
-Öğrencilerin sayısı
-Öğrencilerin yetenek düzeyi,
• Zaman
• Şans başarısı,
• Testin uygulandığı şartlar,
-Kopya çekme
-Sınav salonun durumu
-Gözetmen
Güvenirlik Artırma Yolları
• Güvenirliği artırmada en etkili yol, soru sayısını
artırmaktır. Böylece birimin değeri küçülerek
duyarlılık artar.
• Ölçme aracını oluşturan soruların açık ve anlaşılır
yazılması,
• Soruların uygun büyüklükte puntoyla yazılması,
• Soruların test formu içerisine düzgün yerleştirilmesi,
Güvenirlik Artırma Yolları
• Baskı hatalarının olmaması, okunaklı olması
• Sınav süresinin yeterli verilmesi,
• Sınav ortamının temiz, yeterli düzeyde ısı, aydınlık
olması, gürültü olmaması
• Öğrencinin kaygı düzeyinin belli bir düzeyde
olması.
• Öğrencilerin sınava güdülenmesi,
• Puanlamanın objektifliği
Güvenirlik-Geçerlik İlişkisi

Hedef

Güvenilir ancak geçerli olmayan test sonucu


(Tutarlı ancak hatalı ölçüm)
Güvenirlik-Geçerlik İlişkisi

Hedef

Hem geçerliği hem de güvenirliği düşük test sonucu


(Hem tutarsız hem de hatalı ölçüm)
Güvenirlik-Geçerlik İlişkisi

Hedef

Hem geçerliği hem de güvenirliği yüksek test sonucu


(Hem doğru hem de tutarlı ölçüm)
Güvenirliğin Göstergeleri
• Tesadüfi hatalardan arınıklık,
• Tutarlık,
• Kararlılık,
• İç tutarlık,
• Duyarlık,
• Ayırt edicilik,
• Objektiflik,
• Şans başarısı ya da kopya etkisi,
• Standart hatanın az olması,
Kullanışlılık

• Ölçme aracının hazırlanmasının, geliştirilmesinin,


çoğaltılmasının, uygulamasının ve verilerin toplanmasının,
puanlamasının zaman, emek, maliyet bakımından ekonomik
olmasıdır. Ölçme aracının pratikliği gibi etkenler ölçme
aracının kullanışlılığını gösterir.
• Ölçme aracının kullanışlılığı, diğer iki özelliğini artırıcı yönde
rol oynar.
Kullanışlılık
• Testin ekonomik olması
• Hazırlanma süresi
• Uygulanma süresi
• Hazırlayıcı ve uygulayıcının nitelikleri
• Cevaplayıcının nitelikleri
• Uygulama kolaylığı
• Puanlama kolaylığı
• Puanları yorumlama kolaylığı
gibi faktörler testin kullanışlılığını artırır.
Bir Ölçme Aracının Nitelikleri Nasıl
Geliştirilebilir?

• Test hazırlamaya her şeyden önce test planı


hazırlayarak başlamak,
• Soru sayısını artırmak,
• Soruları açık ve anlaşılır sormak,
• Soruları ilgili olduğu davranışı doğru ölçecek şekilde
hazırlamak,
• Testin uygulanışı ve puanlanışı ile ilgili istenmedik
değişkenleri ortadan kaldırabilmek
Bir Ölçme Aracının Nitelikleri Nasıl
Geliştirilebilir?

• Testin güçlük düzeyini iyi ayarlamak


• Testin başlangıcına yeterli bir yönerge koymak,
• Soruların özgün olmasına dikkat etmek
• Kopya yapmaya izin vermemek
• Objektif puanlama yapmak
• Hazırladığınız ölçme aracınızı o alanda uzman bir
kişinin görüşüne sunmak gibi faktörler sayılabilir.
Ölçmenin Standart Hatası
• Standart hata, bireylerin gözlenen puanlarının
gerçek puanlarına yakınlığı ve uzaklığı ile ilgili
bilgi verir.
• Se = Sx . √1-rx (standart hata formülü)
• Se: Ölçmenin standart hatası
• Sx: Test puanlarının standart kayması
(sapması)
• rx: Testin güvenirliği
Ölçmenin Standart Hatası
• Standart hata test puanlarına karışan bir hata
miktarıdır.
• Standart hata, teste karışan hataların test
puanı cinsinden ifadesidir.
• Ölçmenin standart hatasının hesaplanabilmesi
için formüldeki değerlerin bilinmesi gerekir.
• Test güvenirlik katsayısı ile ölçmenin standart
hatası arasında ters yönde bir ilişki vardır.
Standart Hata
• Bir ölçme aracının güvenirliği rx= 0,75 olarak
hesaplanmıştır. Ölçme sonuçlarının standart
kayması 4 birim olduğuna göre test puanlarına
karışan standart hata kaç birimdir?
• Se=Sx. √1-rx = 4. √ 1-0,75=4 . √ 0,25=4. 0,5=2
birim Olduğu hesaplanır.
• Ölçmenin standart hatası 2 birimdir.
Normal Dağılım Eğrisi
Normal Dağılım Eğrisi
• Standart hata, bireylerin gözlenen puanlarının gerçek
puanlarına yakınlığı ve uzaklığı ile ilgili bilgi verir.
• -1 ile +1 standart hata arasına 1. güven aralığı da
denir. % 68 güven aralığı (olasılık düzeyi) olarak da
bilinir.
• -2 ile +2 standart hata arasına 2. güven aralığı denir ve
% 95 güven aralığı (olasılık düzeyi) olarak da bilinir
• -3 ile +3 standart hata arasına 3. güven aralığı denir.
% 99 güven aralığı (olasılık düzeyi) denir.
Standart Hata
• Se:2 birimdi
• Öğrencinin aldığı puan= 60 olsun
• %68 olasılık düzeyinde, puanınıza bir hata miktarı
ilave edilir ya da çıkarılır.
• Dolayısıyla puanınızın gerçek sınırı, 58-62 olur.
• %95 olasılık düzeyinde, puanınıza iki hata miktarı ilave
edilir ya da çıkarılır.
• Dolayısıyla puanınızın gerçek sınırı, 56-64 olur.
• %99 olasılık düzeyinde, puanınıza 3 hata miktarı ilave
edilir ya da çıkarılır.
• Dolayısıyla puanınızın gerçek sınırı, 56-64 olur.
Kaynaklar

• Formasyon öğrencileri için Ölçme ve


Değerlendirme. Komisyon, Anı Yayıncılık.
• KPSS Ölçme ve Değerlendirme Modülleri (Her
Yayınevi olabilir).
Kpss-2007
• 57. Lisedeki bir rehber öğretmen öğrencilerin mesleki
ilgilerini belirlemek için mesleki ilgi envanteri geliştirmiştir.
Güvenirliğini belirlemek için bu envanteri aynı öğrencilere
altı hafta arayla iki kez uygulamış ve iki uygulamadan elde
edilen ölçüler arasındaki ilişkiyi (korelasyon) 0,45 bulmuştur.
• Aşağıdakilerden hangisi, bu korelasyon değerinin
düşüklüğü için gerekçe olarak gösterilemez?
A) Ölçülen özellik kolay değişme gösteren bir yapıdadır.
B) İki uygulamanın koşulları birbirinden oldukça farklıdır.
C) Öğrenciler maddelere yanıt verirken gerçekçi davranmamışlardır.
D) Sorular her okumada farklı anlamlara gelebilmektedir.
E) İki uygulama arasında geçen süre çok kısadır.
Kpss- 2007

• 46. Pazarlama elemanları seçiminde kullanılmak üzere


bir test geliştirilmiş ve işe alımlarda bu test
uygulanmıştır. Daha sonra, işe alınan elemanların ilk
aydaki başarılı satış sayıları ile işe girişte aldıkları test
puanları arasındaki uyum incelenmiştir.
Yukarıda belirtilen inceleme, uygulanan testin hangi
özelliği hakkında bilgi verir?
A) Yordama geçerliği
B) Yapı geçerliği
C) Kapsam geçerliği
D) İç tutarlığı
E) Puanlayıcılar arası güvenirliği
TEŞEKKÜRLER

You might also like