You are on page 1of 38

Ondokuz Mayıs Üniversitesi

Eğitimde Ölçme ve Değerlendirme Anabilim Dalı

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME


ÖLÇME ARAÇLARINDA BULUNMASI GEREKEN NİTELİKLER

Dr. Öğr. Üyesi Selda ÖRS ÖZDİL


Güvenirlik
Ölçme sonuçlarının (test puanlarının) tesadüfi hatalardan
arınık olması, yani ölçme sonuçlarına hata karışmadan
ölçme işleminin yapılabilmesidir.

Ölçme sonuçlarında hata miktarı ne kadar az olursa


ölçme sonuçları gerçeğe yakın olur ve o kadar güvenirliği
yüksek olur.

Ölçme sonuçlarında karışan hata miktarı yüksek olursa


güvenirlik düşer.
GÜVENİRLİK
«Ölçme sonuçlarının tesadüfi hatalardan arınık olma derecesi»

Kararlılık

Tutarlılık Duyarlılı
k
GÜVENİRLİK BELİRLEME YÖNTEMLERİ

İki Uygulamaya Dayalı Tek Uygulamaya Testteki Hatayı Puan


Yöntemler Dayalı Yöntemler Cinsinden İfade Etme

İki Yarı
Test Tekrar Test
(Eşdeğer Yarılar)
Yöntemi Ölçmenin
Standart Hatası
Paralel
(Eşdeğer) Test

*KR20/ KR21
*Cronbach-Alfa
İki uygulamaya dayalı yöntemler

Test-Tekrar Test Yöntemi


TEST 1 TEST 1
Sorular: Aynı test Sorular:
1. …………… belli bir süre 1. …………….
2. …………... sonra aynı 2. …………….
3. …………… gruba tekrar 3. ………….…
. uygulanır. .
. .
. .
20. …………. 20. …………..

1. Uygulama 2. Uygulama
1 saat sonra 2 hafta sonra
Test-Tekrar Test Yöntemi
■ İki uygulama arası bırakılan zaman ne kadar olmalı
o Birkaç dakika?
o 3 saat?
o 2 gün?
o 1 hafta?

■ Olası HATA kaynakları


Bu güvenirlik “kararlılık” anlamında güvenirlik olarak bilinir.
Kararlılık, bir ölçme aracının tekrar tekrar kullanılması sonucu, elde edilen
sonuçların aynı ya da benzer olabilme derecesidir. Bir ölçme aracının
ölçmeden ölçmeye değişmeyen sonuçlar vermesidir.

Güvenirlik katsayısı O - 1 arasında değişir.

Güvenirlik belirlerken elde edilen korelasyon katsayısının yüksek olduğunu


söyleyebilmemiz için korelasyon katsayısının 0,70’ten yüksek olması
gerekir.

Ölçülen değişkende zaman içinde değişmenin az olacağı düşünülüyorsa


(duyuşsal alan davranışlarının ölçülmesi gibi) ve aracın kararlılığı hakkında
bilgi edinilecekse test-tekrar test yöntemi kullanılır.
Paralel (Eşdeğer) Formlar
Yöntemi
TEST A TEST B
Sorular: Sorular:
Aynı davranışları
1. …………… 1. …………….
ölçen fakat farklı
2. …………... 2. …………….
sorulardan oluşan
3. …………… 3. ………….…
iki test
. .
. .
. .
20. …………. 20. …………..
Paralel (Eşdeğer) Formlar Yöntemi

■ Paralel Test Nedir?


Testlerin paralel olması için, testler aynı özelliği ölçen eşit sayıda
soruya sahip testler olmalı ve testi oluşturan soruların güçlük
düzeylerinin, ayırıcılık düzeylerinin vb. aynı olması gerekir. Test ve
madde istatistiklerinin paralel olması beklenmektedir.
Paralel (Eşdeğer) Formlar
Yöntemi
Birbirine paralel yani aynı davranışları ölçen, fakat farklı sorulardan
oluşan iki test hazırlanır.

İki test aynı öğrencilere uygulanır ve öğrencilerin aldıkları puanlar


arasındaki korelasyon katsayısı hesaplanır.

Korelasyon katsayısı güvenirlik katsayısı olarak kabul edilir.

Bu yöntemle elde edilen güvenirlik katsayısı “eşdeğerlik katsayısı” olarak da


ifade edilir. Eşdeğerlik katsayısı, hem ölçme sonuçlarının zaman içindeki
kararlılığının hem de değişik test maddelerine verilen yanıtların tutarlılığının
ölçüsünü verir.
Olası HATA Kaynakları
Tek uygulamaya dayalı yöntemler
İki Yarı (Eşdeğer Yarılar) Yöntemi
SORULAR
1. …
2. …
3. …
.
..
20. …

1. YARI Uygula 2. YARI

SORULAR SORULAR
1. … 2. …
3. … 4. …
5. … 6. …
. .
. Tutarlılık .
19. … 20. …
■ Testi yarılama(eşdeğer yarılar): Testi oluşturan soruların hepsi aynı özelliği ölçüyorsa
yarılama işlemi tekler / çiftler, ilk yarı / son yarı ya da tesadüfi şekilde yapılabilir.
Fakat, sorular farklı özellikleri ölçüyorsa benzer özellikleri ölçen sorular farklı
yarılarda yer almalıdır.
Elde edilen korelasyon katsayısı testin yarısına ait korelasyon
katsayısıdır. Testin tamamı için güvenirlik kestiriminde, “Spearman
- Brown düzeltme formülü” kullanılır.

Olası HATA Kaynakları


■ Örnek: Uygulanan bir testin iki yarısından elde edilen puanlar arasındaki
korelasyon katsayısı 0,60 olsun. Bu testin tamamına ilişkin güvenirlik
katsayısını hesaplayalım:
İç Tutarlılık Güvenirliği Hesaplama Yöntemi
(KR 20/21- Cronbach Alfa)

Bir testin, bir defa uygulanması ve testte yer alan maddelerin analiz
edilmesine dayanır.

İç tutarlılık güvenirliği bir testteki maddelerin birbirleriyle ne derece


tutarlı olduğunun belirlenmesi için kullanılan bir güvenirlik
hesaplama yöntemidir.

Test maddelerinin birbirleriyle tutarlı olması, testte ilgisiz ya da


hatalı soru olmadığı anlamına gelir.

İç Tutarlılık: Bir testi oluşturan birimlerin birbirine benzerliğidir.


KR-20 / KR-21: 1-0 şeklinde puanlanan maddeli testlerde uygulanabilir
(çoktan seçmeli ya da doğru-yanlış).

Test bir kez uygulanır.

İç tutarlılık katsayısı olarak adlandırılır.

Testteki maddelerin aynı yeterliği ölçtüğü anlamına gelir (testin tek


boyutlu olduğu).

Testi oluşturan maddeler homojendir.


KR-20 / KR-21: 1-0 şeklinde puanlanan maddeli testlerde uygulanabilir
(çoktan seçmeli ya da doğru-yanlış).

KR-20: Testteki her bir maddenin güçlük derecelerinin hesaplanmış


olması gerekir.
(Madde analizi yapılmış testler)
KR-20 / KR-21: 1-0 şeklinde puanlanan maddeli testlerde uygulanabilir
(çoktan seçmeli ya da doğru-yanlış).

KR-21: Testteki her bir maddenin güçlük dereceleri bilinmiyor ve


güçlük derecelerinin eşit olduğu varsayılıyor.
(Madde analizi yapılmamış testler)
KR-20 ve KR-21 Arasındaki İlişki

KR-21 < KR-20

KR-21 güvenirliğin alt sınırıdır.

Güvenirlik ister KR-21 ister KR-20 ile hesaplansın


yapılacak yorum değişmez.
Cronbach Alfa: KR yöntemlerinden tek farkı 1-0 şeklinde
puanlanmayan çoklu puanlanan maddelerin yer aldığı testlerde
maddeler arasındaki tutarlılığı bulmak için kullanılır.
(Likert tipi tutum ölçekleri gibi)
Puanlayıcı Güvenirliği: Özellikle öznel puanlamanın söz konusu
olduğu testlerde kullanılan güvenirlik belirleme yöntemidir.
Testin, farklı kişiler tarafından puanlanmasıyla elde edilen puanlar
arasındaki korelasyonu ifade etmektedir.

Puanlama Güvenirliği: Testin, aynı kişi tarafından farklı zamanlarda


iki kez puanlanması sonucunda elde edilen puanlar arasındaki
korelasyondur.
Ölçmenin standart hatası
■ 85 IQ puanına sahip Mert’in zeka geriliği olduğunu
söyleyebilir miyiz?

90 110

Zeka geriliği normal üstün zekalı

• Bireysel puanları yorumlama


• Belli olasılıklarla testten alınabilecek maksimum ve minimum puanları
belirleme

04.06.2023 Ölçme ve Değerlendirme 26


Ölçmenin Standart Hatası

Güvenirlik için hatasızlığın bir ölçüsü olduğunu söylemiştik. Güvenirlik katsayısı


ölçme işleminde yapılan hatanın miktarını belirtmez.

Standart hata bize hatanın miktarını söyler.

Öğrencilerin gerçek puan aralıklarını bulmamızı sağlar.


■ Ortalaması 100 standart sapması 10 olan normal bir dağılım düşünelim.
■ Normal dağılan, ortalaması 100, standart sapması 10 olan puanların
neredeyse tamamına yakını 70 ile 130 arasında olacaktır.
■ Puanların herhangi bir dağılımı (ortalama ve standart sapma değerlerinden
bağımsız olarak), eğer dağılım normalse, puanların hemen hemen %100’ü
ortalamadan -3 ile +3 standart sapma arasına yerleşecektir.
Ortalamadan uzaklık İçerdiği Yüzde İçerdiği Puanlar
(Ortalama=100 SS=10
ise)
Ortalama ve 1 ss arası %34,13 100-110
1 ss ve 2 ss arası %13,59 110-120
2 ss ve 3 ss arası %2,15 120-130
3 ss ve üstü %0,13 130 ve üstü
Ortalama ve -1 ss arası %34,13 90-100
-1 ss ve -2 ss arası %13,59 80-90
-2 ss ve -3 ss arası %2,15 70-80
Normal dağılımda puanların yaklaşık;
%68’i +1SS ile -1 SS aralığındadır.
68-95-99 KURALI
%95’i +2SS ile -2SS aralığındadır.
%99’u +3SS ile -3SS aralığındadır.

%68.2

%95.4
%99.7

SS -3SS -2SS -1SS 1SS 2SS 3SS


Yüzde 0.13 2,27 15,86 50 84,12 97,71 99,85
■ ÖSH, bir bireyin testten aldığı puana karışmış olması muhtemel tesadüfi hata
miktarının ölçüsüdür.
■ Ölçmede yapılan hataların standart değeridir.
■ Güvenirlik katsayıları ölçülen özellik bakımından gruba bağlı değişme
gösterirken, ölçmenin standart hatası grup değişikliğinden daha az etkilenir.
■ Aynı araçla bir birey için sonsuz sayıda ölçme yapılsa, bireyin aldığı puanlar,
belli bir dağılım gösterecektir. Bu dağılımın ortalaması, kişinin gerçek puanının
iyi bir tahminidir. Böyle bir dağılımın standart kayması, ölçmenin standart
hatası olarak adlandırılır.
Standart sapması 4, güvenirlik katsayısı 0,75 olan bir testin standart hatası kaçtır?

Se  S x 1  rx

Se  4 1  0,75

Se  2
■ Ölçmenin standart hatası (SHö), bilinmesi durumunda, belli olasılıklar dahilinde
gerçek puanların alabileceği alt ve üst sınır değerleri (güven aralığı, GA)
bulunabilir.

Ölçme Sonuçlarının Güven Aralığının Hesaplanması


Bir öğrenci X puanı almışsa…
■ %68 olasılıkla Güven Aralığı: X ± 1 ÖSH (X-ÖSH, X+ÖSH)
■ %95 olasılıkla Güven Aralığı: X ± 2 ÖSH (X-2ÖSH, X+2ÖSH)
■ %99 olasılıkla Güven Aralığı: X ± 3 ÖSH (X-3ÖSH, X+3ÖSH)
Örneğin; X=80 ve ÖSH=4
■ %68 olasılıkla Güven Aralığı: 80 ± 4 (80-4, 80+4)(76, 84)
■ %95 olasılıkla Güven Aralığı: 80 ± 2(4) (80-8, 80+8)(72,88)
■ %99 olasılıkla Güven Aralığı: 80 ± 3(4) (80-12, 80+12) (68,92)
%95 olasılıkla 66-74 arasında

Öğrenci puanı: 70 %68 olasılıkla 68-72 arasında

Se = 2

-3Se -2Se -1Se 1Se 2Se 3Se

%99 olasılıkla 64-76 arasında


Güvenirliği Arttıran Faktörler

Yönergelerin ve testteki maddelerin açık, net ve anlaşılır olması


Testteki madde sayısının artması

1,00

Soru Sayısı
Güvenirlik

Soru Sayısı Soru Sayısı


Güvenirliği Artıran Faktörler

Testteki maddelerin güçlük düzeyi (orta güçlük)

Şans başarısının düşük olması

Testi alan bireye özgü durumlar (Psikolojik durum)

Test edilen grubun (test puanlarının) heterojen olması

Testi yanıtlama süresinin yeterli olması

Testin uygulama koşulları


Puanlama ve puanlayıcı nesnelliği (Puanlama güvenirliği)

You might also like