Hafta Güvenirlik

Ondokuz Mayıs Üniversitesi
Eğitimde Ölçme ve Değerlendirme Anabilim Dalı
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME

ÖLÇME ARAÇLARINDA BULUNMASI GEREKEN NİTELİKLER
Dr. Öğr. Üyesi Selda ÖRS ÖZDİL

Güvenirlik
Ölçme sonuçlarının (test puanlarının) tesadüfi hatalardan
arınık olması, yani ölçme sonuçlarına hata karışmadan
ölçme işleminin yapılabilmesidir.
Ölçme sonuçlarında hata miktarı ne kadar az olursa

ölçme sonuçları gerçeğe yakın olur ve o kadar güvenirliği
yüksek olur.
Ölçme sonuçlarında karışan hata miktarı yüksek olursa

güvenirlik düşer.
GÜVENİRLİK
«Ölçme sonuçlarının tesadüfi hatalardan arınık olma derecesi»
Kararlılık
Tutarlılık Duyarlılı
k
GÜVENİRLİK BELİRLEME YÖNTEMLERİ
İki Uygulamaya Dayalı Tek Uygulamaya Testteki Hatayı Puan

Yöntemler Dayalı Yöntemler Cinsinden İfade Etme
İki Yarı
Test Tekrar Test
(Eşdeğer Yarılar)
Yöntemi Ölçmenin
Standart Hatası
Paralel
(Eşdeğer) Test
*KR20/ KR21
*Cronbach-Alfa
İki uygulamaya dayalı yöntemler
Test-Tekrar Test Yöntemi

TEST 1 TEST 1
Sorular: Aynı test Sorular:
1. …………… belli bir süre 1. …………….
2. …………... sonra aynı 2. …………….
3. …………… gruba tekrar 3. ………….…
. uygulanır. .
. .
. .
20. …………. 20. …………..
1. Uygulama 2. Uygulama
1 saat sonra 2 hafta sonra
Test-Tekrar Test Yöntemi
■ İki uygulama arası bırakılan zaman ne kadar olmalı
o Birkaç dakika?
o 3 saat?
o 2 gün?
o 1 hafta?
■ Olası HATA kaynakları

Bu güvenirlik “kararlılık” anlamında güvenirlik olarak bilinir.
Kararlılık, bir ölçme aracının tekrar tekrar kullanılması sonucu, elde edilen
sonuçların aynı ya da benzer olabilme derecesidir. Bir ölçme aracının
ölçmeden ölçmeye değişmeyen sonuçlar vermesidir.
Güvenirlik katsayısı O - 1 arasında değişir.
Güvenirlik belirlerken elde edilen korelasyon katsayısının yüksek olduğunu

söyleyebilmemiz için korelasyon katsayısının 0,70’ten yüksek olması
gerekir.
Ölçülen değişkende zaman içinde değişmenin az olacağı düşünülüyorsa

(duyuşsal alan davranışlarının ölçülmesi gibi) ve aracın kararlılığı hakkında
bilgi edinilecekse test-tekrar test yöntemi kullanılır.
Paralel (Eşdeğer) Formlar
Yöntemi
TEST A TEST B
Sorular: Sorular:
Aynı davranışları
1. …………… 1. …………….
ölçen fakat farklı
2. …………... 2. …………….
sorulardan oluşan
3. …………… 3. ………….…
iki test
. .
. .
. .
20. …………. 20. …………..
Paralel (Eşdeğer) Formlar Yöntemi
■ Paralel Test Nedir?

Testlerin paralel olması için, testler aynı özelliği ölçen eşit sayıda
soruya sahip testler olmalı ve testi oluşturan soruların güçlük
düzeylerinin, ayırıcılık düzeylerinin vb. aynı olması gerekir. Test ve
madde istatistiklerinin paralel olması beklenmektedir.
Paralel (Eşdeğer) Formlar
Yöntemi
Birbirine paralel yani aynı davranışları ölçen, fakat farklı sorulardan
oluşan iki test hazırlanır.
İki test aynı öğrencilere uygulanır ve öğrencilerin aldıkları puanlar

arasındaki korelasyon katsayısı hesaplanır.
Korelasyon katsayısı güvenirlik katsayısı olarak kabul edilir.
Bu yöntemle elde edilen güvenirlik katsayısı “eşdeğerlik katsayısı” olarak da

ifade edilir. Eşdeğerlik katsayısı, hem ölçme sonuçlarının zaman içindeki
kararlılığının hem de değişik test maddelerine verilen yanıtların tutarlılığının
ölçüsünü verir.
Olası HATA Kaynakları
Tek uygulamaya dayalı yöntemler
İki Yarı (Eşdeğer Yarılar) Yöntemi
SORULAR
1. …
2. …
3. …
.
..
20. …
1. YARI Uygula 2. YARI
SORULAR SORULAR
1. … 2. …
3. … 4. …
5. … 6. …
. .
. Tutarlılık .
19. … 20. …
■ Testi yarılama(eşdeğer yarılar): Testi oluşturan soruların hepsi aynı özelliği ölçüyorsa
yarılama işlemi tekler / çiftler, ilk yarı / son yarı ya da tesadüfi şekilde yapılabilir.
Fakat, sorular farklı özellikleri ölçüyorsa benzer özellikleri ölçen sorular farklı
yarılarda yer almalıdır.
Elde edilen korelasyon katsayısı testin yarısına ait korelasyon
katsayısıdır. Testin tamamı için güvenirlik kestiriminde, “Spearman
- Brown düzeltme formülü” kullanılır.
Olası HATA Kaynakları

■ Örnek: Uygulanan bir testin iki yarısından elde edilen puanlar arasındaki
korelasyon katsayısı 0,60 olsun. Bu testin tamamına ilişkin güvenirlik
katsayısını hesaplayalım:
İç Tutarlılık Güvenirliği Hesaplama Yöntemi
(KR 20/21- Cronbach Alfa)
Bir testin, bir defa uygulanması ve testte yer alan maddelerin analiz
edilmesine dayanır.
İç tutarlılık güvenirliği bir testteki maddelerin birbirleriyle ne derece

tutarlı olduğunun belirlenmesi için kullanılan bir güvenirlik
hesaplama yöntemidir.
Test maddelerinin birbirleriyle tutarlı olması, testte ilgisiz ya da

hatalı soru olmadığı anlamına gelir.
İç Tutarlılık: Bir testi oluşturan birimlerin birbirine benzerliğidir.

KR-20 / KR-21: 1-0 şeklinde puanlanan maddeli testlerde uygulanabilir
(çoktan seçmeli ya da doğru-yanlış).
Test bir kez uygulanır.
İç tutarlılık katsayısı olarak adlandırılır.
Testteki maddelerin aynı yeterliği ölçtüğü anlamına gelir (testin tek

boyutlu olduğu).
Testi oluşturan maddeler homojendir.

KR-20: Testteki her bir maddenin güçlük derecelerinin hesaplanmış

olması gerekir.
(Madde analizi yapılmış testler)
KR-21: Testteki her bir maddenin güçlük dereceleri bilinmiyor ve

güçlük derecelerinin eşit olduğu varsayılıyor.
(Madde analizi yapılmamış testler)
KR-20 ve KR-21 Arasındaki İlişki
KR-21 < KR-20
KR-21 güvenirliğin alt sınırıdır.
Güvenirlik ister KR-21 ister KR-20 ile hesaplansın

yapılacak yorum değişmez.
Cronbach Alfa: KR yöntemlerinden tek farkı 1-0 şeklinde
puanlanmayan çoklu puanlanan maddelerin yer aldığı testlerde
maddeler arasındaki tutarlılığı bulmak için kullanılır.
(Likert tipi tutum ölçekleri gibi)
Puanlayıcı Güvenirliği: Özellikle öznel puanlamanın söz konusu
olduğu testlerde kullanılan güvenirlik belirleme yöntemidir.
Testin, farklı kişiler tarafından puanlanmasıyla elde edilen puanlar
arasındaki korelasyonu ifade etmektedir.
Puanlama Güvenirliği: Testin, aynı kişi tarafından farklı zamanlarda

iki kez puanlanması sonucunda elde edilen puanlar arasındaki
korelasyondur.
Ölçmenin standart hatası
■ 85 IQ puanına sahip Mert’in zeka geriliği olduğunu
söyleyebilir miyiz?
90 110
Zeka geriliği normal üstün zekalı
• Bireysel puanları yorumlama

• Belli olasılıklarla testten alınabilecek maksimum ve minimum puanları
belirleme
04.06.2023 Ölçme ve Değerlendirme 26

Ölçmenin Standart Hatası
Güvenirlik için hatasızlığın bir ölçüsü olduğunu söylemiştik. Güvenirlik katsayısı

ölçme işleminde yapılan hatanın miktarını belirtmez.
Standart hata bize hatanın miktarını söyler.
Öğrencilerin gerçek puan aralıklarını bulmamızı sağlar.

■ Ortalaması 100 standart sapması 10 olan normal bir dağılım düşünelim.
■ Normal dağılan, ortalaması 100, standart sapması 10 olan puanların
neredeyse tamamına yakını 70 ile 130 arasında olacaktır.
■ Puanların herhangi bir dağılımı (ortalama ve standart sapma değerlerinden
bağımsız olarak), eğer dağılım normalse, puanların hemen hemen %100’ü
ortalamadan -3 ile +3 standart sapma arasına yerleşecektir.
Ortalamadan uzaklık İçerdiği Yüzde İçerdiği Puanlar
(Ortalama=100 SS=10
ise)
Ortalama ve 1 ss arası %34,13 100-110
1 ss ve 2 ss arası %13,59 110-120
2 ss ve 3 ss arası %2,15 120-130
3 ss ve üstü %0,13 130 ve üstü
Ortalama ve -1 ss arası %34,13 90-100
-1 ss ve -2 ss arası %13,59 80-90
-2 ss ve -3 ss arası %2,15 70-80
Normal dağılımda puanların yaklaşık;
%68’i +1SS ile -1 SS aralığındadır.
68-95-99 KURALI
%95’i +2SS ile -2SS aralığındadır.
%99’u +3SS ile -3SS aralığındadır.
%68.2
%95.4
%99.7
SS -3SS -2SS -1SS 1SS 2SS 3SS

Yüzde 0.13 2,27 15,86 50 84,12 97,71 99,85
■ ÖSH, bir bireyin testten aldığı puana karışmış olması muhtemel tesadüfi hata
miktarının ölçüsüdür.
■ Ölçmede yapılan hataların standart değeridir.
■ Güvenirlik katsayıları ölçülen özellik bakımından gruba bağlı değişme
gösterirken, ölçmenin standart hatası grup değişikliğinden daha az etkilenir.
■ Aynı araçla bir birey için sonsuz sayıda ölçme yapılsa, bireyin aldığı puanlar,
belli bir dağılım gösterecektir. Bu dağılımın ortalaması, kişinin gerçek puanının
iyi bir tahminidir. Böyle bir dağılımın standart kayması, ölçmenin standart
hatası olarak adlandırılır.
Standart sapması 4, güvenirlik katsayısı 0,75 olan bir testin standart hatası kaçtır?
Se  S x 1  rx
Se  4 1  0,75
Se  2
■ Ölçmenin standart hatası (SHö), bilinmesi durumunda, belli olasılıklar dahilinde
gerçek puanların alabileceği alt ve üst sınır değerleri (güven aralığı, GA)
bulunabilir.
Ölçme Sonuçlarının Güven Aralığının Hesaplanması

Bir öğrenci X puanı almışsa…
■ %68 olasılıkla Güven Aralığı: X ± 1 ÖSH (X-ÖSH, X+ÖSH)
■ %95 olasılıkla Güven Aralığı: X ± 2 ÖSH (X-2ÖSH, X+2ÖSH)
■ %99 olasılıkla Güven Aralığı: X ± 3 ÖSH (X-3ÖSH, X+3ÖSH)
Örneğin; X=80 ve ÖSH=4
■ %68 olasılıkla Güven Aralığı: 80 ± 4 (80-4, 80+4)(76, 84)
■ %95 olasılıkla Güven Aralığı: 80 ± 2(4) (80-8, 80+8)(72,88)
■ %99 olasılıkla Güven Aralığı: 80 ± 3(4) (80-12, 80+12) (68,92)
%95 olasılıkla 66-74 arasında
Öğrenci puanı: 70 %68 olasılıkla 68-72 arasında
Se = 2
-3Se -2Se -1Se 1Se 2Se 3Se
%99 olasılıkla 64-76 arasında

Güvenirliği Arttıran Faktörler
Yönergelerin ve testteki maddelerin açık, net ve anlaşılır olması

Testteki madde sayısının artması
1,00
Soru Sayısı
Güvenirlik
Soru Sayısı Soru Sayısı

Güvenirliği Artıran Faktörler
Testteki maddelerin güçlük düzeyi (orta güçlük)
Şans başarısının düşük olması
Testi alan bireye özgü durumlar (Psikolojik durum)
Test edilen grubun (test puanlarının) heterojen olması
Testi yanıtlama süresinin yeterli olması
Testin uygulama koşulları

Puanlama ve puanlayıcı nesnelliği (Puanlama güvenirliği)

Hafta Güvenirlik

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Hafta Güvenirlik

Uploaded by

Copyright:

Available Formats

Ondokuz Mayıs Üniversitesi

Eğitimde Ölçme ve Değerlendirme Anabilim Dalı

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME

Dr. Öğr. Üyesi Selda ÖRS ÖZDİL

Ölçme sonuçlarında hata miktarı ne kadar az olursa

Ölçme sonuçlarında karışan hata miktarı yüksek olursa

İki Uygulamaya Dayalı Tek Uygulamaya Testteki Hatayı Puan

Test-Tekrar Test Yöntemi

■ Olası HATA kaynakları

Güvenirlik katsayısı O - 1 arasında değişir.

Güvenirlik belirlerken elde edilen korelasyon katsayısının yüksek olduğunu

Ölçülen değişkende zaman içinde değişmenin az olacağı düşünülüyorsa

■ Paralel Test Nedir?

İki test aynı öğrencilere uygulanır ve öğrencilerin aldıkları puanlar

Korelasyon katsayısı güvenirlik katsayısı olarak kabul edilir.

Bu yöntemle elde edilen güvenirlik katsayısı “eşdeğerlik katsayısı” olarak da

1. YARI Uygula 2. YARI

Olası HATA Kaynakları

İç tutarlılık güvenirliği bir testteki maddelerin birbirleriyle ne derece

Test maddelerinin birbirleriyle tutarlı olması, testte ilgisiz ya da

İç Tutarlılık: Bir testi oluşturan birimlerin birbirine benzerliğidir.

Test bir kez uygulanır.

İç tutarlılık katsayısı olarak adlandırılır.

Testteki maddelerin aynı yeterliği ölçtüğü anlamına gelir (testin tek

Testi oluşturan maddeler homojendir.

KR-20: Testteki her bir maddenin güçlük derecelerinin hesaplanmış

KR-21: Testteki her bir maddenin güçlük dereceleri bilinmiyor ve

KR-21 < KR-20

KR-21 güvenirliğin alt sınırıdır.

Güvenirlik ister KR-21 ister KR-20 ile hesaplansın

Puanlama Güvenirliği: Testin, aynı kişi tarafından farklı zamanlarda

Zeka geriliği normal üstün zekalı

• Bireysel puanları yorumlama

04.06.2023 Ölçme ve Değerlendirme 26

Güvenirlik için hatasızlığın bir ölçüsü olduğunu söylemiştik. Güvenirlik katsayısı

Standart hata bize hatanın miktarını söyler.

Öğrencilerin gerçek puan aralıklarını bulmamızı sağlar.

SS -3SS -2SS -1SS 1SS 2SS 3SS

Ölçme Sonuçlarının Güven Aralığının Hesaplanması

Öğrenci puanı: 70 %68 olasılıkla 68-72 arasında

-3Se -2Se -1Se 1Se 2Se 3Se

%99 olasılıkla 64-76 arasında

Yönergelerin ve testteki maddelerin açık, net ve anlaşılır olması

Soru Sayısı Soru Sayısı

Testteki maddelerin güçlük düzeyi (orta güçlük)

Şans başarısının düşük olması

Testi alan bireye özgü durumlar (Psikolojik durum)

Test edilen grubun (test puanlarının) heterojen olması

Testi yanıtlama süresinin yeterli olması

Testin uygulama koşulları

You might also like