Professional Documents
Culture Documents
Eğitimde Ölçme Ve Değerlendirme: Uğur Yilmazer
Eğitimde Ölçme Ve Değerlendirme: Uğur Yilmazer
ÖLÇME VE
DEĞERLENDİRME
UĞUR YILMAZER 1
1. BÖLÜM
ÖLÇMENİN TEMEL KAVRAMLARI
ÖLÇME VE TEMEL KAVRAMLARI
ÖLÇME TÜRLERİ
ÖLÇEKLER
DEĞERLENDİRME VE TÜRLERİ
UĞUR YILMAZER 2
NEDEN ÖLÇME DEĞERLENDİRME YAPIYORUZ?
UĞUR YILMAZER 3
ÖLÇME NEDİR?
Bir nesnenin belli bir özelliğe sahip olup olmadığının, sahipse, sahip oluş
derecesinin gözlenip gözlem sonuçlarının sayısal olarak veya sembollerle ifade
edilmesidir.
Kısaca Ölçme, nitelikleri nicelemek; gözlem sonuçlarını sayısallaştırmaktır. Ölçme
bir gözlemdir. Bir betimleme işidir.
UĞUR YILMAZER 4
ÖLÇME İŞLEMİNİN AŞAMALARI NELERDİR?
5- NE KADAR?
FARK
4-ÖLÇME BELİRTMEK
ARACI
• Ölçülen
3-NEYE GÖRE UYGULANIR
özellik ya da
NASIL
• Değişken ile niteliği sayı,
2-NE İLE ÖLÇECEĞİZ?
ölçme aracı sembol, sıfat
ÖLÇÜLECEK?
• Özelliğin ne eşleştirmesi ile ifade
1-NEYİ
• Bu kadar yapılır edilir.
ÖLÇECEĞİZ?
davranışları miktarına ne
• Ölçülecek ölçecek bir kadar değer
nitelik ve ölçme aracı verileceğini
özelikleri hazırlanır. belirlenir.
belirlenir. PÜRR DİKKATT!!!
Ölçme yapa bilmek için öncelikle bir değişkene
sonra bir ölçme kuralına ihtiyaç vardır.
UĞUR YILMAZER 5
ÖLÇME İŞLEMİNİN TEMEL ÖZELLİKLERİ
1.Ölçme işlemi farktan doğmuştur. Farklılık olmasa her özellik sabit kalırsa
ölçmeye gerek yoktur.
2.Ölçme nitelikleri niceleme ve betimleme işidir. Betimlemede değişkenler
sayı, sembol ve sıfatlarla ifade edilir. Yani var olan değişkenler aynen ortaya
konur.
3.Ölçme bir özelliğin miktarını betimler ancak o özelliğin yeterliliğini ifade
etmez.
4.Tanımlanan, sıralanan, sınıflanan ve fark belirten her şey ölçmedir.
5.Ölçme, bir gözlemleme türüdür. Bir özellik ya da oluşum nicelendirilir.
6.Ölçme sürecinde bir yargı ya da yorum yapılmaz.
UĞUR YILMAZER 6
ÖLÇME SÜRECİ
DEĞİŞKENLER GÖZLEM YAPMA FARKLILIK BİLDİRME
• Boy uzunluğu • Metre ile ölçme • Alper‘in boyu 1,85cm
• Tarih bilgisi • Sınav yapma • Uğur tarihten 85 puan
• NE ÖLÇÜLECEK? • NE İLE ÖLÇÜLECEK? aldı
• NE İLE İFADE EDİLECEK?
ÖLÇME
BİRİM ÖLÇÜM
KURALI
• Akademik • Yazılı • Öğretmen
başarı • Her soru yoklama • Puan • Uğur 95
5 puandır puan aldı
ÖLÇÜLEN
ÖLÇME ARACI GÖZLEMCİ
DEĞİŞKEN
UĞUR YILMAZER 7
SORU ÇÖZERKEN PRATİK YOL
Bir yargının ölçme olup olmadığını anlamak için;
1. Verilen yargıda farklılık ifade ediliyor mu?
2. Verilen yargıda nitelikler nicelenmiş mi?
3. Verilen yargıda tanımlama var mı?
4. Verilen yargıda sınıflama ve sıralama yapılıyor mu?
Cevabınız “EVET” ise bu yargıda ölçme VARDIR.
Bu soruların hiç birine cevabınız “HAYIR” ise bu yargıda ölçme YOKTUR.
UĞUR YILMAZER 8
ÖLÇME İŞLEMİ İLE İLGİLİ ÖRNEKLER VE AÇIKLAMALARI
1.NİCEL DEĞİŞKEN Miktar belirten sayılarla ifade edilebilen özelliklerdir. Boy uzunluğu, ağırlık….
Değişkenin alacağı
3. SÜREKLİ İki değer arasında çok değer alan, kesirli, virgüllü ifade Uzunluk, ağırlık, reel sayılar
DEĞİŞKEN edilebilen değişkenlerdir. sistemi
UĞUR YILMAZER 10
Her sayı /rakam gördüğümüz yerde nicel değişken yoktur. Rakam miktar ifade
ediyorsa nicel değişkendir aksi halde nitel değişkendir.
Örneğin; sahada 11 futbolcu var ( rakam miktar anlamı taşıyor NİCEL DEĞİŞKEN dir)
Forması 11 olan futbolcu ( rakam miktar anlamı taşımıyor, NITEL değişkendir)
Nicel değişkenler nitel olarak ta ifade edilebilir.
Örneğin; Sınav puanı (90 puan) nicel değişken istenirse geçti-kaldı-başarılı-başarısız gibi
nitel olarak ta ifade edilebilir.
Nicel değişkenler nitel değişken hale dönüştürülebilir ancak nitel değişkenler nicel
değişken haline dönüştürülemez.
Bazen sorularda kavramların eş anlamları sorulur. Bunun için; sürekli
değişken=kesiksiz, süreksiz değişken=kesikli, nitel değişken=kategorik değişken
anlamındadır
UĞUR YILMAZER 11
BAĞIMLI VE BAĞIMSIZ DEĞİŞKEN SORULARI SIKLIKLA SORULMAKTADIR. BU SORULARDA PÜF
NOKTALAR;
1. TİP SORU; verilen açıklamadaki metne «burada neyin? Neye? Etkisi araştırılıyor?» sorulur.
Neyin? Cevabı BAĞIMSIZ, Neye? Cevabı BAĞIMLI değişkendir
Örn; Kullanılan öğretim tekniklerinin öğrenci başarısına etkisi araştırılıyor…….
(BAĞIMSIZ DEĞİŞKEN) (BAĞIMLI DEĞİŞKEN)
2. TİP SORU; verilen açıklamada «fark» kelimesi varsa «ama-göre» yoksa neden sonuç dikkate
alınarak değişkenler adlandırılır.
Örn; Cinsiyete GÖRE başarı puanları arasındaki fark var mıdır?
(Bağımsız Deg) (Bağımlı Degişken)
UĞUR YILMAZER 12
ÖLÇMENİN KAVRAMLARI / 2-ÖLÇME KURALI
UĞUR YILMAZER 13
ÖLÇMENİN KAVRAMLARI / 3-ÖLÇÜM
Ölçme işleminin sonunda ele edilen sayı, sembol ve sıfata ölçüm
denir. Kısaca ölçme sonucuna denir.
ÖRNEKLER;
“Aysima sınavda 85 puan aldı” cümlesinin tamamı ölçmedir fakat bu ölçme
ifadesi içinde geçen “sayı,sembol,sıfat” ölçüm olduğu için 85 rakamı ise
ölçümdür.
“Bu gün hava sıcaktır” cümlesini tamamı ölçmedir. Ancak “sıcak” sıfatı
ölçümdür.
“Alperen Matematik sözlü yoklamasında + aldı” ifadesinin tamamı ölçmedir.
Ancak “+” sembolü ölçümdür.
UĞUR YILMAZER 14
ÖLÇMENİN KAVRAMLARI/ 4-ÖLÇMEDE SIFIR
• Hiçlik-yokluk ifade eder. • Hiçlik-yokluk ifade etmez.
• Doğrudan ölçmelerde kullanılır. • Dolaylı ölçmelerde kullanılır.
• Eşit oanlı ölçeklerde kullanılır. • Eşit aralıklı ölçeklerde kullanılır.
• Sadece pzitif sayılar vardır. • Negatif yada pozitif değerler
• Oranlama ve kat hesabı yapılır. alabilir.
• Öğrenci sayısı,Ağırlık, Nüfus • Oranlama ve kat hesabı yapılmaz.
sayımı, Uzunluk, Yaş, Para...örnek • Notlar, takvim,
olarak verilebilir. meridyen/paraleller, termometre,
ilgi, tutum...örnek verilebilir.
BAĞIL
MUTLAK (DOĞAL,
(TANIMLANMIŞ,
GERÇEK) SIFIR
GÖRELİ, YAPAY) SIFIR
UĞUR YILMAZER 15
DOĞAL/MUTLAK SIFIR BAĞIL/İZAFİ SIFIR
Başlangıç HİÇLİK ten alındığını ifade Başlangıç VARSAYILAN noktadan
eder alındığını ifade eder
UĞUR YILMAZER 16
BURADA HANGİ SIFIRLAR VAR?
UĞUR YILMAZER 17
ÖLÇMENİN KAVRAMLARI / 5-BİRİM
Ölçme ve değerlendirmede genellikle ölçüm ile beraber kullanılan farklılık ifade etmede
başvurulan en küçük temel değere birim denir.
Birim, ölçme aracının en küçük parçasıdır.
Ölçülecek özelliğin ölçme standartıdır.
Birimler hem ölçme işlemini kolaylaştırır hem de ölçümlerin neyi ifade ettiğini daha net bir
şekilde ifade eder.
Sonuçları sayılarla ifadelendirirken çoğu halde bu birimler kullanılır. metre, kilovat,
kilogram, öğrenci sayısı(adet/tane), lira, saat gibi.
Örneğin "bir miktar tuz" ifadesi yerine "2 kg tuz" ifadesi daha anlaşılır ve herkes tarafından
aynı boyutta algılanan bir anlam ifade etmektedir.
UĞUR YILMAZER 18
ÖLÇMENİN KAVRAMLARI / 5-BİRİM
Ölçme sonuçlarının anlaşılır olması için bir birimde şu 3 özelliğe sahip olması gerekir
EŞİTLİK
GENELLİK
KULLANIŞLILIK
UĞUR YILMAZER 19
BİRİM TÜRLERİ
PÜRR DİKKAT!!!!
Tanımlanmış birimler bölünüp küçük parçalara ayrıla bildiği için doğal birimlere göre daha
duyarlı ölçme sonuçları elde etmeye imkan sağlar.
UĞUR YILMAZER 20
UĞUR YILMAZER 21
1- DOĞRUDAN (TEMEL) ÖLÇME
UĞUR YILMAZER 22
1- DOĞRUDAN (TEMEL) ÖLÇME
PÜR DİKKAT; DOĞRUDAN ÖLÇME ÖRNEKLERİ
Doğrudan ölçme yapmak ölçme Çocuğun kendisine verilen ayrana ayran kabına
dokunarak “sıcak” demesi
aracı kullanmamak anlamına
gelmez. Doğrudan ölçmede asıl Bu gün hava bulutludur ve günlerden pazartesidir.
olan ölçülen özellik dışında bir Zahide’nin 7 tane kalemi ve 3 kardeşi var.
başka özelliğin ölçme işlemine Bir sepet kayısının kütlesi, bir kova suyun hacmini
karışmamasıdır. Ölçmenin tasla ölçmek
doğrudan mı yoksa dolaylımı Sınıftaki kursiyer sayısını belirlemek
olup olması araç kullanımıyla
ilgili bir özellik değil, ölçme İnsanları ten rengine göre guruplamak
süreciyle ilgilidir. Sadece duyu Cinsiyet söylemek, ad söylemek, yaş söylemek.
organları kullanılarak yapılan Karış ile sıranın genişliğini yada ayak ile sıranın
tüm fark belirten ifadeler uzunluğunu belirlemek
doğrudan ölçmedir. Beş duyu organı kullanarak direkt fark belirtmek
UĞUR YILMAZER 23
2- DOLAYLI (GÖSTERGEYLE) ÖLÇME
UĞUR YILMAZER 24
2- DOLAYLI (GÖSTERGEYLE) ÖLÇME
PÜR DİKKAT; DOLAYLI ÖLÇME ÖRNEKLERİ
Uzunluk ve ağırlık ölçümleri hem doğrudan Zeka, bilgi, ilgi, tutum, kişilik, inanç gibi özellikler
hem de dolaylı, hem de türetilmiş ölçmeler dolaylı olarak ölçülür.
ile gerçekleştirilir. Örneğin; Malatya ile Hava sıcaklığını termometre ile ölçmek
Elazığ iller arasındaki mesafe belirlenirken; Ağırlığı elektronik tartı, baskül, yaylı terazi, kantar ile
Malatya-Elazığ arasındaki mesafeyi, bir ölçmek
metre kullanıp mesafeyi ölçmek, ya da Bir depremin şiddetini rihter ölçeği ile ölçmek
mesafeyi adımlamak “Doğrudan ölçme”
Malatya-Elazığ arasındaki mesafeyi, bir Telgraf tellerinin esnemesine bakarak havanın sıcak
olduğunu söylemek
araç ile gidip aracın kilometre
göstergesine bakıp ölçmek “Gösterge ile Öğrencilerin yazılı anlatım becerilerini ölçmek
Dolaylı ölçme” Bir kişinin alkol alıp almadığını dengede durup
Malatya-Elazığ arasındaki mesafeyi, durmadığına bakarak söylemek
yol=(hız)x(zaman) formülü ile ölçmek Parmaktaki yüzüğe bakarak evli/nişanlı olduğunu
“Türetilmiş Dolaylı ölçme” dir. söylemek
UĞUR YILMAZER 25
SORU ÇÖZMEDE PRATİK YOL:
Bir ölçmenin doğrudan mı, dolaylı mı yoksa türetilmiş ölçme olup olmadığını
anlamak için;
1. Yapılan ölçme işleminde ÖLÇÜLEN ÖZELLİK NE? KARŞILAŞTIRILAN ÖZELLİK NE?
Sorularının yanıtı nitelik olarak benziyorsa DOĞRUDAN ölçme, benzemiyorsa
DOLAYLI ölçme söz konusudur.
2. Ölçme işleminde ölçülen özellik ile bire bir karşılaştırılan bir ölçme birimi/aracı var
mıdır? var ise ölçme DOĞRUDAN, yok ise ölçe DOLAYLI ölçmedir.
3. Ölçülen özellik somut, oranlanabilir mi? Cevap evet ise DOĞRUDAN ölçme, aksi
halde DOLAYLI ölçme söz konusudur.
4. Ölçme sonucu elde edilen değer iki birimin dört işlemi kullanılarak elde edilmiş ise
TÜRETİLMİŞ ÖLÇME vardır.
UĞUR YILMAZER 26
KARIŞTIRMA!!!
Eğitimde, Psikolojide ve Sosyal bilimlerde; bilişsel, DEVİNİŞSEL VE DUYUŞSAL
alanda yapılan ölçmelerde;
Davranışları sayma DOĞRUDAN ÖLÇME
Davranışları puanlama DOLAYLI ÖLÇME
Davranışlarla ilgili karar alma DEĞERLENDİRME
Örneğin; Bir öğretmenin sözlü yoklamada öğrencinin verdiği doğru cevapları sayması (3 doğru
cevap verdi ya da 8 doğru cevap verdi demesi)performans sayısını belirlediği için “Doğrudan
ölçmedir” fakat bu doğru cevapları bir puanla ifade etmesi (30 puan aldı yada 85 puan aldı demesi)
“Dolaylı ölçmedir”. Aynı şekilde beden eğitimi öğretmeninin futbol oynayan kişilerin gol sayısını
söylemesi Doğrudan ölçme ve bunları puanla ifade etmesi Dolaylı ölçmedir. Bu durumlar resim ve iş
eğitimi dersleri içinde söz konusudur.
UĞUR YILMAZER 27
Ölçülen özellik ile
ÖLÇÜLEN ÖZELLİK ÖLÇME ARACI ÖLÇME TÜRÜ
Ölçme aracı aynı mı?
UĞUR YILMAZER 28
3- TÜRETİLMİŞ ÖLÇME
ÖRNEKLER;
Dolaylı ölçmenin bir başka şeklidir. Öğrencinin sınıf geçme notunun vize
İki ve ya daha fazla değişken arasında ortalamasının % 40’ıyla final puanının
yapılan ilişkilendirme (matematiksel bir % 60’ının toplanmasıyla elde edilmesi
işlem) sonucu elde edilen ölçmedir. Nüfus yoğunluğu, Alan ve hacim
ölçümleri, Gayrı safi milli hâsılanın
hesaplanması
Toplam Kişi başına düşen milli geliri
gelir
hesaplamak
Kişi başına Beden kitle indeksini belirlemek
düşen Bir bölgedeki nüfus yoğunluğu
milli gelir Hızı, yol ve zamandan faydalanarak
Kişi ölçmek
sayısı
UĞUR YILMAZER 29
SORULARDA ÇIKARSA GENEL OLARAK
DOĞRUDAN ÖLÇME: Özellik özellikle ölçülür. Direkt
gözlem sonuçları ve sayılabilen özellikler doğrudan
ölçülür. (SAYI-ADET-TANE)
DOLAYLI ÖLÇME: Özellik başka bir özellikle ölçülür.
Eğitimde en çok kullanır. Göstergeyle yapılan ölçümler
dolaylıdır. (EĞİTİM-İLGİ-TUTUM)
TÜRETİLMİŞ ÖLÇME: Formülüze edilmiş ölçmelerdir.
UĞUR YILMAZER 30
ÖLÇEK VE TÜRLERİ
ÖLÇEKLER TEMEL ÖZELLİĞİ ÖRNEKLER
Farklılık ve benzerlere dikkat edilir -Kişileri saç ve ten rengine göre sarışın esmer diye
SINIFLAMA
Sınıf-tip-gurup-kategorilere ayırılır gruplama
(ADLANDIRMA)
Ad ve numaralar verilir. -Evlere kapı numarası, sokaklara sokak adı verme
UĞUR YILMAZER 32
Bir öğretmen Bir öğretmen sınıfındaki Öğretmen daha sonra Öğretmen bir gurup öğrencinin
sınıfındaki bir gurup öğrencinin boy öğrencilerin boy uzunluğunu Coğrafya dersinden aldıkları
öğrencileri uzunluklarını ölçmüş şu en uzundan en kısaya doğru puanları şu şekilde sıralamıştır.
değerleri elde etmiştir. derecelendirmiş ve her
Mehmet
öğrenciye buna göre numara Mehmet 100puan
Uğur ERKEK 1,85cm vermiştir. Sultan 92puan
Bülent 1,81cm Uğur 85puan E.Aralık
Serkan 1,73cm Oranlı ölçek 1. 1,85cm Tülay 84puan Ölçek
Sultan 1,72cm 2. 1,81cm Bülent 70puan
Tülay KIZ 1,68cm 3. 1,73cm Sıralama Serkan 54puan
4. 1,72cm Ölçeği
Şeklinde cinsiyet Çünkü burada öğretmen 5. 1,68cm Çünkü öğrenci başarısını ölçerken
bakımından ayırması boy ölçerken başlangıç başlangıç noktası izafi sıfır
ve bunlara adlar, noktasını gerçek sıfır Çünkü öğretmen öğrencilerin kullanılır. Eğer öğrencilerin
olarak almıştır, buna göre boy uzunluğunu astlık burada başarıları sıra numarası
nomaralar verip sıf
ölçerek sıralama yapması üstlüklerine göre sıralamış ile ifade edilmiş olsaydı sıralama
guruplara ayırması E.Oranlı ölçektir. Sıralama ölçeğidir. ölçeği olurdu
Sınıflama ölçeğidir
UĞUR YILMAZER 33
DEĞERLENDİRME / DURUM BELİRLEME
UĞUR YILMAZER 34
ÖLÇÜT/KRİTER
Ölçme sonuçlarının karşılaştırıldığı ya da kıyaslamaya tabi tutulduğu değerdir.
Ölçüt değerlendirmenin neye göre yapılacağını ve kararın niçin alındığını belirtir.
Ölçüt, ölçme sonuçlarıyla aynı birim ile ifade edilmelidir..bu doğru karar vermeyi sağlar.
UĞUR YILMAZER 35
MUTLAK VE BAĞIL ÖLÇÜT ÖRNEKLERİ
MUTLAK ÖLÇÜT BAĞIL ÖLÇÜT
• 100 metreyi 10 saniye altında koşarsa • 100 metreyi ilk beş içinde koşarsa
kazanır kazanır
• Finalde 60 puan ve üstü alırsa geçer • Finalde sınıf ortalaması olan 55 puan
• Kazanımların %70 ine ulaşırsa geçer üstü alırsa geçer
• Öğrenme eksikliklerini tamamlarsa alınır • Sınıfta ilk %70 lik dilime girerse guruba
• Eğitim bilimleride 60 ve üstü net yaparsa alınır
atanır • Z puanı 2 üstü olanlar seçilir
• Kpss de branşında ilk 300 e girerse atanır
PÜRR DİKKAT!!!
Bir alanda yada derste yeterliğin belirlenmesi, konu kapsamı yada hedef davranışa dayalı
ölçmeler söz konusu ise mutlak ölçüt kullanılmalıdır.
Seçme sınavlarında(AYT,ALES,KPSS…) bağıl ölçüt kullanmak daha uygundur.
UĞUR YILMAZER 36
ÖLÇÜTE GÖRE DEĞERLENDİRME TÜRLERİ
1- MUTLAK DEĞERLENDİRME /KRİTER PÜR DİKKAT!!MUTLAK DEĞERLENDİRME;
REFERANSLI-ÖLÇÜT DAYANIKLI
DEĞERLENDİRME Programın hedefleri göre yapılır
Dersin, konunun, ünitenin hedefleri için
Değerlendirmede kullanılan ölçüt önceden
yapılır.
belirlenmiştir ve kesin olan MUTLAK
ölçüttür. Öğrenme eksikliklerini belirlemek için yapılır.
Ön koşul öğrenme ve hazırbulunuşluğu
Tüm bireyler aynı ölçütle
değerlendirildiğinden adalet duygusu yaratır. belirlemek için yapılır.
İçerik-kapsam sınırına bağlı yapılır
Sınıf içi ders başarısını değerlendirmede
Nota puana göre yapılır
daha çok önerilir.
Öğretmen kanısına bağlı yapılır.
Bir öğrencinin neleri yapıp ya da
yapmadığını gösterir. • Sınıf geçme notu 50’dir demek mutlak bir ölçüttür,
“Uğur sınavda 85 puan alıp sınıfını geçti” demek
Öğretmenler bu değerlendirme ile mutlak değerlendirmedir.
öğrenciler hakkında kesin kararlar verir. • Öğrenci önceden belirlenen hedef davranışların
%60’ını gerçekleştirerek dersi geçti.
UĞUR YILMAZER
ÖLÇÜTE GÖRE DEĞERLENDİRME TÜRLERİ
2- BAĞIL DEĞERLENDİRME/NORM DAYANIKLI
DEĞERLENDİRME BAĞIL DEĞERLENDİRME ÖRNEKLERİ
Bağıl ölçütler kullanılarak yapılan Ortalamanın üstünde not alanlar sınıfı
değerlendirmedir. geçti.
Değerlendirmede kullanılan ölçüt guruptan Koşu testinde ilk 10’a girenler okul atletiz
bağımlıdır. Bu değerlendirme öğrencinin gurup takımına seçildi
içindeki başarısını gösterir. Yani öğrenci başarıları Yemek yarışmasında sıralamada 1. Olarak
biri birine bağımlıdır. 10.000 TL ödülü aldı
Normlara göre yapılan değerlendirmeler bağıldır. Sınıfın en iyisi olduğu için bilgi
Öğrenci başarıları biri biri ile karşılaştırılarak en yarışmasına alındı
yüksek puan alanlar başarılı kabul edilir Branşında ilk 500 kişi içinde olduğu için
Öğrencilerin gelişim düzeyleri(ders başı- ders sonu atandı
farkı), yetenekleri dikkate alınarak yapılan X partisi ülke barajını aşıp mecliste temsil
değerlendirmeler bağıl değerlendirmedir. hakkı kazandı
En büyük sakıncası öğrenci bireysel rekabete Çan eğrisi, grup ortalaması (aritmetik
girmez ve gurup başarısı ile yetinir. ortalama) denilen analiz, bağıl
değerlendirmedir.
UĞUR YILMAZER
SORU ÇÖZMEK İÇİN PRATİK YOL;
Verilen yargılarda mutlak mı yoksa bağıl mı değerlendirme
yapıldığını anlamak için;
“Değerlendirme işleminde kullanılan ölçüt ölçme yapılan
guruba(ölçme sonuçlarına) bağlı olarak sonradan mı elde
edilmiştir?”
cevabınız “EVET” ise Mutlak
cevabınız “Hayır” ise Bağıl değerlendirme yapılmıştır.
UĞUR YILMAZER
NERELERDE KULLANILIR?
Hedefleri ölçme amaçlı ise
Sınav süresi az ise Hazırbulunuşluğu ölçme amaçlı ise
Sorular çok zor veya çok kolay ise Muafiyet sınavı ise
Seçme amaçlı bir sınav ise Öğrenme eksikliklerini belirleme amaçlı ise
Başvuran sayısı çok alım az ise Kişi hakkında verilecek karar kritik ise
Geniş kapsamlı bir sınav ise Sorular orta güçlükte ise
Bir sınava katılan öğrencilerden 70 ve üzeri puan alan Bir sınava katılan öğrencilerden, puan sıralamasına
öğrenciler başarılı kabul edilmiştir. göre ilk 10 giren öğrenciler başarılı kabul edilmiştir.
“Sınava katılanların başarı sırasına göre ilk %10'u sınavı geçmiştir” demek bağıl değerlendirmedir.
“Sınava katılanlardan soruların %10'unu yapan geçmiştir” demek mutlak değerlendirmedir.
UĞUR YILMAZER
AMACA GÖRE DEĞERLENDİRME TÜRLERİ
UĞUR YILMAZER
AMACA GÖRE DEĞERLENDİRME TÜRLERİ-1
1- TANIMA VE YERLEŞTİRMEYE YÖNELİK (DİAGNOSTİK) DEĞERLENDİRME
ÖRNEKLERİ
NELERDİR?
NOT • Her türlü
KULLANILIR MI? seçme ve
ÖLÇÜTÜ • Değerlendirm yerleştirme
NEDİR? ede not sınavları,
KAPSAMI • Hazır kullanılmaz. muafiyet
NEDİR? bulunuşluk Elde edilen sınavları,
NİÇİN YAPILIR? • İlgili program düzeyini puanlar hazır yetenek
• İlgili program için hazır belirlemede bulunuşlukta testleri, bireyi
NE ZAMAN için hazır bulunuşluk, mutlak ölçüt tanınmak tanıma test
YAPILIR? bulunuşluk, ön öğrenme kullanılırken, sıralamak teknikleri,
• Eğitim ön öğrenme durumunu seçme ve içindir. SBS, Psikolojik
öğretim durumunu tesbit için yerleştirmede tanı testleri…
sürecinin tesbit edip gerekli olan bağıl ölçütler
başında yapılır kişileri tüm kullanılır.
sıralayıp içeriklerdir.
seçmek ve
yerleştirmek
amaçları ile
yapılır
UĞUR YILMAZER
AMACA GÖRE DEĞERLENDİRME TÜRLERİ-2
2- BİÇİMLENDİRME - YETİŞTİRMEYE YÖNELİK (FORMATİF) DEĞERLENDİRME
NOT
NE ZAMAN NİÇİN KAPSAMI ÖLÇÜTÜ
KULLANILIR ÖRNEKLERİ
YAPILIR? YAPILIR? NEDİR? NEDİR?
MI? NELERDİR?
UĞUR YILMAZER
AMACA GÖRE DEĞERLENDİRME TÜRLERİ-1
3- DÜZEY (SEVİYE) BELİRLEMEYE YÖNELİK (SUMMATİF) DEĞERLENDİRME
UĞUR YILMAZER
SORU ÇÖZMEK İÇİN PRATİK YOL;
Amaca yönelik değerlendirme sorularını çözmek için sırası ile şu işlemleri gerçekleştiriniz.
1.Öncelikle değerlendirme işleminin kendisinin zamanıyla ilgili bilgi var mıdır? Sorusunu
sormamız gerekir. Eğer bu soruya cevabınız “evet” ise zaman ifadesini incelememiz gerekir.
2. Sonra değerlendirme niçin yapılmış yada “Değerlendirmenin amacı nedir?” sorusuna cevap
aranmalıdır.
Hazır bulunuşluğu ön öğrenmeleri tespit etmek amaçlanıyorsa TANILAYICI,
bir ünite yada konu sonrası öğrenme eksikliklerini gidermek ise BİÇİMLENDİRİCİ,
program sonu yeterlik kazanım düzeyini belirlemek ise DEĞER BİÇİCİ değerlendirme vardır.
UĞUR YILMAZER
TANIMA YERLEŞTİRME AMACIYLA Hazırbulunuşluk düzeyi belirleniyorsa...MUTLAK DEĞERLENDİRME
YAPILAN DEĞERLENDİRMEDE
Seçme amaçlı yapılıyorsa..............BAĞIL DEĞERLENDİRME
İZLEMEYE-BİÇİMLENDİRMEYE
YETİŞTİRMEYE YÖNELİK DEĞERLENDİRME MUTLAK DEĞERLENDİRME
UĞUR YILMAZER
2. BÖLÜM
ÖLÇMEDE HATA VE ÖLÇME ARAÇLARINDA
BULUNMASI GEREKEN NİTELİKLER
ÖLÇMEDE HATA VE TÜRLERİ
KORELASYON VE ANLAMLARI
GÜVENİRLİK
GEÇERLİK
KULLANIŞLIK
UĞUR YILMAZER 48
ÖLÇME HATASI VE HATA TÜRLERİ
Ölçülen nesnenin gerçek değeri ile ölçme sonuçlarından elde edilen değer arasındaki farka
ölçme hatası denir.
X(gözlenen test puanı) = T(gerçek puan) + E(hata puanı)
Bir ölçme işlemindeki hata miktarı, o ölçme işleminde kullanılan birimin en az yarısı kadardır.
Birim aralığı ne kadar küçülürse hata miktarı o kadar azalır. Her ölçme işleminde bir miktar
hata karışır. Önemli olan gerçeğe yakın ölçümler yapmaktır.
ÖLÇMEDE HATA KAYNAKLARI;
Ölçmeciden (öğretmen) kaynaklanan hatalar
Ölçülenden (öğrenci) kaynaklanan hatalar
Ölçme aracından kaynaklanan hatalar PÜR DİKKAT;
Ölçme yönteminden kaynaklanan hatalar Gözlenen puan ile gerçek puan arasındaki fark azaldıkça
ölçme aracının güvenirliği artar. Yani hata ile güvenirlik
Ölçme ortamından kaynaklanan hatalar
ters orantılıdır.
Ölçülen özellikten kaynaklanan hatalar Ölçme işlemine hata karışmasının en önemli nedeni,
ölçülen özelliklerin kararlı olmaması yani değişkenlik
göstermesidir.
UĞUR YILMAZER 49
ÖLÇME HATASI VE HATA TÜRLERİ
Hatanın Kaynağı, Yönü Ve
HATA TÜRLERİ Temel Özellikleri İstatistiksel Kullanım Alanları
Miktarı
UĞUR YILMAZER 50
UĞUR YILMAZER 51
Hata türleri ile ilgili sorularda verilen madde kökündeki
açıklamalara dikkat edilerek açıklamada öncelikli olarak “ölçme
sonuçlarına karışan hatanın yönü ve miktar belirlene biliyor
mu?” sorusu cevaplandırılmalıdır.
Bu soruya cevabımız “hayır” ise açıklamada verilen hata türü
TESADÜFÎ hatadır.
Bu soruya cevabımız “evet” ise bu sefer “ölçme sonuçlarına
karışan hatanın yönü ve ya miktarı değişiyor mu?” sorusu
cevaplandırılmalıdır.
Bu soruya cevabımız “evet” ise ve yön yada miktardan en az
biri yada ikisi değişiyorsa SİSTEMATİK hata söz konusudur.
Bu soruya cevabımız “hayır” ise ve yön ya da miktardan her
ikiside değişmiyorsa sabit hata söz konusudur.
UĞUR YILMAZER 52
KORELASYON
İki değişken arasında ilişki olup olmadığını,
varsa ilişkinin yönünü ve miktarını
belirlemeyi sağlar.
Korelasyon katsayısı -1 den +1 e kadar
değişik değer alabilir
Koresyon değeri ile; not başarısı, not
ortalaması, neden-sonuç ilişkisi, geçerlik
durumu, güvenirlik durumu,geçerlik
yoromu, gurup başarısı hakkında YORM
YAPILAMAZ.
-1,00Negatif ilişki azalır Negatiflik artar 0,00 Pozitiflik artar Pozitiflik azalır +1,00
PÜRRR DİİKKAT!!!
Tablo sorularında tarih – tarih gibi ilişkiler olmaz üstünü çizelim. Korelasyonda 1 e doğru yaklaştıkça
ilişki artar, 0 a doğru ilişki azalır. Korelasyon ile ilgili tablo sorularında İLİŞKİ BÜYÜKLÜĞÜNDE (– , +)
işaretleri önemsizdir. (– , +) işaretleri ilişkinin YÖNÖNÜ belirlemede etkilidir.
Korelasyon öğrenci notu,aritmetik ortalama gibi değerler hakkında bilgi vermez.
UĞUR YILMAZER 54
UĞUR YILMAZER 55
ÖLÇME ARACINDA ARANAN NİTELİKLER
KULLANIŞLIK = karşılıklı
GÜVENİRLİK (rx) = Nişan GEÇERLİK (rxy) = Düğün
sebatkarlık
• Aranan ilk özelliktir • Aranan en önemli • Ölçme aracının güvenir
• Ölçme aracının ölçtüğü özelliktir ve geçerli olduktan sonra
sonuçlar ile ilgilidir, • Ölçme aracının kendisi hazırlaması, puanlaması,
sonuçların tesadüfi ile ilgili olup aracın uygulanması…ekonomik,
hatalardan arınıklık amaca uygun kullanılma pratik olma düzeyidir.
düzeyidir. düzeyidir.
• 0,00 ile +1,00 arasında • -1,00 ile +1,00 arasında
değerler alır. (minimum değerler alır. (minimum
0,70 olmalı) 0,30 olmalı)
• Tesadüfi hatalardan • Sabit ve sistematik
etkilenir hatalardan direkt,
tesadüfi hatadan dolaylı
etkilenir.
UĞUR YILMAZER 56
ÖLÇME ARACINDA ARANAN NİTELİKLER 1-GÜVENİRLİK(rx) KIZ İSTEME / NİŞAN
UĞUR YILMAZER
Güvenirliğin temelini duyarlılık oluşturur
SORULARIN
Soru sayısını SORU GÜÇLÜĞÜ VE
arttırmak SAYISI AYIRT
duyarlılığı EDİCİLİĞİ
arttırır. Soruların orta güçlükte
SORULARIN
Böylece ayırt ediciliği yüksek
YAPISI
güvenirlik olması güvenirliği arttırır.
artar.
Soruların
benzer,uyumlu,homojen olması
iç tutarlık güvenirliği arttırır.
UĞUR YILMAZER
ÖLÇME ARACINDA ARANAN NİTELİKLER 1-GÜVENİRLİK(rx) KIZ İSTEME / NİŞAN
GÜVENİRLİĞİ ETKİLEYEN FAKTÖRLER
TESTİN
UYGULANDIĞI
GRUP ŞANS
BAŞARISI
KOPYA
Testin uygulandığı grubun
heterojen olması
güvenirliği artırır. Bu iki özellik
güvenirliği olumsuz
TESTİN
STANDART
etkiler.
SAPMASININ
YÜKSEK OLMASI
UĞUR YILMAZER
ÖLÇME ARACINDA ARANAN NİTELİKLER 1-GÜVENİRLİK(rx) KIZ İSTEME / NİŞAN
GÜVENİRLİĞİ ETKİLEYEN FAKTÖRLER
GÜVENİRLİK BİLEŞENLERİ;
İÇ TUTARLILIK: Ölçek maddelerinin birbirleriyle ilişkili olarak aynı yapıyı
ölçmelidir.
İSTİKRARLILIK: Ölçüm sonuçlarının aynı ve farklı koşullarda kararlılık
göstermesi ve değişmemesidir.
TEMSİL EDİCİLİK: Testin aynı ana kütleye ait farklı örneklemlerde
uygulandığında benzer sonuçlar vermesidir.
EŞ DEĞERLİLİK: Aynı zamanda uygulanan iki veya daha fazla testin benzer
sonuçlar vermesidir.
NESNELLİK: Gözlemciler arasındaki değerlendirme güvenilirliğidir. Farklı
değerlendiricilerin aynı kişilerle ilgili olarak benzer puanları vermeleridir
UĞUR YILMAZER 62
ÖLÇME ARACINDA ARANAN NİTELİKLER 1-GÜVENİRLİK(rx) KIZ İSTEME / NİŞAN
UYGULAMA
GÜVENİRLİK TEKNİĞİ ANLAMI TEST SAYSI HATA KAYNAĞI
SAYISI
Test-Tekrar Test Kararlılık Bir İki Zaman
Paralel Formlar
Tutarlılık İki Bir Paralel soru yazmama
(Birlikte Uygulama)
Paralel Formlar Tutarlılık ve Zaman ve paralel soru
İki İki
(Aralıklı Uygulama) kararlılık yazmama
Yarıların farklı güçlükte
Testi Yarılama İç tutarlılık Bir Bir
olması
Kr-20 Ve Kr-21 İç tutarlılık Bir Bir Soruların farklılığı
Corenbach Alfa İç tutarlılık Bir Bir Soruların farklılığı
Puanlayıcı Tutarlılık Bir Bir Puanlayıcının kanı farkları
Puanlama Kararlılık Bir Bir Zaman
UĞUR YILMAZER 63
GÜVENİRLİK TEKNİKLERİ / 1-TEST TEKRER TEST YÖNTEMİ
UĞUR YILMAZER 64
GÜVENİRLİK TEKNİKLERİ / 2-PARALEL FORMLAR TEST YÖNTEMİ
NEDİR?
Öğrenciler A TESTİ B TESTİ
• Aynı kapsamı ölçen, aynı güçlük ve ayırt edicilikte iki
denk test guruba kısa sürede(her iki test bir defada Uğur 100 98
yada ayrı ayrı 3 gün içinde) uygulanır ve elde edilen Ayşe 70 72
puanlar arasındaki korelasyona bakılır.(0,85 üstü
olmalı) Alperen 79 77
Burakhan 89 88
GÜVENİRLİK ANLAMI NEDİR?
Aysima Ebrar 92 90
• Tutarlık katsyısı
Öğrencilerin iki testten aldıkları puanlar
ÖNEMLİ ÖZELLİKLERİ NELERDİR? arasındaki uyum yüksek, korelasyon değeri 0.90
• 2 denk test 1 guruba 1 kez uygulanır İki test eşdeğer ve İki test tutarlıdır.
• Hata kaynağı testlerin denkliğini oluşturmak zordur Tutarlılık güvenirliği yüksektir
• Başarı, Kişilik, zeka, yetenek, tutum gibi çabuk Tesadüfi hata az
değişmeyen test sonuçlarını denetleme daha Uygulama koşulları benzer
uygundur.
Kapsamı aynı ve Soru güçlükleri aynı
• Avantajı; iki ayrı test ile fazla soru ile denetleme yapılır,
dezavantajı denk test oluşturma güçlüğüdür. Ölçülen hedef davranışlar aynıdır.
UĞUR YILMAZER 65
GÜVENİRLİK TEKNİKLERİ / 3-TESTİ YARILAMA YÖNTEMİ
NEDİR?
1 6 11 1 3 5 7
• Test guruba uygulanır, verilen cevaplar puanlanır. 2 7 12 9 11 13
Sonra tek nolu soru cevap puanları bir yarı forma , (rx1,2)= 0,80
çift soru cevap puanları ayrı bir yarı formda
3 8 13
toplanır ve bu yarı formlar arasındaki korelasyon 4 9 14 2 4 6 8
değeri 2 ile çarpılıp, korelasyonun 1 fazlasına 5 10 10 12 14
ölünür. (bu değer en az 0,70 üstü olmalıdır)
UĞUR YILMAZER 66
GÜVENİRLİK TEKNİKLERİ / 4-KR/20 ve 21 YÖNTEMİ
NEDİR?
KR20 KR21
• Kr 20 ve Kr21 iç tutarlık bünyesinde güvenirlik
katsayısı hesaplama yöntemleridir. • Madde istatistikleri • Test istatistikleri
• Bu yöntemlerin hesaplanabilmesi için testteki hesaplanmışsa hesaplanmışsa
soruların %90’nı öğrenciler tarafından kullanılır kullanılır
cevaplandırılmalıdır.
• Düzelteme formülü de kullanılmamalıdır .
• Madde güçlükleri • Madde güçlükleri
farklı ise kullanılır bilinmiyorsa kullanılır
GÜVENİRLİK ANLAMI NEDİR?
Kr20 her zaman kr21’den daha yüksek çıkar. Kr21 güvenirliğin
• İç Tutarlık katsayısı alt sınırıdır.
KR-20 ve KR-21 güvenirlik değerleri 0,70 ten yüksek çıkarsa ;
ÖNEMLİ ÖZELLİKLERİ NELERDİR? Testin iç tutarlılığının yüksek olduğu
• 1 test 1 guruba 1 kez uygulanır Testin tek boyutlu yapıyı ölçtüğü (sadece tek bir özelliği
• Hata kaynağı yerli sayıda madde içinde seçim ölçmesi)
yapılmayabilir Maddelerin homojen ve uygun yapıda olduğu
• Özellikle 0/1 şeklinde puanlanan Doğru yanlış test Maddelerin birbirleriyle uyumlu tutarlı ve tesadüfi
Kontrol listeleri, Çoktan seçmeli testlerin hatadan arınık olduğu
güvenirliğini belirlemede etkilidir. Grubun heterojen olduğu söylenebilir.
UĞUR YILMAZER 67
GÜVENİRLİK TEKNİKLERİ / 5- C.ALPHA YÖNTEMİ
NEDİR? PÜR DİKKAT;
• Madde sayısı, maddelerin varyansı ve test Güvenirlik katsayısı hesaplamada kullanılan Croncbach Alfa kat
puanlarının varyansı dikkate alınarak hesaplanan sayısı güvenirlik kat sayısının alabileceği minimum değeri verir.
özel bir yöntemdir. Bu nedenle testin güvenirliğinin bundan çok daha yüksek
• Kr 20 tekniğinin 1-0’dan farklı 0-1-2-3-4-5 şeklinde olacağı göz önünde bulundurulmalıdır. Yani testin güvenirlik kat
puanlanan testler için geliştirilmiş özel bir halidir. sayısı alfa kat sayısından daha yüksektir. Alfa kat sayısı KR-20 ve
• Likert tipi dereceli ölçekler için kullanılır. KR-21 in daha genel halidir. Alfa güvenirlik kat sayısı da tıpkı KR-
• Psikolojik ve psikomotor testlerin güvenirliğini 20 ve KR-21 gibi 0,00 ile +1,00 arasında değerler alır Formül
hesaplamak için uygundur sonuçları KR-20 ve KR-21 gibi yorumlanır
İç tutarlılık yöntemleri şunlardır:
GÜVENİRLİK ANLAMI NEDİR? 1- Yarıya bölme 4- Teta
• İç Tutarlık katsayısı 2-KR 20 / KR 21 5- Omega
3- Cronbach -Alfa 6- Guttman
ÖNEMLİ ÖZELLİKLERİ NELERDİR? UNUTMA!!!;
• 1 test 1 guruba 1 kez uygulanır Güvenirliği etkileyen önemli istatistikî faktörler şunlardır;
• Hata kaynağı yerli sayıda madde içinde seçim Standart hata ve Standart sapma
yapılmayabilir Ranj(dizi genişliği)
• Özellikle duyuşsal alan ve devinişsel alanı ölçen Test sorularının ayırt edicilik gücü
test sonuçlarını denetlemeye uygundur. Soruların güçlüğü ve Ölçme birimi
Geçerlik
UĞUR YILMAZER 68
GÜVENİRLİK TEKNİKLERİ
UĞUR YILMAZER
Puanlama güvenirliği
Puanlayıcı güvenirliği
Öğrenci isimlerinin kapatılarak sınavının okunması
Öğrenci sınavlarının cevap anahtarı İle okunması
Her kağıdın 1. sorusu puanlandıktan sonra 2. Sorunun ve diğerlerinin
okunması,
OBJEKTİFLİK KAVRAMI İLE İLGİLİDİR
BU DURUM GÜVENİRLİĞİ ARTIRIR.
UĞUR YILMAZER 70
GÜVENİRLİK İLE İLGİLİ SORULARDA PRATİK YOL;
Çıkan soru kökünde yada seçeneklerde duyarlık, tutarlık, iç tutarlık, kararlılık, hataların azlığı,
objektiflik(nesnellik), ölçülen özelliğin yansıtma düzeyi gibi ifadeler geçiyorsa o soru kökü yada
seçenek büyük olasılıkla güvenirlik ile ilgilidir.
UĞUR YILMAZER 72
ÖLÇMENİN STANDART HATASI (Sh /Se)
I 0.80 2 I 0.36 2
II 0.80 4 II 0.64 2
III 0.80 6 III 0.75 2
IV 0.80 8 IV 0.91 2
UĞUR YILMAZER
PUANLARIN GÜVEN ARALIĞINI HESAPLAMA
Puanların gerçek aralığı soruldugunda eğer standart hata
verilmemiş ise önce testin standart hatası hesaplanır
%34,13
%34,13
Standart hatası bireylerin gözlenen puanların gerçek
puanlara yakınlığı ya da uzaklığı konusunda bilgi vericidir
Standart hata sıfır ise bireylerin gözlenen puanı ile gerçek
puan birbirine eşittir.
%13,59
%13,59
Standart hata ne kadar küçükse gözlenen puan gerçek
%2,14
%2,14
puana o kadar yakın, standart hata ne kadar büyükse
gözlenen puan gerçek puana o kadar uzaktır.
Puanların güven aralığı standart hata doğrultusunda 3 Sx -3 -2 -1 0 +1 +2 +3
UĞUR YILMAZER
PUANLARIN GÜVEN ARALIĞINI HESAPLAMA
ÖRNEK SORU : Testin standart sapmasının 5, güvenirlik kat sayısının 0.84 oldugu bir sınavda
50 alan bir öğrencinin gerçek puan aralığı % 68 olasılıkla hangi puan aralıgındadır?
Sh= s.sapma 1 − 𝑟
Sh= 5 1 − 0.84
Sh= 2
%68 %95 %99
48 ile 52 46 ile 54 44 ile 56
Puanları puanları puanları
Arasında arasında arasında
NOT: Diyelim ki geçme dersi 60 olan bir dersten öğrencimiz 58 almış ve biz onu dersten
geçirmişsek bu standart hatayı dikkate aldığımızı gösterir.
UĞUR YILMAZER
ÇIKAN SORULARDA ANAHTAR KAVRAMLAR
UĞUR YILMAZER 76
ÖLÇME ARACINDA ARANAN NİTELİKLER 2-GEÇERLİK(rxy) DÜĞÜN
Bir ölçme aracının ölçmeyi amaçladığı özelliği başka herhangi bir özellikle karıştırmadan,
doğru olarak ölçebilme derecesidir.
UĞUR YILMAZER 77
Geçerlik, bir ölçme aracının kullanıldığı amaca hizmet etme derecesi
olduğu için, ölçme araçlarından elde edilecek ölçümler hangi amaçla
kullanılacaksa ölçme geçerliği de o amaca bağlı olarak değişecektir. Bir
ölçeğin geçerliği sadece kendisiyle de belirlenemez. O ölçeğin,
Kullanış amacına,
Uygulandığı gruba,
Uygulama biçimine,
Puanlama biçimine de bağlıdır.
UĞUR YILMAZER 78
GEÇERLİLİK ( Düğün)
UĞUR YILMAZER 79
Bir sorunun kökünde AMAÇtan bahsediliyorsa geçerlik söz konusu
yapılmaktadır. Aksi durumda soru kökünde geçerlikten bahsediliyorsa verilen
seçeneklerde AMAÇ ile ilgi olan doğru cevaptır.
Kısaca geçerlik, bir ölçme aracının ölçmeyi amaçladığı özelliği başka özelliklere
karıştırmadan, doğru olarak ölçebilme derecesidir.
Bir ölçme aracının geliştirilmiş olduğu konuda maksada hizmet etmesidir.
Testin yada sorunun bilen ile bilmeyeni veya davranışa sahip olanla olmayanı
ayırma derecesi geçerliği ifade eder. Bu durum eğitimde kullanılan araçların
geçerliğini belirlemede ve madde analizlerinde çok kullanılır.
UĞUR YILMAZER 80
GEÇERLİK İLE GÜVENİRLİK ARASINDAKİ İLİŞKİLER-1
Güvenirlik geçerlilik için ön koşuldur. Çünkü ölçme araçları sonuçlarının güvenirliği düşükse ölçme
aracının amaca hizmet etme düzeyi de düşük olacak ve dolayısıyla geçerlikte düşük olacaktır. Ayrıca
geçerliliğin sağlanmasında 2 temel öğe vardır bunlardan biri güvenirlik, diğeri de uyumluluk yani
amaca uygun kullanmaktır.
Bir ölçme aracının geçerliği için güvenirlik ön şarttır. Yani bir ölçme aracının geçerli olması için.
Güvenilir olması gerekir. Ancak güvenirlik geçerlik için yeter şart değildir. Yani güvenilir olan bir
ölçme aracı geçerli olmayabilir. Örneğin; 2cm eksik olan bir cetvel ile kitabın boyunu 5 defa ölçerek
aynı sonuca ulaşmış oluruz. Bu durumda tutarlı yada kararlı ölçmeler olduğundan ölçme sonuçları
güvenirdir. Fakat bu ölçmelerde kullanılan araç hatalı olduğundan özelliği tam olarak ölçme
amacından yoksundur dolayısıyla geçerlik düşüktür. Test puanlarıyla ölçüt ya da ölçütler takımı
arasındaki ilişki katsayısına geçerlik katsayısı adı verilir.
Bir ölçme aracının güvenirliği düştükçe geçerliği de düşer. Örneğin; öğrencinin matematik başarısını
ölçmede kullandığımız Matematik testi sonuçları puanlanırken dikkatsizlik yapılmış puanlar hatalı
toplanmışsa(tesadüfî hata) bu testin sonuçlarının güvenirlik derecesi düşük olur. Bu hatalı testi
öğrencinin matematik bilgisini ölçme amaçlı kullanırsak, hatalı ölçme aracı amaca tam hizmet
edemediği için geçerlikte düşük olacaktır.
UĞUR YILMAZER 81
GEÇERLİK İLE GÜVENİRLİK ARASINDAKİ İLİŞKİLER-2
Her güvenir test geçerli değildir. Yani güvenirliği yüksek olan bir ölçme aracının geçerliği
düşük olabilir. Örneğin; bir Fizik testi sonuçları dikkatlice puanlanıp doğru, objektif, tutarlı
ve kararlılığa sahipse Fizik testi için güvenirdir denir. Ancak güvenirliği yüksek olan Fizik
testini öğrencinin Matematik bilgisini ölçmek amacıyla kullanırsak güvenir ölçme aracı
amaca tam hizmet edemeyeceği için geçerlik düşük olacaktır.
Güvenirlik, geçerliliği sınırlandırır. Çünkü yukarıdaki maddelerde de belirtildiği gibi
güvenirlik geçerliğin ön koşulu ve güvenirlik düştükçe geçerlikte düşer. Örneğin; güvenirlik
kat sayısı 0,85 olan bir test 0,15 kadar tesadüfî hata barındırması nedeniyle geçerliği
sınırlandırmış olur.
Bir testin geçerlik kat sayısı(𝑟𝑥𝑦 ), o testin güvenirlik kat sayısı(𝑟𝑥 )nın karekökü değerini
geçemez. ( 𝑟𝑥𝑦 ≤ 𝑟𝑥 ) Yani bir testin geçerlik değeri en fazla güvenirlik değerinin
kareköküne eşit olur. Örneğin; güvenirliği 0,81 olan bir testin geçerliği en çok 0,81=0,90
olur.
Geçerlik ve güvenirlik bir düzey(derece) sorunudur. Geçerliği vardır yada yoktur denilmesi
yanlıştır. Düzey yüksek ya da düşüktür ifadelerini kullanmak daha doğru olacaktır.
UĞUR YILMAZER 82
UĞUR YILMAZER 83
GEÇERLİK TÜRLERİ/ 1-KAPSAM GEÇERLİĞİ
Özellikle başarı testlerinde ilk aranır ve bir ölçme aracının ölçmek istediği
özellikleri ne derce kapsadığı ile ilgilidir.
Kapsam geçerliği; bir bütün olarak testin ve testteki her bir maddenin
maksada ne derece hizmet ettiğini ve sınav sorularının ölçmek istediği konu
alanını kapsayıp kapsamadığı gösterir.
Bir testin kapsam geçerliği;
1. O testteki toplam maddelerin ölçülecek davranışları ve konu içeriğini
örnekleme derecesine,
2. Testteki her bir maddenin ölçmek istediği davranışı ne derece iyi
ölçtüğüne bağlıdır.
Ölçme konusu evreni yeterli ve dengeli olarak örnekleyen ve kapsadığı
maddelerin her biri ölçmek istediği davranışı gerçekten ölçen bir test, kapsam
geçerliğine sahiptir.
UĞUR YILMAZER 84
GEÇERLİK TÜRLERİ/ 1-KAPSAM GEÇERLİĞİ
UĞUR YILMAZER 89
GEÇERLİK TÜRLERİ/ 2-YAPI GEÇERLİĞİ
insanların sahip olduğu psikolojik yapıların tespitinde kullanılan bir geçerlilik türüdür.
Başka bir değişle insanlarda psikolojik özelliklerin (zeka, kişilik, yetenek, ilgi, tutum, güdü,
değer) olup olmadığı konusunda ölçme yapıldığında kullanılır. Yapı geçerliliğinde amaç
özelliğe sahip olanla olmayanı ayırmaktır. Testteki sorular homojen olmalıdır. Sorular
birbiriyle tutarlıdır. İç tutarlılık katsayısı yüksektir.
Eğitimde kullanılan bir ölçme aracının her bir maddesi testin yapısını oluşturur. Bu
nedenle bir testte yer alan sorular birbiriyle bağlantılı, uyumlu, benzer ve tamamlayıcı
olup hedef davranışları doğru olarak ölçmesi yapı geçerliğini sağlar.
Yapı geçerliği; Bir ölçme aracının ölçülmek istenen kuramsal temeli, teorik yapıyı tam
olarak yansıtmasıdır. Ölçme aracının ölçmek istediği özelliğe göre bireyleri ayırt etmesidir.
Yapı geçerliği hazırlanan bir test üzerinde 3 temel özelliğin bulunmasıdır.
. 3-Ölçülen
2-Sorular
1-Sorular özelliğe sahip
ölçülmek istenen
birbirleriyle ve olan ve olmayan
özelliği tam YAPI GEÇERLİĞİ
testin bütünüyle öğrenciler
ölçmesi amaca
uyumlu olmalıdır birbirinden ayırt
uygun olması
edilebilmeli
UĞUR YILMAZER 90
Yapı geçerliği;
Özellikle psikolojik özellikleri ölçen testlerde aranılan en önemli geçerlik türüdür.
Bir testin teorik bir yapıyı (yaratıcılık,ilgi,zeka gibi) ölçüp ölçmediğinin
belirlenmesidir.
Testteki sorular arasındaki ilişkiyi ifade eder.
Testte yer alan her bir maddenin diğer maddeler ve testin bütünüyle uyumlu olması
demektir.
Bir testte yer alan maddeler ve bu maddelerin alt bölümleri testin tamamıyla bir
bütünlük ve uyum içeriyorsa, testin bütününe aykırı bir madde yer almıyorsa testin
yapı geçerliğinden bahsedilir.
İç tutarlılık anlamında güvenirliği sağlamak yapı geçerliğini sağlamaya yöneliktir.
UĞUR YILMAZER 91
BİR TESTİN YAPI GEÇERLİĞİNİ BELİRLEME YOLLARI
Bir ölçme aracında Soruları sesli olarak Ölçülmek istenilen Konu alanı uzmanı
Faktör analizi : En geçerli yoldur.
hakkında görüşmek
Cevaplayıcılarla cevaplama süreçleri
UĞUR YILMAZER 92
Piaget’in Zekâ Gelişim Kuramını ele alalım. Bilindiği üzere 4 dönemden oluşan ve her dönemde birçok özellikten bahseden bir
kuramdır. Şimdi bir test geliştirdiğimizi düşünelim ve bu testin yapı geçerliliğine sahip olmasını istiyoruz. Bu durumda Piaget’in
bahsettiği her özellikten mutlaka birer soru sormalıyız. Hiçbir özelliği atamadan mutlaka soru sormalıyız ki testimiz yapıyı
temsil edebilsin. Hemen şu soru belirebilir. Peki, kapsamda ne farkı var. En basit farkı, her dönemden birer ya da ikişer soru
sorarsan kapsamı azda olsa tutturursun ama yapıyı tutturamazsın. Yapıyı tutturabilmek için her özellikten mutlaka soru
sorulmalı (nesne devamlılığından soru sormadığını, yana tersinebilirliği sormadığını düşün kuram eksik kalmaz mı) ki yapı
geçerliliği sağlanabilsin.
KAPSAM ve YAPI arasındaki FARKLAR
Kapsamda sorular heterojendir (gelişim hocan zekâ, kişilik, fiziki, ahlak, dil vs. gelişimlerden bahsetmişse hepsinden soru sormalı
/ yani sorular heterojen). Yapıda ise sorular homojendir (sorular sadece Piaget ile ilgili olmalı / yani sorular homojen).
Amaç bilenle bilmeyeni ayırmaksa KAPSAM
Amaç özelliğe sahip olanla olmayanı ayırmaksa YAPI
Amaç gelecekte başarılı olacak ve olmayacağı ayırmaksa YORDAMA
Kişi yaratıcılığı bilmez SAHİP OLUR (ya da sahip olmaz)=Yapı Kişi resim yeteneğini bilmez SAHİP OLUR (ya da sahip olmaz)=Yapı
Kişi dört işlemi bilir (ya da bilmez)=KAPSAM
YANİ BİLENLE BİLMEYENİ AYIRMAK YAPI DEĞİLDİR KAPSAMDIR YAPIDA ÖZELLİĞE SAHİP OLANLA OLMAYAN ARANIR.
UĞUR YILMAZER 93
GEÇERLİK TÜRLERİ/ 3-ÖLÇÜT GEÇERLİĞİ
Ölçüt puanların elde ediliş zamanına göre ikiye ayrılır.
A) Yordama geçerliği; bir ölçekten elde edilen puan ile B) Uygunluk geçerliği; geçerliği yüksek olarak
ölçülmek istenen özellikleri ölçtüğü bilinen kriter arasındaki bilinen bir ölçme aracıyla geçerliği araştırılan ölme
korelasyonun hesaplanmasıyla elde edilir. Yordama araçlarının karşılaştırılmasına dayanır. Geçerliğin
geçerliğinde kısaca sonuçtan yararlanarak sürecin tahmini hesaplanması için beklemeye zamana gerek yoktur.
yapılır. Yor dayıcı puanlalar elde hazır mevcut olan Örneğin geçerlik derecesi yüksek olan bir ölçme
puanlardır. Ölçüt puanlar ise sonradan (gelecekte) elde aracıyla ben şirketime hemen eleman alabilirim.
edilen durumdur. İkisi arasındaki uyum derecesi yani
korelasyon katsayısı yordama geçerliğini verir.
AYT puanının ne
derece geçerli olduğu
Üniversite
eğitiminde
Yüksek başarılı Daha önce elde edilmiş lise
puan alan olacağı akademik başarı puanı veya
dershane deneme puanları
öğrenciler düşünülür. dikkate alınarak kestirilebilir.
UĞUR YILMAZER 94
UYGUNLUK YORDAMA
Öğretmen yapımı
testler
UĞUR YILMAZER 96
GEÇERLİK TÜRLERİ/ 4-GÖRÜNÜŞ GEÇERLİĞİ
Görünüş geçerliği, bir testin gerçekten ne ölçtüğüyle değil, neyi
ölçüyor göründüğü ile ilgilidir.
Uzmanlar tarafından tespit edilen tüm ölçme araçlarında ilk
dikkate edilen geçerliktir. (yapı geçerliği yüksek olan testlerin
görünüş geçerliği düşük olmalıdır)
«Ya olduğun gibi görün ya göründüğün gibi ol» sözü görünüş
geçerliği ile ilgilidir.
Görünüş geçerliği testin kapağı, yazım şekli, renkliliği, dizgisi,
kalınlığı…etkiler. Örneğin; "14/4 işlemi sonucunda kalan kaç olur."
ile "On dört'ü dörde böldüğümüzde kalan kaç çıkar." Soruları
matematik davranışını aynı geçerlik düzeyinde ölçüyor
görünmemektedir. Birincisi daha iyi bir matematik sorusu gibi
görünmektedir.
UĞUR YILMAZER 97
GEÇERLİK TÜRLERİ/ 5-SONUÇSAL GEÇERLİK
Değerlendirmenin öğrenme üzerindeki etkisine dayanır.
Yapılandırmacılığa bağlı olarak ortaya çıkmıştır.
Sonuçsal geçerlik, öğrencinin öğrenme ve öğretme sürecine etkin katılımını,
kendi öğrenme düzeyini sorgulayarak yönetebilmesini, ayrıca öğrenme ile
değerlendirme etkinliklerinin iç içe kullanılmasını gerekli kılan alternatif
değerlendirme yaklaşımlarıyla ilgili bir kavramdır.
Özellikle çağdaş değerlendirme yaklaşımlarının ele alınır. Porfolyo, proje,
performans, rubrik, özdeğerlendirme, akran değerlendirme gibi alternatif ölçme
araçlarında aranılan geçerlik türüdür.
PÜR DİKKAT;
Sonuçsal geçerlikle ilgili dikkat edilmesi gereken önemli bir nokta, daha çok değerlendirme
işleminin geçerliğinin sorgulandığıdır.
UĞUR YILMAZER 98
Verilen
açıklamalarda ilgili Verilen açıklamada
Verilen açıklamada özeliğe sahip olan yapılan sınavın
Verilen açıklamada
hedef/kazanım, ve olmayanları Verilen açıklamada öncekilere
sınavın ilgili özelliği
evren, belirtke arttırmak, tüm seçme yerleştirme benzerliği, sonucun
ölçüyor göründüğü
tablosu, içerikleri içerikleri vurgusu varsa önceki sürece
söz konusuysa
örnekleme derse yansıtmak, iç YORDAMA uyumluluğu
GÖRÜNÜŞ
KAPSAM tutarlık tan GEÇERLİĞİ vurgulanırsa
GEÇERLİĞİ
GEÇERLİĞİ bahsederse UYGUNLUK
GEÇERLİĞİ
YAPI GEÇERLİĞİ
1.ASKER 2.ASKER 3.ASKER
x xxx
x xx
x
x
GÜVENİLİRLİĞİ VE GÜVENİLİR
HEM GÜVENİLİR VE
GEÇERLİ KABUL GEÇERLİĞİ
GEÇERLİDİR.
EDİLEMEZDİR. KABUL
ÖRN; aldığım borcu
ÖRN; aldığım borcu EDİLEMEZ.
belirtiğim günde
farklı günlerde ÖRN; aldığım
ödemek
ödeyeceğimi söyleyip borcu Salı günü
ödememek öderim deyip
ödememek
GEÇERLİLİĞİ ARTTIRMA YOLLARI-1
Her hadef davrnaışla ilgili soru sormak öncelikle geçerliği artırır. YAPI
Soruların bilenle bilmeyeni ayırt etmesi öncelikle geçerliği artırır. KAPSAM/YAPI
Bir sorunun başka bir sorunun cevabını içermesi öncelikle geçerliliği düşürür. YAPI
Yıldan yıla aynı soruların sorulması öncelikle geçerliği düşürür. YAPI
Ölçme yönteminin tercihi ve uygulanış biçimi öncelikle geçerliği etkiler
Soruların sınavdan önce öğrencilere verilmesi öncelikle geçerliği düşürür. YAPI
Grubun heterojen olması geçerliği arttırır. GÜVENİRLİK SONRA GEÇERLİK
Soru sayısı arttıkça geçerlik artar. Ancak sorular aynı kapsamdan olmaMAlıdır.
Tüm hatalar geçerliği düşürür.
• Uygulanmasının Zaman
• Verilerinin toplanmasının
• Puanlanmasının
Açısından ekonomik olmasıdır.
3. BÖLÜM
MADDE ANALİZİ
MADDE GÜÇLÜK İNDEKSİ VE YORUMU
MADDE AYIRT EDİCİLİK İNDEKSİ VE YORUMU
ÇELDİRİCİLER VE ÖZELLİKLERİ
MADDE VARYANSI
MADDE STANDART SAPMASI
MADDE GÜVENİRLİK İNDEKSİ
Madde güçlük
Bağıl Normal
indeksi Merkezi Merkezi
değişkenlik olmayan
eğilim dağılım
ölçüleri ölçüleri katsayısı dağılım
Madde ayırt
edicilik indeksi
Sola
Aritmetik çarpıklık
Madde Ranj
ortalama
varyansı
Sağa
Madde Standart çarpıklık
standart Tepedeğer sapma
sapması
Normal
Çeyrek dağılım
Madde güvenirlik sapma
indeksi Ortanca
Çeldiricilen
işlerliği
BAŞARI SIRASI
4.BURAKHAN
Öğrencilerin sorulara vermiş
5.EBRAR
olduğu cevaplar puanlanır.(her DİKKATE ALINMAZ YÜZDE 46
6.ERDAL
doğruya 1, yanlış ve boş
7.HASAN
cevaba sıfır (0)puan verilir.
Cevap kağıtları en yüksek 8.SERKAN
ALT GRUP
puandan en düşük puana 9.BÜLENT
(BİLMEYENLER) YÜZDE 27
doğru sıraya konur. 10.TÜLAY
1- MADDE AYIRT EDİCİLİK İNDEKSİ 2-MADDE AYIRT EDİCİLİK İNDEKSİ 3- MADDE AYIRT EDİCİLİK İNDEKSİ
NEDİR? NASIL HESAPLANIR? NASIL YORUMLANIR?
• Madde analizinde ilk dikkate alınır • Madde test korelasyonu (yani bir
ve maddenin bilen ve bilmeyeni maddeden elde edilen puanların
ayırt etme düzeyidir. toplamı testin tamamında elde
• Madde teste alınmalı mı yoksa edilen puanların toplamı arasındaki
alınmamalı mı hakkında bilgi verir. korelasyon) 0,30 dan ne kadar
• Bir maddenin kalitesi yani geçerliği büyük 1,00 yakın ise o kadar ayırt
hakkında bilgi verir. edicidir.
• Ayırt edicilik arttıkça maddenin • Alt ve üst gurup değerlerinin
kalitesi artar.(0,30 dan +1,00 a verildiği tablolarda madde ayıet
yaklaştıkça kalite artar) ediciliği yani geçerliği;
𝐧 ü −𝐧(𝐚)
• En ayırt edici maddeler orta • 𝒓𝒋 =
𝐧
güçlükteki (0,50) maddelerdir.
• Ayırt edici maddelerin güvenirliğe
ve geçerliğe katkısı fazladır.
1. Geçerliliği ve güvenirliliği yüksek olan sınav 1. Başvuran çoktur alınacak azdır. 1. Öğrenme eksikliği
2. Bilen bilmeyen ayrımını en iyi şekilde yapan sınav 2. Kontenjan sınırlıdır. 2. Öğrenme güçlüğü
3. Sınıftaki en başarılı öğrenciyi belirlemek istiyorsa 3. ÜST düzey yeterliliğe sahip 3. Kavram yanılgıları
4. Sınıftaki en başarısız öğrenciyi belirlemek istiyorsa Öğrenciler seçilecekse.
Güçlük ve
Güçlük ve Güçlük ve
ayırıcılığı
ayırıcılığı ayırıcılığı
Pjx; 0,70 üstü Rjx; 0,30 ve
Pjx; 0,40 ile Rjx; 0,30 ve Pjx; 0,40 altı Rjx; 0,30 ve
olmalı üstü olmalı
0,60 arası üstü olmalı olmalı üstü olmalı
116
BİR TEST MADDESİNDE OLMASI GEREKEN ÖZELLİKLER;
1. Kaliteli bir sorunun güçlük indeksi 0,50 civarında, ayırt edicilik
indeksi ise 0,40’ın üzerinde olması beklenir.
2. Güvenirlik katsayısının 1,00 yakın olması amaçlanır.
3. Doğru cevabın üst grupta daha çok öğrenci tarafından
cevaplandırılmış olması beklenir.
4. Yanlış cevabın (çeldiricilerin) tüm seçeneklerde birbirine yakın
oranda cevaplandırılmış olması beklenir
5. Üst grup ve alt grup doğru cevap verenlerin farkı pozitif yönde
büyükse o sorunun kaliteli ve iyi soru olduğu ifade edilir.
6. Başvuran öğrencinin çok alınacak öğrencilerin az olduğu bir sınavın
sorularının güç ve ayırt edici olması amaçlanıyorsa böyle bir sınavın
sorularının güçlük indeksinin düşük, ayırt edicilik indeksinin yüksek
olması gerekir.
7. Ayırt edicilik indeksi bir sınav için her durumda tercih edilen
durumdur. Fakat güçlük indeksi öğrenci niteliğine ve sınavın amacına
göre tercih edilir.
UĞUR YILMAZER 117
ÇELDİRİCİLERİN YORUMU
ÇELDİRİCİ NEDİR? DOĞRU CEVAP
SEÇENEKLER
ÇELDİRİCİLER
• Bir maddenin doğru cevap dışındaki tüm seçeneklere denir
119
1
120
MADDE VARYANSI MADDE STANDART SAPMASI
Dağılımdaki bireyler arasındaki farklılıkları gösteren Bir maddenin standart sapması, o maddenin
bir istatistiktir. varyansının karekökü ile belirtilmesidir.
Madde varyansı, o maddeyi doğru cevaplayanların 𝑆𝑠 = √(𝑆𝑠)2 → 𝑆𝑠 = √𝑃𝑗 × 𝑞𝑗
oranıyla, doğru cevaplamayanların oranının Madde standart sapmasının alabileceği en yüksek
çarpımıyla elde edilir. değer 0.50 dir...bu değeri veren maddenin madde
𝒔𝒋𝟐 = pj x gj
güçlüğü de 0.50 güçlük düzeyindeki maddedir.
ÖRN; Madde güçlüğü 0.40 olan bir maddenin madde ÖRN; Madde varyansı 0.25 olan bir maddenin madde
varyansı kaçtır? standart sapması 0.25: 0.50 olur.
𝒔𝒋𝟐 = pj x gj 𝑠𝑗 2 =0,40 x 0,60 = 0.24
MADDE GÜVENİRLİK KATSAYISI
Madde varyansı 0,00 ile 0,25 arasında değerler alır.
Maddenin güvenirlik katsayısı, maddenin
Madde varyansı 0,00 yaklaştıkça Ayırtedicilik azalır. ayırtedicilik değeri ile madde standart
Soru ya zor ya da kolaylaşır. sapmasının çarpımıdır. 𝑟𝑗=𝑅𝑗𝑥×𝑆𝑠
Madde varyansı 0,25 yaklaştıkça Ayırtedicilik artar. ÖRN; madde standart sapması 0.20, madde
Soru orta güçlüktedir. ayırtediciliği 0.30 olan bir maddenin madde
Bir maddenin ayırtediciliği arttıkça madde varyansı en güvenirliği kaçtır?
yüksek değeri olan 0. 25’e yaklaşır. =0,20 x 0,30 = 0.06
UĞUR YILMAZER 121
4. BÖLÜM
TEST PUANLARI ÜZERİDE İSTATİSTİKİ
İŞLEMLER
MERKEZİ EĞİLİM/YIĞILIK ÖLÇÜLERİ
MERKEZİ DAĞILIM/DEĞİŞİM ÖLÇÜLERİ
NORMAL DAĞILIM VE STANDART PUANLAR (Z ve T
puanı)
Verilen bir tabloda en büyük ve en küçük aritmedik ortalama değerleri birden çok ve
eşit ise;
Aritmetik ortalaması BÜYÜK olanlardan standart sapması KÜÇÜK olan BAŞARILIDIR
KURAL
Aritmetik ortalaması KÜÇÜK olanlardan standart sapması BÜYÜK olan BAŞARISIZDIR
Aritmetik Standart
Sınıf
ortalama sapma En başarılı sınıf 7A dır. Çünkü art. ort eşit ise st.
7A 85 3 Sapması küçük olan daha başarılı kabul edilir...nedeni
daha homojen olduğu içindir.
7B 85 5
7C 60 7 En başarısız sınıf 7D dir. Çünkü art. Ort. Eşit ise st.
7D 60 9 Sapmasını büyük olan daha başarısızdır...nedeni
daha heterojen olmasıdır.
𝟐
M1 3 3* 15 3 24 𝟐𝟒
=0.08
M2 4 2* 14 4 24 𝟕
=0.29
𝟐𝟒
M3 0 9 8 7* 24
𝟔
=0.25
M4 6* 6 5 7 24 𝟐𝟒
M5 4 4 12* 4 24 𝟏𝟐
=0.50
𝟐𝟒
Bu beş maddelik alt testin ortalaması kaçtır?
A) 0,75
B) 1,25 ÇÖN!!
C) 1,75 Bu işlemleri uzun uzun yapmamıza gerek
D) 2,25 yok aslında. Her maddede toplam
E) 2,75 öğrenci sayısı aynı olduğu için maddeleri
𝟑+𝟐+𝟕+𝟔+𝟏𝟐 𝟑𝟎
doğru cevaplayan öğrenci sayılarını
𝑷= = =1.25 toplayıp toplama bölmemiz yeterlidir.
𝟐𝟒 𝟐𝟒
Testin ortalama güçlüğü bir testin bütünün ne kadar kolay ya da ne kadar zor olduğunu gösterir.
Soru sayıları farklı ve aritmetik ortalamaları farklı verilmiş tablolarda gurubun başarı yorumunu
yapmada kullanılır. Ortalama güçlük 0,00 ile +1,00 arasında değerler alır. Ortalama güçlüğü yüksek ise(Ne
kadar 1,00 a yakın ise) gurup başarılı, test kolay, kazanımlar edinilmiştir.
PJ
MADDELER MADDE Bu beş maddelik alt testin ortalama güçlüğü kaçtır?
GÜÇLÜĞÜ
I 0.30 𝑋 0.30+0.70+0.50+0.60+0.40 2.5
𝑃= = = =0,50
II 0.70 𝐾 5 5
III 0.50 Her maddenin madde güçlük değeri verildiği için bu güçlük
IV 0.60 değerlerini toplayıp madde sayısına böldük ve testin ortalama
V 0.40 güçlüğünü bulduk..orta güçlükte bir test çıktı.
FİZİK 0.91 15 60 100 Cevap-2; Öğrencilere en zor gelen dersi bulmak için
𝑋
ortalama güçlük 𝑝 = formülünü kullanmamız gerekir.
KİMYA 0.84 10 25 100 𝐾
Bu formül yerine soru sayısını 100 e tamamlamak ve art.
BİYOLOJİ 0.75 4 20 50 Ortalamayı da aynı oranda artırmak bizi daha kısa sürede
sonuca götürür.
TARİH 0.64 15 40 100
Felsefe: 50 soruyu 100 soruya çıkarmak için 2 ile çarpalım,
art.ortalamayı da 2 ile çarpalım..art. Ort. Yeni durumda 30 olur.
1. Ölçmenin standart hatası en çok olan Biyoloji: 50 soruyu 100 soruya çıkarmak için 2 ile çarpalım; art.
test hangisidir? Ortalamayı da 2 ile çarpalım. Art. Ort. Yeni durumda 40 olur.
2. Hangi ders öğrencilere en zor gelmiştir? Şimdi soruları eşitledik . Art. Ort. Yükseldikçe test kolay, art.ort.
ve Hangi ders öğrencilere en kolay Küçüldükçe test zorlaşır.
gelmiştir? Öğrencilere en zor gelen test KİMYA
Öğrencilere en kolay gelen test FİZİK
Yıl sonu başarı notu hesaplamada, DERS KREDİ PUAN (Puan) x (kredi)
başarıya katkısının yüzde olarak farklı
Matematik 4 4 16
olan kredi/ders saati gibi durumlarda,
teşekkür ve takdir belgesi vermede, Türkçe 4 5 20
üniversiteler arası yatay geçiş Sos.Bilgiler 3 5 15
uygulamalarında genellikle ağırlıklı Fen bilgisi 3 3 9
ortalama kullanılır. Resim 1 5 5
Her bir dersin notu (haftalık ders Müzik 1 5 5
saati/kredi/ders yüzdeliği) değerlerinden
Yabancı dil 2 3 6
biri ile çarpılarak bu çarpımların
sonuçları toplanır ve hangi değer ile Toplam 18 30 76
çarpılmış ise bu değerlerin toplamına
(Puan ×Kredi) 76
bölünür. Ağırlıklı Ortalama = Kredi Toplamı
= 18= 4,2
(𝐏𝐮𝐚𝐧 ×𝐊𝐫𝐞𝐝𝐢)
𝐀ğı𝐫𝐥ı𝐤𝐥ı 𝐎𝐫𝐭𝐚𝐥𝐚𝐦𝐚 = 𝐊𝐫𝐞𝐝𝐢 𝐓𝐨𝐩𝐥𝐚𝐦ı
(6 + 4) / 2 = 5 puanı medyandır
KURAL-1
KURAL-2
KURAL -1
ÖRNEK:
1, 2, 3, 3,3, 3, 6, 6, 7, 8, 8, 9 bu dağılımın modu nedir?
CEVAP;
Mod 3’tür. Çünkü en fazla 3 notu tekrar edilmiştir.
KURAL -2 KURAL -3
Gözlenen frekans birbirine eşitse mod olmaz. Yani Ardışık olmayan iki ya da daha çok ölçüm eşit sayıda ve
dağılım modsuzdur. diğer ölçümlerden daha çok tekrar etmişse bu durumda
dağılım çok modludur.
ÖRNEK:
3, 3, 3 – 5, 5, 5 – 6, 6, 6 – 8, 8, 8 bütün frekanslar aynı ÖRNEK :
olduğu için yani her dağılım eşit (3’erli) olduğundan bu 1 – 3, 3, 3 – 4 – 5, 5, 5 – 6 – 8 modları iki tanedir. 3 ve 5 notu en
dağlımın modu yoktur. çok tekrar edilen değerdir.
NEGATİF ÇIKARSA
Test kolay
Sola çarpık dağılım
POZİTİF ÇIKARSA
Test zor
Sağa çarpık dağılım
SIFIR(0) ÇIKARSA
Normal dağılım
MOD
. MEDYAN X Değerler biribirine eşit olduğu için SİMETRİK DAĞILIM
143
ÇARPIKLIK KATSAYISI VE DAĞILIM GRAFİKLERİ-2
1. SİMETRİK DAĞILIM:
ÇÖZÜM
1. Öğrencilerin hangi dersteki öğrenme düzeyleri birbirinden en farklıdır...bu sorunun cevabı için st. Sapma
değerine bakılır..st. Sapma küçüldükçe grup homojenleşir,puanlar benzeşir. St. Sapma büyüdükçe grup
heterojenleşir, puanlar farklılaşır. Türkçe dersi en heterojen dağılım gösteren ders olmuştur.
2. Öğrencilerin öğrenme düzeylerinin birbirine en yakın olduğu ders, st. Sapmanın en küçük olduğu
derstir...sorunun cevabı coğfarya dersidir.
3. Mod, medyan, art.otr. Birbirine eşit ise...dağılım simetrik olmuş demektir.
4. Öğrencilerin en başarılı olduğu ders art. Ortalamanın en yüksek olduğu derstir..art. Ort. Eşit ise medyan
değeri büyük olan grup daha başarılıdır. Cevabımız matematik dersidir.
Dersler
Aritmetik
Medyan Mod
Standart DERS Mod Medyan Art.ort St.Sapma
Ortalama sapma
TARİH 75 70 65 7
A
TÜRKÇE 55 59 62 6
B
MÜZİK 60 60 60 8
Grup içi başarısı sorulmuşsa cevap KİMYA 69 68 64 9
ÇARPIKLIK’tan bulunur. Sola çarpık gruplar
FİZİK 67 64 63 16
başarılı gruplardır.
Homojenlik yada heterojenlik sorulduğu zaman Öğrencilerin en başarılı ve en başarısız olduğu ders
cevap STANDART SAPMADAN bulunur hangisidir?
Ortalama öğrenme düzeyi sorulduğu zaman Gurubun başarı değişkenliği en fazla ve en az olduğu ders
cevap ARİTMETİK ORTALAMADAN bulunur hangisidir?
Öğrencilerin ortalama öğrenme düzeyinin en yüksek ve en
düşük olduğu dersler hangisidir?
A Bilgisayar 2 50 100
B Tarih 10 40 60
Grup başarısı sorulmuşsa cevap; ortalama güçlükten
bulunur. Yada soru sayıları eşitlenir. Anayasa 7 25 75
Homojenlik yada heterojenlik sorulmuşsa cevap; Coğrafya 8 20 50
bağıl değişkenlikten bulunur.
Grubun en başarılı ve en başarısız olduğu derler
hangileridir?
Gurup değişkenliğinin en çok ve en az olduğu
derler hangileridir?
X
A.ortala K (Soru Aritmetik Standart K (Soru Uğur’un
DERSLER S.sapma (Uğur’un Ders
ma sayısı) Ortalama Sapma sayısı Puanı
puanı)
A Gelişim 58 2 20 60
B Öğrenme 59 6 50 59
Öğrencinin başarı sırası sorulmuşsa cevap Z puanı Rehberlik 70 3 25 67
hesaplanarak bulunur Ölçme
60 3 100 66
Öğrencinin mutlak başarı düzeyi sorulmuşsa; Değ.
Uğur’un en başarılı ve en başarısız olduğu ders
MBbirey = BİREYİN ALDIĞI PUAN (X)
× 100 Sonucuna
SORU SAYISI (K) hangisidir?
bakılır. Öğrencinin mutlak başarı düzeyinin en yüksek yada
en düşük olduğu ders hangisidir?
Gurubun mutlak başarı düzeyi sorulmuşsa; Gurubun mutlak başarı düzeyinin en yüksek yada en
MBgrup = A.ORTALAMA (X)
× 100 Sonucuna bakılır. düşük olduğu ders hangisidir?
SORU SAYISI (K)
UĞUR YILMAZER 156
TABLO SORULARINDA DİKKAT!!
Bir dağılımda birinci ve üçüncü çeyreğin farkının yarısı çeyrek sapmayı verir.
Bir puan dizisi 4 eşit parçaya ayrılarak, dörtlüklerin sınırları bulunur. Küçük puanlardan itibaren
birinci dörtlüğün sınırına Q1, ikinci dörtlüğün sınırına Q2; (medyan), üçüncü dörtlüğün sınırına
da Q3 denmektedir. (Kartil 1, kartil 2 ve kartil üç veya çeyrek bir, çeyrek iki ve çeyrek üç
adlarıyla söylenir.) Çeyrek kayma, üçüncü çeyreğin sınırından, birinci çeyreğin sınırı çıkarılıp,
fark ikiye bölünmekle bulunur.
𝑄 −𝑄
𝑄= 3 1
2
Yani; 75.yüzdelik(Q3)ten 25.yüzdelik(Q1) çıkarılarak elde edilen sonucun yarısı çeyrek sapmayı
verir.
Bildiğimiz gibi çeyrek, bir bütünün ¼’üdür. Ancak çeyrek kayma tüm kaymanın (yayılmanın) 1/4
ü değildir.
PÜR DİKKAT!!!
Bir dizi ölçümün merkezi eğilim ölçüsü olarak ortanca(medyan)kullanıldığında, değişiklik ölçüsü
olarak ta çeyrek kayma(kartil) kullanılmalıdır. Çünkü bu iki ölçüde, ölçümlerin sıralarına göre
belirlenir ve uçlardaki puanlardan etkilenmez.
UĞUR YILMAZER 162
BAĞIL DEĞİŞKENLİK KATSAYISI (Vx)
Hem aritmetik ortalamayı hem de standart sapmayı içeren ve daha çok bilgi veren değişkenlik katsayısına
“bağıl değişkenlik kat sayısı” denir.
Bir sınıfta alınan puanların yaygınlığını gösteren sadece standart sapma değildir. Çünkü sadece standart
sapma ile ilgili bazı kararların alınmasında hata olabilir. Bundan dolayı bir gruptaki değişim düzeyini
yorumlamak için bağıl değişkenlik katsayısı belirlenir.
Bağıl değişkenlik katsayısı; standart sapmanın(Sx) aritmetik ortalamaya(X) bölünerek 100 ile çarpılması
sonucunda bulunan yüzdelik değerdir.
Z -3 -2 -1 0 1 2 3
T 20 30 40 50 60 70 80
UĞUR YILMAZER
KONU ÖĞRETEN 100 öğrencinin bulunduğu sınıfta bir test uygulanmıştır. Bu sınıfta 4 öğrencinin aldıkları
SORU!! ham puanlar ve T puanları aşağıdaki tabloda verilmiştir.
Öğrenci Ham puan T puanı Bu testten 63 ham puan alan bir
UĞUR 55 60 öğrencinin T puanı kaçtır?
BURAKHAN 43 30
ALPEREN 39 20
EBRAR 51 50
ÇÖZÜM
Ham puan 39 43 47 51 55 59 63
UĞUR YILMAZER
KONU ÖĞRETEN SORU!!
ÇÖZÜM
DERS Art. Ort. St. Sapma Uğur
öğ𝑟𝑒𝑛𝑐𝑖 𝑝𝑢𝑎𝑛𝚤−𝑎𝑟𝑡.𝑜𝑟𝑡. 53−50 15
Mat 50 1 53 Z mat: 𝑠.𝑠
= 1
= 5
=3z
60−60
Fizik 60 3 60 Z Türkçe : 3 =0z
70−65
Kimya 65 5 70 Z fizik : 5 =1z
64−70
Biyoloji 70 6 64 Z kimya 6 =-1z
84−80
Türkçe 80 2 84 Z biyoloji: 2 = 2z
1-Sınavın 4-Soru
8-
5-Soru tipini
amacını sayısını
belirleme
belirleme Soruların
belirleme yazımı
2-Ölçülecek 6-Sınavın
3-Belirtke 7-Sınavın
hedef güçlük
tablosunun süresini
davranışların derecesini
hazırlanması belirleme
belirlenmesi belirleme
TESTİN AMACI Bir sınıf ya da okuldaki öğretim sonuçlarını ölçmektir. Ülke genelinde ya da belli bir bölgedeki öğretimin etkililiğini ölçmektir.
Sınıf öğretmeninin kendi işlediği ve belirlediği öğretim Ülke genelinde MEB ce verilen ve önerilen ders kitapları ve ders
TESTİN İÇERİĞİ
hedeflerine göre belirlenir. programlarının incelenip analiz edilmesiyle belirlenir.
KULLANILAN SORU TİPİ Hem objektif hem sübjektif soru türleri kullanılır. Mutlaka objektif soru türleri kullanılır.
Test maddeleri son testin uygulanacağı grubun benzeri bir gruba uygulanır
ve her bir maddenin güçlük derecesi (pj) ve ayırt etme gücü (D) hesaplanır.
MADDE ANALİZİ Genellikle yapılmaz.
Testin son formuna girecek maddelerin seçimi, bu bilgiler üzerinde
temellenir.
STANDARTLAŞTIRMA VE Standartlaştırılmaya gidilmez. Norm çıkarılmaz. Sınıfın Test uygulanacağı grubu (evren) temsil eden bir örneklem grubuna
NORMLAR ortalama başarısı hesaplanabilir. uygulanır. Ortalama, yüzdelik sırası gibi bazı tipik puanlar hesaplanır.
FORM SAYISI Genellikle bir tanedir. Genellikle iki ya da daha çok paralel (eşdeğer) takım hazırlanır.
Bir çok özelliğe sahip olan bireyler arasında aranan özelliklere en uygun
SEÇME SINAVLARI olanların sahip olduğu sınavlardır
ÖSS, iş için eleman alım sınavlara buna örnektir
Öğrencilerin sahip oldukları niteliklere göre sınıflandırmak için yapılan
sınavlardır
SINIFLAMA SINAVLARI Öğrencilerin bilgi yetenek bakımından belli alanlara yöneltmek amacı ile
yapılır
Seviye tespit sınavları bu gruba girer
Başvuranların çok alınanların az olduğu durumlarda kullanılır
Sorular adayları çeşitli yönden ayırt edecek şekilde sorulur
YARIŞMA SINAVLARI
Memur, işçi alınırken bu sınavlar uygulanabilir
sınavlardır.
Araştırma inceleme ve çeşitli kaynaklara baş vurma amacına
yönelik olarak yapılan sınavlardır
Öğrencilere sorular önceden verilerek bunlara belli zaman
DIŞARIDAN CEVAPLANDIRILAN SINAVLAR
zarfında cevap vermeleri istenir
Proje, ev ödevleri gibi
Kontrol listeleri daha çok süreci ölçen ve belli Gereksiz sesler çıkarmıyor
kurallara uyulup uyulmadığını, belli işlem
yollarının izlenip izlenmediğini, bir davranışın
gösterilip gösterilmediğini belirlemede Gereksiz tekrar yapmıyor
kullanılır.
UĞUR YILMAZER 188
ÇAĞDAŞ DEĞERLENDİRME YAKLAŞIMLARI/(ALTERNATİF ÖLÇME ARAÇLARI)
Performans
Portfolyo(öğrenci,ürün, Akran
gelişim dosyas)
değerlendirme Öz değerlendirme
(performans görevi) değerlendirme
Bir yıl ya da dönem Verilen bir Öğrenciler verilen Öğrenciler verilen
boyunca yapılan öğrenci performans görevini ölçütler ölçütler
çalışmalarını içeren yerine getirirken doğrultusunda doğrultusunda
dosyadır. öğrenci süreçte kendi çalışmalarını birbirlerinin
yaptıkları ile sonuçta değerlendirir. çalışmalarını
Amaç ; öğrenci ortaya çıkan ürün değerlendirir.
gelişimini izlemektir. birlikte Öğrenci süreçte
değerlendirilmelidir güçlü ve zayıf Yapıcı ve olumlu
Gelecekteki kurumlara yönlerini eleştiride bulunma
ve öğretmenlere bilgi Üst düzey düşünme görür,kendini tanır. becerisi gelişir.
sağlar. becerilerini geliştirir.
Öz denetim becerisini
Öğrenme eksikleri Grupla ya da geliştirir.
belirlenemez. bireysel olabilir.
UĞUR YILMAZER 189
GELENEKSEL ÖLÇME ARAÇLARI / YAZILI YOKLAMALAR
YAZILI YOKLAMA ÜSTÜNLÜKLERİ YAZILI YOKLAMA YETERSİZLİKLERİ
Bilişsel öğrenmenin üst düzeydeki (analiz, sentez, Soru sayısının sınırlı olmasıyla kapsam geçerliği
değerlendirme) öğrenme ürünlerini ölçmede daha düşüktür.
yeterlidir. Cevapların doğruluk derecesini belirlemek zordur.
Soru hazırlamak oldukça kolaydır ve fazla zaman Öğrenci için cevaplaması, öğretmen için okunması
almaz. ve puanlanması zor ve zaman alıcıdır. Hızlı yazmak
Sözlü testlere göre kısa zamanda daha fazla soru gerekir.
sorulabilir. Asıl ölçülmek istenen özelliğin haricinde başka
Şans başarısı oldukça düşüktür. değişkenler de işin içine girebilir (yazı güzelliği vb.)
Sözlü testlerdeki ruhsal durumların etkileri daha az Puanlamada objektifliği tam olarak sağlamak çok
hissedilir. zordur.
Kâğıtlar belge niteliğinde olup, saklanabilir Şişirme cevaplara elverişlidir.
Öğrencilerin düşüncelerini yazılı olarak ifade Madde istatistikleri uygulanamamaktadır.
edebilme yeteneği geliştirilir.
PÜR DİKKAT;
Yazılı sınavlar kişinin özgün ve yaratıcı düşünce gücünü, yazılı anlatım becerisini, belli konulardaki görüşünü,
ilgisini ve tutumunu ölçmede kullanışlıdır. Kısaca üst düzey davranışların yoklanmasında kullanılacak araçlardan
birisidir.
UĞUR YILMAZER 190
GELENEKSEL ÖLÇME ARAÇLARI / SÖZLÜ YOKLAMALAR
Puanlaması Özneldir, uzundur Nesneldir, kısadır Nesneldir, kısadır Nesneldir, kısadır Nesneldir, kısadır Özneldir, kısadır
Kapsam geçerliği ve
Kapsam geçerliği ve
Yaratıcılığı ortaya Yanlış kavramaları Kullanışlılığı en yüksek güvenirliği, Öğrencileri sürekli
En Önemli Yararı güvenirliği, kullanışlığı
çıkarırı ortaya çıkarır testtir. kullanışlığı 2. yüksek çalışmaya yönlendirir.
en yüksek testtir
testtir
Kapsam geçerliği
Öğrencileri ezbere Yaratıcılığı ortaya Çok sayıda soru Kapsam geçerliği
Sakıncaları düşük, puanlaması Şans faktörü %50 dir.
yönlendirir çıkarmada yetersizdir hazırlamak zordur dardır.
özneldir
Şans başarısı Yok Yok Var Var Var Yok
Kullanışlılık Orta Çok Çok Çok Çok Orta