You are on page 1of 10

Neden Ölçme-Değerlendirme

● Öğrencilerin yeterliliklerini ölçmek, öğretmenin kendini değerlendirmesi, öğretmen ve öğrenci


yeterliliklerinin belirlenmesi, anlamlı dönütler vermek, bazı öğrencilerin eksik olduğu
noktaları görüp, bu noktaları tamamlamalarına fırsat vermek için.
● Eğitimde gözlenmeye ya da ölçülmeye çalışılan değişkenler genellikle başarı, ilgi, motivasyon,
yetenek, vb. psikolojik değişkenlerdir.
● Eğitim; girdi, süreç, çıktı ve kontrol ögeleri olan bir süreç olarak ele alınır. Bu süreç sonucunda
istendik davranışların ortaya çıkıp çıkmadığını veya ne derecede gerçekleştirildiğini ortaya
çıkarma, öğrenme güçlüklerini saptama; eğitim programlarının, yöntem ve tekniklerin
etkinliğini belirleme, öğrencileri yönlendirme ve benzeri amaçlara dönük yapılan
değerlendirmelerin hepsi geçerli ve güvenilir ölçme sonuçlarına dayanır.
● Eğitim sürecinde ölçme ile her bir öğrencinin kazandırılmak istenilen davranış değişikliğini ne
derece gerçekleştirdiği, istenilen beceri ve yeteneğe ne düzeyde ulaşmış olduğu belirlenmeye
çalışılır.
● Öğrenme yaşantıları en temelde doğal bir öğrenme ortamı ile sağlanır.
● Öğrenme yaşantılarından elde edilen çıktıların verimli olup olmadığını değerlendirerek
anlarız.
● Öğrenme sürecinde öğrencilere değişik türden etkinlikler yaptırıp, değerlendirme kısmını bu
etkinliklere uygun olmayan türden yapmak doğru değildir.
○ Örneğin; listening-speaking üzerine çalışmış ve bu becerilere uygun etkinlikler yapmış
öğrencilere test sınavı yapılması

● Ölçme ve Değerlendirme dersinin içeriği hangi unsurlarla ilgilidir?


○ Eğitim niteliği- toplumun niteliği
○ Eğitim paydaşları
○ Öğrenme-öğretme-öğretmen

● Ölçme süreci
○ Ölçülecek özellik-ölçme aracı-birim-ölçme kuralı=> ölçme süreci
○ Burada önemli olan noktalardan biri “birimin” tanımlanmasıdır.
○ Tam bir birimden bahsedilebilmesi için üç temel özelliğe sahip olması gerekir;
■ Kullanışlılık: ölçülecek özelliğe en uygun birimin tercih edilmesidir.
■ Eşitlik: bir birimi oluşturan ölçme aracındaki her aralığın birbirine eşit
olmasıdır.
■ Genellik: birimin kullanıldığı her yerde aynı anlama sahip olmasıdır.
○ Ölçme sürecinde birim olmasa da olur, ama birime tam bir birim diyebilmek için bu üç
özelliği barındırması gerekir.

● Ölçme kuralı
○ Ölçülecek özelliklere verilecek değer. Örneğin:
■ Sınavda soru başına 3 puan verilmesi.
■ Basketbolda her bir çizgiden atılan basketin puanının farklılık göstermesi
● Ölçme, karar verilmediği sürece değerlendirme özelliği taşımaz
○ Örnek; “Ali birinci oldu” cümlesi bir ölçmedir. Fakat Ali’nin birinci olup, atanmasını
sağlayacak karar verilmediği sürece değerlendirilmesi yapılmış olmaz. Başka bir örnek,
siyah bir tişörtün ne renk olduğunu söylemek değerlendirme olmaz, kişi bireysel olarak
ölçümünü yapmıştır.
● Ölçme için “fark” kavramı temeldir. Eğer sahip olunan özellikler hep aynı olsaydı veya
aralarında fark bulunmasaydı bu özelliklere ilişkin kavramlar olmayacak ve bunların ölçülmesi
de söz konusu olmayacaktı.
● Bazı özellikler doğrudan gözlenebilirken, bazıları gözlenemez. Bu yüzden doğrudan ve
dolaylı ölçme yöntemleri ortaya çıkmıştır.
● İlgilenilen özellik, kendisiyle aynı türden bir araçla ölçüldüğünde bu doğrudan ölçmedir.
Ölçülen özellik, ilgili olduğu düşünülen başka bir özellik gözlenerek yapılmışsa bu ölçme
dolaylı ölçmedir.
○ Örneğin; fiziksel özellikler doğrudan gözlenebilirken, psikolojik özellikler dolaylı olarak
gözlenebilir.
○ Boy ve kütlenin ölçülmesi doğrudan ölçmeye örnek verilebilir.
○ Sıcaklık veya zeka gibi özellikler ise dolaylı olarak ölçülür. Zeka ya da başarıyı ölçmek
için bireyin tepkide bulunabileceği koşullar yaratılır (test gibi).
● Türetilmiş ölçme, dolaylı ölçmenin farklı bir türüdür. Ölçmek istediğimiz özellik üzerinde
herhangi bir işlem yapmadan, bu özellikle ilgili başka değişkenler üzerinde matematiksel
işlemler yapılarak elde edilen ölçümlerdir.
○ Örnek; akademik not ortalaması. Bu notu elde etmek için belirli bir sınav yapılmıyor
fakat dönem boyu almış olduğunuz notların ortalaması alınarak bu sonuç elde ediliyor.

Ölçek: Nesnelere sayılar vermede ve nesnelere verilen sayıların kullanılmasında uyulması gereken
kuralları ve ölçme bilgisinin düzeyini belirlemek için kullanılır.
● Ölçek Türleri:
Sınıflama Ölçekleri (nominal scale) Sıralama Ölçekleri (rank):
 Nesneleri veya olguları belli bir nitelik  Bu tür ölçekler, belli bir özelliğe sahip
 bakımından benzeyip benzemediklerine oluşu miktarı bakımından nesneleri bir
göre gruplamada ve bu grupları sıraya koymakla elde edilir.
adlandırmada kullanılan ölçeklerdir.  Bu ölçekteki sıraları gösteren sayılar
 Ölçekler içinde en az bilgi veren ölçek arasındaki farklar, özelliğe sahip oluşun ve
türü nesneler arasındaki farkın miktarını
 Tam bir birimden söz edilemez yansıtmaz
 Başlangıç noktası yoktur  Yani sınıflamanın aksine, nesneler
 Dört işlem anlamlı değildir. arasında fark var, fakat bu farkın niceliği
 Örnek= öğrencileri branşlarına göre belirtilmiyor.
ayırmak  Tam bir birimden söz edilemez
 Örnek= güzellik yarışması
 Başlangıç noktası ve sıralar sabit değildir.
Dört işlem yapılamaz.
Eşit Aralıklı Ölçek (interval) Eşit Oranlı Ölçekler (ratio):
 Bu tür ölçeklerde tanımlanmış bir  Eğer ölçme işlemi gerçek (mutlak) sıfırı ve
başlangıç noktası (keyfi sıfır) ve eşit eşit bir birimi olan ölçme sonuçları
kabul edilen birim vardır. veriyorsa bu ölçmenin sonuçları oran
 Eşit aralıklı ölçeklerdeki sıfır, o noktada ölçeğidir.
ölçülen özelliğin gerçekten hiç  Başlangıç noktası ve tam bir birimden söz
bulunmadığı anlamına gelmez. edilebilir. Her türlü matematiksel işlem
 Örnek; Akademik başarının ölçüldüğü yapılabilir.
bir sınavdan öğrencini “sıfır” alması, bu  Her türlü matematiksel işlem yapılabilir.
akademik alanda sıfır bilgisi olduğu  Örnek; ağırlık, uzunluk.
anlamına gelmez  En üst düzeyde, en detaylı ve nitelikli bilgi
 Toplama-çıkarma yapılabilir, fakat veren ölçektir. Ölçekler nitelik açısından
çarpma-bölme işlemleri için uygun sıralanırsa bunlar en alttan en üste şöyle
değildir. Başlangıç noktası vardır. olur; sınıflama<sıralama<eşit
 Korelasyon, mod, medyan, ortalama aralıklı< oran ölçek. Bir üst kalitedeki
hesaplanabilir. ölçek, bir alt kademedeki ölçeğe
 Örnek; matematik başarı puanı, rakım, dönüştürülebilir.
sıcaklık, zeka puanı, saat, vb.

Değerlendirme
● Elde edilen ölçümlerden bir anlam çıkarmak için söz konusu ölçümlerin bir ölçüt ile
karıştırılması ve bir karara varılması
● Ölçüte göre iki tür değerlendirme vardır:
○ Bağıl Değerlendirme: Grubun ○ Mutlak Değerlendirme:
başarısından çıkarılacak ölçüte göre değerlendirilecek grup dikkate alınmadan,
yapılan değerlendirmedir; yani ölçüt daha önceden belli olan ölçüte göre
önceden belirlenmemiştir. yapılan değerlendirmedir. Ölçüt daha
■ Çoğunlukla başvurunun çok önceden belirlenmiş ve kesindir.
olduğu, alınacak kişi sayısının az ○ Örneğin; geçme notunun“50” olması,
olduğu durumlarda karşımıza sürücü belgesi almak (sınav var, belirli bir
çıkar. Sıralama gerektiren yaşta olman gerekiyor)
durumlarda gözükebilir. Gruptan
gruba değişir.
■ Örnek; çan eğrisi
● !!! Harf notları ölçmedir, değerlendirme değil. (hocaya göre) Sayı notlarının harf notuna
dönüştürülmesi değerlendirme olmaz. Örnek “95 üzeri- AA”. Bu ölçmedir, çünkü harf
notlarına göre “geçti/kaldı” kararı verilmiyor.
● !!! Ölçme kuralı: Her bir ölçme işlemine verilecek puan değeri.
● Tanıma ve Yerleştirmeye Yönelik Değerlendirme (Tanılayıcı Diagnostic)
○ Öğrencilerin belli bir kurs ders ya da ünitenin ön koşulu niteliğindeki giris
davranışlarına sahip olma derecesini belirlemek
■ Ön koşul ile kastettiği, örneğin; ingilizce öğretmenliği bölümüne alınmadan önce
yabancı dil bilgilerinin test edilmesi
○ İlgili kurs ya da derste öğrencilere kazandırılması hedeflenen davranışlar arasında
öğrencilerce daha önceden edinilenler olup olmadığını tespit etmek
○ Tanılayıcı değerlendirme sonucunda akademik başarıyı etkileyecek bir not, belge ya
da diploma verilmez. Sadece öğrencinin hazırlık düzeyi belirlenir.
○ Tanıma ve yerleştirmeye dönük değerlendirme yapılırken seviye tespit sınavları,
hazırbulunuşluk testi, seçme testi, tanıma testi, yetenek testi, yerleştirme sınavı,
muafiyet sınavı gibi testler uygulanır.
○ AKADEMİK BAŞARIYI ETKİLEMEYECEK VE SERTİFİKA ALINMAYACAK
○ Örnek; YKS sınavı
● Biçimlendirme ve Yetiştirmeye Yönelik Değerlendirme (Formative)
○ Öğretim süreci devam ederken, her bir ünitedeki öğrenme eksiklerini ve güçlüklerini
belirlemek; bu eksik ve yetersizliklerin giderilmesi, yani ünitelerin daha iyi öğrenilmesi
için her bir öğrenciye ayrı ayrı önerilerde (dönüt) bulunmak
○ Amacı not vermek değil
○ Örneğin “tense”ler anlatıldıktan sonra yeni üniteye geçilecek. Yeni üniteye geçmeden
önce öğrencilerin anlayıp anlamadığını tespit etmek için yapılan değerlendirmeler
○ Bu amaçla kullanılan testlere formatif testler, ünite testleri ya da izleme testleri denilir.
○ ANAHTAR KELİME TELAFİ
● Düzey Belirlemeye Yönelik/ Değer Biçmeye Yönelik (Summative Assessment)
○ Amaç hedef ve kazanımlara ulaşma düzeyinin belirlenmesi
○ Dönem ortasında ya da dönem sonunda uygulanabilir
○ Akademik başarıyı etkileyen bir not verilir. (Örneğin quiz yapıp aldığı puanı sözlüsüne
ekleyebilirsin)
○ İŞİN İÇİNDE PUAN VERME VARSA AMA DÜZEY BELİRLEME. DÜZEY
BELİRLEMEDE AMAÇ ÖĞRENCİNİN GEÇTİ KALDI DURUMUNA KARAR VERMEK
○ Sertifika/belge alınabilir.

Ölçme Araçlarında Güvenirlik


● Hata= gözlenen puan- gerçek puan
● Ölçme sonuçlarından elde edilen her zaman gözlenen puandır.
○ Sabit Hata
■ Bir ölçmeden diğerine, ölçmenin miktarı değişse bile, hatanın miktarının
değişmemesidir.
■ Örneğin; bir sınav yapılıyor ve bu sınavdan 50, 70, 95 gibi puanlar alınıyor.
Öğretmen ise sınava giren herkese +5 puan vermeye karar veriyor. Diğer bir
örnek bir tartının, tarttığı herkesi olduğundan 10 kilo ağır göstermesi
○ Sistematik Hata
■ Ölçülen büyüklüğe, ölçmeyi yapan kişiye veya ölçme şartlarına göre miktarı
değişen hatalar.
■ Ölçmede bu tür hatalar “yanlılık” olarak da adlandırılır.
■ Örneğin; öğrencinin sınavda aldığı puanın ondalık basamağındaki rakam kadar
puan eklenecek. 60 almışsa 6 puan, 90 aldıysa 9 puan.
■ Diğer bir örnek; bir Türkçe öğretmeni güzel yazısı olan öğrencilere fazladan 5
puan verebilir, çünkü dersin kazanımları arasında güzel yazı yazmak vardır.
Fakat bir İngilizce öğretmeninin bunu yapması sistematik hataya girer çünkü
İngilizce dersi kazanımları arasında böyle bir şey yoktur
■ Başka örnekler; cinsiyet ayrımcılığı, öğretmenin kendi takımını tutmayan
öğrencilere ayrım yapması
■ Torpiller de sistematik hataya girer
○ Tesadüfi Hatalar
■ Şans eseri ortaya çıkan, kaynağı ve miktarı belli olmayan, ölçme sonuçlarını
hangi yönde etkilediği kestirilemeyen hatalardır.
■ Örneğin; Sınav olduğu gün yan binada inşaat var. Kimi kişiler bu inşaat sesinden
etkilenebilir, kimi ise etkilenmeyebilir. Bu durum ise sonuçlarda farklılığa sebep
olabilir.
■ Örneğin; uykusuzluk, dikkatsizlik, hastalık, sınav ortamının elverişsizliği, gibi
etkenler bu tür hataların ortaya çıkmasına neden olur.
○ Hata Kaynakları
■ Ölçmeyi yapan kişi
■ Ölçme aracı (örneğin lise seviyesindeki öğrencilere ilkokul seviyesindeki bir sınav
yapmak)
■ Ölçme yöntemi (örneğin ses yarışmasına aday olacak kişileri çoktan seçmeli sınav
ile seçmek)
■ Ölçmenin yapıldığı ortam (örneğin kışın kaloriferin yanmadığı bir sınıfta sınava
girmek)
■ Ölçülen bireyin özellikleri
● Güvenirlik, bir ölçme aracının ölçtüğü niteliği ne denli hatadan arınık ölçtüğü ile ilgilidir.
● Güvenirlik, tesadüfi hatalardan arınık olma derecesidir.
● Hatalardan olabildiğince arınık olan ölçme yapan araçlar, tutarlı ve kararlı ölçme sonuçları
verir.
● Kavramlar
○ Tutarlılık; ölçme aracında yer alan maddelerin birbirleriyle tutarlı olması
○ Kararlılık; ölçülen özellik belirli bir süre sonra yeniden ölçüldüğünde ölçülen
özelliklerde değişiklik olmaması
○ Duyarlılık; ölçme aracının, ölçmek istediği şeyi hassas bir şekilde ölçebilmesi. Yani
hassasiyet. (Örnek; bir metre üzerinde milimetreler de varsa, sadece cm gösteren bir
metrenin aksine daha hassas bir ölçüm yapılabilir. Sınavda nasıl çıkabilir; Soru sayısı.
Bir sınavda 10 soruluk mu yoksa 100 soruluk mu daha güvenilirdir diye sorulursa 100
soruluk sınav daha güvenilirdir. FAKAT önemli bir nokta -> güvenirlik artsın diye soru
sayılarını iyice arttırırsan bu sefer öğrencilerde yorgunluk yaratarak tesadüfi hata
yapmasına neden olursun.)
○ Objektiflik (puanlayıcı güvenirliği); özellikle açık uçlu sorularda
● Güvenirlik nasıl hesaplanır?
○ Korelasyon Katsayısı; yön ve değer açısından yorumlanır. Yönü belli eden şey önündeki
“+” ve “-” işaretleridir.
○ Korelasyonel Yöntemler: (Korelasyon, iki değişken arasındaki ilişkidir.)
■ Test Tekrar Test yöntemi
■ Paralel (eşdeğer) formlar yöntemi
■ İç tutarlık yöntemleri
● Testi yarılama
● Kuder Richardson (KR20 ve KR21)
● Cronbach Alfa katsayısı

Korelasyon Katsayısı
Korelasyon, iki veya daha fazla değişken arasında bir ilişki olup olmadığını, eğer ilişki varsa bu
ilişkinin miktarını ve yönünü sayısal olarak belirlememizi sağlayan istatistiksel bir tekniktir.
İki değişken arasındaki ilişkinin derecesine ise korelasyon katsayısı denir.
Hesaplanan korelasyon katsayısı -1 ile +1 arasında değer alır. -1’den küçük ve +1’den büyük
olamaz. Korelasyonun pozitif (+) olması durumunda değişkenler aynı yönde değişmiş
demektir. Korelasyon katsayısının + olması iki değişkenin aynı yönde bir ilişkide olduğunu,
negatif (-) olması ise iki değişkenin arasında ters yönde bir ilişki olduğunu gösterir. Eğer
değişkenlerdeki artış veya azalış birbirine bağlı değilse korelasyon sıfır olur. Bu da değişkenler
arasında ilişki yok anlamına gelir.
Korelasyon katsayısı 1′ e yaklaştıkça değişkenler arasındaki ilişkinin yükseldiğini,
Korelasyon katsayısı 0’a yaklaştıkça değişkenler arasındaki ilişkinin azaldığını görebiliriz.
Korelasyon 1 olduğunda ilişki mükemmel, 0 olduğunda ise ilişki yok demektir.

Örneğin;
Yorgunluk – Dikkat arasında zıt yönlü ve negatif bir ilişki vardır. Çünkü yorgunluk arttıkça
dikkat azalmaktadır. Zeka – Başarı arasında ise aynı yönlü ve pozitif bir ilişki vardır. Çünkü
zeka ne kadar yüksek ise başarı da o kadar yüksek olacaktır.

Türkçe ve tarih derslerinden alınan puanlar arasındaki korelasyon katsayısı 0,80 olduğunu
varsayalım. 0,75 ilişkinin yüksek olduğunu gösterir. Ayrıca işaretini de dikkate alırsak bu iki
dersin benzer olduğunu görebiliriz. Yani Türkçe dersinin puanı arttığında tarih dersi
puanlarının da arttığı görülür. Bu örnekte yüksek ilişki olduğundan benzerlikte de yüksektir ve
çok benzerdir diyebiliriz.

● Birden Çok Uygulamaya Dayalı Yöntemler


○ Test Tekrar Test Güvenirliği
■ Aynı testi, aynı gruba, farklı zamanlarda tekrarlı olarak uygulamaktır. Bu
durumda güvenirlik katsayısı, aynı bireylerin her iki uygulamadan
aldıkları puan dağılımları arasındaki korelasyon katsayısıdır. Bu tip bir
güvenirlik hesaplamada; hata varyansı, her bir bireyin iki testten elde
ettiği puanlar (performans) arasındaki tesadüfi farklılıkları ifade eder.
■ Test- tekrar test güvenirliği, bir testten elde edilen sonuçların değişik
zamanlara göre ne derece genellenebileceğinin ölçüsünü verir. Test-tekrar
test güvenirliği ne kadar yüksekse, test puanları, test dışındaki çevresel ve
bireysel değişimlere o derece az duyarlı olacaktır.
○ Eşdeğer (Paralel) Formlar Güvenirliği
■ Aynı testi kullanmak yerine eşdeğer formlar geliştirmek ve bunun
üzerinden güvenirliği hesaplamaktır. İki eşdeğer test formun aynı gruba
uygulanmasına dayalıdır. Bu durumda güvenirlik katsayısı, iki formdan
elde edilen puanlar arasındaki korelasyon katsayısıdır.
● Tek Uygulamaya Dayalı Yöntemler (İç Tutarlılık)
○ Bu yöntemlerde güvenirlik katsayısı hesaplamak için tek bir grup ve tek bir
uygulamadan elde edilen puanlar yeterli olacaktır
○ Testi Yarılama Yöntemi
■ Tek oturumda uygulanan ve iki yarıya bölünen testin her iki yarısının
paralel olduğu ve her iki yarının ortalama ve varyanslarının eşit olduğu
varsayılır. Bireylerin testin iki yarısından elde ettikleri puanlar arasındaki
korelasyon eşdeğerlik katsayısı olarak adlandırılır.
■ Örneğin ALES sınavı yapılıyor ve burada 40 Türkçe sorusu soruluyor.
Sınava giren bireyler bu soruları bir defa yanıtlıyor. Araştırmacı bu 40
soruyu 20’şer tane olacak şekilde rastgele iki parçaya ayırıyor. Örneğin X
kişisinin ilk 20 sorudan aldığı puan 18, ikinci 20 sorudan aldığı puan 17.
Eğer herhangi bir hata karışmamışsa, öğrencinin ilk bölümden aldığı puan
ile ikinci bölümden aldığı puanın birbirine yakın olması gerekiyor.
■ Testin bütünü için Spearman-Brown düzeltme formülü kullanılır.
● r (tüm) = 2r(AB) ÷1+ r(AB)
○ KR20 ve KR21 (Kuder-Richardson)
■ Tüm maddelerin birbiriyle ve ölçeğin tamamıyla iç tutarlılığını tahmin
etme amacı üzerine kuruludur
■ Maddeler birbirleriyle benzer bir özelliği ölçüyorsa KR20 ve KR21 yüksek
çıkar. Maddeler birbirlerinden farklı bir özelliği ölçüyorsa ya da bazı
maddeler hiç anlaşılmayacak şekilde hazırlanmışsa KR20 ve KR21 düşük
çıkar, bu da tesadüfi hatanın yüksek olduğunu gösterir.
■ KR20, soruların zorluk ve kolaylık düzeylerinin farklı olduğu
durumlarda hesaplanan güvenirlik katsayısıdır. Yani madde güçlükleri
birbirinden farklı ise kullanılır.
■ KR21, soruların zorluk ve kolaylık düzeylerinin aynı olduğu
durumlarda hesaplanan güvenirlik katsayısıdır. Yani madde güçlükleri
birbirine yakın veya eşit ise kullanılır. Fakat KR21’in bir dezavantajı
vardır. Bu da, madde güçlükleri eşit olduğundan, madde güçlüklerine
dayalı hesaplanan madde varyansı yoktur. Madde varyansı olmadığı için
de elde edilen güvenirlik katsayısı, KR20’ye göre daha düşüktür. Daha
düşük olduğu için de KR21, aynı zamanda “güvenirliğin alt sınırı” olarak
adlandırılır.
○ Cronbach- Alpha
■ İkiden çok puanlamaya sahip olan (örneğin dereceli puanlama, çoklu
puanlandırma gerektiren, açık uçlu sınavlar, anketler) testlerin
güvenirliğini belirlemek için kullanılır.
■ Maddelerin birbirleriyle olan tutarlılığına bakar. Maddeler aynı özelliği
içermelidir. Maddeler birbirleriyle tutarlı ise, Cronbach Alpha katsayısı
yüksek çıkar.
■ Örneğin; kişinin bir konu üzerine ilgisini ölçmek için bir ölçme aracı
hazırlanıyor. Bütün sorular, bu konuyla ilgisi üzerine hazırlanmış ise
Cronbach Alpha katsayısı yüksek çıkar. Ama farklı konu üzerine sorular da
konulmuşsa bu Cronbach Alpha katsayısının düşük çıkmasına sebep olur.
■ Mantık olarak KR20 ve KR21’e çok benzer, kullanım değerleri farklıdır.
KR2O ve KR21, “1-0” şeklinde puanlanır. Cronbach Alpha ise 2’den fazla
puanlama değerlerine sahip
● Korelasyona Dayalı Olmayan Yöntem
○ Ölçmenin Standart Hatası
■ Güvenirliği puan cinsinden verir, korelasyon cinsinden vermez.
■ Puanların üzerindeki hata değeri üzerinden bireylerin alabileceği gerçek
puan sınırını hesaplama.
■ Örneğin öğrenci bir sınavdan 60 alıyor, öğretmen sınavın güvenirliğinin
hesaplandığını ve bunun 0,85, standart hatanın da 3 çıktığını söylüyor.
■ Ölçmenin standart hatası formül = S √1-r(xx)
● S= standart sapma
● r(xx)=teste ait güvenirlik katsayısı
■ ÇOK ÖNEMLİ ÖRNEK


■ Örneğin standart sapma “4” veriliyor. Ölçmenin standart hatası
yukarıdaki bütün aralıklarda eşittir, yani 4’tür.
■ Eğer bu kişinin %68 aralıkla alabileceği maksimum ve minimum puan
aralığı sorulursa, bu “-1 ve +1” aralıklarını kapsar. Minimum için “-1”
aralığı göz önünde bulundurularak 4 puan düşürülür. Maksimum için de 4
puan eklenir. Yani 52 puan almış bir öğrencinin %68 oranla alabileceği
gerçek puan aralığı “48-56” olur.
■ %95 oranında bakıldığında “-2,-1,+1,+2” aralıklarını kapsıyor. Minimum
için iki standart sapma noktası göz önünde bulundurularak 8 puan
çıkartılır (sapma yine 4), maksimum için 2 standart sapma noktası göz
önünde bulundurularak 8 puan eklenır. Burada 52 puan almış bir
öğrencinin %95 oranla alabileceği gerçek puan aralığı “44-60” olur.

● Güvenirliği Etkileyen Etkenler


○ Testin uzunluğu
■ Güvenirlik artsın diye soru sayılarını iyice arttırırsan bu sefer öğrencilerde
yorgunluk yaratarak tesadüfi hata yapmasına neden olursun
○ Testin yönergesi
■ Testin başında öğrencilere sınavın süresi, çıkacak sayı sorusu gibi bilgileri
vermek, sınavın güvenirliğini etkiler.
○ Grubun homojenliği
■ Homojenlik olumsuz etkiliyor. Örneğin aynı sınavı hem tek bir sınıf için hem de
fakülte genelindeki öğrencilere uyguladık. Fakülte üzerindeki güvenirlik daha
yüksek çıkma eğilimindedir. Daha heterojen bir gruptur. Veri olarak bakıldığında
sınıf içi testin güvenirliği 40-80 arasında dağılırken, fakülte düzeyindeki sınavın
oranı 20-100 arasında değişebilir. Böyle bir durumda, tüm fakülteden elde
edilecek verilerin dağılımı daha geniş ve daha heterojen olacağı için, güvenirlik
daha yüksek çıkma eğilimindedir.
○ Testin güçlüğü (orta düzeyde)
○ Puanlamadaki nesnellik
○ Ölçmenin yapıldığı ortam
○ Testin yanıtlama süresi
● Kullanışlılık
○ Bir ölçme aracında bulunması gereken üç teknik nitelik vardır. Bunlar güvenirlik,
geçerlik ve son olarak kullanışlılıktır.
○ Bir aracın kullanışlı olması demek, fiyatının, çoğaltılmasının, uygulama ve
puanlanmasının kolay ve ekonomik olması demektir.
○ Kullanışlılıktan bahsetmek için üç temel özellik göz önünde bulundurulur;
■ Testin uygulama süresi: hazırlanma süresi kısa olan test, hazırlanma süresi
uzun olan teste tercih edilir.
■ Testin fiyatı: test, ekonomik olmalıdır. Daha uzun bir test için daha fazla kağıt
harcanır, bu da maliyeti artırır.
■ Testi uygulayacakların niteliği: Bazı testleri uygulamak için özel eğitimler
alınması gerekebilir. Testin uygulanması özel bir eğitim ve deneyim
gerektirmiyorsa kullanışlıdır.
○ Testi uygulayan ve puanlayan kişi için kullanışlılıktan bahsederken dikkat edilmesi
gereken noktalar;
■ Uygulama sırasındaki güçlükler: Uygulama sırasında test yönergeleri, testin
dil ve anlatımı,uygulamasüresi.. gibi etkenlere bağlı olarak ortaya çıkan sorunlar
aracın kullanışlılığını etkiler
■ Test puanlamadaki güçlükler: Cevap kağıtlarının iyi düzenlenmesi ve testten
ayrı olması, cevapların bilgisayarla, otomatik olarak puanlanabilmesi
kullanışlılığı arttırır.
■ Puanları yorumlama kolaylığı: Testten elde edilen puanların
yorumlanmasına yardımcı olacak araçlar (puan cetveli, norm tabloları..)
kullanışlılığı arttırır.
○ Test, testi alanlar için de kullanışlı olmalıdır
■ Testin baskı yönünden kullanışlı olması: Baskının düzgün ve puntoların
ilgili bireylerin seviyelerine uygun büyüklükte olması gerekir.
■ Testin cevaplama yönünden kullanışlı olması: Cevap kağıtlarının testten
ayrı ve işaretlenmesinin kolay olması gerekir.
○ Kullanışlı Test Uygulamaları
■ Bilgisayar ortamında uygulama
■ İnternet ortamında bilgisayarda uygulama
■ Bilgisayar ortamında bireyselleştirilmiş test uygulaması (adaptive test)
● Geçerlik
○ Ölçme Sonuçlarına (Testlere) Dayanarak Verilen Kararlar
■ Öğretimi değerlendirmeye ve geliştirmeye dönük kararlar
■ Seçme ve yerleştirmeye yönelik kararlar
■ Bireyi tanıma ve rehberlik hizmetine yönelik kararlar
■ Eğitim politikalarının geliştirilmesine ve değiştirilmesine yönelik kararlar
■ Araştırma-geliştirme faaliyetlerine ilişkin kararlar
○ Geçerlik, ölçme aracının amacına uygunluk özelliğini ifade eder. Başka bir deyişle, bir
ölçme aracının, ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle karıştırmadan
doğru olarak ölçebilme derecesidir.
○ Örnek; her sabah fakülte durağına saat 8.00’da otobüs gelir. Bu otobüsün 8.00’de
gelecek olması güvenirliktir. Geçerli olması için durağa otobüsün gelmiş olması gerekir,
yani amacına hizmet etmiş olmalıdır.
○ Örnek; ağırlık ölçmek için metre kullanılamaz. Metre, ağırlık ölçmek için geçerli bir araç
değildir.
○ Bir ölçme aracı, belli bir amaç, belli koşullar ve belli bir grup için geçerlidir. Bir amaç
için geçerli sayılan bir ölçme aracı, başka bir amaç için geçerli sayılamaz.
○ Başlıca geçerlik türleri:
■ Kapsam geçerliği
● Bir ölçme aracının, işlenen bütün konuları içermesidir.
● Kapsam geçerliliğini sağlama yolları;
○ Belirtke tablosu oluşturmak. Bu, konular/kazanımlar ile bilişsel
hedeflerin bir araya geldiği bir tablodu
■ Görünüş geçerliği
● Ölçme aracında yer alan maddelerin, neyi ölçtüğünün görünmesi
● Örneğin ölçme ve değerlendirmesi zannederek açtığın sınav formunun
soruları, ölçme ve değerlendirme ile ilgili sorulardan ziyade, başka bir
derse ait gibi görünüyor. Bu da görünüş geçerliğine uymadığını gösterir.
■ Ölçüt dayanaklı geçerlik
● 1. Yordama Geçerlik
○ işe/okula alınacak bireylerin gelecek performanslarını hakkında
tahmin yürütme. Örneğin, kişi çalışmaya başlamadan önce
seviyesini ölçmek için bir sınav yapılır. İşte bir süre çalıştıktan
sonra yapılan başka bir sınav ile ilk sınavın sonuçları
karşılaştırıldığında kişinin performansı iyiyse, bu durumda
yordama geçerliğin başarısından söz edilebilir.
● 2. Benzer Ölçekler (uygunluk, eş zaman, halihazır, uyum)
Geçerliği
○ Geçerliği daha önceden belirlenen test ile aynı değişkenleri ölçtüğü
ileri sürülen ve yeni hazılana test arasındaki korelasyon yeni testin
benzer ölçekler geçerliğidir.
○ Örneğin; üniversite sınavına girmeden önce, öğrencilerin lisedeki
puanları ölçüt olarak alınabilir. Yani lise puanları ve üniversite
sınavı puanları karşılaştırılır.
■ Yapı geçerliği
● Gözle görülmeyen, o bireyde var olduğu düşünülen özellikleri ölçme aracı
ile ortaya çıkarabilme derecesidir
○ Geçerliği artırmak için yapılması gerekenler;
■ Kopya çekilmesini önlemek,
■ Uzun okuma parçaları verilmemelidir. Soru ne anlatmak istiyorsa az ve öz şekilde
aktarılmalıdır.
■ Hedef ve kazanımların tümünü kapsaması lazım
■ Ölçülen özelliğe sahip olan ile o özelliğe sahip olmayanları ayırabilecek nitelikte
sorular hazırlanmalı

You might also like