Professional Documents
Culture Documents
Ölçme Ve Değerlendirme
Ölçme Ve Değerlendirme
Modül
MODÜL-2 ÖLÇME VE DEĞERLENDİRME (%12)
1. ÖLÇME VE DEĞERLENDİRMENİN TEMEL KAVRAMLARI
1. BÖLÜM (Ölçme Ve Değerlendirmenin Temel Kavramları)
1-Eğitim Sisteminde Ölçme Ve Değerlendirmenin Yeri:
Sistem= girdi, süreç ve çıktı
Uzak hedefler: Devletlerin hedefleridir, bazı ülkelerde çerçevesi anayasa ile güvenceye alınmıştır.
Genel hedefler: Kurumların (MEB, MEB genel müdürlükleri, il millî eğitim müdürlükleri, okul yönetimleri vb.) işevuruk hedefleri
Özel hedefler: Dersin hedefleridir, bir dersin kazanımlarını kapsar.
Girdi: Eğitim-öğretim için gerekli her şey(öğrenci, öğretmen, okul, çalışanlar, yönetim, eğitim program)
Süreç: Hedeflerinin öğrenciye kazandırıldığı eğitim durumları.Süreç, kontrol edilmeli.Olumluysa devam, değilse müdahale gerek.
Çıktı: Öğrencinin bir dersin sonunda ulaştığı hedefler ve kazanımlar. Çıktılar hedeflerle tutarlı mı diye kontrol edilmektedir.
Eğitimde kontrol (denetleme) ölçme ve değerlendirme ile mümkündür. Gözlenmeyen süreçler ve ürün değerlendirilemez.
2-Yirmi Birinci Yüzyıl Değişen Eğitim Paradigması: ABD’de 1930-1950’lerde okullardan “eğitim fabrikaları” olarak söz ediliyor
Atatürk’ün «muasır medeniyetler seviyesine ulaşmak» Türkiye’de eğitimin uzak hedefi oldu.
Eğitimin genel hedefi “toplumun bireylerden beklediği görev ve sorumluluklar doğrultusunda bilgi ve donanıma sahip olma”
-21. YY’da sanayi toplumlarından bilgi toplumlarına hızlı bir dönüşüm başladı ve eğitim-öğretim ortamlarına da yansımaya başladı.
-21. YY ekonomi görüşü, bir ülkede ortalama eğitim bir birim arttığında, ekonomik büyüme %0,7 artmakta. Büyümenin yarısı
doğrudan eğitimin katkısı iken diğer yarısı eğitim ve ekonomi arasındaki etkileşimden kaynaklı.
-PISA, TIMSS ve PIRLS gibi dünya eğitim örgütleri, doğrudan ekonomik ya da siyasi- ekonomik politikalar üretiyorlar.
-20. yüzyıl eğitim ve ölçme zihniyeti ile 21. yüzyıl becerileri kazandırılamaz.
Ölçmenin anlam ifade etmesi değerlendirme ile olanaklıdır. Ölçmeye temel olan durum “fark”tır.
Fark, bireyler arasında yada ortaya koydukları özellikler arasında da olabilir.
Eğitimde akademik başarı dışında yetenek, ilgi, tutum, özel gereksinim gereken alanlar vb. özellikler de ölçmeye konu olur.
b-Ölçüt:Ölçülen özellik hakkında karar alma / yargıya varmak / değerlendirme yapmak için dayanak alınan referans noktası(aralığı)
c-Değerlendirme: Bir ölçme sonucunu (ölçüm) en az bir ölçüte vurarak ölçülen nitelik hakkında karar verme / yargıda bulunma
*Ölçüt, ölçme ve değerlendirme arasında köprü görevi görür. Ölçüt değişirse değerlendirme de değişir.
b)Dolaylı Ölçme (Göstergeyle Ölçme): Doğrudan gözlenemez, dolaylı gözlenebilir. Davranışlar aracılığı ile gözlenerek ölçülebilir.
(Öğrencilerin dört işlem becerisi, derse yönelik tutumları, genel muhakeme düzeyleri, öz düzenleme becerileri, sınav kaygıları)
( İyi Yurttaş: vergi verme, seçme ve seçilme hakkını kullanma, askerlik vb. görevleri yapma davranışları sergilemesi gözlenir)
c)Türetilmiş Ölçme:Kendisinden farklı iki ya da daha fazla özelliğin arasında matematiksel bir bağıntı (dört işlem) yardımıyla
( hız (yol / zaman), yoğunluk (kütle / hacim), zekâ bölümü (zekâ yaşı / takvim yaşı x 100) vb. )
2-Ölçüt Türleri:
a)Mutlak Ölçüt (Kriter Referanslı Ölçüt): Eğer ölçüt ölçme işleminin yapıldığı grubun özelliklerinden bağımsız olarak
belirleniyorsa “mutlak”tır. ölçme işlemi öncesinde ilan edilir.
(Dersten geçme notu 50’dir, doktora başvurusu için ALES’ten en az 60 almak gerekir, Ehliyeti sınavında 70 alan başarılı sayılır )
-Tam öğrenme kuramı doğrultusunda 100 üzerinden 70, başarılı olma koşuludur.
-Bir öğrencinin notu, diğer bir öğrencinin değerlendirmesini (geçme / kalma) etkilemez. Herkes geçebilir de kalabilir de.
b)Bağıl Ölçüt (Norm Referanslı Ölçüt): Eğer ölçüt, ölçme işleminin yapıldığı grubun belirli bir özelliğine / normuna dayalı ise
(aritmetik ortalamaya / ortancaya / moda denk ve üzerinde puan alan geçer , başarısı yüksek ilk on öğrenci proje için seçilecektir)
*Bağıl ölçüt ancak ölçme işlemi sonrasında belirlenebilir. Rekabetçi bir eğitsel ortam kaçınılmazdır.
Not 1: Eğitsel kararların verilmesinde mutlak ve bağıl ölçütler bir arada da kullanılabilir.(YKS, KPSS Ortaöğretim Memur Ataması)
**Eğer değerlendirme mutlak ölçüte göre yapılıyorsa “mutlak değerlendirme”, bağıl ölçüte göreyse “bağıl değerlendirme”
Selim ……. fen lisesine yerleştirilmiştir. ➙ Bağıl değerlendirme
Güzin lisans programları için tercih yapabilecektir. ➙ Mutlak değerlendirme
**Ortalama 40-60 ise mutlak ya da bağıl değerlendirme yapılır; ortalama 60’ın üzerindeyse mutlak değerlendirme, 40’ın altındaysa
bağıl değerlendirme zorunludur.
Not 2: Öğrenci ile ilgili önemli / hayati kararlar verileceği zaman mutlak değerlendirme yapılması gerekir. ( tek ders sınavları)
Not 3: Başvuran kişi sayısının çok, alınacak kişi sayısının az olduğu (arz-talep dengesizliği olan) sınavlarda yerleştirme / atama vb.
bağıl değerlendirme ile yapılmak zorundadır. (LGS, YKS, KPSS, TUS )
Not 4: Muafiyet sınavlarında mutlak değerlendirme yapılması gerekir. (yabancı dil muafiyet sınavları )
b)Biçimlendirme-Yetiştirmeye Yönelik Değerlendirme (Formatif Değerlendirme): Belirli bir konu / ünite sonunda öğrencilerin
öğrenme eksiklerini belirlemek amacıyla yapılır. Amaç not vermek değildir.
(Not verilmeden yapılan kısa sınavlar (quiz), ünite tarama testleri(izleme testleri) )
Bir ünitedeki öğrenmeler, başka ünite için ön öğrenme hâline gelebilir. Blooma’a göre o öğrenme açığı kar topu gibi devam eder.
c)Değer Biçmeye / Düzey Belirlemeye Yönelik Değerlendirme (Summatif Değerlendirme): Sürecinin sonunda, not vermek
Alanda erişi testi uygulanır.( Bitirme sınavları, sertifika sınavları, üniversitedeki vize ve finaller, yazılı yoklamalar )
İlk üç değerlendirme türü öğrenci başarısına odaklıdır
e)Program Değerlendirme: Eğitim programlarının planlanması, mevcut programlar ve/veya ürünlerin etkililiğinin değerlendirilmesi
ve eğitim programlarının ve/veya ürünlerin geliştirilmesi amacıyla yapılır.
a)Sabit Hata:Her ölçme işlemine aynı miktarda karışan hatalardır.(Marketteki terazi, üzerinde herhangi bir nesne yokken terazi -120
g gösteriyorsa ne tartılırsa tartılsın 120 g eksik ölçülecektir. Bir öğretmen, sınavında herkese 10 puan fazla veriyorsa )
b)Sistematik Hata: Ölçülen büyüklüğe, öğretmene ya da ölçme koşullarına göre miktarı değişen hatalardır.
(Marketteki terazi, her bir kilogramda 120 g eksik tartıyorsa üzerine konulan nesnenin ağırlığı arttıkça hata miktarı da artacaktır.)
(Bir öğretmen, sınavında yazısı kötü olandan puan kırıyorsa yine karışan hata sistematik olacaktır.)
*Sistematik ve sabit hatalarda karışan hata miktarı, yönü ve kaynağı bellidir. Bu tür hataları düzeltmek görece daha kolaydır.
c)Tesadüfi (Rastlantısal) Hata: Şansla ortaya çıkan ne yönde ve ne ölçüde karıştığı genellikle bilinemeyen hatalardır. (psikometri)
1-Ölçme işlemini yapan kişiden / öğretmenden kaynaklanan hata:
Ölçme işlemi sürecinde:Test katılımcısının dikkatini dağıtacak ve/veya kaygısını artıracak davranışlar
Ölçme işlemi sonrasında:Puanlamada dikkat(titizliğin) zamanla değişmesi,yorgunluk,öncelik-sonralık yanılgısı,maddi hata
2-Ölçme aracından kaynaklanan hata: Maddelerin iyi ifade edilmemesi, dil bilgisi, imla kurallarına uygun olması; maddelerde
anlatım bozukluğu bulunmaması, muğlâk ya da belirsiz (müphem) ifadelerin bulunmaması gerekir.
-Kapsam olarak Homojen(benzeşik) maddelerden oluşan bir araç,heterojen(ayrışık) maddelerden oluşan bir testten daha güvenilir.
-Madde sayısı ile güvenilirlik arasında doğru orantılı vardır.Ancak madde sayısı arttıkça yorgunluk, dikkat azalması hatayı arttırır.
-Bilişsel özellikleri ölçen testlerde eğer seçenek verilmişse şans, başarının yüksek görünmesine yol açabilir. (Rastgele İşaretleme)
3-Bireyden / öğrenciden kaynaklanan hata: Fiziksel, fizyolojik ve psikolojik durumları(Uykusuzluk, açlık, hastalık, ağrı, kaygı vb)
*Heterojen gruplarda güvenirlik katsayısı artarken daha homojen gruplarda güvenirlik katsayısı azalır.
4-Fiziksel ortamdan kaynaklanan hata: Sıcaklık, ışık, ses, koku, görsel uyarıcıların fazlalığı, ergonomi vb.
3- Geçerlilik, Güvenilirlik Ve Hata İlişkisi:
*Geçerlilik sabit, sistematik ve tesadüfü hatalardan etkilenir.) Güvenilirlik sadece tesadüfi hatadan etkilerinr.(Klasik Test Kuramı)
*Testin güvenilir olması onun geçerli olacağı anlamına gelmez ancak bir test geçerli ise büyük olasılıkla güvenilirdir.
*Bir ölçme aracının değil, elde edilen puanların geçerliliği ve güvenilirliği vardır.
Ölçme araçlarının psikometrik nitelikleri şu durumlara göre değişebilir:
a. Ölçme amacının değişmesi, d. Maddelerde ve/veya alt ölçeklerde yapılan değişiklikler,
b. Uygulama grubunun değişmesi, e. Farklı kültürler,
c. Dilin eskimesi / değişmesi, f. Kuramsal bilgi birikiminde değişiklikler.
*Testten elde edilen puanlar yüksek ,orta ve düşük düzeyde geçerli; yüksek,orta ve düşük düzeyde güvenilir biçiminde nitelendirilir.
*Modern test kuramına göre geliştirilen ölçekler eleştiriye açıktır. Böylece testlerin niteliği ve test bilgisi gelişir.
4-Korelasyon((co-relation): En az iki değişken arasında karşılıklı bir ilişki bulunup bulunmadığı, eğer ilişki varsa bu ilişkinin yönü ve
miktarı hakkında bilgi veren istatistik bir tekniktir. “r” ile sembolize edilir.
(Öğrencilerin derse ilişkin tutumları ile ders başarıları arasında bir ilişki var mıdır? Saç uzunluğu ile zekâ arasında bir ilişki var mı?)
*Pozitif korelasyon iki değişken arasında doğru orantılı(ders çalışma süresi ile sınav notu), Negatif korelasyon ters orantılı(ders
süresi ile dikkat veya yükseklik ile sıcaklık ilişki anlamına gelir. ∓1 mükemmel korelasyon anlamına gelir.
*Sıfır(0) mükemmel ilişkisizlik denir.(Öğretmenlerin boyları ile aylık ücretleri arasındaki korelasyonun sıfır olması beklenir)
*Yön, negatif ya da pozitif olarak değerlendirilirken miktar, kabaca düşük, orta ya da yüksek olarak nitelendirilir.
Not 1: Korelasyon mutlak değer olarak değerlendirilmeli. Negatif ya da pozitif olması büyüklük-küçüklük belirtmez, yön bildirir.
Not 2: Doğru ya da ters orantılı bir ilişki olması, değişkenler arasında bir neden-sonuç ilişkisinin varlığı anlamına gelmez.
Özet: @muhalif33 Kaynak: MEB 3
2.Modül
5-Geçerlilik Sorgulama Yöntemleri:
a)Kapsam Geçerliliği: Bir testin ölçülmek istenen davranışları ne derece kapsadığıyla ilgilidir
Testteki soruların / maddelerin içeriği yeterli ve dengeli bir biçimde ölçüyor olması ve kazanımla doğrudan ilgili olması gerekir.
Mantıksal / rasyonel yöntemler:
1- Belirtke tablosunun hazırlanması:Kkapsam dâhilinde davranışların(sol) belirlenmesi ve hedefler(sağ üst) belirtilir.
2-Uzman görüşüne başvurulması: Ölçme ve değerlendirme tekniklerini bilen bir alan uzmanıdır. Uzmana belirtke tablosu sunulur.
1-Uzmanlardan alınan dönütler betimsel / muhakemeye dayalı bir yolla çözümlenebilir.
2-Uzmanlar “uygundur/ düzeltme gerekir / soru kullanılmamalıdır” vb. biçimde değerlendirme yapması istenebilir.
İstatistiksel yöntemler: 2. Maddede uzmanlar arasında uyuşum olup olmadığı, çeşitli istatistiksel yöntemlerle test edilir.
b)Ölçüt Dayanaklı Geçerlilik: Edilen puanların ölçüt bir puanla (testin tahmin etmeye çalıştığı ve geçerliliği yüksek bir puan)
karşılaştırılarak geliştirilen ölçme aracının geçerliliğine ilişkin nitelendirme yapılır.
1-Yordama Geçerliliği: Yordama, tahmin demektir ancak her tahmin yordama değildir. Eldeki veriden yola çıkarak geleceğe, henüz
gerçekleşmemiş bir olguya ilişkin yapılan tahmindir. Ölçme aracının bu kestirim işini ne ölçüde doğru ve isabetli yaptığıdır.
*Yordama geçerliliğinin yüksek olması istenir.Seçme(YKS, KPSS, LGS) ya da yönlendirme(meslek/alan seçimi) testleri örnektir.
Ölçme aracından elde edilen puanlar, ölçme aracının tahmin ettiği puanla (ölçüt puan) karşılaştırılır ve tahminin ne ölçüde doğru
olduğu belirlenir. Yordama geçerliliğinde ölçüt puan gelecekte belli olacağından beklemek gerekmektedir.
Alınan Puan
2-Zamandaş Geçerlilik: Hâlihazır geçerlilik, benzer ölçekler geçerliliği, uygunluk geçerliliği adı ile de anılmaktadır.
*Geliştirilen ölçme aracı ile ilişkili olabilecek nitelikleri ölçen ve geçerliliği yüksek bir aracın puanı ölçüt puan olarak ele alınabilir.
*Daha sonra geliştirilen ölçme aracı ve ölçüt araç aynı zamanda uygulanıp iki araçtan elde edilen puanlar arasındaki ilişki incelenir.
(Örnek: Murat, bugün dakikada 54 sözcük yazmıştır. Geçen hafta dakikada 45 sözcük yazmıştır.)
İki ölçüm arasındaki uyumsuzluğun birçok nedeni olabilir. (dikkat ve çaba, fiziksel büyüme, öğrenme, sağlık ve kişilikteki değişim)
-Ölçme hataları(istenmeyen değişken) giderilene kadar sürdürülmeli ve böylece gerçek puan elde edilmelidir.
-Geleneksel olarak hataların varlığı, gözlenen puanın gerçek puandan yüksek ya da düşük olmasına neden olur.
(Örnek Bir koşucu, bir mesafeyi farklı zamanlarda 23.7, 24.0, 24.2,... 25.1, 25.2 saniyelerde koşuyor. Ölçümlerin ortalaması 24.7 ise
gerçek puanı 24.7’dir. 23.7 ve 25.2 saniyede koştuğu durumlara birçok faktörün etkisinin olabililir. (Gerçek puan kuramı)
Örnek: Bir ölçmede s=8 ve rx=.75 ise Sh=8√1 − .75=4 Bu sonuç bireylerin puanlarına –/+ 4 puan hata karıştığı anlamına mı gelir?
Üç olasılık değeri kullanılır; Dolayısıyla bir kişi 100 üstünden 50 puan almış ve Sh=4 ise;
%68 olasılık için X ∓1×Sh %68 olasılık: X∓1×Sh50∓1×4=Bireyin gerçek puanı %68 olasılıkla 46-54 arasında değişir.
%95 olasılık için X ∓2×Sh %95 olasılık için X∓2×Sh50∓2×4= gerçek puanı %95 olasılıkla 42-58 arasında değişir.
%99 olasılık için X ∓3×Sh %99 olasılık için X∓3×Sh50∓3×4=Bireyin gerçek puanı %99 olasılıkla 38-62 arasında değişir.
-Ölçmenin standart hatası yükseldikçe ölçme işlemi bireylere rastgele puan vermekten farklı olmayacaktır.
*Güvenilirlik katsayısı 0 ile 1 arasında değişir.0.70+ (kabul edilen), 0.70-0.80 arası(ön bilgi elde etme)0.90+(Genel yetenek ölçmek)
a-Birden çok uygulamaya dayalı yöntemler: Test-tekrar test ve eşdeğer (paralel) test
-Zamandaş geçerliliği (benzer ölçekler geçerliliği, hâlihazır geçerlilik, uygunluk geçerliliği ) vardır.
-Bu yöntemlerle güvenilirlik kanıtı elde etmek biraz zahmetlidir.(Test-tekrar test yönteminde testi farklı zamanda ikinci kez
uygulamak için grup bulmak bazen zor olabilir. Ayrıca katılımcı kaybı yaşamak da olasıdır. )
1-Test-Tekrar Test Yöntemi: Bir test, aynı gruba, belli bir zaman aralığıyla iki kez uygulanır.
İki uygulamada, elde edilen korelasyon katsayısına kararlılık (devamlılık / istikrarlılık) katsayısı adı verilir
1-Test Yarılama (Eşdeğer Yarılar / İki Yarı Güvenilirliği) Yöntemi: Bir test iki eşdeğer yarıya bölünür ve bireylerin iki yarıdan
aldıkları puanlar arasındaki tutarlılık incelenir. a) ilk yarı ve son yarı b) tek ve çift ve c) rastlantısaldır.
İlk ve son yarı yöntemi her test için uygun değildir. Uygun olmadığı durumlar:
Testteki maddeler basitten zora doğru sıralanmış ise,
Maddeler konu içeriklerine ya da faktörlere göre kümelenerek yerleştirilmiş ise,
Madde sayısı çok fazla ise
2-Kuder-Rıchardson 20 Ve 21 Yöntemleri: Kuder-Richarson 20 ve 21 ya da kısaca KR-20 ve KR-21, testin kendi içinde tutarlı bir
bütün oluşturup oluşturmadığı ile ilgili bilgi verir. Bu yöntemlerden elde edilen katsayıya iç tutarlılık katsayısı adı verilir.
*KR-20 ve KR-21 ile güvenilirlik kestirimi, puanlamanın kategorik olduğu ölçme araçları için uygundur. Puanlamanın kategorik
olması, doğru yanıtlara 1 puan, yanlış ve boş bırakılan maddelere 0 puan vererek puanlamanın yapıldığı ya da maddenin yanıtının iki
seçenekli verildiği durumlardır.
3-Cronbach Alfa Yöntemi: Eğer ölçme aracının puanlaması çok kategorili ise KR- 20 ile aynı mantık üzerine kurulu Cronbach alfa
hesaplanır. Elde edilen katsayının ismi yine iç tutarlılık katsayısıdır.
*Derecelendirme ölçekleri puanlamanın çok kategorili olduğu araçlara örnek verilebilir.
NOT: Güvenilirliği artıran faktörler geçerliliği de artırır. Ancak geçerlilik yalnızca tesadüfi hatalardan değil, aynı zamanda sabit ve
sistematik hatalardan da etkilenir.
Özet: @muhalif33 Kaynak: MEB 6
2.Modül
3.TEST GELİŞTİRME VE MADDE / SORU TÜRLERİ
DEĞERLENDİRME
PERFORMANS
2-Test Geliştirme: Test geliştirmenin işlem basamakları:
a. Amacın belirlenmesi, e. Denemelik test formunun hazırlanması,
b. Kapsamın belirlenmesi ve belirtke tablosunun f. Testin uygulanması,
oluşturulması, g. Test ve madde istatistiklerinin hesaplanması,
c. Denemelik soruların yazılması, h. Seçilen maddelerden oluşan nihai formun oluşturulması.
d. Soruların gözden geçirilmesi (redaksiyon),
2-PERFORMANS DEĞERLENDİRME:
a)Öğrenci değerlendirmeleri;
1-ÖZ DEĞERLENDİRME:
Öğrencinin bir ürünü ortaya koymada gösterdiği performans vb. kendi kendisini değerlendirmesidir
Öğrencilerin kendi özellikleriyle (yetenek, ilgi, beceri vb.) farkındalığının artmasını, zayıf ve güçlü yönlerini keşfetmesini sağlar.
Öz düzenleme becerisi artar. Ölçütlü düşünme becerisi artar. Öğrenme motivasyonunu artırır.
Ancak Öğrencilerin kendi performanslarını değerlendirirken yanlı davranmaları , deneyimsizlikden yanılgılar söz konusu olabilir.
2-AKRAN DEĞERLENDİRME:
Öğrencinin ortaya koyduğu performansa ilişkin arkadaşlarının değerlendirmesine denir.
Akranların değerlendirme sürecine katılması nedeniyle daha katılımcı, aktif bir eğitim ortamı olur (Sorumluluk duygusu artar.)
Eleştiri kültürü (olumlu-olumsuz) gelişebilir. Öğretmen dışındaki bir kaynaktan dönüt almak öğrencinin performansını artırabilir.
Kişisel ilişkiler olumlu ya da olumsuz yönde değerlendirmeye etki edebilir. Genel izlenimle puan verme söz konusu olabilir.(-)
b)Öğretmen Değerledirmeleri
1-RUBRİK (DERECELİ PUANLAMA ANAHTARI): Performans ürünlerinin değerlendirilmesinde en sık kullanılan araçlardan
biridir. Amaç, öğretmen tarafından ürünün genel izlenimle puanlamasındaki öznelliğini azaltmaktır.
Rubriklerin geliştirilmesi uzmanlık gerektirir. Rubrikler için geçerlilik ve güvenilirlik çalışmaları yapılmalıdır.
Rubrikler performans görevleriyle birlikte öğrenciye verilmelidir.
Bütüncül (Holistik) Rubrik Örneği (Maket Yapımı) Analitik rubrik örneği (Maket yapımı)
Sivri, basık, sola çarpık ve sağa çarpık dağılımlar normalden sapma gösteren dağılımlardır.
Sapma durumları grup sayısının az olması, testin kolay ya da zor olması, grubun ölçülen özellik açısından genel niteliği vb. etkilenir.
Bir test zorlaştıkça dağılımın sağa çarpık, kolaylaştıkça sola çarpık olma olasılığı artar.
Normal dağılım ortalama ve standart sapma gibi basit iki istatistikle özetlenebilir.
Normal dağılım ortalama etrafında üç standart sapma sağa ve sola, toplamda altı
alanda özetlenebilir (%99,74’lük kısmı). Dolayısıyla bir kişinin ortalamadan kaç
standart sapma uzaklaştığı, grup içerisindeki yerini gösterir.
Madde İstatistikleri: Ölçme işlemi sonucunda bireylerin madde puanları üzerinden hesaplanan istatistiklerdir.
Eğitimde en sık kullanılan istatistikler madde güçlük indeksi, madde ayırt edicilik indeksi, madde güvenilirliği vb.dir.
Madde güçlük indeksi; maddenin kabaca zor mu, orta mı, kolay mı olduğunu gösterir.
Madde güçlük indeksi 1’e yaklaştıkça maddenin kolaylaştığı, 0’a yaklaştıkça zorlaştığı
anlaşılır. 0.50 civarı ise ortalama güçlükte. Her ne kadar ayrı bir formülü olsa da madde
güçlükleri toplamının madde sayısına bölümü testin ortalama güçlüğünü ortaya koyar.
Ayırt ediciliği ve güvenilirlik katsayısı yüksek bir ölçme işleminde orta güçlükte bir test hazırla (Ortalama güçlükte soru fazla olur)
Madde ayırt edicilik indeksi; maddenin bilenle bilmeyeni ayırt edip edemediğine ilişkin bir istatistiktir.
-1 ile 1 arasında değer alır ve genellikle alanyazında 0.30 ile 1 arası ayırt edici olarak nitelendirilir.
Her bir alan sosyal beceri olarak tanımlanan özelliklerdir. Birleşik beceriler diye tanımlanan ve bu beşliye dâhil olmayan ama
onunla ilişkili olup sosyal beceriler açısından önemli görülen iki ayrı beceri ise başarma motivasyonu ve öz yeterlik algısıdır.
Bu çalışmayı özel kılan aynı sorular üzerinden hem öğrencilerden hem öğretmenlerinden hem de velilerinden bilgi toplanmasıdır
ki bu tüm girdilerin/verilerin birleştirilerek sonuçların daha güvenilir hâle getirilmesine katkı sağlamaktadır. (Veri çeşitlemesi)
Veri çeşitlemesi kullanılmasının sebebi utangaçlık ya da kendine güven gibi duyuşsal becerilere ilişkin soruları, öğrencilerin
oldukları gibi değil olmak istedikleri veya görünmek istedikleri şekilde cevaplandırma eğilimlerinin önüne geçebilmek; daha
gerçekçi sonuçlara ulaşabilmektir.
Bu çalışmaya katılan ülkeler ve şehirler şu şekildedir: Kanada (Ottawa), ABD (Houston), Kolombiya (Manizales ve Bogota),
Portekiz (Sintra), Finlandiya (Helsinki), Türkiye (İstanbul), Rusya Federasyonu (Moskova), Güney Kore (Daegu) ve Çin Halk
Cumhuriyeti (Suzhou).
Sonuç olarak farklı ülkelerin katılımıyla ortaya çıkan kültürel çeşitlilik son derece önemlidir çünkü kültürel özelliklerle beş
faktörlü modelde bahsi geçen sosyal ve duygusal özelliklerin yakından ilişkili olduğu bilinmektedir.
Türkiye, 10 yaş grubundan yaklaşık 2.700 ve 15 yaşda ise yaklaşık 3.200 öğrenci ile katılmıştır. Paylaşılan temel bulgular tüm
katılımcılardan elde edilen genel bulgular olmakla birlikte Türkiye’nin bulguları genel bulgularla benzerlik göstermektedir.
Enteresan sonuçlarından biri 10 yaş grubunun sosyal ve duygusal beceri puanlarının 15 yaşdan daha yüksek olmasıdır. 15 yaş
grubunda ergenliğin etkilerinin yoğun görüldüğü düşünüldüğünde 10 yaştan 15 yaşa geçerken önemli bir düşüş olduğu aşikârdır.
Strese dayanıklılık, duygu kontrolü ve enerji gibi bazı özelliklerde erkek öğrencilerin puanları yüksekken, sorumluluk, empati,
birlikte çalışma, hoşgörü ve merak gibi becerilerde kız öğrencilerin puanları daha yüksektir.
Özetle ,sosyal ve duygusal beceriler anlamında kız ve erkek öğrencilerin farklılıkları olduğu(cinsiyetler farkların dikkate alınmalı)
Sosyoekonomik düzey, ailenin sahip olduğu eğitim düzeyi ve gelirden öğrencinin evde sahip olduğu eğitim imkânlarına, okuma
imkânlarına hatta fiziksel imkânlara (keni odası olup olmaması, internet bağlantısına sahip olup olmaması) kadar her türlü eğitim
ve imkâna dayalı fırsatı kendi içinde barındıran yapı olarak tanımlanmaktadır. Sosyoekonomik açıdan avantajlı öğrencilerin daha
yüksek sosyal ve duygusal beceri puanlarına sahip olduğu gözlenmiştir. Özellikle yaratıcılık, empati, öz yeterlik gibi becerilerde
puanları daha yüksektir.
Merak ve Sebat(çalışma sabrı) 10 yaş grubunda akademik başarıyla doğrudan ilişkili görünmektedir. 15 yaş grubunda ek olarak
kendini güvende hissetme, sorumluluk bilincine sahip olma ve yaratıcılık özelliği de farklı başarı göstergeleri ile ilişkilidir.
**Müfredat dışı sanat ve spor etkinliklerinin desteklenmesi akademik başarıyı da yükseltme potansiyeline sahiptir.
Öğrencilerden gerçekçi beklenti arttıkça, akademik performansları ve kendi öz yeterlik algılarının arttığı bilinmektedir.
Veli ve öğretmen beklentileri arttıkça öğrencinin psikolojik iyilik hâli ve sınav kaygısı da artmakta ancak bir taraftan da psikolojik
kaygıları ve yaşam doyumları kısmen artmaktadır.
Rekabetçi okul iklimi destekleyen politikalar, öğrencilerin özellikle psikolojik iyilik hâlinde önemli eksikler oluşturuyor.
Tüm katılımcı şehirlerde 10 yaştan 15 yaşa doğru öğrencilerin yaşam doyumu azalmaktadır.(Olumlu okul iklimi önemli)
Öğretmen ve öğrenci ilişkisi arttıkça(etkileşim) zorbalığa maruz kalma durumu azalmakta ve okula aidiyet artmaktadır.
**Ulusal izleme çalışmaları kapsamında Akademik Becerilerin İzlenmesi ve Değerlendirilmesi (ABİDE) araştırması, üst düzey
bilişsel becerilere ne kadar sahip olduklarını incelenmekte; Türkçe-Matematik-Fen Öğrenci Başarı İzleme Araştırması (TMF-ÖBA)
ise öğrencilerimizin eğitim programına bağlı kazanımlara ulaşma düzeylerini belirlemek üzere yapılmaktadır.
**Son olarak 2019 yılında ilk defa tamamen bilgisayar ortamında gerçekleştirilen okuma, dinleme, yazma ve konuşma olmak üzere
dört temel becerinin hepsini kapsayan Türkçe dil becerilerinin izlenmesi araştırması yapılmış ve yaygınlaştırılmaktadır.