You are on page 1of 47

PENILAIAN DAN KELAS BELAJAR

Oleh Black, Paul, Wiliam, Dylan, Penilaian Pendidikan: Prinsip, Kebijakan & Praktek
Mar1998, Vol. 5, Edisi 1

ABSTRAK
Artikel ini adalah review literatur tentang kelas penilaian formatif. Beberapa studi menunjukkan
bukti kuat bahwa inovasi yang dirancang untuk memperkuat umpan balik sering bahwa siswa
menerima sekitar hasil belajar keuntungan belajar substansial mereka. Persepsi siswa dan
peran mereka dalam penilaian diri dianggap bersama analisis 'strategi yang digunakan oleh
guru dan strategi formatif tergabung dalam pendekatan sistemik seperti penguasaan
pembelajaran. Ada berikut analisis yang lebih rinci dan teoritis dari sifat umpan balik, yang
menyediakan dasar untuk diskusi tentang pengembangan model teoritis untuk penilaian
formatif dan prospek untuk perbaikan praktek.
Pengantar
Salah satu fitur yang luar biasa dari studi penilaian dalam beberapa tahun terakhir telah
menjadi pergeseran fokus perhatian, terhadap kepentingan yang lebih besar dalam interaksi
antara penilaian dan pembelajaran di kelas dan jauh dari konsentrasi pada sifat dari bentuk
dibatasi uji yang hanya lemah terkait dengan pengalaman belajar dari "siswa. Pergeseran ini
telah ditambah dengan berbagai ekspresi harapan bahwa perbaikan dalam penilaian kelas
akan membuat kontribusi yang kuat untuk perbaikan pembelajaran. Jadi salah satu tujuan
utama dari kajian ini adalah untuk survei bukti yang mungkin menunjukkan apakah atau tidak
harapan tersebut dibenarkan. Tujuan kedua adalah untuk melihat apakah isu-isu teoritis dan
praktis terkait dengan penilaian untuk pembelajaran dapat diterangi oleh sintesis wawasan
yang timbul antara studi beragam yang telah dilaporkan.
Tujuan dari Pendahuluan ini adalah untuk memperjelas beberapa terminologi kunci yang kita
gunakan, membahas beberapa ulasan sebelumnya yang menentukan dasar dari yang
penelitian kami berangkat, membahas beberapa aspek dari metode yang digunakan dalam
pekerjaan kami, dan akhirnya untuk memperkenalkan struktur dan pemikiran untuk bagian
berikutnya.
Fokus utama kami adalah bukti tentang penilaian formatif oleh guru di sekolah atau perguruan
tinggi kelas mereka. Seperti yang akan dijelaskan di bawah, batas untuk laporan penelitian
dan ulasan yang telah disertakan telah longgar daripada ditarik erat. Alasan utama untuk ini
adalah bahwa penilaian formatif istilah tidak memiliki arti ketat didefinisikan dan diterima
secara luas. Dalam ulasan ini, itu harus diartikan sebagai meliputi semua kegiatan yang
dilakukan oleh guru, dan / atau oleh siswa mereka, yang memberikan informasi yang akan
digunakan sebagai umpan balik untuk memodifikasi kegiatan belajar mengajar di mana
mereka terlibat.
Dua artikel review substansial, satu per Natriello (1987) dan yang lainnya oleh Crooks (1988)
di bidang ini sama berfungsi sebagai acuan dasar untuk ulasan ini. Oleh karena itu, dengan
beberapa pengecualian, semua artikel dibahas di sini diterbitkan selama atau setelah 1988.
pencarian literatur dilakukan dengan beberapa cara. Salah satunya adalah melalui pencarian
kutipan dari artikel oleh Natriello dan Crooks, diikuti oleh pencarian serupa di kemudian dan
relevan ulasan isu komponen yang diterbitkan oleh salah satu dari kami (Black, 1993b), dan
oleh Bangert-tenggelam dan Kuliks (Kulik et al ., 1990; Bangert-tenggelam et al, 1991a, b)..
Pendekatan kedua adalah untuk mencari dengan kunci-kata dalam ERIC data dasar; ini
adalah pendekatan yang tidak efisien karena kurangnya istilah yang digunakan dengan cara
yang seragam yang mendefinisikan bidang kita menarik. Pendekatan ketiga adalah bola salju
'pendekatan `menindaklanjuti daftar referensi dari artikel ditemukan. Akhirnya, untuk 76 jurnal
yang paling mungkin, isi semua masalah yang dipindai, dari tahun 1988 sampai sekarang di

beberapa kasus, dari tahun 1992 untuk orang lain karena pekerjaan sudah dilakukan untuk
1993 review oleh Black (lihat Lampiran untuk daftar jurnal scan).
Ulasan Natriello ditutupi bidang yang lebih luas daripada kita sendiri. Makalah ini membentang
berbagai tujuan penilaian, yang ia dikategorikan sebagai sertifikasi, seleksi, arah dan motivasi.
Hanya dua terakhir ini dibahas di sini. Penjahat menggunakan istilah `evaluasi kelas 'dengan
arti yang sama seperti yang kita usulkan untuk` penilaian formatif'. Kedua artikel memberi
daftar referensi yang berisi 91 dan 241 item masing-masing, tetapi hanya 9 item muncul dalam
kedua daftar. Hal ini menggambarkan kesulitan kembar dan terkait mendefinisikan lapangan
dan mencari literatur.
Masalah menyusun kerangka kerja untuk tinjauan juga diilustrasikan oleh perbedaan antara
Natriello dan artikel Crooks. Natriello ulasan isu dalam kerangka yang disediakan oleh model
siklus penilaian, yang dimulai dari tujuan, kemudian bergerak ke pengaturan tugas, kriteria dan
standar, kemudian melalui penilaian kinerja dan memberikan umpan balik dan hasil. Dia
kemudian membahas penelitian tentang dampak dari proses evaluasi ini pada siswa. Mungkin
titik paling signifikan, bagaimanapun, adalah bahwa dalam pandangannya, sebagian besar
penelitian menjadi efek dari proses evaluasi tidak relevan karena perbedaan kunci
digabungkan (misalnya dengan tidak mengendalikan kualitas serta kuantitas umpan balik) .
Dia menyimpulkan dengan menyarankan bagaimana kelemahan dalam penelitian yang adadasar mungkin dibahas dalam penelitian masa depan.
Kertas penjahat 'memiliki fokus sempit - dampak praktek evaluasi siswa-dan membagi bidang
menjadi tiga bidang utama - dampak praktek pengujian kelas normal, dampak dari berbagai
praktek pembelajaran lain yang menanggung evaluasi, dan akhirnya aspek motivasi yang
berhubungan dengan evaluasi kelas. Dia menyimpulkan bahwa fungsi sumatif evaluasi gradasi - telah terlalu dominan dan lebih menekankan harus diberikan kepada potensi
penilaian kelas untuk membantu belajar. Umpan balik kepada siswa harus fokus pada tugas,
harus diberikan secara teratur dan sementara masih relevan, dan harus spesifik untuk tugas
itu. Namun, dalam Crooks 'melihat' yang paling penting dari semua pesan yang muncul dari
ulasan ini '(hal. 470) adalah bahwa penilaian harus menekankan keterampilan, pengetahuan
dan sikap dianggap paling penting, namun sulit masalah teknis yang ini mungkin
menyebabkan.
Seperti review Natriello ini, penelitian yang dikutip oleh Crooks mencakup berbagai gaya dan
konteks, dari studi-kurikulum terkait yang melibatkan kerja di kelas normal dengan guru siswa
sendiri, untuk eksperimen dalam pengaturan laboratorium oleh para peneliti. Relevansi
pekerjaan yang tidak dilakukan di dalam kelas normal dengan guru bisa disebut dalam
pertanyaan (Lundeberg & Fox, 1991), tetapi jika semua pekerjaan tersebut dikeluarkan, tidak
hanya akan lapangan akan lebih jarang penduduknya, tetapi juga akan menghadap banyak
petunjuk penting dan petunjuk menuju tujuan yang sulit mencapai pemahaman memadai
kompleks dan lengkap penilaian formatif. Dengan demikian ulasan ini, seperti itu dari Natriello
dan lebih terutama yang dari Crooks, eklektik. Karena itu, keputusan tentang apa yang harus
disertakan telah agak sewenang-wenang, sehingga kita sekarang memiliki beberapa
pemahaman simpatik kurangnya tumpang tindih antara sumber literatur yang digunakan
dalam dua ulasan sebelumnya.
Proses yang dijelaskan di atas menghasilkan total 681 publikasi yang muncul terkait, pada
pandangan pertama, untuk review. Rincian bibliografi bagi mereka yang diidentifikasi dengan
cara elektronik yang diimpor (dalam banyak kasus, termasuk abstrak) ke dalam database
bibliografi, dan lain-lain dimasukkan secara manual. Review awal, dalam beberapa kasus
berdasarkan pada abstrak saja, dan dalam beberapa kasus yang melibatkan membaca
publikasi penuh, mengidentifikasi jumlah awal sekitar 250 publikasi ini sebagai cukup penting
untuk meminta membaca secara penuh. Setiap publikasi ini kemudian dikodekan dengan label
yang berkaitan dengan fokus - total 47 label yang berbeda yang digunakan, dengan rata-rata

2,4 label per referensi. Untuk setiap publikasi berlabel, abstrak yang ada ditinjau dan, dalam
beberapa kasus dimodifikasi untuk menyoroti aspek publikasi yang relevan untuk review ini,
dan abstrak ditulis di mana tidak ada dalam database. Berdasarkan pembacaan awal makalah
yang relevan, struktur tujuh bagian utama diadopsi.
Penulisan untuk setiap bagian dilakukan dengan terlebih dahulu mengalokasikan masingmasing label untuk bagian. Semua kecuali satu dari label dialokasikan ke bagian yang unik
(satu dialokasikan untuk dua bagian). Abstrak publikasi yang relevan dengan setiap bagian
kemudian dicetak bersama-sama dan setiap bagian dialokasikan ke salah satu penulis
sehingga draft awal bisa disiapkan, yang kemudian direvisi bersama-sama. Tujuh bagian yang
muncul dari proses ini dapat dijelaskan secara singkat sebagai berikut.
Pendekatan pada bagian Contoh bukti yang pragmatis, dalam akun diberikan pertama dari
berbagai potongan yang dipilih penelitian tentang efektivitas penilaian formatif, dan kemudian
ini dibahas dalam rangka untuk mengidentifikasi satu set pertimbangan yang harus ditanggung
diingat dalam berhasil - lebih analitik - bagian. Bagian berikutnya Pengkajian oleh guru
menambah latar belakang empiris dengan menghadirkan penjelasan singkat bukti tentang
keadaan saat praktek penilaian formatif antara guru.
Ada mengikuti akun lebih terstruktur lapangan. Dua bagian berikutnya menangani masingmasing dengan perspektif siswa dan peran guru. Sementara pada bagian Strategi dan taktik
untuk guru berfokus pada taktik dan strategi pada umumnya, bagian berikutnya pada Sistem
berikut dengan membahas beberapa sistem spesifik dan komprehensif untuk pengajaran di
mana penilaian formatif memainkan peranan penting. Bagian pada Feedback lebih reflektif
dan teoritis, menyajikan akun, didasarkan pada bukti, dari sifat umpan balik, konsep yang
merupakan pusat untuk penilaian formatif. Ini mempersiapkan tanah untuk bagian akhir, pada
Prospek untuk teori dan praktek penilaian formatif, di mana kita mencoba melakukan sintesis
beberapa isu utama dalam konteks upaya untuk meninjau landasan teori, prospek penelitian
dan kebutuhan, dan implikasi untuk praktek dan kebijakan dari studi penilaian formatif.
Contoh di Bukti
Kelas Pengalaman
Pada bagian ini kami menyajikan akun singkat potongan penelitian yang, antara dan di antara
mereka, menggambarkan beberapa isu utama yang terlibat dalam penelitian yang bertujuan
untuk mengamankan bukti tentang efek penilaian formatif.
Yang pertama adalah proyek di mana 25 guru Portugis matematika dilatih dalam metode
penilaian diri pada kursus paruh waktu 20 minggu, metode yang mereka dimasukkan ke dalam
praktek karena kursus berkembang dengan 246 siswa dari usia 8 dan 9 dan dengan 108 siswa
yang lebih tua dengan usia antara 10 dan 14 (Fontana & Fernandes, 1994). Para siswa dari
lebih 20 guru Portugis yang mengambil kursus lain di bidang pendidikan pada saat itu
menjabat sebagai kelompok kontrol. Kedua kelompok eksperimen dan kontrol diberi tes
sebelum dan sesudah prestasi matematika, dan kedua menghabiskan waktu yang sama di
kelas matematika. Kedua kelompok menunjukkan hasil yang signifikan selama periode
tersebut, namun kelompok eksperimen yang mendapatkan rata-rata adalah sekitar dua kali
lipat dari kelompok kontrol untuk siswa 8 dan 9 tahun - perbedaan jelas signifikan. Efek yang
sama diperoleh bagi siswa yang lebih tua, tetapi dengan hasil yang kurang jelas statistik
karena pre-test, karena terlalu mudah, tidak bisa mengidentifikasi perbedaan awal mungkin
antara kedua kelompok. Fokus dari pekerjaan penilaian pada teratur - terutama setiap hari self-assessment oleh siswa. Ini melibatkan mengajar mereka untuk memahami baik tujuan
pembelajaran dan kriteria penilaian, memberi mereka kesempatan untuk memilih belajar tugas
dan menggunakan tugas yang memberi mereka ruang lingkup untuk menilai hasil belajar
mereka sendiri.

Penelitian ini memiliki validitas ekologi, dan memberi ketat dibangun bukti keuntungan belajar.
Para penulis menunjukkan bahwa banyak pekerjaan yang diperlukan untuk mencari hasil
jangka panjang dan untuk mengeksplorasi efektivitas relatif antara beberapa teknik yang
digunakan dalam konser. Namun, pekerjaan ini juga menggambarkan bahwa inisiatif dapat
melibatkan jauh lebih dari hanya menambahkan beberapa latihan penilaian untuk mengajar
yang ada - dalam hal ini dua elemen yang beredar adalah fokus pada penilaian diri dan
pelaksanaan penilaian ini dalam konteks konstruktivis sebuah kelas. Di satu sisi dapat
dikatakan bahwa satu atau lain dari fitur ini, atau kombinasi dari keduanya, bertanggung jawab
untuk keuntungan, di sisi lain dapat dikatakan bahwa tidak mungkin untuk memperkenalkan
penilaian formatif tanpa beberapa perubahan radikal dalam pedagogi kelas karena, dari
sifatnya, merupakan komponen penting dari proses pedagogik.
Contoh kedua dilaporkan oleh Whiting et al. (1995), penulis pertama menjadi guru dan copenulis universitas dan distrik sekolah staf. Account adalah review dari pengalaman dan
catatan guru, dengan sekitar 7000 siswa selama periode setara dengan 18 tahun,
menggunakan penguasaan pembelajaran dengan kelas nya. Ini pengujian terlibat reguler dan
umpan balik kepada siswa, dengan syarat bahwa mereka baik mencapai skor tes yang tinggi
- setidaknya 90% - sebelum mereka diizinkan untuk melanjutkan ke tugas berikutnya, atau,
jika skor lebih rendah, mereka mempelajari topik lebih lanjut sampai mereka bisa memenuhi
kriteria penguasaan. Skor tes akhir Whiting dan titik rata-rata kelas dari murid-muridnya secara
konsisten tinggi, dan lebih tinggi daripada siswa di kursus yang sama tidak diajarkan oleh dia.
`Gaya belajar siswa Me 'yang berubah sebagai hasil dari metode pengajaran, sehingga waktu
yang dibutuhkan untuk unit berturut menurun dan angka harus merebut kembali tes menurun.
Selain itu, tes sikap mereka terhadap sekolah dan terhadap pembelajaran menunjukkan
perubahan positif.
Seperti penelitian sebelumnya, pekerjaan ini memiliki validitas ekologi - itu adalah laporan
pekerjaan di kelas nyata tentang apa yang telah menjadi metode yang biasa digunakan oleh
guru selama bertahun-tahun. Keuntungan dilaporkan adalah substansial; meskipun
perbandingan dengan kontrol tidak didokumentasikan secara rinci, dilaporkan bahwa guru
mengalami kesulitan menjelaskan tingkat keberhasilan yang tinggi kepada rekan-rekan. Hal
ini mengakui bahwa keberhasilan bisa disebabkan keunggulan pribadi guru, meskipun ia
percaya bahwa pendekatan ini telah membuatnya menjadi guru yang lebih baik. Secara
khusus ia telah datang untuk percaya bahwa semua murid bisa berhasil, keyakinan yang ia
anggap sebagai bagian penting dari pendekatan. `Me Hasil menunjukkan dua ciri-ciri dan
terkait - yang pertama adalah bahwa perubahan mengajar melibatkan rezim yang sama sekali
baru belajar bagi siswa, bukan hanya penambahan beberapa tes, makhluk kedua yang justru
karena ini, itu tidak mudah mengatakan sampai sejauh mana efektivitas tergantung khusus
pada kualitas dan komunikasi umpan balik penilaian. Ini berbeda dari contoh pertama dalam
timbul dari gerakan tertentu yang bertujuan perubahan radikal dalam penyediaan
pembelajaran, dan dalam hal itu didasarkan pada asumsi yang berbeda tentang sifat
pembelajaran.
Contoh ketiga juga memiliki asal-usulnya dalam gagasan penguasaan pembelajaran, tetapi
berangkat dari ortodoksi di bahwa penulis dimulai dari keyakinan bahwa itu adalah pengujian
sering yang penyebab utama prestasi belajar yang dilaporkan untuk pendekatan ini. Proyek
ini adalah percobaan dalam matematika mengajar (Martinez & Martinez, 1992), di mana 120
mahasiswa Amerika di kursus aljabar pengantar ditempatkan di salah satu dari empat
kelompok di 2 X 2 desain eksperimen untuk kursus 18 minggu yang meliputi tujuh bab dari
teks. Dua kelompok diberi satu tes per bab, dua lainnya diberi tiga tes per bab. Dua kelompok
diajarkan oleh sangat berpengalaman dan sangat dinilai guru, dua lainnya oleh seorang guru
yang relatif tidak berpengalaman dengan penilaian rata-rata. Hasil post-test menunjukkan
keuntungan yang signifikan bagi mereka lebih sering diuji, tetapi keuntungan itu jauh lebih kecil
untuk guru berpengalaman daripada pendatang baru. Perbandingan skor akhir dengan
kelompok yang lebih besar dari siswa dalam kursus yang sama tetapi tidak dalam percobaan

tetapi sifat dari dua rezim yang dibandingkan sangat berbeda. angka yang sesuai untuk kelompok eksperimen yang saya di 17 gersang 1 di 71. Para guru dari kelompok eksperimen dilatih untuk melaksanakan pengukuran dan perencanaan sistem yang diperlukan masukan penilaian awal untuk menginformasikan mengajar di tingkat murid individu. Contoh ini menggambarkan lagi embedding rutin penilaian formatif ketat dalam suatu program inovatif. Tes kriteria yang digunakan. Mereka diberi tugas tertulis yang harus ditangani secara individual di bawah pengawasan. yang tradisional pilihan ganda. Para siswa diberi dua jenis tugas berpasangan. dan penilaian diagnostik yang dirancang untuk membantu menemukan setiap anak pada suatu titik pada skala ini. setengah lainnya berada di kuartil bawah. Tiga sesi diadakan. Analisis data menggunakan model persamaan struktural menunjukkan bahwa langkah-langkah pre-test adalah penentu kuat dari semua hasil.. Misalnya nomor empat dilakukan dengan anak-anak 5 tahun yang diajarkan di TK (Bergan et al. rata-rata 1 anak di 3. 1988). Dengan perbandingan dengan studi pertama di atas. dan bekerja dengan kegiatan open-gaya yang memungkinkan mereka untuk membedakan tugas dalam setiap kegiatan agar sesuai dengan kebutuhan individu anak. Apa yang lebih penting di sini adalah dasar. satu dari setiap pengujian pasangan berpikir konvergen. konsultasi tentang kemajuan setelah dua minggu. 1991). setengah dari mereka yang dipilih berada di kuartil atas kelas mereka pada tes matematika dan bahasa. Ada kemungkinan bahwa keunggulan guru yang berpengalaman mungkin telah di / nya keahliannya dalam aspek ini. sehingga penulis bisa menyimpulkan bahwa pengujian lebih sering memang efektif.diskusi tentang pertanyaan yang harus fokus pada kualitas interaksi gurusiswa dan apakah hasil tes merupakan umpan balik dalam arti yang mengarah ke tindakan korektif yang diambil untuk menutup kesenjangan dalam kinerja (Ramaprasad. tidak disesuaikan agar cocok dengan gaya yang berpusat pada anak terbuka kerja kelompok eksperimen ini. dari model pengembangan kinerja terkait dengan skema berdasarkan kriteria penilaian diagnostik. tetapi banyak dari "the gain bisa diamankan oleh seorang guru yang luar biasa dengan kurang sering pengujian. dalam program itu. Tes hasil dibandingkan dengan tes awal dari keterampilan yang sama.7 disebut sebagai memiliki kebutuhan belajar khusus dan 1 di 5 ditempatkan di pendidikan khusus. dengan seluruh kursus berlangsung delapan minggu. Para guru digunakan terutama pengamatan keterampilan untuk menilai kemajuan. Percobaan ini melibatkan 48 siswa Israel 11 tahun dipilih dari 12 kelas di 4 sekolah. karya itu didasarkan lebih sempit dalam teori psikologi eksplisit. tetapi kelompok eksperimen mencapai skor signifikan lebih tinggi pada tes membaca. Salah satu fitur keberhasilan percobaan ini adalah bahwa guru telah ditingkatkan keyakinan dalam kekuatan mereka untuk membuat keputusan rujukan bijak. matematika dan ilmu pengetahuan dibandingkan kelompok kontrol. penilaian baru untuk memberikan review diagnostik lebih lanjut dan keputusan baru tentang siswa 'perlu setelah empat minggu. 1983). Memang. dari kelompok kontrol.menunjukkan bahwa guru yang berpengalaman memang luar biasa. sehingga membuat pengujian lebih efektif formatif di kedua frekuensi. Para peneliti menyimpulkan bahwa kapasitas anak-anak di bawah-dikembangkan dalam mengajar konvensional sehingga banyak yang `meletakkan 'tidak perlu dan memiliki masa depan mereka berprasangka. yang satu ini memiliki ukuran statistik yang sama dan analisis. divergen yang lain. dalam hal ini tentang hubungan antara motivasi intrinsik dan jenis evaluasi bahwa siswa telah diajarkan untuk diharapkan. Selanjutnya. Ada penekanan dalam pelatihan mereka pada model kriteria-referenced dari pengembangan pemahaman disusun atas dasar hasil karya sebelumnya. tidak kurikulum terkait. dengan pengenalan dan penjelasan lisan. dengan pasangan yang sama dari tugas yang digunakan dalam . salah satu bisa mempertanyakan apakah pengujian sering benar-benar merupakan penilaian formatif . Melibatkan 838 anak-anak diambil terutama dari latar belakang rumah yang kurang beruntung di enam wilayah yang berbeda di Amerika Serikat. Dalam contoh nomor lima (Butler. Motivasi yang mendasari adalah keyakinan bahwa perhatian dekat dengan akuisisi awal keterampilan dasar sangat penting.

untuk kedua jenis tugas. Tes minat murid juga menunjukkan pola yang sama: Namun. efeknya dapat dirusak oleh efek motivasi negatif dari umpan balik normatif. bekerja selama tujuh hari tujuh paket bahan pembelajaran pecahan di bawah instruksi dari mahasiswa pascasarjana. Untuk `komentar hanya 'kelompok skor meningkat sekitar sepertiga antara sesi pertama dan kedua. efektivitas umpan balik formatif akan tergantung pada beberapa fitur rinci dari kualitas. atau tidak. baik pada pekerjaan sesi pertama sebelum kedua. dan pada pekerjaan sesi kedua sebelum ketiga. The `komentar dengan kelas 'kelompok menunjukkan penurunan yang signifikan dalam skor di tiga sesi. Siswa bekerja dalam empat kelompok terpisah dikenakan perlakuan yang berbeda . Ada dua kelompok yang berbeda hanya dalam jenis tujuan yang menekankan-Tujuannya . sepertiga dari kelompok diberi komentar terdiri individual pada pertandingan. dari semua jenis umpan balik. Kelompok kedua hanya diberi nilai. Yang pertama adalah bahwa. sementara percobaan tidak memiliki validitas ekologi karena itu bukan bagian dari atau yang berhubungan dengan pekerjaan kurikulum normal dan tidak dilakukan oleh guru biasa siswa. satu kelompok harus mengevaluasi kemampuan pemecahan masalah mereka pada akhir setiap sesi pertama. Hasil dibahas oleh penulis dalam hal teori evaluasi kognitif.pertama dan ketiga. berasal dari nilai pada pekerjaan sesi sebelumnya itu. dan bukan pada ada atau tidaknya belaka. termasuk semua penerimaan dan refleksi pada umpan balik. terjadi pada hari yang sama. 1996). Skor pada kerja yang dilakukan di masing-masing tiga sesi menjabat sebagai ukuran hasil. Kelompok ketiga diberi baik nilai dan komentar. Untuk setiap set tujuan. Ukuran hasil dari keterampilan. 44 siswa dalam satu USA SD. Sesi kedua dan ketiga. dalam pekerjaan kelas normal. dalam tugas konvergen. dan tetap pada tingkat ini lebih tinggi untuk sesi ketiga. Sebuah fitur yang signifikan di sini adalah bahwa bahkan jika komentar umpan balik secara operasional membantu untuk pekerjaan siswa.untuk dua kelompok instruktur stres tujuan pembelajaran (belajar bagaimana memecahkan masalah) sementara untuk dua lainnya mereka menekankan tujuan kinerja (hanya menyelesaikannya). motivasi dan self-efficacy menunjukkan bahwa kelompok diberikan tujuan kinerja tanpa evaluasi diri keluar lebih rendah dari tiga lainnya pada semua tindakan. tapi hanya pada satu kesempatan mendekati akhir daripada setelah semua enam sesi pertama. sedangkan yang lain diminta bukan untuk menyelesaikan kuesioner sikap tentang pekerjaan. khususnya pada tugas-tugas yang berbeda. sampai-sampai bahkan memberi pujian dapat memiliki efek negatif dengan berprestasi rendah. Pelajaran kedua adalah kemungkinan bahwa. sedangkan berprestasi tinggi di semua tiga kelompok umpan balik mempertahankan tingkat bunga yang tinggi. Untuk umpan balik. Setiap siswa menerima satu dari tiga jenis umpan balik yang ditulis dengan pekerjaan kembali. Interpretasi hasil ini menyarankan bahwa efek dari evaluasi diri sering telah keluar-beratnya efek diferensial dari dua jenis tujuan. Mereka juga mendukung pandangan bahwa pra-pendudukan dengan kelas pencapaian dapat menurunkan kualitas kinerja tugas. Contoh keenam adalah dalam beberapa cara yang mirip dengan kelima. Dalam karya ini (Schunk. Hasil ini konsisten dengan literatur yang menunjukkan bahwa evaluasi tugas-melibatkan lebih efektif daripada evaluasi ego-melibatkan. Penelitian ini membawa dua pesan penting untuk tinjauan umum ini. ke-9 atau 10 tahun. yang tidak kemudian dipertahankan. dari pekerjaan mereka dengan kriteria yang telah menjelaskan kepada semua terlebih dahulu. sementara` kelas hanya' kelompok menurun pada kedua tugas antara sesi pertama dan terakhir. Hal ini dikonfirmasi dalam studi kedua di mana semua siswa melakukan evaluasi diri. hal itu tetap mungkin menggambarkan beberapa pelajaran penting tentang cara di mana umpan balik evaluasi formatif mungkin dibuat lebih atau kurang efektif dalam bekerja kelas normal. Sebuah pesan ketiga adalah bahwa perhatian harus diberikan kepada efek diferensial antara rendah dan tinggi berprestasi. satu-satunya perbedaan yang signifikan antara tinggi dan kelompok mencapai rendah adalah bahwa bunga dirusak untuk berprestasi rendah dengan salah satu rezim yang melibatkan umpan balik dari nilai. yaitu dengan memberikan nilai. terutama pada tugas konvergen. tetapi menunjukkan keuntungan pada sesi kedua .

Karya eksperimental ini disusun sekitar penggunaan siswa alat penyelidikan sistematis dan beralasan. dan konteks sosial menulis dan mode komunikasi lainnya. juga ditemukan dua hasil lainnya. sedang atau tinggi pada awal tes keterampilan dasar. Namun. kelompok eksperimen menunjukkan kenaikan yang signifikan secara keseluruhan. mereka yang menunjukkan pemahaman terbaik dari proses penilaian mencapai nilai tertinggi. Dua fitur khas lain dari penelitian ini adalah pertama. Sementara perbedaan eksperimen-kontrol di sini berbaring hanya dalam pengembangan `penilaian reflektif 'di antara siswa. tetapi menunjukkan bahwa fitur ini berinteraksi dengan umpan balik evaluatif. dalam hal ini adalah metaanalisis dari 21 studi yang berbeda. Kursus mengajar difokuskan pada pendekatan inquiry praktis untuk belajar tentang gaya dan gerak. Contoh ketujuh yang terlibat bekerja untuk mengembangkan kurikulum berbasis sains sekolah menengah berbasis inquiry (Frederiksen & White. satu skor pada dua proyek dipilih yang setiap siswa dilakukan secara mandiri. Ukuran hasil yang dari tiga jenis: satu nilai rata-rata pada proyek-proyek di seluruh kursus. yang di antara mereka menghasilkan 96 efek ukuran yang berbeda (Fuchs & Fuchs. Ini saham dengan sebelumnya (kelima) mempelajari fokus pada orientasi tujuan. tetapi semua langsung mencerminkan tujuan pengajaran. dan pekerjaan yang terlibat 12 kelas dari 30 siswa setiap di dua sekolah. dan yang kedua keuntungan diferensial antara siswa yang akan diberi label `kemampuan rendah 'dan` kemampuan tinggi' masing-masing. kelompok skor rendah menunjukkan superioritas suatu. dan apakah atau tidak umpan balik ini berasal dari sumber eksternal atau dari evaluasi diri . menggunakan model siklus penyelidikan yang dibuat eksplisit kepada siswa. pekerjaan ini tertanam dalam lingkungan di mana penilaian tersebut adalah komponen intrinsik. kelompok menengah hanya lebih dari dua. Seperti yang diharapkan. Sebuah pola yang sama.adalah untuk memungkinkan efek tujuan untuk menunjukkan tanpa efek luar biasa yang mungkin dari evaluasi diri sering. dan kelompok yang tinggi lebih dari satu. ketika siswa dibagi menjadi tiga kelompok sesuai dengan nilai rendah. meskipun frekuensi tinggi dari sesi evaluasi diri akan sangat tidak biasa. Dengan demikian. dan petunjuk yang diberikan di keempat `perlakuan 'yang dari jenis yang mungkin telah diberikan oleh guru yang berbeda. Contoh kedelapan dan terakhir adalah berbeda dari yang lain. dan satu skor pada tes fisika konseptual. Semua pekerjaan dilakukan dalam kelompok sebaya. terstruktur untuk mempromosikan penilaian reflektif. Efek ukuran rata-rata yang diperoleh adalah 0. Pekerjaan dalam penelitian ini kurikulum terkait. baik di dalam dua jenis tugas. anak-anak mulai dari pra-sekolah sampai kelas 1: 2. Pada skor proyek rata-rata. Setiap kelas diajarkan untuk rencana kurikulum hati-hati dibangun di mana urutan isu berdasarkan konseptual telah dieksplorasi melalui eksperimen dan simulasi komputer. Fokus utama adalah pada pekerjaan untuk anak-anak dengan cacat ringan. penggunaan ukuran hasil dari berbagai jenis.70. lebih dari tiga standar deviasi. penelitian ini lebih dekat dengan validitas ekologi tetapi tetap percobaan dibikin luar kondisi kelas normal. 1997). Beberapa studi juga termasuk anak-anak tanpa cacat: ini memberikan efek ukuran rata-rata . Penelitian itu hati-hati dipilih-segala-yang terlibat antara kelompok eksperimen dan kontrol. dengan kedua penilaian sejawat dari presentasi untuk kelas dan penilaian diri. sementara kelompok eksperimen menghabiskan waktu yang sama pada diskusi. Proyek ilmu ini sekali lagi menunjukkan versi penilaian formatif yang merupakan komponen intrinsik dari inovasi yang lebih menyeluruh-akan mengubah pengajaran dan pembelajaran. Setiap kelas dibagi menjadi dua bagian: kelompok kontrol digunakan beberapa periode waktu untuk diskusi umum modul. dan semua kegiatan penilaian yang terlibat dengan frekuensi antara 2 dan 5 kali per minggu. Semua siswa diberi tes kemampuan dasar yang sama sejak awal. orientasi tujuan pembelajaran menyebabkan motivasi dan prestasi yang lebih tinggi daripada hasil tujuan kinerja. superioritas dari kelompok eksperimen yang lebih ditandai untuk siswa skor rendah pada tes keterampilan dasar. atas rekan-rekan kelompok kontrol mereka. 1986). Di antara siswa dalam kelompok eksperimen. dan pada penggunaan umpan balik untuk dan oleh guru.

Yang pertama adalah bahwa penulis membandingkan keberhasilan mencolok dari pendekatan formatif dengan hasil yang tidak memuaskan dari program yang telah berusaha untuk bekerja dari resep priori untuk program pembelajaran individual untuk anak-anak. Lebih umum. mengingat hati-hati ini.70 dibandingkan dengan 0. hati-hati harus dilakukan untuk setiap studi di mana mereka mengajar kelompok eksperimen tidak guru sama dengan yang untuk setiap kelompok kontrol.73 untuk kelompok cacat).26).63 lebih dari 22 set hasil (tidak berbeda secara signifikan dari rata-rata 0. Studi (oleh Whiting et al. itu bisa menjadi fitur yang menonjol dan eksplisit dari suatu inovasi. mereka studi di mana guru melakukan untuk menghasilkan grafik kemajuan anak individu sebagai panduan dan stimulus untuk bertindak melaporkan keuntungan rata-rata yang lebih besar daripada yang mana hal ini tidak dilakukan (berarti efek ukuran 0. kami akan menganggap bahwa. berdasarkan teori-teori belajar tertentu dan diagnostik pra-tes. Fitur ketiga adalah bahwa akumulasi seperti bukti seharusnya memberikan beberapa dorongan umum untuk pengembangan penilaian formatif . dan siswa dengan satu sama lain.42 untuk yang kedua. bagaimanapun. enam dari mereka. Beberapa Masalah Umum Studi yang dipilih sejauh semua didasarkan pada perbandingan kuantitatif keuntungan belajar. Kami tidak menyiratkan bahwa informasi yang berguna dan wawasan tentang topik tidak dapat diperoleh dengan bekerja di paradigma lain. dan orang-orang Ulasan di kedelapan. validitas ekologi studi jelas penting dalam menentukan penerapan hasil kerja kelas normal. dan ini mensyaratkan dalam kualitas interaksi mereka yang berada di jantung pedagogi. Semua pekerjaan tersebut melibatkan beberapa derajat umpan balik antara mereka diajarkan dan guru. Sifat interaksi ini antara guru dan siswa. 1995) yang paling jelas salah satu ajaran normal dalam kelas sehari-hari adalah. tetapi sulit untuk mendapatkan data tentang kualitas ini dari banyak laporan yang diterbitkan. salah satu yang perbandingan kuantitatif dengan kontrol ketat setara itu tidak mungkin.. Dalam kedua kasus itu mungkin sulit untuk memisahkan kontribusi tertentu dari umpan balik formatif untuk setiap keuntungan pembelajaran. mau tidak mau. Demikian pula. Sulit untuk melihat bagaimana setiap inovasi dalam penilaian formatif dapat diperlakukan sebagai perubahan marjinal dalam pekerjaan kelas. Secara khusus. Para penulis mencatat bahwa sekitar setengah dari studi guru bekerja untuk menetapkan aturan tentang ulasan dari data dan tindakan untuk mengikuti. yang ketat dalam menggunakan pra dan pasca . akan menjadi penentu utama untuk hasil perubahan. Contoh yang menunjukkan bagian dari berbagai cara di mana ditingkatkan kerja formatif dapat tertanam dalam mode baru pedagogi.belum makalah ini tampaknya telah diabaikan dalam sebagian besar literatur kemudian. Seperti disebutkan dalam Pendahuluan. Mantan menghasilkan efek ukuran rata-rata 0.seperti penguasaan pembelajaran. Mengingat pemesanan ini. Program-program tersebut diwujudkan pendekatan deduktif kontras dengan pendekatan induktif dari program umpan balik formatif. adalah mungkin untuk meringkas beberapa fitur umum yang menggambarkan contoh-contoh ini dan yang akan berfungsi sebagai kerangka kerja untuk bagian akhir artikel ini. pelajaran berguna yang dapat dipelajari dari penelitian yang terletak di berbagai titik antara `'kelas normal dan kondisi khusus yang dibentuk oleh para peneliti. Fitur kedua adalah bahwa keuntungan pembelajaran utama dari karya formatif hanya dicapai ketika guru dibatasi untuk menggunakan data dengan cara yang sistematis yang baru bagi mereka.tes dan perbandingan eksperimental dengan kelompok kontrol. Dalam hal ini semua studi menunjukkan beberapa derajat gerakan menjauh dari `normal 'kelas. Namun.0. sedangkan di lain tindakan yang tersisa untuk penilaian guru. atau tambahan untuk beberapa gerakan skala yang berbeda dan lebih besar . Tiga fitur dari contoh terakhir ini adalah kepentingan tertentu di sini. Masalah evaluasi lain yang muncul di sini adalah bahwa hampir semua inovasi .92 dibandingkan dengan 0.

akan signifikan. perlu untuk mengubah gigi dan menjauh dari deskripsi holistik contoh dipilih untuk bentuk yang lebih analitik presentasi. fitur yang konsisten di berbagai contoh-contoh ini adalah bahwa mereka semua menunjukkan bahwa perhatian terhadap penilaian formatif dapat menyebabkan keuntungan belajar yang signifikan.terikat untuk mengejar inovasi dalam ujung serta sarana. Ini dapat eksplisit dan mendasar. atau dalam pendekatan diagnostik Bergan dkk. tetapi juga pada konteks yang lebih luas dari asumsi tentang motivasi dan selfpersepsi siswa di mana itu terjadi. Di sini sekali lagi asumsi tentang belajar. Salah satu contoh.4 standar deviasi. Untuk penilaian formatif menjadi informasi umpan balik harus digunakan-yang berarti bahwa aspek penting dari pendekatan apapun akan perawatan diferensial yang tergabung dalam menanggapi umpan balik. 1989). Penilaian oleh Guru Praktek saat ini Praktek guru dalam penilaian formatif ditinjau dalam artikel oleh Crooks (1988) dan Black (1993b). Beberapa fitur umum muncul dari survei ini. studi TK dari Bergan dkk. Realitas yang tajam ini mungkin tidak terlihat sepenting itu benar-benar adalah ketika hasilnya disajikan datar dalam hal ukuran efek (katakanlah) 0. seperti di dasar konstruktivis pertama dan terakhir dari contoh. umpan balik yang diarahkan untuk kebutuhan obyektif mengungkapkan. Mendasari berbagai pendekatan asumsi tentang psikologi belajar. dengan asumsi bahwa setiap siswa dapat dan akan berhasil. Namun. terutama di mana diri dan peer penilaian oleh dan antara mahasiswa adalah fitur penting (dengan beberapa alasan bahwa itu adalah tak terhindarkan Fitur-lihat Sadler. Varietas yang berbeda dan prioritas di seluruh asumsi ini membuat kemungkinan berbagai eksperimen yang melibatkan penilaian formatif. Inovasi ini khususnya telah mengubah peluang kehidupan banyak anak.bahwa beberapa siswa yang tidak mampu yang lain sehingga tidak dapat mengharapkan sukses penuh. Untuk mengumpulkan lebih dari karya yang diterbitkan. memiliki efek yang sangat berbeda dari bahwa umpan balik yang subjektif dalam menyebutkan perbandingan dengan rekan-rekan. Meskipun tidak ada jaminan bahwa ia akan melakukannya terlepas dari konteks dan pendekatan tertentu diadopsi. sehingga permintaan untuk perbandingan kuantitatif ambigu efektivitas pernah bisa sepenuhnya puas.meskipun covert-. disembunyikan karena hanya diambil untuk diberikan di beberapa laporan. (1991) membawa keluar secara dramatis pentingnya yang mungkin melekat pada pencapaian keuntungan tersebut. seperti dalam pendekatan pembelajaran penguasaan. (1991) atau implisit dan pragmatis. Gambaran keseluruhan adalah salah satu praktik yang lemah. Secara khusus. Dalam hal ini. Peran siswa dalam penilaian merupakan aspek penting. kami belum menemukan laporan apapun dari efek negatif berikut pada peningkatan praktek formatif. Ini akan dilakukan dalam lima bagian berikutnya. Efektivitas kerja formatif tidak hanya tergantung pada isi umpan balik dan kesempatan belajar yang terkait. dan tentang struktur dan sifat tugas belajar yang akan memberikan tantangan terbaik untuk meningkatkan pembelajaran. Kelemahan utama adalah: . tapi eksplisit pada orang lain. satu pesan umum dari tinjauan Crooks telah lebih didukung. dengan asumsi .

1989. 1996. Ada sedikit fokus pada hasil seperti spekulasi dan refleksi kritis (Stiggins et al. hal. dan siswa fokus pada mendapatkan melalui tugas dan menolak upaya untuk terlibat dalam kegiatan berisiko kognitif (Duschl & Gitomer. 1992. penilaian yang dalam hal afektif. 1995. Penilaian mereka kemungkinan besar akan didasarkan pada. 1996. Pollard et al. Meskipun guru dapat memprediksi kinerja murid mereka pada tes eksternal . hal. dan ketidakamanan. 1994. penilaian guru berfokus pada tingkat rendah tujuan. Ulasan praktek sekolah dasar di Inggris dan di Yunani telah melaporkan bahwa guru catatan cenderung menekankan kuantitas karya siswa daripada kualitas. dan struktur kelembagaan. Baik dalam mempertanyakan dan ditulis kerja. sehingga mereka de-termotivasi dan kehilangan kepercayaan dalam kapasitas mereka sendiri untuk belajar. yang dikaitkan dengan perasaan yang sangat kuat kewalahan. Ada kecenderungan untuk menggunakan normatif daripada pendekatan kriteria. yang lain menutup dengan Pertanyaan bingung Mengapa tingkat dan sifat dari penilaian formatif dalam ilmu sehingga miskin? ' (Daws & Singh. Sebuah studi yang digunakan wawancara dan menghasilkan gambar yang lebih kaya dari persepsi guru US menyimpulkan sebagai berikut: Sebagian besar guru dalam penelitian ini tertangkap dalam konflik antara sistem kepercayaan. Mereka berbeda dalam strategi penilaian mereka dan dalam bahasa yang mereka digunakan untuk menggambarkan pengembangan literasi siswa.. rasa bersalah.. Russell et al. 1997). Penelitian yang lebih baru telah mengkonfirmasi gambaran umum ini. Kanada. 1987). 1990. Mereka yang bekerja dalam situasi yang sangat mengendalikan yang cenderung menggunakan menyalahkan bahasa dan cenderung untuk memberikan.Praktek evaluasi kelas umum mendorong pembelajaran yang dangkal dan hafalan. 1997). Ada beberapa komentar mencolok oleh mereka yang telah meneliti masalah ini .meskipun tes mencerminkan tingkat rendah bertujuan . sehingga ada sedikit refleksi pada apa yang sedang dinilai. 1993. Semakin sedikit . dan nilai-nilai.satu laporan tentang praktek ilmu melihat formatif dan penilaian diagnostik sebagai `yang serius membutuhkan pembangunan '(. biasanya item pengetahuan yang siswa segera melupakan. Rudman. sementara survei guru di Provinsi Quebec. dengan penekanan pada fungsi sosial dan manajerial (Bennett et al. 99). agenda. 104).. penilaian deskriptif negatif global dalam bahasa impersonal. Guru tampaknya tidak menyadari pekerjaan penilaian rekan dan tidak percaya atau menggunakan hasil penilaian mereka (Cizek et al. hal. Fungsi grading terlalu ditekankan dan fungsi pembelajaran di bawah-ditekankan..... 1992.. dan bahwa sementara tugastugas sering dibingkai dalam hal kognitif. Schilling et al. 1991. terutama mengingat. pengertian linear sederhana melek. Bukti adalah bahwa dengan praktek-praktek seperti efek umpan balik adalah untuk mengajarkan murid lemah bahwa mereka tidak memiliki kemampuan. Guru umumnya tidak meninjau pertanyaan penilaian yang mereka gunakan dan tidak mendiskusikannya kritis dengan teman sebaya. 1996). dan kemarahan. berkonsentrasi pada mengingat rincian terisolasi. melaporkan bahwa untuk penilaian formatif `Memang mereka membayar layanan bibir untuk itu tetapi mempertimbangkan bahwa praktek adalah realistis dalam konteks pendidikan hadir '( dikutip Dassa et al. Bol & Strage. 1997). p 489). Guru-guru ini menyatakan kesulitan dalam melacak dan memiliki bahasa untuk berbicara tentang perkembangan melek anak.. Senk et al. Titik gesekan antara konflik ini adalah penilaian. Pijl. 116). 1995. frustrasi.. Kesimpulan dari survei tentang praktek di sekolah dasar Belgia adalah bahwa kriteria yang digunakan oleh guru `hampir tidak valid dengan standar eksternal '(Grisay.penilaian mereka sendiri tidak memberitahu mereka apa yang mereka perlu tahu tentang siswa mereka belajar (Lorsbach et al. 1992. Mavromattis. Mereka juga menggambarkan tekanan dari pengujian akuntabilitas eksternal. Balai et al. yang menekankan persaingan antara murid dan bukan perbaikan pribadi masing-masing.

Efek yang sama ditemui di reformasi penilaian di Queensland (Butler & Beasley.. Scott. seperti yang terjadi di sekolah-sekolah. menyaksikan bukti di Inggris bahwa ketika guru diminta untuk melakukan penilaian mereka sendiri. 1991. seperti yang terjadi di bagian atas pengalaman Kelas. 1995) dan. Di mana perubahan telah diperkenalkan dengan pelatihan substansial atau sebagai bagian intrinsik dari sebuah proyek di mana guru telah terlibat erat. p. bahwa guru menggunakan tes eksternal ketika mereka berpikir murid mereka siap. Penilaian. Beberapa laporan yang dikutip di atas memberikan bukti ini.. 1987). 1996). Harlen & Malcolm.. 1992. jauh dari masalah hanya teknis. menemukan bahwa meskipun pelatihan. Memang. banyak guru menempel agenda mereka sendiri dan gagal untuk menanggapi isyarat atau petunjuk dari siswa yang bisa kembali berorientasi bahwa agenda (Radnor. Shepard. Implementasi tambal sulam dilaporkan untuk reformasi penilaian guru di Perancis (Broadfoot et al. tidak mengherankan bahwa ketika kebijakan penilaian nasional atau lokal berubah.. Studi ini menunjukkan bahwa penilaian. Dalam sebuah proyek yang bertujuan untuk meningkatkan kekuatan guru sains untuk mengamati siswa mereka di tempat kerja. Isu yang muncul di sini. 1990). 1995) . Efek sini berjalan dalam.. 1994). Sebuah proyek dengan guru dalam seni kreatif. Allinder (1995) menemukan bahwa guru dengan keyakinan yang kuat dalam keberhasilan pribadi dan mengajar mereka tinggi membuat lebih baik menggunakan penilaian formatif dari rekan-rekan mereka kurang percaya diri. 1989. 1992). beberapa di antaranya mungkin counter produktif dan bertentangan dengan tujuan menyatakan perubahan yang memicu mereka (McCallum et al. Sebaliknya. Persyaratan di Skotlandia. 1997). 1996). dan mereka yang berpendapat bahwa hal itu dapat dilakukan dan memang harus dilakukan untuk menghindari dominasi pengujian sumatif eksternal (Hitam. guru tidak bisa menemukan waktu untuk mengamati karena mereka tidak siap untuk mengubah praktik kelas untuk memberikan siswa tanggung jawab lebih bebas dan memberikan diri mereka kurang kontrol erat menuntut . 1996) dan dalam bahasa Perancis Kanada (Dassa. . 1996.. 1990). 1993a. Dalam penelitian dengan guru pendidikan khusus. Sebuah ketegangan yang berbeda antara penilaian formatif dan sumatif muncul ketika guru bertanggung jawab untuk kedua fungsi: ada perdebatan antara mereka yang menarik perhatian pada kesulitan menggabungkan dua peran (Simpson. Shepard et al.. guru menjadi bingung. Pedagogi dan Inovasi Mengingat masalah ini. William & Black. sementara di Inggris perubahan tersebut telah menghasilkan keragaman praktek.mengendalikan situasi yang kurang ini mungkin terjadi. dan tampaknya mampu berpikir hanya dalam hal tes sumatif sering dengan tidak ada tindakan umpan balik (Ratcliffe. beberapa pekerjaan seperti gagal untuk menghasilkan efeknya. 1994). Para penulis menafsirkan ini sebagai keengganan untuk memecahkan simbiosis yang ada saling ketergantungan antara guru dan siswa (Cavendish et al.. adalah link dekat praktek penilaian formatif baik dengan komponen lain dari pedagogi guru sendiri. 1992). tampaknya tidak telah diselesaikan ketegangan ini (Harlen et al. itu adalah sangat sosial dan pribadi. mereka meniru tes eksternal (Bennett et al. Gipps et al. 1994. 1990. 1993. dan dengan konsepsi guru dari perannya. 359) Kutipan terakhir ini juga menarik perhatian dominasi pengujian surnmative eksternal. (Johnston et al. laju perubahan lambat karena sangat sulit bagi guru untuk mengubah praktik yang tertanam erat dalam keseluruhan pola mereka pedagogi (Torrie. banyak kekurangan kerangka penafsiran yang mereka butuhkan untuk mengkoordinasikan banyak bit yang terpisah dari informasi penilaian dalam terang tujuan pembelajaran yang luas (Bachor & Anderson. 1995. yang mencoba untuk melatih mereka untuk berkomunikasi dengan siswa untuk menghargai pandangan siswa tentang pekerjaan mereka sendiri. dan terutama untuk tujuan moderasi (yaitu memeriksa konsistensi standar antara sekolah). Harlen et al.

Untuk keperluan ulasan ini. . Untuk aksi pertama.Kami belum mencoba di sini untuk memberikan review yang komprehensif dari literatur tentang praktek penilaian guru. Yang kedua adalah tindakan yang dilakukan oleh pelajar untuk menutup kesenjangan bahwa untuk mencapai tujuan yang diinginkan (Ramaprasad. terutama guru. bekerja sama dengan rekan-rekan. dan kemungkinan sebaya dan penilaian diri. dalam kaitannya dengan tindakan yang dilakukan oleh pelajar itu akan menjadi kesalahan untuk menganggap siswa sebagai penerima pasif dari panggilan untuk bertindak. Kekhawatiran akan dengan efek dari keyakinan tentang tujuan pembelajaran. keterlibatan siswa dalam penilaian formatif akan dipertimbangkan oleh divisi menjadi dua topik yang luas. Ketiga fitur yang luar biasa adalah: bahwa penilaian formatif tidak dipahami dengan baik oleh guru dan lemah dalam praktek. penelitian harus dikaitkan dengan program intervensi. Tujuannya telah menyoroti beberapa poin kunci yang relevan dengan tujuan utama dari tinjauan ini. maka inisiatif formatif akan menjadi bagian dari pola yang lebih besar dari perubahan dan evaluasi harus dilihat dalam konteks yang lebih besar. pemilihan garis tindakan dan sifat komitmen seseorang untuk itu. tapi mungkin harus menggunakan peneliti diimpor karena guru tidak dapat diharapkan cepat untuk meninggalkan peran kebiasaan dan metode untuk percobaan terbatas. dan / atau keterampilan). dan kegiatan belajar yang mungkin atau mungkin tidak mengikuti. dan yang pelaksanaannya panggilan untuk perubahan agak dalam baik dalam persepsi guru dari peran mereka sendiri dalam hubungannya dengan siswa dan dalam praktek kelas mereka. Fitur-fitur ini memiliki implikasi untuk penelitian ke daerah ini. mengenai kapasitas seseorang untuk merespon. Apapun prosedur dimana pesan ketetapan yang dihasilkan. bahwa konteks persyaratan nasional atau lokal untuk sertifikasi dan akuntabilitas akan memberikan pengaruh yang kuat pada praktek. Untuk menjadi produktif karena itu. dan tentang apa pekerjaan pembelajaran harus seperti: semua ini mempengaruhi motivasi untuk mengambil tindakan. dan / atau pemahaman. yang discerns dan menafsirkan kesenjangan dan mengkomunikasikan pesan tentang hal itu kepada siswa. kemampuan belajar. 1983. itu akan mengubah peran dan cara mengajar mereka. Yang pertama adalah persepsi oleh pelajar dari kesenjangan antara tujuan yang diinginkan dan keadaan sekarang nya (pengetahuan. Jadi setidaknya beberapa penelitian yang diperlukan pasti akan kekurangan validitas ekologi. Fokus di sini akan di metode penelitian. cara di mana persepsi yang memotivasi pilihan antara program yang berbeda dari tindakan. (2) kedua akan fokus pada cara-cara yang berbeda di mana tindakan positif dapat diambil dan rezim dan konteks bekerja di mana tindakan yang mungkin dilakukan. Sadler. Ada link yang kompleks antara cara di mana pesan diterima. Potongan difokuskan lebih dekat dari penelitian mungkin akan lebih menarik sebagai cara untuk mengeksplorasi isu-isu yang berbeda yang terlibat. Jika intervensi tersebut adalah untuk mencari implementasi dengan dan melalui guru di kelas mereka yang normal. tanggung jawab utama untuk menghasilkan informasi yang mungkin terletak dengan siswa dalam penilaian diri. Mahasiswa dan Penilaian Formatif Inti dari kegiatan penilaian formatif terletak pada urutan dua tindakan. Penelitian yang hanya menginterogasi praktek yang ada mungkin dapat melakukan sedikit lebih dari mengkonfirmasi temuan agak mengecewakan dilaporkan di atas. atau dengan orang lain. 1989). sebagai berikut: (1) Yang pertama akan fokus pada faktor-faktor tersebut yang mempengaruhi penerimaan pesan dan keputusan pribadi tentang bagaimana menanggapi hal itu. tentang risiko yang terlibat dalam merespon dalam berbagai cara.

1991. 1996a). memiliki membuat waktu untuk kegiatan lain selain pekerjaan sekolah [. beberapa anak-anak dan remaja dengan siapa ia berurusan dipenjara di identitas seorang murid yang buruk dan lawan. kedua sumber umpan balik telah dipertimbangkan. bisa ada pengaruh lain. Gejala ini tidak aman disertai dengan sering bergerak untuk mengamankan diri dari guru. Satu masalah mungkin takut . apakah mereka dihasilkan oleh diri atau oleh orang lain. Banyak penelitian melaporkan bahwa keuntungan belajar yang positif dijamin dengan umpan balik formatif berhubungan dengan sikap yang lebih positif untuk pembelajaran . tetapi dimodifikasi. Newman & Schwager (1995) menemukan bahwa. (Perrenoud. meskipun dengan cara yang berbeda.komitmen pribadi tambahan yang diperlukan dapat membawa dengan itu suatu hukuman ditingkatkan untuk kegagalan dalam hal seseorang harga diri. Masalah lain mungkin bahwa siswa dapat gagal untuk mengenali umpan balik formatif sebagai sinyal membantu dan panduan (Tunstall & Gipps. Secara khusus. Namun. hal. 1990. sehingga menghindari masalah utama. ini mempengaruhi generasi awal pesan tentang kesenjangan serta cara di mana pelajar dapat bekerja untuk menutupnya.terutama di rezim penguasaan pembelajaran dimana penggunaan yang akan dibuat dari umpan balik yang jelas direncanakan (Kulik et al. . frekuensi permintaan bantuan dari semua siswa mengejutkan rendah dan mereka menyimpulkan bahwa ada kebutuhan untuk mendorong lebih banyak mencari bantuan di kelas biasa. ia menunjukkan bukti bahwa siswa dapat enggan untuk mencari bantuan.] Setiap guru yang ingin berlatih penilaian formatif harus merekonstruksi kontrak mengajar sehingga dapat menangkal kebiasaan diakuisisi oleh muridmuridnya. Perrenoud komentar bahwa: Sejumlah murid tidak bercita-cita untuk belajar sebanyak mungkin.] Penilaian formatif selalu mengandaikan pergeseran titik keseimbangan ini terhadap pekerjaan sekolah lagi. hari atau tahun tanpa bencana besar.strategi regulasi. Blumenfeld melaporkan (1992) bahwa beberapa siswa AS akan mencoba untuk menghindari risiko yang terlibat dalam menangani tugas yang menantang. Penerimaan dan Respon Dalam analisisnya tentang penilaian formatif oleh guru di Perancis. set overmelengkung dari keyakinan yang harus dipertimbangkan dalam fokus beruang pertama pada persepsi dan respon terhadap pesan umpan balik. Dalam review dan analisis yang disampaikan oleh Blumenfeld (1992). dan akan 'tak pernah puas' dalam pencarian mereka untuk isyarat untuk 'jawaban yang benar' dari guru. dengan ditemukannya Swain 1991) bahwa beberapa siswa sekunder bekerja pada guru dinilai proyek ilmu pengetahuan di Inggris akan menanggapi kesulitan yang serius dengan bekerja pada aspek anak perusahaan dari tugas. tetapi konten untuk 'mendapatkan oleh'. Demikian pula... Fitur utama dari . sikap yang lebih serius untuk belajar [. tetapi ada juga bisa negatif mempengaruhi dan pengertian tentang sikap dan motivasi harus dieksplorasi secara lebih rinci jika asal efek tersebut harus dipahami. 92 (huruf miring penulis)) Pandangan yang agak pesimis ini didukung.Jelas ada interaksi yang kuat antara kedua daerah. yang bertujuan untuk mengeksplorasi diri mereka . Demikian pula. menunjukkan bahwa respon dapat ditentukan secara kultural. Selain itu. dan tidak selalu senang menerima bantuan tambahan karena ditafsirkan sebagai bukti kemampuan mereka rendah. . 1995). sementara pendekatan yang berbeda bisa membuat perbedaan. Jadi sementara keengganan untuk ditarik ke dalam keterlibatan yang lebih serius dengan pekerjaan belajar mungkin timbul dari keinginan hanya untuk meminimalkan usaha. dalam penelitian eksperimental mereka dari efek berbagai bentuk bimbingan dengan 3 dan kelas 6 memecahkan masalah matematika.. Whiting et al.. Dalam studi yang dilaporkan dalam topik pertama. Purdie & Hattie (1996) studi banding dari tanggapan siswa Jepang dan Australia. jika diri dan peerassessment dipromosikan di kelas. untuk melewati periode.

Dua ulasan umum bidang ini baik stres bahwa umpan balik yang menarik perhatian dari tugas dan terhadap harga diri dapat memiliki efek negatif pada sikap dan kinerja (Cameron & Pierce. dan terfokus pada pentingnya keluar-melakukan orang lain. bahwa pemberian nilai bisa merusak bantuan positif yang diberikan oleh komentar tugas. dan keduanya menunjukkan bahwa di mana umpan balik pada tujuan proses itu dilengkapi untuk menyertakan informasi tentang kemajuan siswa ke arah tujuan keseluruhan dari belajar. terutama jika tidak terkait dengan umpan balik yang obyektif tentang pekerjaan. Pola-pola hubungan antara prestasi.mereka dengan orientasi penguasaan dan orang-orang dengan orientasi kinerja. Dalam sebuah penelitian kemudian. Ini telah dibawa keluar dalam satu dijelaskan pada bagian pengalaman Kelas. 1991). Hasil mengejutkan dari studi ini. kedua menunjukkan bahwa hasil yang lebih baik dijamin dengan memberikan gol proses daripada tujuan produk.') dengan sesuai penekanan pada menyelesaikan masalah sebanyak mungkin. Butler & Neuman (1995) menunjukkan bahwa mereka dalam mode tugas lebih mungkin untuk mencari bantuan dan untuk menjelaskan bantuan-menghindari dalam hal mencari penguasaan independen. The disebabkan kegagalan kedua kurangnya kemampuan. terutama ketika mereka awalnya diklasifikasikan sebagai berprestasi rendah dibandingkan di dua kelompok. . tetapi pentingnya konsep diri jelas. dan rezim studi dan umpan balik yang dialami oleh siswa telah menjadi subyek dari analisis rinci. 1994. Mantan berbicara tentang pentingnya belajar. menggunakan hasil dari 12 program biologi SMA. Studi tentang Ames & Archer (1988) hanya melibatkan penyelidikan tujuan bahwa siswa sudah digelar. 1996). Satu kelompok diberitahu bahwa tujuan dari pekerjaan yang belajar ('ini akan membantu Anda untuk belajar hal-hal baru . 1993a). percaya pada nilai upaya untuk mencapai penguasaan. Perbedaan serupa dilakukan dalam studi intervensi oleh Butler (1988) sudah dijelaskan pada bagian pengalaman Kelas atas di mana istilah 'ego-melibatkan umpan balik' dan 'tugas-melibatkan umpan balik' yang digunakan. Hal ini bahkan kasus yang memberikan pujian dapat memiliki efek buruk.. berada di level tertinggi. satu di belajar membaca dengan siswa kelas 5 remedial (Schunk & Rice.studi khusus ini adalah bahwa perbedaan antara dua bentuk bimbingan umpan balik yang diberikan adalah satu tampaknya sempit. dalam hal pekerjaan dan semua didorong untuk mencari bantuan setiap kali mereka merasa perlu. Mereka menemukan bahwa sampel mereka dari 176 siswa mulai lebih nilai 8 sampai 11 dapat dibagi menjadi dua kelompok . semua menerima pendidikan yang sama. 1996) telah mengembangkan tema yang sama ini. dan juga tampak bahwa pemberian tugas yang menantang dan umpan balik yang luas menyebabkan keterlibatan siswa lebih besar dan prestasi yang lebih tinggi. kinerja pembelajaran baik siswa dan keyakinan mereka tentang kemampuan kinerja mereka sendiri (self-efficacy). menggambarkan sensitivitas isu yang diangkat di sini. oleh Thomas et al. lebih berbicara dari segi kemampuan relatif mereka. Beberapa studi oleh Schunk (Schunk. sementara sebuah studi rinci oleh Pryor & Torrance (1996) menunjukkan bagaimana seorang guru dapat berkonsentrasi pada perawatan pelindung untuk anak dengan mengorbankan membantu anak untuk belajar. (Schunk & Swartz. belajar dengan relatif sedikit usaha jika mampu. termasuk umpan balik. Pola kompleks link muncul. Terlepas dari perbedaan ini. (1993). Dalam dua studi.. sementara orang-orang di mode ego meminta bantuan kurang dan menjelaskan menghindari mereka di hal masking ketidakmampuan mereka. yang lain menulis instruksi dengan arus utama 5-kelas. Lepper & Hodell (1989) berpendapat bahwa sistem reward dapat merusak baik minat dan motivasi. Para siswa tujuan kinerja lebih cenderung menunjukkan pola pertanyaan maladaptif dan memecahkan masalah yang lebih sedikit..') dengan penekanan pada pentingnya memahami bagaimana untuk mengatasi masalah dari jenis yang disajikan. Tujuan Orientasi Ini efek dari orientasi tujuan pembelajaran telah diteliti secara luas. dan memiliki sikap yang umumnya positif untuk belajar.. Kluger & DeNisi. konsep diri. sementara untuk yang lain tujuan stres adalah kinerja mereka sendiri ('Bagaimana Anda lakukan membantu kita untuk mengetahui seberapa pintar Anda dan apa jenis kelas Anda akan mendapatkan .

orang-orang dengan konsep diri awalnya tinggi tidak menunjukkan keuntungan. kepercayaan rekan-rekan dan orang tua juga dapat mempengaruhi cara di mana-konsep diri siswa dikembangkan. Ames (1992) mulai dari bukti tentang keuntungan yang 'penguasaan' (yaitu-tugas yang berhubungan) tujuan dapat mengamankan dan ulasan fitur yang menonjol dari lingkungan belajar yang dapat membantu untuk mengamankan keunggulan ini. menunjukkan bahwa konsep diri siswa dapat ditingkatkan dengan umpan balik yang dirancang untuk tujuan ini dan bahwa sementara mereka yang konsep diri awalnya rendah menunjukkan keuntungan besar. efek yang mereka dikaitkan dengan peningkatan otonomi dan internal locus of control.. Craven et al. menarik dan cukup menuntut. Raja (1994) dan Butler & Winne (1995). Tentu saja. yang pengaturan tujuan dan gaya umpan balik harus baik dirancang untuk mengamankan. hasil yang diperoleh oleh peneliti tidak dapat direplikasi oleh guru dan tidak ada perbedaan yang signifikan dalam pencapaian antara eksperimen dan kelompok kontrol. dan berprestasi tinggi yang cenderung atribut keberhasilan untuk usaha. 1991). dalam intervensi singkat ini. dan ini akan sangat dipengaruhi oleh 'keyakinan tentang kepentingan relatif dari' guru upaya 'sebagai terhadap kemampuan' dalam pandangan mereka belajar. The persepsi diri siswa adalah yang paling penting di sini. dan harus mendorong mereka untuk menganggap kemampuan sebagai kumpulan keterampilan yang mereka dapat menguasai dari waktu ke waktu. yang atribut kegagalan untuk kemampuan rendah. Ada bukti dari banyak studi bahwa keyakinan peserta didik tentang kapasitas mereka sendiri sebagai pembelajar dapat mempengaruhi prestasi mereka. Studi tentang Fernandes & Fontana menunjukkan bahwa prestasi dalam eksperimen di Portugal dijelaskan pada bagian pengalaman Kelas yang terkait dengan peningkatan rasa siswa kontrol mereka sendiri atas pembelajaran mereka. di samping meliputi bukti bahwa banyak faktor yang disebutkan di atas dapat memiliki terhadap prestasi belajar. tapi sebelum ini tugas yang diusulkan harus membantu siswa untuk menetapkan tujuan diri direferensikan mereka sendiri dengan menawarkan tantangan yang berarti. tentang jumlah usaha yang belajar sukses dapat menuntut. . Selain itu. Grolnick & Ryan (1987) menunjukkan bahwa gaya belajar mandiri diproduksi belajar yang lebih baik konseptual. Studi oleh Skaalvik (1990). Kerja Craven dalam matematika dan membaca dengan siswa di kelas 3-6 (Craven et al. atribusi siswa sukses dalam pekerjaan untuk usaha meningkat sementara atribusi kemampuan tidak. Siero & van Oudenhoven (1995) dan Vispoel & Austin (1995) semua menunjukkan bahwa alasan siswa berikan untuk hasil belajar mereka berbeda antara berprestasi rendah. Fernandes & Fontana (1996). dan harus mendorong pandangan bahwa kesalahan adalah bagian dari pembelajaran. dan bekerja Raja juga fokus pada locus of control sebagai prediktor kinerja. (1991). Dia juga merekomendasikan bahwa umpan balik harus pribadi. seperti yang ditunjukkan dalam analisis Blumenfeld (1992). (1994). juga menarik perhatian pada pentingnya keyakinan peserta didik tentang pentingnya upaya. Namun. tentang sifat pembelajaran.Self-Persepsi Dalam review yang lebih umum dari literatur di bidang ini. Sebuah perspektif akhir dan selanjutnya ditambahkan oleh review dari Butler & Winne (1995). yang. Penggunaan imbalan ekstrinsik dapat menjadi kontra-produktif jika mereka memusatkan perhatian pada kemampuan 'bukan pada keyakinan bahwa upaya seseorang dapat menghasilkan kesuksesan. Vispoel & Austin mendesak bahwa guru harus membantu siswa untuk mengatasi atribusi kemampuan. Secara khusus. harus dikaitkan dengan peluang untuk perbaikan. Dia menyimpulkan bahwa evaluasi kepada siswa harus fokus pada perbaikan individu dan penguasaan. yang menarik kesimpulan umum mirip dengan Ames. Isu-isu ini dianalisis dalam makalah teoritis oleh Deci & Ryan (1994) yang dibahas lebih lanjut pada bagian proses Meta-tugas. Contoh yang dapat ditambahkan untuk mereka yang sudah dikutip di atas adalah dari Lan et al. adalah penting bahwa motivasi dipandang melibatkan perubahan dalam keyakinan kualitatif siswa tentang diri mereka sendiri.

sementara yang kedua akan dibahas dalam bagian berjudul Strategi dan taktik untuk guru dan Sistem di bawah ini. dan mungkin untuk berkolaborasi dalam menilai satu sama lain. Fokus pada penilaian diri oleh siswa tidak praktek umum. Pentingnya fitur ini muncul dari gabungan dari dua jenis hasil penelitian yang dirangkum di atas. Yang pertama adalah untuk bertujuan untuk mengembangkan kapasitas siswa untuk mengenali dan menilai setiap celah dan biarkan siswa tanggung jawab untuk perencanaan dan melaksanakan setiap tindakan perbaikan yang mungkin diperlukan. Dalam penilaian formatif. Pilihan kedua adalah bagi guru untuk mengambil tanggung jawab sendiri untuk menghasilkan informasi stimulus dan mengarahkan aktivitas yang berikut.misalnya. Ada jelas tumpang tindih kompleks dan interaksi antara fitur ini. Secara keseluruhan. setiap guru memiliki pilihan antara dua pilihan. .jika mereka bisa melakukannya sendiri guru bisa menyebarkan / usaha nya lebih efisien. Opsi pertama ini berarti perkembangan dalam siswa dari kapasitas untuk menilai diri mereka sendiri. hlm. bagian ulasan ini telah selektif dan tidak mengklaim untuk menutupi banyak aspek yang mungkin tersirat dalam sikap dan motivasi istilah. self-efficacy.. Salah satunya adalah bahwa `fitur pribadi 'yang disebut di atas dapat memiliki efek penting pada pembelajaran siswa. 1996.dewasa . seperti batas antara bagian ini dan bagian dari pengalaman Kelas.dan tentang . Yang lain adalah bahwa cara di mana informasi formatif disampaikan kepada mahasiswa. dapat mempengaruhi fitur pribadi baik atau buruk. dan asumsi tentang sifat pembelajaran. Motif memperkenalkan praktek ini beragam. topik yang sering diabaikan . Yang pertama dari dua ini akan menjadi subjek bagian ini. Dalam ulasannya dari literatur tentang evaluasi diri siswa dalam kursus pelatihan profesional dalam ilmu kesehatan. koleksi sebaliknya komprehensif oleh Phye (1997) tidak berisi potongan yang berfokus secara eksplisit pada diri dan peer-assessment. Dua pilihan tumpang tindih dalam bahwa adalah mungkin untuk menggabungkan dua pendekatan: batas antara bagian ini dan bagian tentang Strategi dan taktik untuk guru karena itu akan sewenang-wenang. diri atribusi. 92-119) menggambarkan pengenalan penilaian diri. Pesan berharap adalah bahwa inovasi yang telah membayar perhatian ke fitur-fitur ini telah menghasilkan keuntungan belajar yang signifikan bila dibandingkan dengan norma-norma yang ada praktek kelas.harapan bahwa semua pembelajaran harus mengarah jawaban sederhana dan jelas untuk semua pertanyaan yang bisa dinaikkan. Penilaian oleh Mahasiswa Fokus bagian ini adalah untuk membahas salah satu aspek dari kegiatan pembelajaran yang dapat mengikuti dari penerimaan siswa dan pemahaman tentang kebutuhan untuk menutup kesenjangan antara prestasi hadir dan tujuan yang diinginkan. Daws & Singh (1996) menemukan bahwa hanya sekitar sepertiga dari guru sains Inggris yang mereka sampel terlibat murid langsung dalam penilaian mereka sendiri dengan cara apapun. Geisler-Brenstein & Schmeck (1995) dalam analisis yang komprehensif dari bukti ini antar-hubungan. bahkan di antara orang-orang guru yang mengambil penilaian serius. hlm. Fokus tertentu dalam karya Ulasan di sini adalah untuk menarik perhatian pentingnya berbagai fitur-konsep diri pribadi. telah merumuskan sebuah `Inventarisasi Proses Belajar 'dalam rangka untuk mempromosikan apa yang mereka sebut` perspektif multi-faceted perbedaan individu dalam belajar Non'. Parkin & Richards dimulai karena ketidakmungkinan praktis menilai tingkat kebutuhan masing-masing individu dalam kelas sekitar 30 siswa yang terlibat dalam pekerjaan laboratorium praktis . 15-28 ) dan rekening inisiatif Norwegian Jernquist (dilaporkan dalam Black & Atkin. Dalam literatur umum pada penilaian kelas. 1994. dan kedua Parkin & Richards (dalam Fairbrother et al. sebagai inovasi. masing-masing dalam ilmu sekolah menengah di Inggris dan matematika sekunder di Norwegia. dan konteks budaya dan keyakinan tentang kemampuan dan usaha di mana umpan balik ditafsirkan oleh penerima individu kelas.

. kekuasaan guru dengan mudah menguasai kontribusi siswa. mengembangkan sekaligus gambaran di mana mereka dapat menemukan posisi mereka sendiri dalam kaitannya dengan tujuan tersebut. Studi ini menunjukkan bahwa dalam dialog tersebut. baik oleh guru saja. tetapi juga dijelaskan penelitian baru untuk mengembangkan keterampilan ini dalam pendidikan keperawatan. sementara tiga melakukan lebih baik daripada kelompok kontrol yang tidak memiliki umpan balik formatif. Sikap teoritis ini akan ditelusuri lebih lanjut pada akhir bagian ini dan di bagian yang berjudul Prospek untuk teori dan praktek penilaian formatif.Arthur (1995) melaporkan bahwa keterampilan yang diperlukan tidak sengaja diajarkan di kebanyakan program. untuk memahami kriteria penilaian. Evaluasi rekan berperan hanya dalam studi Frederiksen & White. Pada bagian pertama ini (McCurdy & Shapiro. atau melalui peer-monitoring. Ini sekarang akan dibahas pada gilirannya. 1994. Sebuah pandangan yang berbeda pada aspek ini disediakan dalam studi oleh James dialog tercatat antara guru dan siswa (1990). praktek evaluasi diri ditingkatkan ketekunan. Beberapa penelitian yang dibahas pada bagian pengalaman Kelas atas percobaan terlibat mana pekerjaan pada tujuan dikejar baik dengan dan tanpa pelatihan evaluasi diri. dan kemudian lanjutkan untuk mengejar dan internalisasi belajar yang mengubah pemahaman mereka (Sadler. 1997). Motif yang diberikan di sini adalah bahwa masa depan profesional akan membutuhkan semua keterampilan yang diperlukan untuk belajar seumur hidup. dan evaluasi diri harus menjadi salah satu dari ini. tingkat membaca lisan siswa sekolah dasar ditingkatkan dengan memberi mereka verbal dan visual yang umpan balik kinerja. Dalam penelitian kedua (Sawyer et al. Kedua atas dasar penerimaan untuk para guru yang terlibat dan pada keandalan penilaian mereka sendiri pekerjaan mereka. dan memiliki kesempatan untuk merefleksikan pekerjaan mereka. Kedua hal ini memiliki kesamaan penekanan pada kebutuhan bagi siswa untuk memahami tujuan pembelajaran. Dua penelitian telah bekerja dengan anak-anak yang mengalami kesulitan belajar. Beberapa penulis telah mengambil argumen lebih lanjut dengan mengembangkan refleksi teoritis tentang bagaimana siswa bisa mengubah pemahaman mereka. yang melihat diri dan peer-assessment sebagai bagian intrinsik dari setiap program yang bertujuan untuk membantu siswa untuk mengambil tanggung jawab lebih untuk pembelajaran mereka sendiri. dicapai oleh kelompok pemantauan diri. Efeknya adalah bahwa penyelidikan alasan untuk kesulitan siswa tidak dikejar. jika dikombinasikan dengan tujuan kinerja. 1992) fokus pada keterampilan komposisi penulisan 4 dan siswa kelas 5. diukur dengan perbandingan skor sebelum dan sesudah tes selama periode program dari sembilan minggu. yang terakhir terlalu sederhana tentatif. tetapi semua kelompok dengan umpan balik . Kelompok pertama yang lebih baik secara keseluruhan pada generalisasi dari keterampilan menulis diajarkan. atau pemantauan diri.yang melibatkan pekerjaan eksperimental menghasilkan data kuantitatif pada prestasi dan orang-orang yang bukti-bukti kualitatif. contoh adalah penelitian oleh Schunk (1996) yang menunjukkan bahwa. penilaian diri adalah sine qua non untuk pembelajaran yang efektif. Frederiksen & White. 1989). 1992). Norwegia inisiatif mulai dari motif yang lebih mendasar. Dalam pandangan ini. Asumsi di sini adalah mereka tidak bisa melakukannya kecuali mereka pertama kali dapat memahami tujuan yang mereka gagal untuk mencapai. Keuntungan terbesar. metode sebaya dan pemantauan diri yang disukai dan salah satu manfaat dari kedua adalah bahwa mereka mengurangi jumlah waktu bahwa guru pendidikan khusus harus menghabiskan pengukuran di kelas mereka. self-efficacy dan prestasi. Di sini. Dua contoh kuantitatif telah dijelaskan secara rinci pada bagian pengalaman Kelas (Fontana & Fernandes. Studi dari Self-assessment Studi penelitian dari diri dan peer-assessment secara luas dapat dibagi menjadi dua kategori . sebuah kelompok yang diajarkan strategi self regulated dengan perhatian eksplisit untuk tujuan melakukan lebih baik daripada kelompok serupa tanpa penekanan tujuan dan kelompok tanpa instruksi pemantauan diri.

dari orang-orang yang mendorong itu. termasuk umpan balik kinerja yang luas. Evaluasi diri merupakan aspek intrinsik dari refleksi atas pembelajaran sendiri seseorang. Beberapa penelitian kualitatif melaporkan inovasi dirancang untuk mendorong refleksi diri tersebut. kualitas dan kedalaman diri penilaian siswa yang ditingkatkan sebagai percobaan berlangsung. mereka berhasil lebih cepat. kurangnya korespondensi antara persepsi diri mereka dari pekerjaan mereka dan penilaian orang lain. Maqsud & Pillai (1991) dilatih kelas siswa SMA diri-skor tes mereka dan menemukan bahwa keuntungan nilai mereka secara signifikan lebih tinggi daripada kelas kelompok kontrol: mereka dikaitkan ini dengan menurunkan ketidakpercayaan yang normal siswa mereka ' dari dan antagonisme terhadap umpan balik ditandai. berdasarkan laporan diri oleh mereka yang terlibat. dan bukti Ulasan yang menetapkan bahwa kegiatan tersebut dapat meningkatkan prestasi belajar siswa. seperti tes ulasan handout. 1991). tetapi karena mereka mulai dengan merenungkan masalah dan mempertimbangkan kemungkinan menggunakan strategi yang berbeda sebelum melanjutkan . (1993). Dalam ilmu pendidikan.hasil yang tampaknya untuk menghubungkan dengan meta-kognitif penekanan mendasari pelatihan pemantauan diri. siswa harus mengevaluasi apakah perubahan ini telah terjadi.melakukan yang lebih baik. dan tanggung jawab untuk belajar antara siswa. 1994). Powell & Makin (1994) dan Meyer & Woodruff (1997). Fokus pada pembelajaran mandiri terlihat. Latihan pemantauan disediakan oleh buklet pertanyaan dengan mana siswa dipantau hasil mereka pada set praktek latihan pemecahan masalah yang dipilih dari perangkat lunak. Ia membedakan fitur saja yang mencegah belajar mandiri. Kemudian. adalah bahwa implementasi sukses telah dicapai. Dalam penelitian untuk menyelidiki cara yang paling efektif untuk menggunakan program pemecahan masalah software (Delclos & Harrington. tetapi mereka dengan pelatihan pemantauan juga secara signifikan lebih baik daripada mereka yang tidak. Pekerjaan serupa dilaporkan oleh Griffiths & Davies (1993). Ada juga kelompok kontrol cocok yang digunakan program tanpa pelatihan. Mereka tampaknya untuk berbuat lebih baik. Baik guru dan siswa yang terlibat harus menganalisis apa yang terjadi dalam sepotong karya pembelajaran. dua kelompok 5 dan kelas 6 siswa berdua pelatihan diberikan dalam penggunaan pro-aktif mereka dari program. tetapi salah satu dari mereka juga harus mengambil bagian dalam latihan pemantauan. Satu set terkait erat studi oleh Raja (1994) pada strategi pertanyaan siswa akan ditinjau pada bagian Pertanyaan bawah. kemampuan belajar. Tujuannya adalah untuk mengubah penilaian prestasi dalam seni visual dengan membawa siswa ke dalam proses penilaian sebagai praktisi reflektif. Dalam review praktek menulis. dijelaskan oleh penulis sebagai meta-kognitif pelatihan. Sukses serupa yang diraih oleh Merret & Merret (1992) dalam percobaan yang bertujuan untuk membantu siswa untuk menyadari. Kedua kelompok dilatih mencapai sukses yang lebih besar dengan program daripada kelompok kontrol. terutama melalui . Bukti. menjadi bersamaan diperlukan untuk bergerak untuk mengembangkan kerja praktek. Mereka lebih sukses dengan masalah yang lebih kompleks. Baird et al. di review oleh Thomas (1993). Sebuah inovasi skala yang lebih besar sepenuhnya dijelaskan dalam sebuah buku oleh Ross et al. Zimmerman & Risemberg (1997) membahas berbagai bentuk praktek pengaturan diri yang digunakan oleh beberapa penulis terkenal dan terkait ini untuk penelitian bukti efektivitas mendukung siswa dengan mendorong pemantauan diri (Schunk & Swartz. (1991) melaporkan pada pekerjaan dengan 27 guru dan 350 siswa di mana guru yang membantu untuk mengetahui lebih banyak tentang siswa mereka dan belajar lebih banyak tentang bagaimana mereka dapat mengubah gaya kerja kelas dengan strategi berdasarkan meta-kognisi dan konstruktivisme. setelah percobaan tertentu adalah lebih. Zimmerman & Bamdura. melalui umpan balik dari penilaian diri mereka. 1993b. dan masing-masing pihak harus mengajukan tiga perubahan yang akan diberlakukan. bukan karena mereka bisa menggunakan strategi tertentu secara lebih efektif. dan secara keseluruhan mereka terlihat akan menggunakan strategi yang lebih efektif. dari siswa ketidakmampuan belajar lainnya tanpa pengalaman umpan balik tersebut.

. kelompok-kelompok yang tidak akurat dalam penilaian mereka dari kelompok lain. Reliabilitas diri dan rekan-penilaian juga diselidiki. 3. dan berbagi dalam kelompok. Namun. dan 85% mengatakan bahwa itu membuat mereka belajar lebih banyak. mapan berprestasi tinggi adalah yang paling produktif. Pertanyaan tentang komposisi kelompok optimal adalah kompleks satu. kualitas siswa penilaian estetika. Dalam kedua kasus. beberapa umpan balik rekan juga digunakan untuk menjawab dan mendiskusikan upaya mereka. pilihan yang jelas harus dibuat. dalam pekerjaan mereka dengan 1 dan kelas 2 sekolah-anak mengembangkan keterampilan penilaian dalam pekerjaan proyek terpadu mereka.pengembangan `penilaian percakapan 'di mana siswa didorong untuk merefleksikan pekerjaan mereka dan untuk mengartikulasikan refleksi mereka. 161). Semua siswa mengatakan bahwa diri dan rekan-penilaian kerja membuat mereka berpikir lebih. Demikian laporan kualitatif diberi sebuah inisiatif untuk menyerahkan semua tanggung jawab untuk penilaian dari program sarjana tahun pertama untuk penilaian diri siswa (Edwards & Sutton. Dalam sebuah studi eksperimental oleh Koch & Shulamith (1991). 1992). dan kelompok ini menunjukkan keuntungan belajar yang lebih besar daripada yang lain. Hughes & Besar (1993) juga meneliti peer-penilaian mahasiswa tahun terakhir di farmakologi dan menemukan koefisien korelasi 0. Penilaian sejawat Beberapa akun diuraikan dalam bagian ini melibatkan baik penilaian diri dan peer-assessment.83 antara peringkat rata-rata rekan-rekan dan orang-orang dari kelompok staf. dan tujuan untuk meningkatkan kinerja individu melalui kolaborasi kelompok. Dalam kelompok-kelompok tersebut. Ulasan umum yang diberikan oleh Slavin (1991) dan oleh Webb (1995). oleh Stefani (1994). (1994) juga digunakan kerja kolaboratif. bekerja sama dengan mitra percakapan mereka '(p . 1991). dalam pekerjaan dengan siswa biologi perguruan tinggi. di mana tujuan kelompok memiliki prioritas. dan kualitas ini naik selama penelitian. tetapi untuk tugas-tugas yang lebih terbuka berbagai jenis siswa adalah keuntungan. Peer-penilaian seperti itu termasuk dalam beberapa rekening pengembangan kerjasama kelompok sebagai bagian dari kegiatan pembelajaran di kelas.71 untuk penilaian diri dan 0. Higgins et al.89 untuk rekan-penilaian. dengan anak-anak cenderung kurang menilai. Namun. dan tidak mungkin pada umumnya untuk menganggap setiap dilaporkan keuntungan untuk komponen penilaian. inisiatif menghasilkan perubahan signifikan dalam komitmen siswa untuk pekerjaan mereka dan ada juga beberapa bukti tidak langsung di kedua peningkatan prestasi belajar mereka. digambarkan dengan kutipan. bukti-bukti dari `sukses 'dari pekerjaan ini adalah untuk ditemukan hanya dalam rekening. tetapi berprestasi rendah mendapatkan keuntungan lebih dari kelompok campuran asalkan pelatihan kelompok . Anak-anak yang dihasilkan kriteria mereka sendiri. dan dari hasil proyek untuk melatih 2. tetapi itu juga diperlukan bahwa guru meninggalkan praktek penilaian tradisional.. Dia menemukan korelasi dengan penilaian guru dari 0. di antara mereka menghasilkan pertanyaan mereka sendiri. Mereka menyimpulkan bahwa pendekatan membuka peluang baru dalam estetika mengetahui dan penilaian. dan siswa kelas 4 untuk merekam mereka atau menonaktifkan tugas negara kerja secara berkala (Wheldall & Pangagopolou-Steamatelatou. dan mencapai keuntungan belajar yang lebih baik daripada mereka yang menggunakan pertanyaan hanya guru. Hal ini sering sulit untuk menguraikan aktivitas peer-assessment dari kegiatan baru lainnya dalam pekerjaan semacam ini. maka untuk tugas-tugas yang didefinisikan dengan baik. mahasiswa diajarkan untuk menghasilkan pertanyaan-pertanyaan mereka sendiri tentang topik dalam fisika. Penulis antusias dalam rekening mereka dari keberhasilan pekerjaan mereka. Kesepakatan yang baik dengan penilaian guru dicapai. Dimana kinerja individu memiliki prioritas. maka berprestasi tinggi sedikit dipengaruhi oleh campuran. antara tujuan kinerja terbaik dari kelompok sebagai sebuah kelompok. Kedua dari ini tidak fokus pada praktek penilaian dalam kerja kelompok dan menekankan pentingnya pelatihan dalam proses kelompok dan dari pengaturan tujuan yang jelas dan kriteria prestasi yang jelas. dan percaya bahwa siswa yang terlibat menunjukkan bahwa mereka `mampu tanggapan yang kaya dan canggih untuk dan pemahaman dari pekerjaan mereka sendiri .

Beberapa poin dapat diperkenalkan di sini. menggantikan beberapa pekerjaan pada pemecahan masalah untuk diri mereka sendiri yang mereka biasanya akan melakukan. Hattie dkk. bukan luar biasa. diskusi Bonniol (1991) mengarah pada kesimpulan bahwa guru harus memberikan model pemecahan masalah bagi siswa. dan karena itu kurang baik kerangka teoritis di mana untuk menafsirkan bukti yang diberikan oleh siswa dan model yang mengarahkan mereka di pengembangan kriteria penilaian diri mereka sendiri. Kesulitan di sini adalah bahwa banyak guru tidak memiliki model yang baik dari pemecahan masalah dan penalaran yang efektif untuk mengirimkan. Penulis mengusulkan bahwa bagi banyak siswa. Penilaian harus dilihat sebagai momen pembelajaran.mereka perlu diyakinkan melalui diskusi yang mempromosikan refleksi mereka sendiri di mereka berpikirdan juga bahwa jika mahasiswa tidak dapat merencanakan dan melaksanakan pekerjaan sistematis pembelajaran remedial untuk dirinya sendiri. kontribusi mereka. Kebutuhan untuk perawatan seperti ditekankan dalam sebuah studi dari diskusi kelompok dalam pendidikan ilmu pengetahuan dengan Solomon (1991). dan kebutuhan juga untuk dapat memahami model di kepala pelajar sehingga ia / dia bisa membantu pelajar untuk menertibkan ke dalam nya `meta-kognitif kabut '. Tugas mengembangkan kemampuan self-assessment siswa dapat didekati sebagai tugas menyediakan mereka dengan model yang tepat dari cara kerja. Elshout-Mohr (1994) menunjukkan bahwa kedua siswa sering tidak mau menyerah kesalahpahaman . dan siswa harus aktif dalam penilaian mereka sendiri dan membayangkan belajar mereka sendiri dalam terang pemahaman tentang apa artinya untuk mendapatkan yang lebih baik. Bahwa siswa memiliki model seperti yang untuk tingkat budaya ditentukan diilustrasikan oleh perbandingan pendekatan untuk belajar siswa Australia dan Jepang (Purdie & Hattie. meta-kognitif. dapat dilihat bahwa berbagai pendekatan untuk mengembangkan selfassessment oleh murid menjanjikan keberhasilan. pengembangan mungkin ada gunanya. Salah satu alasan untuk kebutuhan untuk mencari perubahan radikal adalah bahwa siswa membawa ke model kerja mereka belajar yang mungkin menjadi kendala untuk belajar mereka sendiri. sementara temuan bahwa siswa yang paling mampu di kedua negara yang lebih mirip dari rekan-rekan mereka di setelah mengembangkan kebiasaan efektif yang sama pembelajaran menunjukkan bahwa tradisi menghambat tersebut dapat diatasi. Link ke Teori Belajar Argumen yang diberikan oleh Zessoules & Gardner (1991) menunjukkan bagaimana perubahan penilaian dari jenis yang dijelaskan di atas mungkin diharapkan untuk meningkatkan belajar jika mereka membantu siswa untuk mengembangkan kebiasaan reflektif pikiran. Dengan cara yang sederhana. Strategi dan Taktik untuk Guru . Diskusi lengkap dari ini dan bekerja sama akan ditangguhkan sampai bagian terakhir dari artikel ini. interpretasi mereka dalam kaitannya dengan teori-teori yang lebih umum pembelajaran menimbulkan masalah mendasar. Dalam review penelitian Eropa di bidang ini. Namun. Kedua ini menunjukkan bahwa penilaian diri adalah penting. (1996) berpendapat bahwa pengajaran langsung dari kemampuan belajar untuk siswa tanpa memperhatikan reflektif. dan berprestasi rendah menunjukkan perbaikan yang sangat baik.menekankan metode untuk menarik keluar. Mereka lebih lanjut menyatakan bahwa pembangunan tersebut harus menjadi komponen penting dalam program untuk pelaksanaan penilaian otentik dalam praktek kelas. Demikian pula. seperti yang digambarkan oleh analisis Tittle (1994). Singkatnya. Carroll (1994) mencoba untuk melakukan hal ini dengan memberikan contoh bekerja masalah aljabar untuk siswa mereka untuk belajar. Lebih umum. 1996). Studi contoh bekerja memberikan situasi belajar yang kurang dimuat di mana refleksi pada proses yang digunakan dapat dikembangkan. ia tidak akan dapat memanfaatkan umpan balik formatif baik. tugas menangani masalah baru di daerah baru kerja tidak mungkin berguna karena overload kognitif. Pencapaian siswa ini ditingkatkan dengan metode ini.

Yang pertama adalah sifat dari tugas yang ditetapkan. termasuk pekerjaan yang terlihat lebih mendalam pada asumsi dan alasan-alasan yang mungkin mendasari artikulasi taktik. atau (b) disajikan khas 'masalah' tapi tidak satu identik dengan salah satu yang diteliti. Demikian pula. sub-bagian di bawah ini akan berurusan pada gilirannya dengan pilihan tugas. Mereka merekomendasikan bahwa semua tiga jenis tugas yang diperlukan. menyebarkan pengetahuan didirikan dengan cara yang baru. Sebuah tugas di mana tantangannya pergi terlalu jauh dapat menyebabkan penghindaran mahasiswa risiko yang terlibat. Sebuah bagian penutup kemudian akan melihat strategi secara keseluruhan. Pilihan Tugas Hal ini jelas bahwa penilaian formatif yang memandu peserta didik menuju tujuan pembelajaran dihargai hanya dapat dihasilkan dengan tugas-tugas yang keduanya bekerja untuk tujuan-tujuan tersebut dan yang terbuka dalam struktur mereka untuk generasi dan menampilkan bukti yang relevan. Ceramah . membutuhkan identifikasi algoritma yang sesuai dan penggunaannya. dengan wacana kelas. Skema ini tugas dibedakan yang (a) disajikan situasi tertentu identik dengan salah satu yang diteliti. Mereka diuraikan skema untuk analisis komparatif tugas yang dapat digunakan oleh guru untuk menghasilkan analisis deskriptif tugas mereka gunakan. Dengan demikian. baik dari siswa untuk guru dan siswa itu sendiri . Mereka menekankan perlunya menggeser pedagogi saat untuk memberikan lebih banyak penekanan pada aspek prosedural pengetahuan dan kurang untuk aspek deklaratif. Ames (1992) memilih tiga fitur utama yang mencirikan sukses `penguasaan '(sebagai lawan` performance'-lihat bagian pada orientasi Goal atas) ruang kelas. dengan beberapa aspek penggunaan pertanyaan. daripada yang sebenarnya replikasi prosedur sebelumnya seperti pada (a). Dumas-Carre & Larcher (1987) yang lebih ambisius. membantu siswa mengembangkan tujuan diri direferensikan jangka pendek. menawarkan tantangan yang wajar. Sebuah fitur umum adalah keragaman kegiatandengan kelas penekanan pada sering bertanya di mana 60% dari pertanyaan yang ditanyakan oleh siswa. menunjukkan bahwa gagasan seperti `menantang 'dan` bermakna' yang bermasalah.Ikhtisar Berbagai aspek kerja guru dalam penilaian formatif dapat diatur dalam kaitannya dengan urutan temporal keputusan dan tindakan yang mensyaratkan. dengan tes dan kemudian dengan umpan balik dari tes. Siswa akan membutuhkan pelatihan khusus dan eksplisit untuk menangani tugas-tugas dari jenis (c). baik untuk penyediaan umpan balik dan untuk merencanakan bagaimana menanggapi hal itu. tugas dapat bermakna untuk berbagai alasan dan penting untuk menekankan mereka makna yang mungkin menjadi produktif untuk pembelajaran. Dalam tinjauan sebelumnya tentang ajaran ilmu pengetahuan. Dalam review yang lebih umum dari lingkungan kelas. Garnett & Tobin (1989) menyimpulkan bahwa kunci keberhasilan mereka adalah cara mereka mampu untuk memantau pemahaman. Pendekatan ini akan digunakan di sini sebagai kerangka kerja untuk menggambarkan pekerjaan dilaporkan dalam literatur. Blumenfeld (1992) membahas beberapa isu-isu ini. Dalam penelitian kualitatif rinci karakteristik kelas dua guru ilmu tinggi-sekolah luar biasa sukses. yang harus baru dan bervariasi bunga. fokus pada aspek bermakna pembelajaran dan mendukung pengembangan dan penggunaan yang efektif strategi pembelajaran. tetapi bahwa guru saat ini tidak berencana atau menganalisis tugas-tugas yang mereka ditetapkan oleh skema jenis ini. dan (c) masalah cukup baru yang memerlukan penalaran baru dan pembangunan pendekatan baru. Kejelian tersebut merupakan syarat penting untuk merencanakan penggabungan penilaian formatif. dan bagi siswa yang jauh di belakang sulit untuk mendorong usaha mereka tanpa pada saat yang sama membuat mereka menyadari betapa jauh di belakang mereka.

Variabel wacana ini disertakan dengan tiga langkah-langkah lain. dan ini dapat membantu untuk menjelaskan mengapa bukti kuantitatif untuk efek belajar variasi wacana sulit untuk menemukan. Pryor & Torrance (1996) memberikan contoh bagaimana pola kebiasaan bisa membantu untuk belajar. (1993) dalam penilaian estetika dalam seni dapat dilihat sebagai respon terhadap permohonan ini. Dalam review mempertanyakan di ruang kelas. argumentasi. mereka menggunakan pertanyaan tingkat tinggi masih jarang. Cosgrove & Schaverien (1996) dan Duschl & Gitomer (1997) semua pekerjaan laporan dengan guru sains untuk mempromosikan wacana tersebut. Dalam nada yang sama. jumlah lintas korelasi (indikator koherensi) dan proporsi tema eksplisit terkait dengan isi pelajaran. locus of control dan tingkat Piaget masing-masing. grading kualitas wacana dengan penjumlahan atas empat kriteria. tentang cara-cara di mana pertanyaan di kelas tertentu telah datang untuk menandakan pola hubungan antara mereka yang terlibat yang telah dibangun dari waktu ke waktu. melemahkan penggunaan konstruktif dari wacana dan meremehkan pengetahuan sosial. Karena kedua ia dan Filer (1995) berpendapat. dari bakat skolastik. dengan pengamatan pekerjaan kelas. Johnson & Johnson (1990) menyajikan meta-analisis menunjukkan bahwa wacana kolaboratif dapat menghasilkan keuntungan yang signifikan dalam belajar. dan berpendapat bahwa inkonsistensi hasil penelitian tentang tingkat kognitif pertanyaan mungkin karena mengabaikan fakta bahwa arti pertanyaan tidak dapat disimpulkan dari permukaan fitur saja. (1989) yang mempelajari 36 guru lebih berbagai mata pelajaran dan lebih nilai 2-12. dan kesulitan yang dilaporkan oleh Radnor (1994) adalah bukti dari tidak memadainya mendirikan praktek. atas dasar yang sama. Newmann (1992) membuat permohonan. Ini termasuk jumlah tema diinterpretasi. studi dokumentasi mereka. peta tersebut. Quicke & Musim Dingin (1994) sukses laporan dalam pekerjaan dengan siswa mencapai rendah di Tahun 8. Kertas Radnor yang menggunakan frase `kualitatif penilaian formatif dalam judulnya. dalam pembicaraan tentang pekerjaan mereka. Carlsen (1991) kontras pendekatan proses-produk dengan paradigma sosial-linguistik. dan wawancara. Dengan kelas sebagai unit analisis. Di semua tingkat interogasi didominasi oleh pertanyaan recall. Pertanyaan Beberapa aspek yang relevan dari interogasi oleh guru telah diperkenalkan di atas. Contoh hasil . Permohonan ini didasarkan pada argumen bahwa metode saat ini. Karya Ross et al. berfungsi untuk memberikan poin yang berguna acuan dalam menjelaskan poin dalam pembahasan dan memungkinkan guru untuk terlibat dalam `penilaian dinamis '. Ia menganalisis wacana tiga guru di empat ruang kelas. ditarik oleh siswa. Roth & Roychoudhury (1994) merekomendasikan penggunaan peta konsep sebagai bantuan dalam diskusi tersebut. makna di balik wacana saja juga tergantung pada konteks. di mana mereka bertujuan untuk mengembangkan kerangka kerja sosial untuk dialog tentang belajar. Rodrigues & Bell (1995). dari fokus dalam hal berdasarkan sehari-hari dan konten menuju diskusi lebih dalam pembelajaran konseptual. seperti yang diungkapkan dalam karya Stiggins dkk. Sebuah contoh yang mencolok dari efek seperti dilaporkan dalam makalah oleh Filer (1993).Bahwa kualitas wacana antara guru dan siswa dapat dianalisis di beberapa tingkat yang berbeda terlihat dari tulisan lengkap mengenai interaksi kelas dan analisis wacana. untuk penilaian dalam studi sosial untuk fokus pada wacana. dengan tiga orang lainnya akuntansi masing-masing untuk di bawah 4%. Kualitas pertanyaan kelas adalah masalah keprihatinan. dan prestasi post-test sebagai variabel dependen. Pengecualian adalah penelitian oleh Clarke (1988) pada dialog kelas di kelas sains. di mana siswa dibatasi untuk menggunakan bahasa lain. 22% dan 14%. penjelasan atau analisis. dan sementara mereka dilatih untuk mengajarkan keterampilan berpikir tingkat tinggi mengajukan pertanyaan yang lebih relevan. sebagai variabel bebas. Perhatian dalam semua tiga kasus adalah untuk membantu siswa untuk bergerak. yang didefinisikan oleh dia sebagai bahasa yang dihasilkan oleh siswa dengan tujuan memberikan narasi. variabel wacana menyumbang 63% dari varians.

keseluruhan adalah bahwa di kelas sains. Sebuah penelitian jenis ini (Pressley et al. dengan cara 1. pendekatan yang sama digunakan dalam pelatihan siswa dengan pemecahan masalah pada komputer diberikan tugas (Raja.?. dan bekerja sama dalam kelas sains sekolah (King & Rosenshine. b. 1991). Pelatihan terakhir difokuskan pada penggunaan. Kesimpulannya adalah bahwa tidak ada bukti bahwa rekan interaksi lebih unggul instruksi langsung dalam generasi pertanyaan." Hasilnya diukur dengan post-test dari masalah tertulis dan tugas komputer baru. yang paling sukses menjadi generasi pertanyaan studi mereka sendiri diikuti oleh upaya untuk menjawab mereka. Kategori lain dari pertanyaan adalah penggunaan pertanyaan tambahan dengan teks. Foos dkk. Bromme & Steinberg (1994) mempelajari strategi kelas guru pemula dalam matematika dan menemukan bahwa mereka cenderung memperlakukan 'pertanyaan sebagai dari peserta didik. dan review membahas berbagai pendekatan yang diadopsi dalam beberapa detail. Dalam pekerjaan dengan siswa sekolah kelas 5. 1992) menetapkan bahwa memerlukan pelajar untuk menulis jawaban dengan penjelasan untuk mengeksplorasi pengetahuan mereka tentang pekerjaan baru tidak meningkatkan pembelajaran. yang lain adalah untuk melakukan perkembangan ini melalui interaksi rekan. Pekerjaan tersebut memiliki dua elemen utama. lain dilatih untuk bertanya dan menjawab pertanyaan dengan mitra siswa..88 untuk 11 orang lain tanpa fitur ini (perbedaan antara tidak signifikan). Sebuah penggunaan yang agak berbeda dari pertanyaan ini adalah untuk menggali dan mengembangkan pengetahuan siswa sebelumnya. 1995). dengan hanya 17% pada penalaran inferensial dan deduktif. 1994) menemukan pelatihan yang yang mendorong siswa untuk menghasilkan pertanyaan pemikiran tertentu dan kemudian berusaha untuk menjawab mereka lebih efektif daripada pelatihan dalam teknik studi lain. 65% dari pertanyaan yang untuk mengingat. yang ia menafsirkan dalam hal strategi yang mendasari pelatihan yang bertujuan untuk mengembangkan peserta didik otonomi dan kontrol peserta didik atas pekerjaan mereka sendiri.. Salah satunya adalah promosi berpikir tingkat tinggi dan self-regulation studi mereka dengan siswa melalui generasi pertanyaan. Sebuah studi oleh Holliday & . Ada sedikit untuk menambah sini untuk studi ditinjau oleh Crooks. ini dapat dilihat sebagai perpanjangan bekerja pada penilaian diri siswa.00 untuk 5 studi dengan timbal balik pertanyaan rekan dan 0. (1994) telah melaporkan keberhasilan serupa di ukuran hasil ketika siswa dilatih untuk mempersiapkan ujian dengan beberapa teknik. Yang terakhir memberikan efek yang lebih besar. Efek yang sangat positif. Kelompok dilatih untuk mengajukan pertanyaan strategis yang lain keluar-melakukan orang lain. Dengan sampel 46 siswa. sedangkan tanggapan dari guru ahli cenderung diarahkan lebih ke `siswa kolektif' siswa. sementara kelompok ketiga juga dilatih dalam mempertanyakan satu sama lain berpasangan tetapi diarahkan untuk menggunakan pertanyaan strategis untuk bimbingan dalam kognitif dan aktivitas meta-kognitif. Hal ini menunjukkan bahwa alasan teoritis untuk pengolahan aktif siswa tidak memberikan panduan spesifik tentang pilihan metode. yang juga menunjukkan bahwa pertanyaan siswa sendiri hasil yang lebih baik daripada pertanyaan tambahan dari guru. 1993) dapat dilihat sebagai bagian dari strategi yang lebih besar untuk mempromosikan penyelidikan berbasis berpikir kritis (Raja. Hasil yang sama. Pola kerja ditulis sama dengan yang untuk pekerjaan oral.1992a. Sebuah review yang komprehensif tentang jenis ini oleh Rosenshine dan rekan (1996) menyajikan meta-analisis studi yang dipilih. Raja (1990. dan bahwa ini mungkin karena membantu pelajar untuk berhubungan baru yang lama dan untuk menghindari penilaian dangkal tentang konten baru. Dengan mahasiswa. pertanyaan generik 'seperti `Bagaimana X dan Y sama?' dan `Apa yang akan terjadi jika . dan seperti yang ditunjukkan di bagian atas diri-penilaian di atas. atau tes pemahaman yang dikembangkan oleh eksperimen. dilaporkan untuk mahasiswa Israel oleh Koch & Shulamith (1991). Beberapa penulis melaporkan pekerjaan difokuskan pada generasi pertanyaan oleh siswa. satu kelompok tidak diberi instruksi tambahan. tetapi ukuran efek tergantung pada apakah ukuran hasil adalah tes standar. Pekerjaan ini.

(1990) untuk seni visual dan kinerja dengan siswa sekunder tua dan oleh Harnett (1993) untuk sejarah di sekolah dasar. efek positif ditemukan oleh Schloss dkk. pascates item asing dan survei kepuasan dengan instruksi. tes kriteria mungkin lebih penting untuk kelompok kontrol dibandingkan dengan kelompok perlakuan. Iverson dkk. Carroll. Hasil menegaskan bahwa pertanyaan yang digunakan tidak berhasil dalam tujuan mereka memfokuskan perhatian siswa pada konsep yang terlibat. Dalam penyelidikan kemudian dengan mahasiswa psikologi.1992. 1992). guru enggan menggunakan tes karena takut menghambat kreativitas. Dalam beberapa bidang studi. Studi lain dengan menggunakan pertanyaan tambahan pemahaman bertujuan untuk meningkatkan konsep belajar dengan pelajaran sains di mana urutan animasi komputer yang digunakan (Holliday & McGuire. Mereka menunjukkan bahwa sifat tes kriteria bisa mendistorsi hasil. Mereka dipilih 20 studi. Para penulis menyusun pertanyaan untuk melayani tujuan umum perancah aktivitas meta-kognitif siswa. Dalam setiap studi tersebut. tetapi bertentangan dengan. 1990. tapi itu di luar itu (di suatu tempat di luar 1 dan 2 tes per minggu) bisa menurun lagi. Bukti serupa dikutip Dempster (1991. meskipun siswa dalam percobaan mengatakan bahwa mereka ingin memiliki tes tersebut di program lain juga. Hasil serupa negatif dilaporkan oleh Strawitz (1989). (1990) bekerja dengan mahasiswa pascasarjana di pelatihan guru untuk pendidikan khusus. (1994) menemukan bahwa penambahan sering tes tidak ditingkatkan mutunya tidak menghasilkan perbaikan yang signifikan dalam kinerja. Di sisi lain. lihat bagian pada proses motivasi Tugas. Gilbert (1996) berusaha untuk mengatasi masalah ini dengan guru sekolah dasar dalam penilaian seni. yang 18 memberi efek positif. Khalaf & Hanna (1992) melakukan review lebih mencari dan tidak setuju dengan Crooks tentang hal ini. kinerja ditingkatkan. Penjahat berspekulasi bahwa tujuan tingkat rendah mungkin mendapat manfaat dari tes yang lebih sering.Benson (1991) dengan kelas biologi SMA menunjukkan bahwa ketika guru diperlukan bekerja pada pertanyaan dari jenis yang akan digunakan dalam pengujian dan menekankan pentingnya mereka. Tujuan dan struktur dari tes yang digunakan tidak dijelaskan dalam kebanyakan studi. dkk. Bangert-tenggelam. pekerjaan tersebut harus dinilai dalam terang hasil dikutip dalam bagian pada Pilihan tugas di atas (dan Otero & Campanario. Siswa kelas delapan ditugaskan untuk kelompok kontrol atau salah satu dari empat kelompok perlakuan. mereka memproduksi efek pada cara di mana orang-orang yang tersisa adalah dipelajari. Meta-analisis mereka dari 40 studi yang relevan menunjukkan bahwa kinerja ditingkatkan dengan sering pengujian dan peningkatan dengan peningkatan frekuensi hingga tingkat tertentu. dan dari ini kelompok mampu merumuskan panduan tentang umpan balik yang sesuai untuk anak-anak sesuai dengan klasifikasi dalam rangka yang pekerjaan mereka itu dinilai sesuai. Perkembangan metode penilaian baru yang sesuai dengan mata pelajaran tertentu juga dijelaskan oleh Adelman et al. 1992). Proyek ini bekerja dengan baik guru yang berpengalaman dan trainee untuk mengembangkan kerangka kerja dan bahasa untuk menilai seni. Namun. Bukti juga menunjukkan bahwa beberapa tes singkat lebih efektif daripada yang lebih sedikit lagi. di bawah). Ketika diberi kuis formatif singkat setelah setiap siswa kuliah dilakukan secara signifikan lebih baik daripada yang mereka lakukan ketika tidak ada kuis diberikan pada tiga langkah pasca-tes item akrab. jika tes sumatif akhir yang mengandung pertanyaan yang sama dengan . Penggunaan Tes Satu studi memberikan bukti bahwa sering pengujian dapat menyebabkan peningkatan pembelajaran telah dikutip di bagian pengalaman Kelas atas (Martinez & Martinez. (1991b) Ulasan bukti efek pengujian kelas sering. tapi itu tujuan tingkat yang lebih tinggi akan mendapat manfaat dari frekuensi yang lebih rendah. 1994) yang menunjukkan bahwa mungkin membantu untuk menggunakan beberapa waktu belajar siswa pada tugas-tugas penting lainnya di tempat waktu yang dihabiskan menangani pertanyaan. dan bahwa di mana mereka digunakan untuk hanya pertama 8 dari 12 urutan digunakan.

keseluruhan yang dipandu oleh fokus pada pembelajaran mendalam daripada dangkal. Ada perbedaan yang signifikan antara kedua kelompok pada kedua kesempatan tes. Efeknya jauh lebih besar untuk berprestasi tinggi daripada media dan berprestasi rendah. Kelas kontrol diberi kuis bulanan normal. tapi mereka semua dengan mahasiswa. Balik reservasi ini terletak masalah yang lebih besar dari apakah atau tidak pengujian adalah melayani fungsi penilaian formatif. sehingga pembelajaran di masalah adalah relatif dangkal di alam. Tan (1992) menggambarkan situasi di lapangan bagi mahasiswa kedokteran tahun pertama di mana ia mengumpulkan bukti bahwa sering tes sumatif yang memiliki pengaruh negatif yang besar pada pembelajaran mereka.000 siswa di 93. Mereka melatih guru untuk memberikan umpan balik tertulis yang berkonsentrasi pada kesalahan spesifik dan strategi yang buruk. maka Situasi dapat berjumlah tidak lebih dari sering pengujian sumatif. Perawatan yang diambil dengan percobaan ini menunjukkan bagaimana penelitian tidak dapat diterima sebagai relevan tanpa pengawasan yang cermat dari desain eksperimen. Ini tidak dapat dijelaskan tanpa studi tentang bagaimana hasil tes diinterpretasikan oleh siswa. kelas di Arab Saudi. (1991a) menggunakan meta-analisis dari 58 percobaan yang diambil dari 40 laporan. mungkin ada distorsi dalam arah sebaliknya. itu maka kualitas umpan balik yang pengaruh terbesar pada kinerja. Kualitas Feedback Kedua sub-bagian sebelumnya mengarah ke titik hampir jelas bahwa kualitas umpan balik yang diberikan adalah fitur kunci dalam setiap prosedur untuk penilaian formatif. dengan saran tentang bagaimana meningkatkan.37. Namun. dan kualitas pertanyaan yang digunakan untuk kedua pengobatan dan tes kriteria. dibahas lebih lanjut dalam bagian berjudul Harapan dan pengaturan sosial. Mereka menyimpulkan bahwa hanya empat dari studi mereka Ulasan bebas dari jenis cacat. dan jika mereka tidak lebih dari indikator dari highstakes akhir tes sumatif. Tes yang disebut hanya untuk keterampilan tingkat rendah dan telah demikian membentuk `kurikulum tersembunyi 'yang menghambat tingkat tinggi pembangunan konseptual dan yang berarti bahwa siswa tidak diajarkan untuk menerapkan teori ke praktek. kelompok ketiga dari guru terlatih ditandai setengah dari kelas mereka dengan umpan balik penuh dan .yang di tes kelas. para penulis ini menggambarkan hasil penyelidikan dengan 2. sementara yang lain diberi kuis dua bulanan. di bawah). Sebuah kelompok kontrol mengikuti praktek normal menandai pekerjaan rumah tanpa komentar. (1995. Setelah tinjauan kritis mereka. Ketika efek ini telah diizinkan untuk. Efek instruksional umpan balik dari tes telah diperiksa oleh Bangert-tenggelam dkk. Jika tes tidak digunakan untuk memberikan umpan balik tentang pembelajaran. dan termasuk tes pada akhir kursus dan tes tertunda tiga bulan kemudian. Pengobatan dan pengendalian kelas didirikan di pasang memiliki guru yang sama untuk dua anggota masing-masing pasangan. Hasil minyak 'ini semua positif dengan ukuran efek rata-rata 0. 1985). Instruksi diprogram dan item penilaian penyelesaian sederhana dikaitkan dengan efek terkecil. Untuk memeriksa apakah efek dari pelatihan umpan balik pada pengajaran mereka dapat menjelaskan hasil apapun. tes yang digunakan yang terdiri hanya dari item pilihan benar-salah atau beberapa. Kekhawatiran yang sama tentang tingkat kognitif pengujian pekerjaan diungkapkan oleh Balai dkk. Umpan balik yang diberikan oleh 'ditulis tanggapan siswa guru pekerjaan rumah dipelajari dalam percobaan dengan lebih dari 500 siswa Venezuela yang melibatkan 18 guru matematika di tiga sekolah (Elawar & Como. Umpan balik yang paling efektif ketika dirancang untuk merangsang koreksi kesalahan melalui pendekatan bijaksana kepada mereka dalam kaitannya dengan pembelajaran asli relevan dengan tugas.3 mendukung kelompok lebih sering diuji. dengan efek ukuran sekitar 0. kelas 10. Efek umpan balik dikurangi jika siswa memiliki akses ke jawaban sebelum umpan balik disampaikan. Kriteria yang ditetapkan oleh tes penyidik yang belum pernah melihat salah satu kuis dibangun dan digunakan oleh guru. atau jika mereka adalah komponen dari skema penilaian berkelanjutan sehingga mereka semua menanggung implikasi berisiko tinggi.

dan asumsi yang menginformasikan interpretasi umpan balik itu. sehingga kriteria yang memandu strategi formatif dapat disesuaikan dengan siswa lintasan dalam belajar. Salah satu syarat untuk pendekatan semacam ini model suara siswa kemajuan dalam pembelajaran materi pelajaran. urutan kriteria harus menyesuaikan diri dengan data normatif untuk menunjukkan harapan yang masuk akal untuk siswa pada usia yang berbeda. Brown & Denvir. instrumen dan interpretasi didasarkan semuanya penting. Namun. Keterkaitan umpan balik kepada asumsi tentang sifat belajar siswa yang dirancang untuk mendorong telah diambil lebih lanjut dalam pekerjaan pada penilaian-kurikulum berbasis oleh Fuchs et al. Pada saat yang sama jelas bahwa asumsi mendasar tentang belajar di mana prosedur. atau sebagai cacat karena salah satu taktik akan berbeda-beda efeknya dengan konteks holistik di mana ia beroperasi. hanya kelompok ketiga yang dihasilkan prestasi siswa yang lebih baik daripada yang pertama. Kesimpulan yang dicapai adalah bahwa guru perlu lebih dari penilaian yang baik instrumenmereka juga membutuhkan bantuan untuk mengembangkan metode untuk menafsirkan dan menanggapi hasil dengan cara formatif. 1993a. orang-orang di ketiga Ulasan keduanya. 1986. Kedua kelompok kedua dan ketiga direvisi program pengajaran mereka lebih sering daripada yang pertama. Hal ini juga muncul bahwa setidaknya beberapa dari rekening yang tidak lengkap dalam bahwa kualitas prosedur atau instrumen yang membangkitkan umpan balik. partisipasi. Dalam lingkup yang sangat berbeda dari belajar. dan yang ketiga yang menggunakan penilaian yang sama bersama-sama dengan sistem pakar. Masters & Evans. Tenenbaum & Goldring (1989) dilakukan meta-analisis dengan 16 studi tentang efek dari 'ditingkatkan instruksi'. penguatan. . Pengobatan juga mengurangi keunggulan awal anak laki-laki lebih anak perempuan dan memiliki dampak positif besar pada sikap terhadap matematika. 1987). Analisis varians dari hasil penelitian menunjukkan efek yang besar terkait dengan pengobatan umpan balik. telah dipelajari untuk kedua matematika sekolah dan sains sekolah (Hitam.setengah lainnya dengan tanda saja.. Ini telah berusaha dengan data untuk ejaan. Paparan bentuk-bentuk peningkatan diproduksi keuntungan dengan ukuran efek rata-rata 0. Perumusan Strategi Sub-bagian di atas dapat dianggap sebagai perawatan dari berbagai komponen dari kit dari bagian-bagian yang dapat dirakit untuk menyusun strategi lengkap. Percobaan menggunakan tiga kelompok guru. Semua diberi pre-test dan salah satu dari tiga bentuk paralel post-test. kebutuhan ini. umpan balik dan koreksi. gersang beberapa bukti bantalan pada cara-cara untuk memenuhi kebutuhan itu. Sebuah diskusi yang lebih komprehensif dari umpan balik akan ditawarkan di bagian bawah dikhususkan untuk topik ini. dan sementara guru di kelompok kedua menanggapi umpan balik dengan menggunakan masalah yang berbeda tanpa mengubah strategi pengajaran. membaca dan matematika oleh Fuchs et al. karena mereka mengeksplorasi situasi yang kompleks dengan memperlakukan satu variabel pada suatu waktu.66. (1991). Studi penelitian dijelaskan dapat dinilai berharga. orang yang tidak menggunakan penilaian yang sistematis. Untuk data tersebut. yang menganggap baik kebutuhan praktis dan implikasi dari data tersebut untuk studi perkembangan kemajuan akademik. pada keterampilan motorik belajar di pelajaran fisik. (1993). yang menyumbang 24% dari varians dalam pencapaian akhir (dengan yang lain 24% terkait dengan prestasi sebelumnya). tidak dapat dinilai. dan mereka juga ditingkatkan waktu siswa pada tugas. kelompok kedua yang digunakan penilaian tersebut. Percobaan mereka dengan siswa matematika menjelajahi kemungkinan pengayaan skema penilaian yang sistematis pengembangan siswa dengan mendirikan sebuah 'sistem pakar' yang guru bisa berkonsultasi untuk memandu perencanaan pembelajaran mereka dalam kaitannya dengan hasil penilaian siswa. hlm 58-61. yang melibatkan penekanan pada isyarat.

perbedaan antara kinerja dan penguasaan perspektif adalah titik awal. Account dari proyek untuk memprovokasi dan guru dukungan dalam membuat perubahan jenis ini (Torrie. dan dalam mengubah pengajaran dan umpan balik mereka untuk melepaskan diri dari asumsi norma-direferensikan dalam mendukung pembelajaran siswa.satu behavioris. Untuk Ames (1992). Tes harus dirancang dalam terang model struktur pengetahuan khusus untuk membantu menentukan kemajuan peserta didik dalam memperoleh struktur tersebut. (1994) analisis Nichols masuk lebih dalam berkonsentrasi pada apa yang ia sebut kognitif penilaian diagnostik. (1992) dieksplorasi faktor yang mempengaruhi validitas tugas penilaian ketika dinilai dari perspektif konstruktivis dan menekankan bahwa ancaman utama bagi validitas adalah sejauh mana siswa dapat membangun makna dari tugas dimaksud oleh mereka yang mengatur mereka. tapi dia kemudian menguraikan tiga ciri utama. Model ini digunakan untuk menganalisis 11 tes instruksional dan mengungkapkan bahwa ada banyak asumsi tentang empat isu-isu ini yang tertanam dalam bahasa tentang evaluasi formatif. tugas yaitu bermakna. hanya informasi yang sangat umum disediakan tentang kualitas yang mendasari pekerjaan yang sedang dipelajari. Lorsbach dkk. Baik dalam akun mereka dan bahwa dari Torrance & Pryor (1995) analisis digambarkan oleh catatan rinci dari pekerjaan satu atau dua guru. Keterlibatan siswa dalam pekerjaan penelitian aktif positif terkait dengan penyediaan kegiatan menantang dan dengan umpan balik yang luas pada pekerjaan mereka dalam kursus. yang akan diambil dalam terang tujuan instruksi. Analisis beruang banyak kesamaan dengan yang Zessoules & Gardner (1991). promosi kemandirian peserta didik dengan memberikan kewenangan untuk pengambilan keputusan mereka sendiri.Beberapa penulis telah menulis tentang gambaran strategis yang lebih besar. dan berpendapat bahwa desain instruksional harus didasarkan pada keputusan eksplisit tentang empat ini. menekankan pengukuran terhadap tujuan. 1989) memunculkan banyak kesulitan yang guru yang dihadapi. Karya ini merupakan upaya ambisius. maka bahasa yang umum diperlukan. (1995) berpendapat bahwa jika literatur tentang penilaian formatif adalah untuk menginformasikan desain instruksional. Mereka diterapkan pemodelan linear hirarkis data yang dikumpulkan dari 12 program biologi SMA. memberikan lebih luas diskusi teoritis. Kedua Ames dan Nichols mencoba lebih ambisius analisis rinci. Di antara hubungan lain yang menggoda keluar adalah temuan bahwa dukungan instruktur yang mengurangi tuntutan saja memperkuat hubungan antara konsep diri dan prestasi. (1993) menonjol karena mereka telah berusaha studi kuantitatif untuk mencakup banyak variabel yang terlibat. teknik apa yang dapat digunakan dan dalam situasi apa ini bisa terjadi. hasil penelitian menunjukkan hubungan positif antara prestasi dan kedua konsep diri mereka dari kemampuan akademik dan kegiatan penelitian mereka. Hal ini jelas bahwa banyak jenis tradisional tes tidak memadai untuk tujuan ini karena mereka tidak mengungkapkan metode yang digunakan oleh mereka diuji. hampir kebutuhan. berfokus pada fitur dari program yang ditempatkan tuntutan pada dan memberi dukungan kepada siswa. Pentingnya mengubah asumsi bahwa guru membuat tentang pembelajaran diakui dalam ulasan ini. Pada tingkat siswa. penulis terakhir. mengembangkan argumen di Torrance (1993). Shohamy (1995) berpendapat bahwa kompleksitas bahasa panggilan untuk disiplin khusus . Namun. sehingga interpretasi umpan balik dapat melayani tujuan membuat kesimpulan tentang mekanisme kognitif siswa. Weston et al. baik dalam membuat penilaian mereka yang berkaitan dengan kriteria pembelajaran. dan referensi telah dibuat untuk beberapa argumen mereka. Demikian pula. Umpan balik seperti juga terkait langsung dengan prestasi tinggi. Hal ini menunjukkan bahwa psikometri klasik telah diarahkan pada penggunaan penilaian untuk memandu seleksi. apa peran dapat diambil. dan evaluasi yang berfokus pada perbaikan individu dan penguasaan. tetapi. kontras dua pendekatan formatif penilaian . untuk penilaian bahasa. dan hubungan baru dengan ilmu kognitif diperlukan jika akan digunakan untuk memandu belajar. Analisis Thomas et al. dan konstruktivis satu sosial mengintegrasikan penilaian ke belajar.yang berpartisipasi. Mereka mengidentifikasi empat komponen . dua terakhir juga terkait dengan satu sama lain.

1992. namun dengan banyak (jika tidak semua) dari sistem pengajaran. Dengan demikian pemilihan tugas. dan jenis umpan balik yang tugas mungkin menghasilkan. ilmuwan kognitif dan ahli subjek diperlukan. setiap siswa bisa belajar apa pun jika mereka belajar cukup lama. 6). 1976 . Untuk alasan ini. Carroll. Jadi. siswa harus terlibat dalam negosiasi catatan disepakati.). 1996). Satu. p. apalagi kontribusinya terhadap global perbaikan dalam pencapaian yang dihasilkan. Jadi self-assessment dilaporkan menjadi fitur penting. sulit. 1990.. Penilaian dan umpan balik juga merupakan fitur penting dari program pembelajaran penguasaan. dibahas lebih rinci di bawah. menggunakan berbasis kelompok pendekatan pengajaran guru-tanggung. 1992. dan dibedakan dari apa yang telah dibahas dalam. 1986) . Broadfoot et al. (1988) menunjukkan bahwa umpan balik dan baik pencatatan merupakan aspek kunci dari efektivitas. Semua diskusi ini menunjukkan kebutuhan untuk sangat jauh perubahan jika evaluasi formatif adalah untuk mewujudkan potensinya. yang melibatkan kolaborasi antara psychometricians. Bagian ini dengan pendekatan yang komprehensif dan strategis mereka. Ia mengusulkan bahwa keberhasilan dalam belajar adalah fungsi semata-mata dari rasio waktu benar-benar menghabiskan belajar dengan waktu yang dibutuhkan untuk belajardengan kata lain. Dalam inisiatif di Inggris untuk mengembangkan 'Record of Achievement' holistik untuk mencakup semua aspek pekerjaan siswa dan kontribusi dalam sekolah. memerlukan teori kognitif yang dapat menginformasikan hubungan antara pemahaman peserta didik dan interaksi mereka dengan tugas-tugas penilaian. Studi Penguasaan Belajar Ketuntasan belajar berasal sebagai implementasi praktis dari teori-teori belajar dari John B. yang dikembangkan oleh Benjamin Bloom. kualitas pengajaran. Ini akan menjadi subjek dari bagian berikutnya. Sistem Strategi umum Penilaian umpan balik yang baik adalah baik secara eksplisit disebutkan atau sangat tersirat dalam laporan dari berbagai studi dan inisiatif di mana umpan balik tersebut adalah salah satu komponen dari strategi yang lebih luas. Sebagian besar penelitian yang dilakukan dalam . misalnya.untuk penilaian bahasa. sistem ini ditinjau hanya sebentar dalam apa yang berikut. dan kemampuan peserta didik untuk memahami ajaran ini (lihat Block. dalam meringkas sebuah penelitian efektivitas sekolah Mortimore et al. Kesimpulan dari analisis ini adalah bahwa usaha yang sangat besar. untuk pemulihan membaca contoh dan Sukses Slavin untuk Semua skema (Slavin dkk. bahkan mengidentifikasi sifat yang tepat dari umpan balik formatif digunakan. tetapi telah tergabung dalam berbagai cara dan kadang-kadang dangkal (Broadfoot. didasarkan pada perspektif teoritis yang jelas tentang apa yang dimaksud dengan 'tahu bahasa'. Waktu yang dihabiskan belajar tergantung baik pada waktu yang diizinkan untuk belajar dan ketekunan pembelajar sementara waktu yang dibutuhkan untuk belajar tergantung pada bakat pelajar. Pendekatan seperti tentu saja akan berinteraksi kuat dengan pedagogi diadopsi. Ditingkatkan memperhatikan diagnosis dan remediasi adalah fitur dari banyak skema lain. disebut Learning untuk Penguasaan (LFM) dan yang lain adalah individu berbasis. Dua pendekatan utama untuk penguasaan pembelajaran yang dikembangkan pada tahun 1960. dan mungkin harus marah apriori posisi teoritis dengan kesiapan untuk beradaptasi dan berkembang dengan pendekatan induktif sebagai umpan balik formatif menantang alasan pekerjaan (Fuchs & Fuchs. dalam terang yang kegiatan penilaian dapat dirancang dan diinterpretasikan. & Bums. Personalized Sistem-siswa yang serba Keller dari Instruksi (PSI). Beberapa perubahan besar-besaran di pedagogi telah berusaha untuk memenuhi target tersebut.

Hal ini berguna untuk memecah kursus atau subjek menjadi unit-unit kecil belajar dan untuk menguji pada akhir setiap unit. Guru harus memberikan umpan balik tentang kesalahan tertentu setiap pelajar dan kesulitan setelah setiap tes. Guru harus menemukan cara untuk mengubah waktu beberapa siswa telah tersedia untuk belajar. Tiga ulasan utama dari penelitian efektivitas pembelajaran penguasaan menggunakan teknik 'meta-analisis' untuk menggabungkan hasil dari berbagai studi yang berbeda. Tujuan instruksional khusus yang berhubungan dengan tugas belajar harus dirumuskan. Mereka menemukan ukuran rata-rata efek 0. hal ini tidak akan dicapai dengan menargetkan mengajar sumber daya untuk siswa dari bakat yang lebih rendah. Mungkin menguntungkan untuk memberikan kesempatan belajar alternatif. dan yang telah dilakukan pada PSI sebagian besar terbatas untuk melanjutkan dan pendidikan tinggi. ulasan Block & Luka bakar (1976) dan Guskey & Gates (1986) memberikan 83 langkah (dari 35 studi) dari pengaruh penguasaan belajar terhadap prestasi umum. yang setara dengan meningkatkan pencapaian 'rata-rata' mahasiswa itu dari 20%. bukan Model Keller. Konsekuensi utama dari model LFM Bloom adalah bahwa mahasiswa yang berbeda bakat akan berbeda dalam prestasi mereka kecuali mereka yang kurang bakat yang diberikan baik kesempatan yang lebih besar untuk belajar atau mengajar kualitas yang lebih baik. semua menggunakan 'Belajar Untuk Penguasaan' pendekatan (LFM). tetapi dengan meningkatkan kualitas pengajaran untuk semua siswa. asumsi yang mendasari adalah bahwa siswa dengan bakat yang lebih tinggi lebih mampu memahami instruksi lengkap atau miskin (Milkent & Roth. Namun tidak jelas apakah ini karena siswa yang lebih tua lebih 'diatur dalam cara mereka' dan karena itu memiliki lebih banyak kesulitan dalam mengubah cara mereka bekerja dengan yang dibutuhkan untuk penguasaan pembelajaran.82. Untuk sebagian besar pendukung penguasaan pembelajaran. Oleh karena itu. (1990) mencakup dekade berikutnya. . 1989). Ketika usia siswa yang terlibat diperiksa. Di antara mereka. atau karena penguasaan pembelajaran disesuaikan lebih mudah dalam kurikulum sekolah dasar dan pedagogi. dan salah satu efek rata terbesar yang pernah dilaporkan untuk strategi mengajar (Kulik & Kulik. tampak seolah-olah penguasaan pembelajaran kurang efektif bagi siswa yang lebih tua. 1989) . Upaya mahasiswa meningkat ketika kelompok-kelompok kecil dari dua atau tiga siswa bertemu secara teratur selama satu jam untuk meninjau hasil tes mereka dan untuk membantu satu sama lain mengatasi kesulitan diidentifikasi dengan cara tes. meskipun prinsip-prinsip penguasaan pembelajaran mencakup semua aspek belajar dan mengajar. Review Block & Bums (1976) meliputi pekerjaan yang dilakukan pada paruh pertama tahun 1970-an sementara Guskey & Gates (1986) dan Kulik et al. Elemen-elemen kunci dalam strategi ini. menurut McNeil (1969) adalah: Pelajar harus memahami sifat dari tugas yang harus dipelajari dan prosedur yang harus diikuti dalam belajar itu.penguasaan pembelajaran telah berpusat pada Bloom. penilaian formatif efektif adalah komponen kunci dari efektif belajar penguasaan.

Efek ukuran ditemukan lebih kecil dari yang ditemukan oleh Block & Bums dan Guskey & Gates-tidak mengherankan mengingat representasi yang lebih besar dari studi dengan siswa yang lebih tua. dan memang. Dari jumlah tersebut. ia mengkritik meta-analisis sebagai terlalu kasar. (1990) menemukan bahwa efek ukuran untuk penguasaan belajar yang diukur dengan tes formatif (biasanya sekitar 1. lebih tinggi. 17 studi berbasis sekolah semua digunakan LFM.harus itu tes guru-diproduksi atau tes standar? .17) lebih besar dari tes sumatif untuk (sekitar 0. dan tampaknya juga mengurangi tingkat penyelesaian dalam kursus perguruan tinggi. 1987). Lainnya. sementara Guskey & Gates (1986) juga menemukan efek ukuran rendah untuk ilmu pengetahuan. sosiologi) yang lebih konsisten. ia menunjukkan bahwa hampir semua efek ukuran besar telah ditemukan pada tes guru-siap. juga menemukan bahwa pendekatan PSI sendiri mondar-mandir cenderung memiliki efek ukuran yang lebih kecil dibandingkan dengan pendekatan LFM guru serba. tapi itu lebih efektif bagi guru yang kurang berpengalaman. Oleh karena itu inti dari perselisihan ini adalah ukuran dari 'penguasaan' dari domain . karena cara yang dihasilkan dari semua studi penelitian yang memenuhi kriteria inklusi yang rata-rata. Dengan kata lain. memandang 108 studi yang dinilai memenuhi kriteria mereka untuk dimasukkan dalam meta-analisis. Hal ini didukung oleh Kulik et al. telah menemukan tidak ada bukti untuk mendukung 'penurunan variabilitas hipotesis'.6 untuk tes mingguan dan 0. meskipun orang lain. para guru fokus sempit pada konten yang akan diuji. Sejajar dengan masalah apakah penguasaan pembelajaran lebih efektif bagi siswa yang lebih rendah-mencapai adalah bahwa apakah itu sama efektif untuk semua guru.Ulasan ini juga mempertimbangkan apakah penguasaan pembelajaran lebih efektif dalam beberapa mata pelajaran dari yang lain. sementara hasil untuk matematika. Tiga ulasan juga menemukan bahwa program penguasaanpembelajaran yang lebih efektif bagi siswa rendah mencapai. Block & Luka bakar (1976) menemukan bahwa hasil ilmu pengetahuan (dan menurut beberapa penulis. Meskipun banyak dari temuan setuju dengan meta-analisis ulasan yang dijelaskan di atas. Hal ini menunjukkan bahwa efektivitas pembelajaran penguasaan mungkin bergantung pada 'kurikulum-embeddedness' dari ukuran hasil.hanya dua dari studi yang terdapat hasil apapun dari siswa muda dari 11 tahun. terutama Robert Slavin. (1991b) memperkirakan bahwa pengujian sekali setiap tiga minggu menunjukkan-efek ukuran 0. meningkat menjadi sekitar 0. Martinez & Martinez (1992) melihat efek dari pengujian diulang dalam kursus sarjana matematika remedial dan menemukan bahwa sering 'penguasaan' pengujian efektif dalam meningkatkan prestasi. Kulik et al. efek yang dihasilkan (baik sadar atau tidak sadar) dengan 'mengajar untuk menguji'. Dengan demikian tidak ada konsensus yang jelas muncul dari penelitian tentang efektivitas relatif dari program pembelajaran penguasaan dalam mata pelajaran yang berbeda.5 lebih tidak ada pengujian.75 untuk tes dua kali seminggu. tetapi lebih rendah dari untuk mata pelajaran lainnya. Namun. dan keduanya jauh lebih rendah daripada yang ditemukan untuk seni bahasa dan ilmu sosial. rata-rata. di mana penguasaan penelitian hasil diukur dengan menggunakan tes guru-diproduksi belajar. meskipun ini juga miring terhadap siswa yang lebih tua . Slavin (1987) berpendapat bahwa ini adalah karena. seperti Livingstone & Gentile (1996). daripada standar. 72 menggunakan pendekatan PSI Keller dan 19 menggunakan pendekatan LFM Bloom. melampirkan lebih (tentu subjektif) berat untuk studi yang dirancang dengan baik dan dilakukan. Pendekatan sendiri adalah dengan menggunakan 'terbaik-bukti' sintesis (Slavin. 1990 review oleh Kulik et al. Namun. tetapi jauh kurang konsisten. ini adalah sebanding dengan efek ukuran untuk matematika. 91 dilakukan dengan siswa lebih dari 18 tahun. Berdasarkan metaanalisis dari 40 studi. Dalam ulasannya sendiri penelitian tentang penguasaan pembelajaran. telah mempertanyakan apakah penguasaan pembelajaran efektif sama sekali. Bangert & tenggelam dkk. sehingga cenderung (sebagai awalnya ditujukan) untuk mengurangi berbagai prestasi dalam kelompok.6). efek ukuran untuk penguasaan pembelajaran diukur oleh tes standar yang mendekati nol.

memberi pelatihan tambahan yang diperlukan. salah satu kritik disuarakan oleh pengulas dikutip di atas adalah bahwa terlalu sering tidak mungkin untuk membangun dari laporan penelitian yang menampilkan pembelajaran penguasaan dilaksanakan dalam penelitian yang dilaporkan. Hogan & Pressley.. Di sisi lain.. (1996) sekelompok siswa kelas dua rendah mencapai diberi tahun `strategi transaksional instruksi '(TSI). bahwa umpan balik tersebut (atau setidaknya dimaksudkan untuk menjadi) diagnostik. lebih efektif dalam program guru serba daripada di program sendiri mondarmandir. 1997). 1988) . Setidaknya ada lima aspek yang khas penguasaan program pembelajaran `'yang relevan dengan tujuan dari tinjauan ini: bahwa siswa diberikan umpan balik. literatur memberikan sangat sedikit bukti untuk yang aspek program pembelajaran penguasaan efektif. sementara sebagian besar penelitian berkonsentrasi pada efek penguasaan belajar pada siswa. penjelasan dari efek bisa yang mempersiapkan mengajar untuk penguasaan memberikan pengembangan profesional bagi guru (Whiting et al. 1995). dalam sebuah studi oleh Brown et al. program tanpa formal `penguasaan 'pengujian. bahwa umpan balik tersebut diberikan dengan cepat.Relevansi Mastery Learning Satu-satunya pesan yang jelas muncul dari penguasaan literatur belajar adalah bahwa pembelajaran penguasaan tampaknya efektif dalam meningkatkan nilai siswa pada tes gurudiproduksi. Kulik & Kulik (1987) berpendapat bahwa pengujian penguasaan adalah komponen penting dalam keberhasilan pembelajaran penguasaan. Sebagai contoh. Penilaian Driven Model Account telah diberikan pada bagian pengalaman Kelas dari pengenalan sistem yang lengkap perencanaan dan pengukuran untuk anak-anak TK. dan mendorong siswa untuk menjelaskan satu sama lain bagaimana mereka menggunakan strategi. sementara menetapkan bahwa dalam keadaan tertentu. Misalnya. bahwa siswa diberi kesempatan untuk berdiskusi dengan rekan-rekan mereka bagaimana untuk memperbaiki setiap kelemahan. Memang. dan bahwa kelalaian yang menyebabkan penurunan substansial dalam efektivitas program ini. tetapi dengan banyak fitur lain dari` penguasaan' program dapat menunjukkan efek yang signifikan. apalagi yang efektif (Guskey & Pigott. Sebagai contoh. 1993. tidak jelas bahwa semua ini diperlukan untuk mencapai keuntungan diklaim untuk belajar penguasaan. Beda lagi adalah pendekatan mana masalah yang bekerja pada . di mana inovasi grosir tampaknya memiliki penilaian formatif sebagai komponen utama. Namun. di mana guru menjelaskan dan strategi model. Namun. kelompok ini mengungguli dengan selisih yang cukup kelompok serupa yang diajarkan oleh guru sangat dihormati menggunakan metode yang lebih tradisional (ukuran efek yang tepat tidak diberikan. Pada akhir tahun. dan lebih efektif untuk muda siswa. 1991). tetapi mereka berkisar antara 1 dan 2 standar deviasi). sehingga tampaknya berlaku untuk atribut keberhasilan dilaporkan bahwa komponen (Bergan et al. Pendekatan grosir lain adalah dengan mereformasi wacana melalui penerapan konsep scaffolding (Day & Cordon. bahwa siswa diberikan umpan balik tentang prestasi mereka saat ini terhadap beberapa tingkat yang diharapkan dari pencapaian (yaitu 'tingkat `penguasaan). penguasaan pembelajaran efektif dalam meningkatkan prestasi.

Sebuah presisi lanjut dianggap penting oleh dua penulis adalah untuk membedakan CBA dari penguasaan belajar (Deno. Mereka melihat ketuntasan belajar sebagai mengharuskan peserta didik mengikuti urutan keterampilan tertentu langkah demi langkah. Shinn tidak membuat perbedaan yang tajam antara CBA dan konsep terkait pengukuranKurikulum berbasis (CBM). dengan kurang penekanan memperlakukan keterampilan diskrit dalam isolasi. Deno. tetapi bahwa lokasi ini juga harus diinformasikan oleh data yang norma tentang kemajuan orang lain bekerja dengan kurikulum yang sama. Fokus perhatian adalah pembelajar individu dan tindakan perbaikan selaras secara individual. dan juga menganggap judul ini istilah `Pengukuran 'sebagai mencerminkan pentingnya dalam strategi berkaitan langkah-langkah untuk skala kuantitatif didirikan. Ada juga beberapa ketidaksepakatan mengenai apakah atau tidak CBA dapat digambarkan sebagai perilaku pendekatan `'. Tujuan utama untuk penilaian adalah tujuan formatif. 1984. 1993). namun metode-metode dan prinsip-prinsip dapat diterapkan tepat di seberang spektrum pendidikan. -Kurikulum berbasis penilaian (CBA) merupakan pengembangan yang diperluas di akhir 1980an. dan untuk menunjukkan kasus kebutuhan khusus. 1988). misalnya. 1993). tetapi yang lain bersikeras perbedaan ini (Salvia & Hughes. 1990. 1993) menetapkan fitur utama dari CBA sebagai berikut: Latihan penilaian harus setia mencerminkan tujuan pembelajaran utama dan harus dirancang untuk membangkitkan bukti tentang kebutuhan belajar. Bukti penelitian tentang CBM ditinjau oleh Fuchs (1993). Salvia & Ysseldyke. melihat CBM sebagai sub-set CBA berkaitan dengan langkah-langkah khusus dan prosedur difokuskan pada keterampilan dasar untuk pekerjaan diagnostik guru pendidikan khusus.hasil ketetapan ditangani dengan membangun bekerja pada modul tertentu atau topik sedemikian rupa bahwa ide dasar telah ditutupi oleh sekitar dua-pertiga dari jalan melalui kursus. sehingga dalam waktu dibedakan pekerjaan yang tersisa dapat melanjutkan sesuai dengan kebutuhan siswa yang berbeda (Black & Dockrell. Baginya. 1991. pengaturan tujuan pembelajaran eksplisit adalah ciri khas dari CBM. Dua sistem didefinisikan lebih longgar adalah mereka digambarkan sebagai `-kurikulum berbasis penilaian 'dan mereka digambarkan sebagai portofolio`' sistem. dan satu artikel di koleksi yang (Shinn & Baik 111.dipandang sebagai memastikan bahwa keputusan instruksional diambil atas dasar bukti penilaian dibenarkan.untuk mengikuti kemajuan masing-masing murid pada umumnya. Ulasan berguna literatur yang dapat ditemukan dalam koleksi diedit oleh Kramer (1993). yang kendala-kendala yang belajar untuk mengikuti jalan tertentu. Deno. Informasi dari penilaian harus berfungsi untuk mencari pencapaian individu dalam kaitannya dengan kriteria untuk belajar. Tindal. ditetapkan pada awal dan tidak kemudian diubah. sedangkan CBA jauh lebih luas dan longgar sehingga memungkinkan bagi peserta didik untuk mengikuti berbagai rute untuk belajar. Percobaan juga telah dibandingkan mereka yang bekerja untuk tujuan statis. dengan mereka yang bekerja untuk tujuan . 1993. Bukti penilaian ditinjau pada tahap ini. Dwight. Bukti penelitian adalah bahwa siswa mencapai tingkat yang lebih tinggi dari pencapaian jika tujuan pembelajaran yang ambisius untuk mereka. 1993. Fokus dari banyak penelitian telah di pendidikan tahun-tahun awal dan identifikasi siswa dengan kebutuhan pendidikan khusus. Fuchs. Validitas adalah yang terpenting . Penilaian harus sering sehingga lintasan belajar dari waktu ke waktu dapat ditelusuri: gradien keberhasilan belajar adalah indikator kunci .

menunjukkan bahwa praktek membantu siswa untuk merefleksikan pekerjaan mereka telah membuat guru lebih reflektif untuk diri mereka sendiri. Pendekatan dinamis mengarah ke prestasi yang lebih baik. untuk membangun keunggulan pembelajaran. Apa mungkin khas adalah desakan pada desain uji tajam terfokus. Calfee & Perfumo (1996b) laporan penelitian dengan guru dalam pengalaman mereka menggunakan portofolio. Mills (1996) memberikan penjelasan tentang asal-usul inovasi. dan pada penggunaan sering tes untuk memberikan grafik kinerja terhadap waktu sebagai instrumen diagnostik kunci. berbicara tentang respon siswa `Apa yang mencolok adalah kemampuan mereka untuk merefleksikan pekerjaan mereka sendiri dalam kaitannya dengan serangkaian standar diinternalisasi -. proyek.. Ada literatur yang terkait dengan gerakan portofolio di Amerika Serikat. Lainnya (Herman et al. oleh Collins (1992). pengujian belajar sekolah. Keterlibatan mahasiswa dalam meninjau dan memilih dipandang sebagai pusat . hal. Portofolio Gerakan portofolio lebih erat terkait dengan upaya untuk mengubah dampak berisiko tinggi. menulis tentang berbeda. dalam koleksi diedit dari Belanoff & Dickson (1991) dan-untuk penilaian tulisan . dengan kriteria yang masing-masing dimensi mencerminkan aspek pembelajaran yang dapat dipahami oleh siswa dan yang mencerminkan aspek penting dari pembelajaran. Namun. dan bukti bahwa guru percaya perubahan pekerjaan cara-cara di mana mereka mengajar dan meningkatkan harapan mereka untuk siswa mereka. nasional. Namun. dalam analisis yang lebih halus dari konsep refleksi sebagai pembelajaran.oleh Calfee & Perfumo (1996a). Daro (1996) menjelaskan pendekatan scoring berdasarkan pendekatan multi-dimensi. sementara Pengadilan & McInerney (1993). ada sedikit dengan cara bukti penelitian. Hasil penelitian menunjukkan kesenjangan mengganggu antara . 1996. Perhatian telah difokuskan lebih pada keandalan scoring guru portofolio karena motif untuk membuat mereka memenuhi keprihatinan untuk akuntabilitas. baik untuk kekuatan portofolio untuk memusatkan perhatian siswa pada upaya pembelajaran mereka sendiri dan prestasi. 1996. menjelaskan pekerjaan sebagai upaya di Vermont untuk memenuhi tuntutan akuntabilitas sementara menghindari tekanan dari tes standar.sebagai Mills mengatakan `Menemukan cara untuk mempromosikan jenis refleksi pada skala luas telah berada di jantung dari penilaian Vermont dari awal '(Mills. 1996) menekankan bahwa itu adalah berharga bagi siswa untuk memahami kriteria penilaian untuk diri mereka sendiri. 192) dan. ia mengidentifikasi masalah sehingga `Tapi itu tidak harus mengikuti bahwa hal itu akan praktis untuk membawa standar nasional ke dalam fokus siswa diri menilai dan guru mereka (Davo. Daro (1996) melaporkan pada antusiasme para inovator '. sementara Yancey (1996). dan untuk melayani tujuan sumatif serta formatif tersebut. dalam terang kemajuan diukur. 1996. 1996). Calfee & Freedman (1996) melihat portofolio sebagai menawarkan teknologi untuk membantu slogan `berpusat pada siswa belajar 'untuk menjadi kenyataan. Portofolio adalah kumpulan karya siswa. Demikian pula. p 194 ). 241). Banyak yang ditinjau. yang melampaui laporan dari guru. dan bahwa banyak dari fitur-fiturnya akan menjadi penting dalam penggabungan penilaian formatif menjadi program pembelajaran. sering standar. menetapkan beberapa isu dalam pendidikan tinggi. biasanya dibangun oleh seleksi dari corpus lebih besar dan sering disajikan dengan sepotong reflektif yang ditulis oleh siswa untuk membenarkan seleksi. p . Deskripsi oleh Shinn dari apa yang disebutnya paradigma CBA membuat jelas bahwa ini adalah pendekatan penilaian formatif. biasanya up-dinilai dengan perubahan yang sesuai dalam instruksi. standar yang mereka berbagi dengan banyak orang lain '(Mills. yang diubah.yang dinamis. ketegangan antara tujuan bermain keluar baik dalam pemilihan dan dalam scoring tugas (Benoit & Yang. Dalam hal ini.

atau kemungkinan positif untuk mempromosikan sebuah revolusi besar dalam belajar. konten nosional dan kemampuan kognitif. 1988. `Me Tujuan keseluruhan adalah untuk membantu guru memberikan umpan balik pribadi formatif dalam keterbatasan ruang kelas normal. Butler. Uji coba di lima kelas menunjukkan bahwa dibandingkan dengan satu set kontrol lima ruang kelas yang lebih. atau menjadi terlalu standar . telah dijelaskan oleh Ratcliffe (1992). Pengadilan & McInerney (1993) juga melaporkan upaya untuk mengevaluasi kursus menulis dengan mahasiswa yang juga tampaknya menunjukkan hanya keuntungan kecil. Dalam bahwa mereka menggantikan pemeriksaan terminal dengan tes sering dalam masing-masing sekolah. tes prestasi adalah tes pilihan ganda 24-item. Dalam bab 3 buku mereka. fitur penting telah penyediaan bank sentral dari pertanyaan penilaian dari mana guru dapat menarik sesuai dengan kebutuhan khusus mereka . Lock & Ferriman. Lock & Wheatley. mereka mempengaruhi cara di mana penilaian dioperasikan di dalam sekolah dan memberikan skenario khas untuk bekerja keluar ketegangan formatif-sumatif. Kesimpulan mereka adalah bahwa nasib masa depan gerakan tergantung pada keseimbangan. dilakukan di sekolah-sekolah tapi dimoderatori (yaitu diperiksa untuk konsistensi standar antara sekolah) oleh otoritas memeriksa. Swain. Ferriman & Lock. dan meningkatkan pentingnya komponen kursus yang dinilai sebagai kontributor untuk hasil sumatif. salah satu masalah yang menonjol adalah kesulitan yang guru dan pengembang bertemu dalam mencoba untuk membangun pendekatan kriteria-referenced untuk penilaian. tapi menunjukkan bahwa mereka menilai kualitas tulisan holistik yang penilaian dan pembelajaran sebelumnya pengalaman siswa mereka telah diabaikan. 1990) ada tidak muncul untuk menjadi setiap penelitian yang dipublikasikan yang bisa mengidentifikasi perkembangan tertentu dari fungsi formatif dalam skema ini. Dalam semua account tersebut. baik antara tiga kemungkinan negatif . karena mereka menunjukkan bahwa banyak guru yang membayar sedikit perhatian untuk standar eksternal dan memproduksi sedikit bukti dari setiap keterlibatan siswa dalam memahami mengapa mereka melakukan pekerjaan ini. yang mungkin tidak mencerminkan beberapa keuntungan dari pendekatan portofolio. Di Kanada. tetapi kemudian mengalami masalah dalam kualitas dan norma-referensi dari penilaian berbasis sekolah. 1986.tetapi ini umumnya telah dirancang dengan kebutuhan sumatif dalam pikiran. Masalah mengembangkan penilaian kriteria-referenced dilanda reformasi radikal jauh lebih di Queensland (Withers. (1993) menjelaskan pengaturan dari bank item diagnostik diselenggarakan dalam skema tiga dimensi: konteks diagnostik. mereka menggunakan bank item memiliki keuntungan unggul. berarti ukuran efek yang 0.7. Artikel Butler 's menceritakan perkembangan pendekatan kriteria-referenced. barang yang berasal dari studi tentang kesalahan umum sehingga mereka bisa memberikan dasar untuk diagnosis kausal . Negara bagian Australia ini dihapuskan pemeriksaan eksternal untuk sekolah menengah pada tahun 1971. Pemeriksaan sumatif Model Skema Graded Assessment di Inggris yang ketentuan komprehensif yang dirancang untuk menggantikan pemeriksaan terminal untuk sertifikat publik dengan serangkaian penilaian dinilai.anarki. (1997) menggambarkan sebuah eksperimen di kursus aljabar pengantar untuk mahasiswa yang tidak menghasilkan perbedaan yang signifikan dalam pencapaian antara kelompok yang terlibat dalam produksi portofolio dan kelompok kontrol.retorika umum dan praktek yang sebenarnya. Dalam beberapa skema seperti itu. Iredale. Slater et al. 1995). hilangnya. Sebuah skema yang sama dalam ilmu. Sementara rekening umum skema ini telah dipublikasikan (Pennycuick & Murphy. Namun. 1988. dan pada saat yang sama guru melaporkan bahwa kelompok portofolio akhirnya mengajukan pertanyaan tentang aplikasi dunia nyata dan telah menyebabkan membahas fenomena yang lebih kompleks dan menarik daripada kelompok kontrol. 1990. 1987. dengan guru harus mempelajari keterampilan dan negara harus mengembangkan sistem untuk . 1989. 1989. di bahwa fungsi sumatif itu terkait dengan sering penilaian selama masa diperpanjang dalam pekerjaan kelas. Dassa dkk.

Karena sentralitas dalam penilaian formatif. Namun. Sifat Feedback Awalnya. mekanisme untuk membandingkan dua tingkat. penting untuk mengeksplorasi dan memperjelas konsep. meskipun perlu dicatat bahwa persyaratan untuk agen eksternal tidak termasuk selfregulation. Penekanan lebih besar pada penilaian tersebar lebih dari dua tahun dalam pekerjaan kelas. Namun.memastikan komparabilitas interpretasi standar kriteria. pada umpan balik kepada siswa tentang hasil penilaian berturut-turut. Data pada tingkat referensi atribut itu. itu disebut umpan balik negatif. Di mana efek ini adalah untuk mengurangi kesenjangan. kita dapat mengidentifikasi empat elemen yang membentuk sistem umpan balik: Data pada tingkat yang sebenarnya dari beberapa atribut yang dapat diukur. umpan balik digunakan untuk menggambarkan pengaturan di sirkuit listrik dan elektronik dimana informasi tentang tingkat sebuah `keluaran 'sinyal (khusus kesenjangan antara tingkat sebenarnya dari sinyal output dan beberapa didefinisikan referensi`' tingkat) diumpankan kembali ke dalam satu input sistem. dan menghasilkan informasi tentang kesenjangan antara dua tingkat. Mereka mendefinisikan `umpan balik intervensi 'sebagai` tindakan yang diambil oleh agen eksternal untuk memberikan informasi mengenai beberapa aspek kinerja seseorang tugas'. telah diperlukan dalam perkembangan ini. dampak dari pada peran formatif penilaian masih harus diteliti. mekanisme dimana informasi tersebut dapat digunakan untuk mengubah kesenjangan. dan bagian pada kualitas umpan balik secara eksplisit peduli dengan fungsi umpan balik. Sebaliknya. itu disebut `umpan balik positif '. Namun. 1996 dan bagian yang berjudul Apakah implikasi bagi kebijakan? Bawah ). di mana tekanan berisiko tinggi yang baik diabaikan. 4). dan di mana efek umpan balik ini adalah untuk meningkatkan kesenjangan. Umpan balik istilah telah sering terjadi di akun sejauh ini. Untuk Kluger & DeNisi (1996) hanya yang pertama ini diperlukan untuk umpan balik untuk ada. Dalam menerapkan model ini ke ilmu perilaku. Ini akan dilakukan di bagian ini sebagai prolog yang diperlukan untuk review lebih lengkap dari penilaian formatif di bagian akhir berikutnya. dan pada produksi portofolio siswa sebagai bukti untuk prosedur moderasi. ada ada sedikit bukti bahwa hubungan formatif-sumatif telah dipikirkan dalam desain mereka. Umpan Balik Dua konsep penilaian formatif dan umpan balik tumpang tindih kuat. dan bukti substansial sedikit tentang bagaimana ia telah bekerja dalam praktek (tapi lihat Rowe & Hill. bagian yang memiliki fokus yang terbatas. . Ramaprasad (1983) mendefinisikan tanggapan sebagai berikut: Umpan balik informasi tentang kesenjangan antara tingkat aktual dan tingkat referensi dari parameter sistem yang digunakan untuk mengubah kesenjangan dalam beberapa cara (p. atau diterima di prestasi yang pada langkah-langkah yang ada digunakan (dilematis) sebagai kriteria keberhasilan. dan penggunaan umumnya telah beragam dan tidak tunduk pada konsistensi yang ketat. Sistem yang dijelaskan dalam kategori ini harus memang memiliki implikasi untuk penilaian formatif dan bisa mendekati masalah hubungan formatif-sumatif dari arah yang berbeda dari kebanyakan studi lainnya.

yang merupakan respon khas ketika tujuan yang jelas. dan mengembangkan model teoritis yang menyumbang proporsi yang signifikan dari variabilitas dalam efek ukuran ditemukan dalam literatur. efek substantif. Untuk keperluan ulasan ini. bagi mereka yang perhatian langsung ke diri yang dalam bentuk ekstrim oleh stres hanya pada imbalan dan hukuman.dan secara khusus mensyaratkan bahwa untuk umpan balik ada. menghasilkan 607 efek ukuran. berdasarkan penelitian kelas. mereka diperiksa kemungkinan `moderator 'dari efektivitas intervensi umpan balik . respon adalah mengubah standar. mulai dari orang-orang yang mengarahkan perhatian pada tugas dan metode pembelajaran. Mereka mulai dengan mencatat bahwa disajikan dengan `gap 'antara tingkat aktual dan referensi dari beberapa atribut (apa Kluger & DeNisi 1996. baik negatif maupun positif. dan sekitar dua dari setiap lima efek negatif. daripada mengeluarkan bukti penting. Fakta bahwa begitu banyak laporan penelitian menemukan bahwa umpan balik dapat memiliki efek negatif pada kinerja menunjukkan bahwa ini bukan hanya artefak dari desain miskin.yang faktor yang mempengaruhi. Jika informasi tidak benar-benar digunakan dalam mengubah kesenjangan. yang melibatkan tugas fokus. kami telah mengambil pandangan yang luas tentang apa yang merupakan umpan balik. Sepertiga. dan detail-detail di mana tidak cukup diberi untuk memperkirakan ukuran efek. daripada meninggalkannya sama sekali. di mana kinerja hanya dibahas daripada diukur. maka tidak ada tanggapan. Tanggapan keempat celah umpan balik-standar hanya untuk menyangkal itu ada. jika berhasil. yang melibatkan diri. Tunstall & Gipps (1996b) diatur berbagai jenis mereka di spektrum. ada empat kelas yang luas dari tindakan. Yang pertama adalah untuk mencoba untuk mencapai standar atau tingkat referensi. proses tugas-motivasi. Tipe kedua adalah respon untuk meninggalkan standar sepenuhnya. dan sebaliknya. Para penulis ini tidak belajar efek pada pembelajaran. Mereka mengidentifikasi tiga tingkat proses terkait yang terlibat dalam regulasi kinerja tugas: proses meta-tugas. Untuk menjelaskan variabilitas dalam efek ukuran dilaporkan. memilih untuk meningkatkan standar. dan melibatkan 12. istilah` tanggapan-standar perbedaan'). dan tugas proses yang melibatkan rincian tugas fokus belajar. namun studi tersebut oleh orang lain (misalnya Siero & van . pada efektivitas umpan balik. Setelah tidak termasuk yang tanpa kontrol yang memadai. Kluger & DeNisi (1996) menemukan dukungan empiris untuk masing-masing kategori respon.652 peserta. Mereka meninjau lebih dari 3000 laporan efek umpan balik pada kinerja (2500 kertas dan 500 laporan teknis). di mana individu memiliki komitmen yang tinggi untuk mencapai tujuan dan di mana keyakinan individu dalam keberhasilan akhirnya tinggi. atau tidak dapat diandalkan dalam langkah-langkah. dan kurang ekstrim. yang sangat umum di mana keyakinan individu dalam keberhasilan akhirnya rendah (yang mengarah ke 'ketidakberdayaan yang dipelajari' . terutama kemungkinan di mana mereka tidak dapat atau tidak ingin meninggalkannya. 1986). Proses meta-tugas Dalam mengusulkan tipologi umpan balik guru.Dweck. tetapi standar deviasi dari ukuran efek hampir 1. mereka yang tersisa dengan 131 laporan. Salah satu ulasan yang paling penting dari efektivitas umpan balik dilakukan oleh Kluger & DeNisi (1996).4 (setara dengan meningkatkan pencapaian ratarata siswa untuk persentil ke-65). di mana kurang dari 10 peserta termasuk dalam studi. informasi tentang kesenjangan harus digunakan untuk mengubah kesenjangan. tapi nyata. mereka di mana intervensi umpan balik yang bingung dengan efek lainnya. Mereka menemukan efek ukuran rata-rata 0. Individu dapat menurunkan standar. mungkin.

6). sementara peraturan introjected 'mengacu pada perilaku yang dimotivasi oleh prods internal dan tekanan seperti harga diri yang relevan kontinjensi' (hal. daftar kelemahan dan rencana kerja untuk instruksi lebih lanjut. menceritakan tentang kesalahan mereka dan diberi kesempatan untuk memperbaikinya. Sekelompok 80 siswa Kanada di tahun ketiga mereka dari sekolah menengah secara acak ditugaskan untuk salah satu dari tiga kelompok untuk kursus pada penulisan skala besar di musik (tidak ada perbedaan antara kelompok dalam hal bakat musik. introjected. bukan pada tugas-tugas sendiri. Selanjutnya. yang diberikan pujian memiliki persepsi keberhasilan tertinggi. seperti yang ditunjukkan pada Gambar. kelompok eksperimen pertama (GE1) diberi umpan balik pada pre-test dalam bentuk pujian ditulis. (hal. meskipun mereka telah secara signifikan kurang berhasil dibandingkan kelompok 'komentar'. Jadi memuji. jika ada. Strategi untuk mempromosikan motivasi intrinsik dibahas oleh Lepper & Hodell (1989). (1990). tampaknya lebih masuk akal bahwa pesan ucapan selamat yang diawali umpan balik tertulis cued siswa menjadi fokus pada proses metatugas. sebagai lawan eksternal. tetapi hanya bila dikaitkan dengan internal. .Oudenhoven. Peraturan eksternal 'menggambarkan perilaku yang diatur oleh kontinjensi terangterangan eksternal untuk individu'. Ide-ide ini mirip dengan kerangka yang diusulkan oleh Deci & Ryan (1994). 6). seperti Good & Grouws (1975). Menariknya. Hal ini mungkin menjelaskan hasil yang diperoleh oleh Boulet dkk. Salah satu interpretasi dari hasil ini adalah bahwa pemberian oral umpan balik lebih efektif daripada pengiriman tertulis dari umpan balik. sedangkan kelompok eksperimen kedua (GE2) diberi umpan balik lisan. dapat dilihat bahwa baik motivasi internal dan eksternal dapat efektif. Hal ini konsisten dengan temuan Cameron & Pierce (199. diidentifikasi dan terpadu. keberhasilan akademik sebelumnya atau kemampuan untuk belajar). Meskipun empat kelompok yang cocok pada skor pre-test. Pada post-test. kuesioner yang diberikan kepada siswa pada akhir sesi menunjukkan bahwa siswa diberikan nilai dan pujian mencetak jauh lebih tinggi dari 'komentar' atau 'tidak ada umpan balik' kelompok atas tindakan ego-keterlibatan sedangkan komentar yang diberikan mencetak lebih tinggi dari tiga kelompok lainnya pada langkah-langkah tugasketerlibatan. 6). kelompok eksperimen kedua telah mendapatkan lebih dari baik kelompok eksperimen pertama atau kelompok kontrol (yang tidak berbeda nyata). menemukan bahwa guru yang paling efektif sebenarnya memuji kurang dari rata-rata). 6). Dalam kerangka ini. Selama instruksi mereka. sedangkan hasil regulasi terpadu 'dari integrasi nilai-nilai dan peraturan diidentifikasi dalam arti seseorang koheren diri '(hal. pujian. yang mengidentifikasi empat jenis pengaturan perilaku: eksternal. Bukti lebih lanjut dari efek negatif dari isyarat murid untuk fokus pada diri daripada tugas berasal dari sebuah studi yang dilakukan oleh Butler (1987) di mana ia meneliti efek dari empat jenis umpan balik (komentar. siswa diberi komentar mencetak satu standar deviasi lebih tinggi daripada kelompok lain pada post-test (tidak ada perbedaan yang signifikan antara tiga kelompok lainnya). umumnya memiliki efek negatif (dan berjalan beberapa cara untuk menjelaskan mengapa beberapa studi. 1995) menunjukkan bahwa intervensi umpan balik yang isyarat individu untuk mengarahkan perhatian pada diri daripada tugas tampaknya cenderung memiliki efek negatif pada kinerja . seperti isyarat lain yang menarik perhatian harga diri dan jauh dari tugas. 1. yang menemukan bahwa sementara pujian verbal dan umpan balik mendukung dapat meningkatkan minat siswa dalam dan sikap terhadap tugas. efek pada kinerja. meskipun motivasi adalah ekstrinsik. umpan balik seperti memiliki sedikit. Diidentifikasi peraturan 'hasil ketika sebuah perilaku atau peraturan yang diadopsi oleh diri sebagai pribadi yang penting atau berharga' (hal. Namun. dihargai tujuan. nilai. tidak ada umpan balik) pada kinerja 200 kelas 5 dan 6 siswa Israel dalam tugas-tugas berpikir divergen. Keempat jenis peraturan sehingga dapat dianggap sebagai hasil dari persimpangan lokus dari sistem nilai dengan motivasi.4).

menghasilkan efek ukuran rata-rata di 30 studi dari 0. Pesan yang jelas dari penelitian tentang teori atribusi (lihat misalnya Vispoel & Austin. dibandingkan dengan yang diberikan hanya tanda . ditemukan bahwa memberikan umpan balik dalam bentuk jawaban atas pertanyaan tinjauan adalah efektif hanya ketika siswa tidak bisa 'melihat ke depan' untuk jawaban sebelum mereka telah berusaha dengan pertanyaan sendiri apa Bangert-tenggelam dkk. Ulasan serupa oleh Dempster (1991. umpan balik lebih efektif ketika umpan balik memberikan rincian dari jawaban yang benar. Juga dibahas pada bagian Kualitas umpan balik adalah Elawar & Como (1985) studi dari 18 guru sekolah dasar. materi yang akan dibahas. (1991a) digunakan meta-analisis untuk menyingkat temuan 40 studi menjadi efek umpan balik dalam apa yang mereka sebut 'test-seperti' peristiwa (misalnya pertanyaan evaluasi bahan pembelajaran diprogram. atau dengan bertindak penyelenggara muka sebagai primitif untuk. Studi ini telah dibahas dalam bagian pada kualitas umpan balik. dengan tes pertama terjadi tak lama setelah instruksi yang relevan. Tugas Motivasi Proses Berbeda dengan orang-orang intervensi yang isyarat memperhatikan proses meta-tugas. bukan pada stabil faktor umum seperti kemampuan (internal) atau apakah seseorang positif dianggap oleh guru (eksternal).1992) mengkonfirmasi temuan ini. (1991a). Mereka juga menemukan bahwa penggunaan pra-tes menurunkan efek ukuran. intervensi umpan balik yang mengarahkan perhatian terhadap tugas itu sendiri umumnya jauh lebih sukses. 1994). mungkin dengan memberikan peserta didik berlatih di.). (1991a) menemukan. dll . dan khususnya karya Dweck dan rekan-rekannya (lihat Dweck. 1986 untuk ringkasan). Seperti yang ditunjukkan di sana. digeneralisasikan dan dipindahtangankan). yang disebut 'mengendalikan ketersediaan pra-search'). sehingga bertentangan dengan analogi yang sering dikutip bahwa 'berat babi tidak menggemukkan itu. bukan hanya menunjukkan apakah jawaban siswa benar atau salah (lihat juga Elshout-Mohr. Temuan penting lain dalam pekerjaan Dempster adalah bahwa tes mempromosikan belajar serta sampel itu. Selanjutnya. faktor-faktor tertentu seperti usaha. tetapi juga menunjukkan bahwa penting untuk interval antara tes berturut-turut meningkat. tetapi bahwa efektivitas tes berturut-turut berkurang jika siswa tidak merasa sukses pada tes pertama. di mana ia menemukan bahwa perbedaan karena diberi komentar khusus tentang kesalahan dan saran untuk strategi.58. Variabel penting tampaknya: personalisasi (apakah faktor internal atau eksternal). Mereka menyimpulkan bahwa fitur kunci dalam penggunaan efektif umpan balik adalah bahwa hal itu harus mendorong 'kesadaran' dalam menanggapi siswa untuk umpan balik. Proses tugas Belajar . review tes pada akhir blok pengajaran. spesifisitas (apakah faktor yang spesifik dan terisolasi atau apakah mereka bersifat global. 1995) adalah bahwa guru harus bertujuan untuk menanamkan pada siswa mereka gagasan bahwa sukses adalah karena internal tidak stabil. permanen (apakah faktor stabil atau tidak stabil).Terkait dengan temuan ini adalah tubuh besar bekerja pada cara siswa atribut alasan untuk keberhasilan dan kegagalan. Bangert-tenggelam dkk. yang sama besar seperti perbedaan prestasi karena pencapaian sebelumnya .sebuah temuan yang signifikan mengingat peran baik-dibuktikan dari pencapaian sebelumnya dalam menentukan kesuksesan masa depan. Mengendalikan dua faktor ini dihilangkan hampir semua ukuran negatif efek yang Bangerttenggelam dkk.

menunjukkan tingkat yang lebih tinggi dari respon (yang diukur dengan taksonomi SOLO) ketika bekerja di sudut dan rotasi masalah di atas kertas daripada ketika bekerja di sebuah Logo lingkungan. mudah untuk mendapatkan kesan bahwa penilaian formatif adalah proses statis mengukur jumlah pengetahuan saat ini dimiliki oleh individu.. jenis bantuan yang penting juga. Namun. sambil memfokuskan pada tujuan proses mengarah ke pencapaian keuntungan yang lebih besar dari fokus pada tujuan produk. Fakta bahwa ini hampir tidak tampak mungkin meminta refleksi pada bidang penelitian. Hari & Cordon (1993) studi dua kelas kelas 3 menemukan bahwa siswa diberi 'respon scaffolded `. Kualitas intervensi umpan balik. sebagai meta-analisis dari Fuchs & Fuchs (1986) menunjukkan. dan makan ini kembali ke individu dalam beberapa cara.Apa yang mengejutkan dari meninjau literatur adalah bagaimana sedikit perhatian telah dibayarkan kepada karakteristik tugas dalam melihat efektivitas umpan balik. Dalam penelitian ini. dan relatif lebih berhasil dalam situasi yang membutuhkan 'tingkat tinggi' berpikir seperti tes terstruktur dan pemahaman latihan Bangert-tenggelam et al. Ada juga bukti bahwa kualitas dialog dalam intervensi umpan balik penting (Graesser et al. 1995) dan dapat. Prospek untuk Teori dan Praktek Penilaian Formatif Tidak ada Meta-analisis Mungkin terlihat diinginkan. 1995). dan khususnya. 1993a). akun dengan Lidz (1995) dari sejarah dan sastra penilaian dinamis (dan khususnya karya Vygotsky dan Feuerstein) membuat jelas bahwa penilaian formatif adalah sebanyak peduli dengan prediksi (yaitu apa yang seseorang dapat belajar) seperti dengan apa yang mereka miliki sudah belajar. Mengapa ini mungkin jadi tidak jelas. meskipun Mory (1992) menunjukkan bahwa hasil tidak meyakinkan tentang hal ini. atau hanya sedikit terkait. 1990. untuk review jenis ini untuk mencoba meta-analisis dari studi kuantitatif yang telah dilaporkan. bagaimana kaitannya dengan tugas di tangan. Dalam semua ini. Namun. sangat penting. Meningkatkan kemampuan siswa dalam meminta dan memberi bantuan juga memiliki efek positif langsung pada prestasi (Bland & Harris. efektivitas sangat tergantung pada analisis sistematis dan penggunaan umpan balik oleh guru. Selanjutnya. dan lebih mampu menerapkan pengetahuan mereka untuk serupa. 1991). Beberapa peneliti telah menemukan bahwa penjelasan berulang teknik yang sebelumnya telah menyebabkan kegagalan kurang efektif daripada menggunakan strategi alternatif (Fuchs et al. Hasil yang sama dilaporkan oleh Declos & Harrington (1991) untuk siswa yang telah menggunakan buku dari pertanyaan tambahan untuk memantau kemajuan mereka dalam menangani masalah praktek. 1992). 1988).out-dilakukan para siswa diberikan solusi lengkap segera setelah mereka terjebak .diberikan sebanyak atau sedikit bantuan yang mereka butuhkan . Beberapa . tapi satu petunjuk datang dari sebuah penelitian yang dilakukan oleh Simmons & Cope (1993).. usia 9-11. Umpan balik tampaknya kurang berhasil dalam 'berat-cued' situasi seperti yang ditemukan dalam instruksi berbasis komputer dan diprogram belajar urutan. tugas. Selanjutnya. Ross. umpan balik yang berkaitan dengan kemajuan tampaknya lebih efektif daripada umpan balik pada tingkat absolut kinerja (Schunk & Rice. dengan sedikit atau tanpa pengalaman pemrograman Logo. yang penulis dikaitkan dengan kecenderungan dari umpan balik langsung diberikan dalam lingkungan Logo untuk mendorong tambahan atau 'percobaan dan perbaikan' strategi. pasang anakanak. 1991b) atau pemetaan konsep (Bernard & Naidu. lebih penting daripada kemampuan sebelumnya dan faktor kepribadian gabungan (Clarke. pada kenyataannya. 1991.. dan hanya dalam interaksi dengan pembelajar (learning dan) yang berguna penilaian dapat dibuat. Schunk & Swartz. dan memang mungkin diantisipasi sebagai konvensional.

standar itu?) Atau sebagai diagnosis (apa yang harus saya lakukan untuk sampai ke sana?). hal. Dengan kata lain. 'Jika informasi tersebut hanya dicatat. Individu studi kuantitatif yang melihat penilaian formatif secara keseluruhan memang ada.atau diabaikan. diteruskan ke pihak ketiga yang tidak memiliki baik pengetahuan atau kekuatan untuk mengubah hasilnya. misalnya. Mengadopsi definisi (meskipun tidak istilah) yang diusulkan oleh Sadler (1989). kami mengusulkan. Namun. 1996). karena masing-masing studi terkait dengan pedagogi tertentu. menunjukkan kebutuhan untuk membangun teori lebih lanjut. sebagai kelas ringkasan yang diberikan oleh guru) untuk memimpin untuk tindakan yang tepat. Namun. Kinerja aktual dapat dievaluasi baik dalam hal sendiri. itu tidak akan formatif dalam fungsi dan dalam pandangan kami ini menunjukkan dasar untuk membedakan fungsi formatif dan sumatif dari penilaian. Dari bukti-bukti yang disajikan dalam ulasan ini. Nilai generalisasi mereka juga dipertanyakan karena aspek kunci dari berbagai penelitian bahwa mereka mensintesis. diabaikan karena sebagian besar peneliti tidak memberikan bukti tentang aspek-aspek ini. Namun ada perbedaan yang lebih dalam: bahkan di mana studi penelitian tampak serupa dalam prosedur yang terlibat. mereka berbeda dalam sifat data yang mungkin telah dikumpulkan . yang kita telah mencatat di kertas sebelumnya (Wiliam & Black. untuk mengacu pada setiap informasi yang diberikan kepada pemain dari setiap tindakan tentang kinerja itu. Fakta bahwa fitur menentukan penting sering tidak diberi perhatian adalah salah satu tanda dari konseptualisasi yang tidak memadai dari isu yang terlibat. apalagi beberapa metode membandingkan dua. dengan asumsi yang menyertainya tentang pembelajaran: satu yang dalam banyak kasus telah dibangun sebagai unsur utama dari inovasi yang diteliti.penelitian yang didasarkan pada meta-analisis telah menyediakan materi yang berguna untuk ulasan ini. misalnya kualitas pertanyaan yang disediakan pada frekuensi yang berbeda. atau dengan membandingkannya dengan standar referensi. kita akan berpendapat bahwa umpan balik dalam penilaian setiap melayani fungsi formatif hanya dalam kasus yang terakhir. 'umpan balik'.atau memang luar . misalnya frekuensi pertanyaan. Masalah yang mendasar. Mengambil lanjut argumen pada bagian umpan balik. 121). . Seperti komentar Sadler. demi kesederhanaan. jelas bahwa banyak bangunan teori masih perlu terjadi di wilayah penilaian formatif. sedangkan penilaian mungkin formatif dalam tujuan. Pada satu tingkat. sementara ini ketat dalam kerangka kerja dan tujuan mereka sendiri. 'penilaian berbasis kurikulum'. atau terlalu dalam kode (misalnya. dan kami akan memberikan saran di bawah ini tentang dasar untuk pengembangan ini. 'evaluasi formatif' dan sebagainya. penilaian formatif adalah hanya ketika perbandingan tingkat aktual dan referensi menghasilkan informasi yang kemudian digunakan untuk mengubah kesenjangan. 1996). Makna seperti yang kita telah melekat istilah di sini juga diwakili untuk orang lain dengan istilah-istilah seperti 'evaluasi kelas'. juga perlu ada tentu ada beberapa standar referensi terhadap yang kinerja diukur. ini telah difokuskan pada aspek yang agak sempit kerja formatif. dan beberapa telah dibahas di atas. kontrol loop tidak bisa ditutup '(Sadler. adalah bahwa 'penilaian formatif' istilah tidak umum dalam literatur penilaian. perbedaan ini jelas pada pemeriksaan kasual. Sebagai jarak (seberapa jauh dari . Kebutuhan ini tidak selalu berasal dari sumber eksternal (seperti. bahwa umpan balik istilah digunakan dalam arti setidaknya yang membatasi. dan sementara mereka menunjukkan beberapa koherensi dan penguatan dalam kaitannya dengan keuntungan belajar yang terkait dengan inisiatif penilaian kelas. Perbandingan baik dapat dalam hal kesetaraan (yaitu ini adalah sama atau berbeda?). meskipun jumlah dengan ketelitian kuantitatif yang memadai dan sebanding akan menjadi urutan 20 paling banyak. 1989. akan diperlukan oleh Kluger & DeNisi. Dalam kasus seperti itu. perbedaan yang mendasari antara studi yang sedemikian rupa sehingga setiap merger dari hasil mereka akan memiliki sedikit makna.

dapat berhubungan baik dengan jabatan dalam kaitannya dengan pembelajaran pada umumnya. Fungsi sumatif penilaian prihatin dengan konsistensi keputusan di (relatif) kelompok besar siswa. sehingga over-naik penting adalah bahwa makna dibagi oleh pengguna yang berbeda dari hasil penilaian. orientasi oleh seorang mahasiswa dari pekerjaan nya hanya dapat menjadi produktif jika siswa yang datang untuk berbagi visi guru dari materi pelajaran. Dua kontribusi kunci. dan untuk epistemologi tertentu yang relevan dengan materi pelajaran yang bersangkutan. Apa yang sering hilang adalah indikasi yang jelas apakah inovasi ini dimaksudkan untuk melayani tujuan jangka pendek dari peningkatan pembelajaran. 1995) berpendapat bahwa ini bisa dilakukan dengan tujuan mengklarifikasi. Sadler dibangun di atas gagasan Ramaprasad tentang kesenjangan antara negara diungkapkan oleh umpan balik dan keadaan yang diinginkan. fungsi formatif penilaian memprioritaskan konsekuensi yang diinginkan baik untuk (relatif) kelompok kecil siswa (seperti kelompok mengajar) atau untuk individu tertentu. dan jadi meta-kognisi yang terlibat. terkait dengan pergeseran dari psikometri untuk penilaian pembelajaran. Demikian pula. Sebuah masalah tertentu untuk konstruktor dari penilaian sumatif adalah bahwa persis siapa yang akan memanfaatkan hasil penilaian kemungkinan akan belum ditentukan. atau keduanya. dan karenanya banyak . penilaian otentik.dari Shinn & Hubbard. 1995. 1994) berpendapat bahwa definisi ini harus tetap implisit jika mereka tidak mendistorsi belajar. Sebaliknya. Bab 9) menarik perhatian pergeseran paradigma dari budaya pengujian untuk budaya penilaian. atau tujuan jangka panjang memberikan bentuk yang lebih valid dari penilaian sumatif. dari apa yang mereka sebut paradigma penilaian saat ini (dan apa yang kita telah di sini disebut fungsi sumatif dari penilaian) untuk apa yang mereka sebut 'masalah Paradigma -solving '(secara luas setara dengan apa yang kita di sini memanggil fungsi formatif penilaian). Mereka menggambarkan perbedaan dengan perbedaan dalam cara bahwa pertanyaan yang diajukan dalam dua paradigma bersama berbagai dimensi (lihat Tabel 1 . Wiliam. Sebuah perkembangan teori ini tampaknya panggilan untuk link ke teori-teori belajar yang kompatibel dan teori-teori dari meta-kognisi dan locus of control dari peserta didik. Contoh dapat ditemukan dalam berkembang dari artikel dan buku. Dia lebih jauh berpendapat bahwa pada akhirnya. itu harus dilihat sebagai penting. tentang penilaian kinerja. Pertama. tindakan untuk menutup gap yang harus diambil oleh mahasiswa . di mana inovasi dijelaskan. Teoritis Dasar Semua itu bisa diatur di sini adalah beberapa 'catatan terhadap teori penilaian formatif'. di (katakanlah) apresiasi estetika puisi akan sangat berbeda dari yang untuk (katakanlah) fisika. Dengan demikian penilaian diri oleh siswa bukanlah pilihan yang menarik atau mewah. tetapi yang lain (misalnya Claxton. (1994) kerangka judul menekankan tiga dimensi.mahasiswa yang secara otomatis mengikuti resep diagnostik guru tanpa pemahaman tujuan atau orientasi tidak akan belajar. Shinn & Baik III (1993) berpendapat bahwa perlu ada sebuah 'pergeseran paradigma' dalam penilaian.Gipps (1994. yang ditawarkan sebagian karena mereka mungkin menjadi bantuan membantu untuk refleksi pada pekerjaan yang disurvei dan sebagian karena mereka dapat membantu dalam melihat ke depan untuk implikasi dari pekerjaan ini. Sifat epistemologi. 1992). Mengingat ini. menekankan tindakan yang akan menghambat jika kesenjangan ini dipandang sebagai impracticably lebar. Kurangnya kejelasan tentang formatif / sumatif perbedaan lebih atau kurang jelas dalam banyak literatur. epistemologi dan teori yang terlibat. adalah mereka dari Sadler (1989) dan Tittle (1994). terutama di Amerika Serikat. dengan fokus hanya pada keandalan penilaian guru dan kelayakan pekerjaan kelas yang terlibat. yang referensi telah dibuat. kadang-kadang dengan bukti yang disajikan sebagai evaluasi. penilaian portofolio dan sebagainya. Beberapa (misalnya Klenowski.

terutama pemberdayaan pelajar. dan link ini membawa keluar pentingnya memahami respon pembelajar dalam kaitannya dengan harapan bahwa pelajar dan asumsi tentang proses kelas. Penekanan pada aspek etika dan moral penilaian adalah fitur dari perspektif digariskan oleh Aikenhead (1997). Dia mengacu pada karya Habermas (1971. Satu. Awalnya. Paradigma ini juga menyerukan ke dalam bermain perlunya kritik dari tujuan pembelajaran (dan kriteria penilaian di mana mereka dioperasionalkan) yang harus meminta yang kepentingannya tujuan ini dirancang untuk melayani. hanya kerangka teoritis untuk mendiskusikan apa yang sedang terjadi. di hati. di mana guru adalah co-peserta. penekanan ini diperkuat dan dikembangkan oleh argumen Sadler. Guy Brousseau (1984) telah menggunakan istilah `kontrak didactical 'untuk menggambarkan jaringan (sebagian besar implisit) harapan dan perjanjian yang berkembang antara siswa dan guru. dan menuju eksplorasi situasi matematika berpotensi kaya. Dalam ketiga. sedikit yang dikatakan tentang detail dari ini. Terutama. reaksi guru cenderung berfokus pada sejauh mana respon siswa diberikan dengan harapan guru (apa istilah Davis `evaluatif 'mendengarkan). tapi keyakinan guru. orang akan mencari kritik dari tujuan yang lebih luas yang dikejar. dengan langkah ditandai jauh dari struktur pelajaran yang jelas dan hasil belajar pra-ditentukan. yang terjadi dalam pengaturan sosial. dan pilihan antara baik memilih elit atau mencapai keunggulan untuk semua. paradigma interpretatif. Setelah refleksi berkelanjutan dan diskusi dengan peneliti selama beberapa bulan. Harapan dan Pengaturan Sosial Dua analisis terakhir ini membawa fitur yang dalam pandangan kami telah absen dari banyak penelitian kami review. Ini adalah bahwa semua proses penilaian yang. yang dilakukan oleh. atau tentang efek khas dari subjek tertentu materi yang terlibat. reaksi guru ditempatkan meningkatnya penekanan pada `pencarian informasi 'yang bertentangan dengan` responseeking' yang ditandai pelajaran sebelumnya (`interpretatif 'mendengarkan). dan tentang siswa dan kelas. 1991). dan dia sangat menekankan pentingnya ini. sifat sebenarnya dari nilai-nilai yang dikecualikan. menciptakan kesan bahwa satu (mungkin cukup koheren) set nilai-nilai ini sama baiknya dengan yang lain. Menjelang akhir periode dua tahun. paradigma kritisteori. 308) dan Ryan (1988) mengusulkan bahwa pertimbangan penilaian dapat jatuh dalam tiga paradigma yang biasa ditemui dalam ilmu sosial. Dimensi ketiga judul ini membawa penerjemah dan pengguna. 1989) menekankan sifat muatan nilai dari proses penilaian. tentang belajar. pandangan guru sendiri materi pelajaran yang diajarkan `'dikembangkan dan diubah bersama dengan siswa (` hermeneutik' mendengarkan).fitur dari penilaian formatif akan berbeda antara kedua bidang pembelajaran . jika hanya karena itu adalah atas dasar ini bahwa penilaian dari `kesenjangan Sadler 'harus dirumuskan. dan untuk aktor sosial. jelas link ke penekanan psikometri dalam pengujian standar. proses sosial. terjadi pergeseran lebih lanjut dalam praktek guru. Kedua. p. Sehubungan dengan siswa. empiris-analitis. Dengan demikian konsepsi saat ini berlaku tidak memberikan panduan untuk apa `seharusnya 'yang akan terjadi. Dimensi kedua adalah lebih jelas salah satu karakteristik penilaian. Sebuah fitur khusus dari kontrak tersebut adalah bahwa mereka melayani untuk . Hal ini jelas karena itu komitmen untuk penggunaan penilaian formatif tentu memerlukan pindah dari pengertian kesatuan intelijen (Wolf et al. harus diadopsi dalam penilaian formatif. Tittle juga membuat poin penting bahwa sementara konsepsi modem teori validitas (misalnya Messick. Kekhawatiran yang sama memotivasi kerangka teoritis yang diusulkan oleh Davis (1997) sebagai hasil dari studi rinci tentang perubahan (selama dua tahun) dari praktek guru matematika sekolah menengah tunggal dalam cara dia bereaksi terhadap respon siswa pertanyaan nya. tentang materi pelajaran. bersama-sama dengan interpretasi nya permintaan tugas dan kriteria untuk sukses. juga harus komponen penting dalam model apapun. dapat berkomentar di sini bahwa dalam beberapa studi yang dilaporkan di sini.. di tahap ketiga ini.

1995). sementara mereka yang tidak mengerti meniru atau mengikuti aturan. meskipun mereka dianggap bukan sebagai check-list statis. setiap huruf singkatan nomor yang berbeda. Namun. ketika diminta untuk memecahkan dua persamaan berikut 3a = 24 a + b = 16 banyak siswa percaya bahwa tidak mungkin. seperti produksi prosedur yang benar. Jika siswa menjawab semua pertanyaan dengan benar. (2) perluasan konsep: siswa yang telah memahami sesuatu sering mengambil ide lebih lanjut atas inisiatif sendiri. melainkan sebagai rangkaian petunjuk potensial dengan tingkat pemahaman siswa: (1) perubahan dalam sikap: siswa yang telah dipahami adalah `bermata cerah 'sementara mereka yang tidak muncul tanggung-tanggung. Hal ini karena pada contoh ditemui di sebagian besar buku pelajaran. tidak sah atau bahkan berarti (Schoenfeld. Prinsip penting di sini adalah perbedaan antara `fit 'dan` match' (Von Glasersfeld. para `membuka bergerak 'dari guru dan siswa dalam negosiasi kontrak kelas tersebut akan ditentukan oleh epistemologis mereka. Sebuah studi dari tujuh berpengalaman guru SD diperiksa kriteria implisit bahwa guru digunakan untuk menentukan apakah siswa memiliki `mengerti 'sesuatu (Reynolds et al. psikologis dan keyakinan pedagogis.. teori mereka belajar. . dan ini. Hubungan antara fit dan pertandingan sangat bergantung pada kekayaan pertanyaan yang digunakan oleh guru. (5) menggunakan cara pintas: hanya siswa yang yakin akan `gambaran besar 'bisa pintas prosedur sehingga memikirkan atau menggunakan short-cut diambil sebagai bukti pemahaman. hal ini sering tidak terjadi. yaitu mereka menganggap bahwa siswa pemahaman cocok mereka.membatasi sah 'aktivitas' oleh guru. keyakinan guru akan mempengaruhi kedua pertanyaan yang diajukan dan cara yang jawaban diinterpretasikan. dan pengalaman mereka peserta didik. 1987. tetapi tidak bisa karena adalah 8'. (3) membuat modifikasi pola: siswa yang memahami. Sebagai contoh. 1985). Sebagai (1994) pendekatan Tittle menekankan. seorang guru dapat menetapkan masalah siswa dalam sistem persamaan sederhana pemecahan. pada gilirannya akan tergantung pada pengetahuan guru subjek. (4) menggunakan proses dalam konteks yang berbeda: siswa yang telah memahami ide tertentu sering mulai melihat pola yang sama di tempat lain. Siswa karena itu pemahaman tidak cocok tetapi hanya `fit 'dengan guru. Setelah mempelajari dan membahas ekstrak video dan transkrip pelajaran. siswa mungkin melihat pertanyaan tentang` pemahaman' atau `aplikasi 'tidak adil. hal. 13). Misalnya. (6) kemampuan untuk menjelaskan: siswa yang telah memahami sesuatu biasanya mampu menjelaskannya. secara spontan mulai membuat modifikasi sendiri. ketika seorang guru mempertanyakan mahasiswa. Sebagai contoh. Misalnya. tujuh `indikator pemahaman 'muncul yang disepakati oleh semua tujuh guru. mengatakan hal-hal seperti 'Aku terus mendapatkan b adalah 8. di ruang kelas di mana pertanyaan guru selalu dibatasi untuk `rendah-order 'keterampilan. guru mungkin menyimpulkan bahwa siswa telah `mengerti 'topik.

mereka indikator yang lebih baik dari motivasi dan penyelesaian tugas. Apakah siswa percaya kemampuan untuk menjadi tambahan atau tetap akan memiliki pengaruh yang kuat pada bagaimana siswa melihat pertanyaan-sebagai kesempatan untuk belajar atau sebagai ancaman bagi harga diri (Dweck. formal. 1997). Pendekatan tradisional untuk analisis sosiologis telah menggunakan kategori kasar seperti jenis kelamin. siswa difokuskan pada nilai diberikan. Ruang di sekolah yang ditunjuk untuk kegiatan tertentu. Dalam mencoba untuk mendamaikan efek ini struktur dan lembaga. dan sejauh mana guru dapat membangun makna untuk tanggapan siswa. Namun. sementara dalam tugas tutorial. ras. Wiliam. dan kelas sosial untuk `menjelaskan 'perbedaan. ketertiban dan kepuasan mahasiswa seperti mereka dengan mengembangkan kemampuan siswa (Torrance & Pryor. Mungkin beberapa guru puas dengan `cocok 'daripada' pertandingan 'karena mereka tidak menyadari kemungkinan konsepsi siswa yang berbeda dari mereka sendiri. meskipun ada sedikit bukti sejauh ini tentang manfaat sebenarnya dari perangkat lunak tersebut. sehingga cenderung memperlakukan semua orang- . (1992) yang dikutip di bagian awal pada praktek sekarang menemukan bahwa ancaman besar bagi validitas penafsiran tes-hasil adalah sejauh mana siswa dapat membangun makna untuk tugas-tugas mereka ditetapkan.(7) kemampuan untuk memusatkan perhatian: ketekunan pada tugas diambil sebagai tanda pemahaman. konteks yang sebenarnya dari penilaian juga dapat mempengaruhi apa yang siswa percaya diperlukan. 1995. Dalam hal ini. 1988) akan memiliki dampak yang mendalam pada` perhatian' dengan mana siswa yang merespon. diskusi di antara siswa dari tutorial yang berbeda fokus lebih langsung pada materi pelajaran (yaitu geometri) dari melakukan (intens) perbandingan nilai dari beberapa tes pilihan. sedangkan. tetapi menemukan bahwa pendekatan tersebut sulit untuk menerapkan dalam `ruang kelas nyata '(Dassa. 1995) di mana kinerja dinilai dalam dua cara-melalui tes pilihan ganda dan dengan tugas di mana siswa harus merancang HyperCard geometri tutorial. 1996). Dengan cara ini. Contohnya adalah studi dari kelas 5 kelas geometri (Hall et al. hasil. 1986). siswa terlibat dalam lebih presentasi dan diskusi kualitatif pekerjaan mereka. Pada gilirannya. Bahkan di mana siswa memiliki `belajar 'sebagai lawan kinerja`' orientasi. Sebuah review oleh Rismark (1996) menunjukkan bahwa siswa sering terpinggirkan dan pekerjaan mereka undervalued jika mereka menggunakan kerangka acuan dari pengalaman pribadi mereka di luar sekolah dan Filer (1993) menemukan bahwa anak-anak tulisan tangan dan ejaan dalam bahasa Inggris kelas sekolah dasar belajar yang dibatasi oleh guru untuk mengembangkan keterampilan ini dalam konteks standar. Lebih khusus. Dalam beberapa tes pilihan. 1990). Tindakan guru dan siswa juga `enframed '(Mitchell. pada kenyataannya. Studi tentang dua guru sekolah menengah dengan Lorsbach dkk. dan mengingat pentingnya melekat pada `ketertiban 'di sebagian besar ruang kelas.. tanggapan siswa untuk pertanyaan akan tergantung pada sejumlah faktor. Pryor & Torrance. keyakinan siswa tentang apa yang dianggap sebagai `karya akademis '(Doyle. perangkat lunak komputer yang memungkinkan guru untuk memberikan umpan balik formatif dan diagnostik mungkin memiliki peran untuk bermain (Dassa et al. tampaknya mungkin bahwa kebanyakan guru menyadari manfaat dari gaya interogasi lebih kaya. Mereka juga menemukan bahwa guru digunakan hasil penilaian seolah-olah mereka memberi informasi tentang apa yang siswa tahu. guru tindakan yang sering peduli dengan membangun rutinitas. sehingga pengalaman pribadi mereka sendiri yang `diblokir '. Mungkin yang paling signifikan. 1993. misalnya.. 1985) mungkin sangat bermanfaat. 1995) . konon `tujuan 'penilaian yang dibuat oleh guru mungkin sedikit lebih dari hasil sedimentasi berturut sebelumnya` informal penilaiandalam kasus ekstrim ramalan pelabelan guru siswa (Filer. 1997). pengertian Bourdieu dari habitus (Bourdieu. 1991) dengan struktur sekolah dan masyarakat dan biasanya pengetahuan terkait erat dengan situasi di mana ia belajar (Boaler.

studi tersebut mungkin juga fokus pada masalah perubahan dan disorientations petugas. tentang `kemampuan dan prospek siswa mereka. persepsi dan keyakinan guru tentang belajar. tampaknya sangat sulit.meskipun salah satu masalah jelas dalam banyak studi tampaknya bahwa meskipun mereka melayani tujuan belajar bahwa metode yang didirikan mengabaikan atau mengecilkan. dan tentang tujuan dan metode untuk studi mereka. pengalaman dan posisi diadopsi oleh aktor sosial. karena kami percaya.orang dalam kategori sebagai homogen. sifat yang tepat dari berbagai jenis bukti penilaian diungkapkan oleh tanggapan peserta didik. . seperti yang dibuat oleh anggota belajar dan mengajar dan dengan kendala sistem sekolah yang lebih luas karena mereka memahami dan mengevaluasi mereka. ada kebutuhan untuk berkembang pendekatan baru secepat mungkin. Jika. tidak harus dicari . Ini tidak berarti bahwa langkah-langkah yang dapat diandalkan hasil. baik belajar dan sikap terhadap mata pelajaran yang dipelajari. Dalam terang spesifikasi seperti itu. Gagasan tersebut tampaknya sangat cocok untuk menggambarkan ruang kelas. yang tampaknya telah mendapat sedikit perhatian dalam studi penelitian dari penilaian formatif. sejauh mana konteks studi apapun buatan dan kemungkinan efek fitur ini pada generalisability hasil. sifat pengaturan sosial di dalam kelas. dan tentang peran mereka sebagai penilai. alasan yang mendasari komposisi dan presentasi karya pembelajaran. apalagi mengendalikan mereka dalam desain kuantitatif klasik. Ini menarik perhatian pada berbagai fitur penting yang akan menggabungkan untuk menentukan dampak dari rezim kelas apapun. Jelas ada kebutuhan untuk kombinasi tindakan tersebut dengan studi kualitatif lebih kaya dari proses dan interaksi dalam kelas. persepsi dan kepercayaan yang dianut oleh peserta didik tentang diri mereka sebagai pelajar tentang pekerjaan belajar mereka sendiri. mereka harus membenarkan diri mereka sendiri dalam kaitannya dengan tes yang disesuaikan dengan metode yang ditetapkan saja. Sebuah daftar lengkap dari aspek-aspek penting dan relevan akan meliputi: asumsi tentang belajar yang mendasari kurikulum dan pedagogi. Penelitian . divisi tanggung jawab antara peserta didik dan guru dalam proses ini. Bourdieu menggunakan gagasan habitus untuk menggambarkan orientasi.prospek dan kebutuhan Diskusi di atas memiliki implikasi yang jelas untuk desain investigasi penelitian. kelas dan jenis kelamin. mengingat fakta bahwa pengalaman siswa di kelas yang sama bisa begitu berbeda (Dart & Clarke. khususnya dalam rangka untuk menjelaskan perbedaan antara individu dalam kategori yang sama. jelas bahwa sebagian besar studi dalam literatur belum hadir untuk beberapa aspek penting dari situasi yang diteliti. Untuk membuat laporan yang memadai dari semua ini. kerangka interpretatif yang digunakan oleh guru dan peserta didik dalam menanggapi bukti ini. pekerjaan pembelajaran yang digunakan dalam bertindak pada interpretasi sehingga diperoleh. 1989). masalah yang berhubungan dengan ras.

dan interpretasi yang tepat dan penggunaan umpan balik yang memandu lintasan belajar siswa.bukti yang tidak didukung dalam hasil penelitian lain. mencatat argumen pada bagian Siswa dan penilaian formatif. dalam bekerja untuk kedua tujuan. pilihan. McCallum et al. dan strategi tertentu dieksplorasi pada bagian Sistem. Keuntungan dalam prestasi tampaknya cukup besar. 1996). atau kopling masalah. Selandia Baru atau Inggris negara ke dalam `lima 'setelah negara-negara pinggiran Pasifik Singapura. orientasi Goal dan Self-persepsi tentang respon siswa terhadap umpan balik. Masalah kedua.7. Kontradiksi jelas di sini mungkin muncul karena ada beberapa fitur penting dari ruang kelas yang belum dicatat dan dipahami. hati-hati membaca bagian awal pada penerimaan dan respon. dan jika keseimbangan optimal tidak dicari. kasus yang akan dibuat di sini adalah pertama bahwa keuntungan belajar yang signifikan terletak dalam genggaman kita.. efek ukuran dari 0. antara tujuan formatif dan sumatif yang pekerjaan mereka mungkin harus melayani. salah satu cara atau yang lain. ada yang bukti ekstensif menunjukkan bahwa tingkat ini praktek dalam aspek ini mengajar rendah (Black. dan sementara berbagai eksperimen dan skema dijelaskan seluruh ulasan ini. Feedback dan Harapan dan pengaturan sosial. framing dan artikulasi tugas pembelajaran yang tepat. didukung oleh pendekatan konstruktivis untuk belajar. memberikan contoh yang berguna. baik bagi guru dan peserta didik. maka langkah kedua adalah untuk guru-guru di sekolah untuk terprovokasi dan didukung dalam mencoba untuk membangun praktik baru dalam penilaian formatif. penyebaran ini dengan pedagogi yang tepat untuk membangkitkan umpan balik. di antara yang terbesar yang pernah dilaporkan untuk intervensi pendidikan. Korea. Elemen-elemen ini akan menjadi pengaturan tujuan yang jelas. dan bagian dari bagian atas Kualitas umpan balik. Ada jelas banyak cara yang berbeda di mana pedoman tersebut dapat dimasukkan ke dalam praktek kelas. berkaitan dengan kebingungan mungkin dan ketegangan. dan seperti disebutkan sebelumnya. Sebagai gambaran betapa besar keuntungan ini. Untuk kebijakan publik terhadap sekolah. Yang pertama adalah bukti dalam banyak penelitian yang penekanan baru pada penilaian formatif adalah manfaat khusus kepada peserta didik yang kurang beruntung dan rendah mencapai . jelas ada tidak ada kerajaan tunggal jalan. Jika poin pertama ini diterima. 1993b. Tidak dapat dipungkiri bahwa semua akan terlibat. 1993). dan bahwa tingkat sumber daya yang . Jepang dan Hong Kong (Beaton et al. pekerjaan formatif akan selalu aman karena ancaman dominasi diperbaharui dengan sumatif yang Apakah ada Implikasi Kebijakan? Tabel I dapat dibaca di samping bagian tentang Strategi dan taktik untuk guru membantu untuk menentukan unsur-unsur penting dari setiap strategi untuk meningkatkan pembelajaran melalui implementasi menyeluruh dari penilaian formatif. akan setara dengan menaikkan nilai pencapaian matematika rata-rata 'negara' seperti Inggris. jika itu bisa dicapai pada skala nasional. Dalam dan berjalan melalui rencana tersebut harus menjadi komitmen untuk melibatkan siswa dalam proses diri dan rekan-penilaian sebagai ditekankan di bagian atas. Secara khusus. Jika benar bahwa rentang prestasi sekolah mungkin dipersempit oleh peningkatan pencapaian mereka sampai sekarang dianggap sebagai pelajar yang lambat.Perhatian khusus harus diberikan kepada dua masalah tertentu. Penelitian yang dilaporkan di sini menunjukkan secara meyakinkan bahwa penilaian formatif tidak meningkatkan pembelajaran. maka ada alasan sosial dan pendidikan yang sangat kuat untuk memberikan prioritas tinggi untuk penelitian dan pengembangan sensitif untuk melihat bagaimana memahami dan mengatasi isu yang terlibat.. harus menunjukkan bahwa dalam membingkai umpan balik yang mereka berikan kepada guru siswa harus diingat beberapa pertimbangan penting dan halus yang tidak dikenal atau dipahami.

dan inisiatif di sini tidak mungkin untuk gagal melalui pengabaian fitur lembut dan halus. yang dukungan kami mengucapkan terima kasih. Meskipun dukungan tersebut. dari tinjauan sekarang ini. deskripsi yang memadai. Rowe & Hill. setidaknya di Inggris sejak 1988. meskipun adanya beberapa hasil marginal dan bahkan negatif.ditujukan untuk dukungan. Ucapan Terima Kasih Penyusunan ulasan ini dimungkinkan oleh pemberian hibah dari Nuffield Foundation. Keuntungan yang signifikan dapat dicapai dengan banyak rute yang berbeda. untuk penilaian formatif adalah usaha yang tangguh. tentu saja. Artinya. salah satu model yang optimum yang kebijakan seperti itu mungkin didasarkan. sementara membangun teori yang koheren. Kami juga ingin mengucapkan terima kasih kepada anggota Kebijakan Penilaian Inggris Asosiasi Penelitian Pendidikan Kelompok Tugas yang menugaskan pekerjaan. dan panduan tegas didasarkan untuk berlatih. dan telah dimasukkan oleh setiap guru dalam praktek nya dengan cara sendiri (Broadfoot et al.. 1995). kisaran kondisi dan konteks di mana penelitian telah menunjukkan bahwa keuntungan dapat dicapai harus menunjukkan bahwa prinsip-prinsip yang mendasari pencapaian perbaikan substansial dalam belajar yang kuat. seluruh tanggung jawab penulis. misalnya. dan membuat saran untuk referensi tambahan untuk dimasukkan. Apa yang muncul adalah seperangkat prinsip. telah hampir diabaikan (Daugherty. yang. 1996). dengan peringatan umum bahwa perubahan dalam praktek kelas yang dibutuhkan adalah pusat daripada marjinal. ada cukup bukti di tempat untuk memberikan bimbingan membantu untuk tindakan praktis (untuk account dari negara utama sistem penilaian -lebar yang menggabungkan fungsi formatif dan sumatif dari penilaian. 1996). Poin terakhir ini sangat penting karena ada tidak muncul. lihat. dan perlu terus dukungan dari kedua praktisi dan peneliti. kelalaian dan kekeliruan. memberi komentar yang bermanfaat tentang draft awal. . ulasan ini terikat untuk mengandung kesalahan. reformasi dalam dimensi ini pasti akan memakan waktu yang lama. Selanjutnya. Tidak ada keraguan bahwa.