You are on page 1of 7

ERIC Identifier: ED328611 Tanggal Publikasi: 1990-12-00 Penulis: Wiggins, Grant Sumber:.

ERIC Clearinghouse on Pengukuran Tes dan Evaluasi Washington DC, Amerika
Institutes Penelitian Washington DC.

Kasus untuk Penilaian Otentik
Mr. Wiggins, seorang peneliti dan konsultan tentang isu-isu reformasi sekolah, adalah advokat dikenal luas dari
penilaian autentik dalam pendidikan. Digest ini didasarkan pada bahan yang ia siapkan untuk California Balai
Pengkajian.
APAKAH PENILAIAN ASLI?
Penilaian otentik ketika kita langsung memeriksa kinerja siswa pada tugas-tugas intelektual yang layak.
Penilaian tradisional, dengan kontrak, bergantung pada langsung atau proxy 'barang' - efisien, pengganti
sederhana dari yang kami pikir kesimpulan yang valid dapat dibuat tentang kinerja siswa di tantangan-
tantangan dihargai.
Apakah kita ingin mengevaluasi siswa masalah-berpose dan pemecahan masalah dalam matematika?
Penelitian eksperimental dalam ilmu? berbicara, mendengarkan, dan memfasilitasi diskusi? melakukan
penyelidikan sejarah berdasarkan dokumen-? benar-benar merevisi tulisan imajinatif sampai "bekerja"
untuk pembaca? Lalu biarkan penilaian kami dibangun dari tantangan intelektual teladan tersebut.
Perbandingan lebih lanjut dengan tes standar tradisional akan membantu untuk menjelaskan apa yang
"keaslian" berarti ketika mempertimbangkan desain penilaian dan penggunaan:
• penilaian Authentic mengharuskan mahasiswa untuk menjadi pemain yang efektif dengan pengetahuan
yang diperoleh. Tes tradisional cenderung mengungkapkan hanya apakah siswa dapat mengenali, recall
atau "plug in" apa yang telah dipelajari di luar konteks. Ini mungkin bermasalah dengan menyimpulkan
mengemudi atau kemampuan dari tes tertulis saja mengajar. (Catatan, karena itu, bahwa perdebatan tidak
"baik-atau": mungkin ada kebajikan dalam berbagai instrumen penilaian lokal dan negara sebagaimana
layaknya tujuan pengukuran.)
• Penilaian Authentic menyajikan siswa dengan array penuh tugas yang mencerminkan prioritas dan
tantangan yang ditemukan dalam kegiatan pembelajaran terbaik: melakukan penelitian; menulis, merevisi
dan membahas makalah; menyediakan analisis lisan menarik dari peristiwa politik baru-baru ini;
berkolaborasi dengan orang lain pada debat, dll tes konvensional biasanya terbatas pada kertas dan pensil,
satu- menjawab pertanyaan.
• penilaian otentik menghadiri apakah siswa dapat kerajinan dipoles, menyeluruh dan dibenarkan
jawaban, pertunjukan atau produk. Tes konvensional biasanya hanya meminta mahasiswa untuk memilih
atau menulis jawaban yang benar - terlepas dari alasan. (Jarang ada kesempatan yang memadai untuk
merencanakan, merevisi dan memperkuat respon pada tes yang khas, bahkan ketika ada pertanyaan
terbuka). Akibatnya,
• penilaian otentik mencapai validitas dan reliabilitas dengan menekankan dan standardisasi kriteria yang
sesuai untuk mencetak seperti (bervariasi) produk; pengujian tradisional standarisasi tujuan "item" dan,
karenanya, (satu) jawaban yang tepat untuk setiap.
• "Uji validitas" harus tergantung sebagian pada apakah tes mensimulasikan dunia nyata "tes"
kemampuan. Validitas pada tes pilihan ganda yang paling ditentukan hanya dengan pencocokan item
dengan isi kurikulum (atau melalui korelasi canggih dengan hasil tes lainnya).

• tugas Authentic melibatkan "sakit-terstruktur" tantangan dan peran yang membantu siswa berlatih untuk ambiguitas kompleks "permainan" dari orang dewasa dan kehidupan profesional. menilai unsur statis dan terlalu sering sewenang-wenang diskrit atau sederhana dari kegiatan tersebut. . Tes tradisional latihan lebih seperti.

Kedua belah pihak dituntun untuk percaya bahwa jawaban yang benar lebih penting daripada kebiasaan pikiran dan pembenaran pendekatan dan hasil seseorang. pengambilan sampel mungkin menjadi respons yang tepat . Jika tujuan kita adalah semata-mata untuk memantau kinerja maka pengujian konvensional mungkin memadai. Norma tidak standar. buku untuk menulis. Mahasiswa datang untuk percaya bahwa belajar adalah menjejalkan. Tes terbaik selalu mengajarkan siswa dan guru jenis pekerjaan yang paling penting. dan belajar siswa banyak. Di banyak perguruan tinggi dan semua pengaturan profesional tantangan penting yang dikenal di muka . bukan isi dari tes yang berbahaya bagi pembelajaran. presentasi Dewan. menilai lokal. dan guru bisa datang ke percaya bahwa hasil penilaian yang baik berarti dan berguna untuk meningkatkan instruksi. jawaban yang benar tidak alasan-alasan. Vermont dan Connecticut dalam kinerja dan penilaian portofolio proyek baru . membuat sulit bagi guru dan siswa untuk berlatih dan mendapatkan kepercayaan diri yang berasal dari mengetahui kewajiban kinerja mereka. Jika biaya membuktikan mahal.tanpa mengorbankan validitas.laporan yang akan datang. Dengan demikian. (Tantangan dikenal juga memungkinkan untuk menampung semua siswa untuk standar yang lebih tinggi). terlalu sering tes kami menyesatkan siswa dan guru tentang jenis pekerjaan yang harus dikuasai. resital. kriteria dan standar. tes rahasia terdiri dari item proxy dan skor yang tidak memiliki arti atau kegunaan yang jelas melemahkan kemampuan untuk meningkatkan instruksi dan siswa guru kemampuan untuk meningkatkan kinerja mereka. MENGAPA KITA PERLU BERINVESTASI DALAM BENTUK KERJA-INTENSIF PENILAIAN? Sementara tes pilihan ganda dapat indikator valid atau prediktor prestasi akademik. item masalah tidak nyata. guru datang untuk percaya bahwa tes setelah-the-fakta.tidak relevan dengan maksud dan keberhasilan mereka. Sebuah langkah menuju tugas yang lebih otentik dan hasil sehingga meningkatkan pengajaran dan pembelajaran: siswa memiliki kejelasan tentang kewajiban mereka (dan diminta untuk menguasai tugas lebih menarik). dengan mewajibkan kerahasiaan lengkap untuk validitas mereka. Seperti negara-negara seperti California dan New York telah menemukan (dengan menulis dan tangan-on tes ilmu mereka) perbaikan yang signifikan terjadi secara lokal dalam mengajar dan menilai menulis dan ilmu pengetahuan ketika guru terlibat dan diinvestasikan dalam proses penilaian. dll tes Tradisional. kasus hukum. mereka memungkinkan dan memandang ke depan.memikirkan musik dan pelatihan militer . Jika tujuan kita adalah untuk meningkatkan kinerja di seluruh papan maka tes harus terdiri dari tugas-tugas teladan. bukan hanya mencerminkan ajaran sebelumnya. Kami berlatih untuk dan mengajarkan untuk tes otentik .strategi yang digunakan di California. gangguan terdiri dari pertanyaan- buat dikenakan . demonstrasi validitas teknis tes standar seharusnya tidak menjadi masalah dalam perdebatan reformasi assessment. TIDAK PENILAIAN ASLI BE terlalu mahal dan memakan waktu? Biaya menipu: sedangkan scoring tugas berbasis penghakiman tampaknya mahal jika dibandingkan dengan pilihan ganda tes (sekitar $ 2 per siswa vs 1 sen) keuntungan untuk pengembangan profesi guru. Apa yang kebanyakan pembela tes tradisional gagal lihat adalah bahwa itu adalah bentuk.Di luar pertimbangan teknis pindah ke penilaian reformasi didasarkan pada premis bahwa penilaian harus terutama mendukung kebutuhan peserta didik.

Apakah melalui sampling banyak genre penulisan. Dan apa yang telah kita diperoleh dengan gagal untuk cukup menilai semua kapasitas dan hasil kami mengaku menghargai hanya karena memakan waktu. atau padat karya? Sebagian besar negara- negara lain secara rutin meminta siswa untuk menanggapi secara lisan dan tertulis pada tes utama mereka .mereka.negara yang sama yang mengalahkan kami di perbandingan internasional. mahal. atau melalui menilai hanya contoh kecil dari siswa. Uang. informasi berharga diperoleh dengan biaya minimum. di mana setiap siswa mendapat satu-satunya yang cepat. waktu dan pelatihan secara rutin menyisihkan untuk memastikan penilaian . atau melalui sampel sejumlah kecil semua kertas siswa dan portofolio sekolah-lebar.

sebagai peneliti Lauren Resnick telah menempatkan itu." di Berlak Menilai Prestasi (ed.dan biasanya kebal dari pengawasan publik dan pengawasan. TAMBAHAN READING Archbald. . California.yangberkualitas tinggi.seperti yang terjadi secara rutin di seluruh profesional. Buffalo. Untuk meningkatkan kinerja siswa kita harus mengakui bahwa kemampuan intelektual penting jatuh melalui celah-celah pengujian konvensional. NY: SUNY Press.dan yang mencetak lokal (sementara diaudit oleh negara). makalah membaca "buta" dan prosedur untuk mencegah bias dan melayang gain keandalan yang memadai. Apa yang Anda menilai adalah apa yang Anda dapatkan. pertunjukan model yang digunakan sebagai eksemplar. bagian yang telah memasukkan pertanyaan esai sejak awal mereka . termasuk tidak hanya esai pada kebanyakan tes tetapi tes berbasis kinerja di Art Portfolio dan Bahasa Asing ujian. D. kualitas pekerjaan siswa lebih dilihat ke awam daripada ketika kita harus mengandalkan terjemahan pembicaraan tentang stanines dan renorming. dan New York. dan cara di mana norma atau memotong-nilai ditetapkan seringkali cukup subjektif . • Nasional Penilaian Kemajuan Pendidikan (NAEP). prosedur dimana item yang dipilih. Connecticut. Kami memantau dan meningkatkan penghakiman melalui sesi pelatihan. F. penilaian kongres yang dimandatkan. pelatihan pembaca. & Newmann.): Menjelang pengembangan Ilmu Baru dari Educational Testing. Akuntabilitas asli tidak menghindari penilaian manusia. Mereka juga benar menganggap bahwa standar tinggi tergantung pada kualitas sehari-hari penilaian lokal . Meskipun skor tes standar tidak memiliki kesalahan yang signifikan. Penilaian autentik juga memiliki keuntungan dari memberikan orang tua dan anggota masyarakat dengan produk-produk langsung diamati dan bukti dimengerti tentang kinerja siswa mereka. jika Anda tidak mengujinya Anda tidak akan mendapatkannya. • baru-mandat berbasis kinerja dan pengujian berbasis portofolio negara-lebar di Arizona. (1989) "Fungsi dari Pengkajian dan Sifat Prestasi Akademik Authentic. • penilaian negara-lebar menulis di dua negara lusin mana kertas model. AKAN PUBLIK MEMILIKI IMAN DI KEJUJURAN DAN KEANDALAN SKOR PENILAIAN BERBASIS? Kita lupa bahwa banyak program negara dan pengujian nasional dengan tingkat tinggi kredibilitas dan integritas telah bertahun-tahun beroperasi menggunakan hakim manusia: • ujian New York Bupati. atletik dan seni dunia dalam penjurian kinerja. menggunakan banyak terbuka pertanyaan tes dan menulis petunjuknya (dan berhasil diujicobakan tangan-uji kinerja ilmu pengetahuan). • program Advanced Placement yang menggunakan pertanyaan-pertanyaan terbuka dan tugas. audit dan kebijakan pengawasan serta melalui prosedur dasar seperti memiliki hakim tertarik mengulas pekerjaan siswa "buta" untuk nama atau pengalaman siswa . Pada akhirnya.lebih lanjut mengimbangi jelas tingginya biaya pelatihan guru untuk mencetak pekerjaan siswa dalam penilaian regional atau nasional. Maryland. Kentucky.

Chestnut Hill. MA: NCTPP. A. . 18. Komisi Nasional Pengujian dan Kebijakan Publik (1990) Dari Gatekeeper ke Gateway: Transformasi Pengujian di Amerika.Frederiksen. & Collins. 9 (Desember)." Peneliti Pendidikan. J. Boston College. (1989) "A Pendekatan Sistem untuk Educational Testing.

7. Wolf. (1989) "A Uji Benar: Menuju Lebih Authentic dan Penilaian Pemerataan.. G. Departemen Pendidikan AS dengan nomor kontrak R88062003. 70. (1989) "Portofolio Penilaian: Sampling Kerja Siswa. D. pp 35- 39 (April). 9 (Mei). ----- Buku ini dibuat dengan dana dari Kantor Penelitian Pendidikan dan Peningkatan. Izin diberikan untuk menyalin dan mendistribusikan ini ERIC / TM Digest.Wiggins. Pendapat yang dikemukakan dalam laporan ini tidak mencerminkan posisi atau kebijakan dari OERI atau Departemen Pendidikan." Kepemimpinan Pendidikan 46." Phi Delta Kappa. .