Validitas Alat Evaluasi By ishaq madeamin on Minggu, 05 Juni 2011

Salah satu komponen terpenting yang menentukan hasil dari pelaksanaan evaluasi adalah kualitas alat evaluasi yang digunakan. Baik digunakan dalam proses penelitian yang menggunakan metode kuantitatif maupun evaluasi dalam proses bukan dalam bentuk penelitian. Alat evaluasi yang digunakan dalam proses-proses yang disebutkan di atas (termasuk instrumen tes) dapat disebut berkualitas apabila memenuhi beberapa kriteria, diantaranya: 1. Validitas, 2. Reliabilitas, [baca 1 dan baca 2] 3. Objektivitas dan Kepraktisan [baca] Validitas Validitas memiliki pengertian valid, sahih, atau tepat. Suatu alat evaluasi dikatakan valid (sahih) jika alat evaluasi tersebut mampu mengevaluasi apa yang seharusnya dievaluasi. Atau, dengan kata lain alat evaluasi (instrumen) tersebut memiliki tingkat kevalidan apabila memiliki ketepatan dalam melakukan evaluasi. Bahasa sederhananya "alat evalusi atau instrumen-instrumen yang digunakan bertujuan untuk mengukur apa yang seharusnya di ukur." Dalam menganalisis tingkat validitas alat evaluasi (termasuk instrumen) tergantung jenis alat evaluasi yang digunakan. Misalkan alat evaluasi dalam bentuk buku siswa, LKS, dan sbg. maka lebih cocok diukur tingkat kesahihannya dengan menggunakan pendapat pakar atau jika alat

evalusi dalam bentuk tes lebih baik menggunakan validator siswa dalam hal ini dilakukan uji coba kepada siswa. Beberapa jenis validasi berdasarkan cara-cara melakukan pengukuran tingkat validitas sebuah alat evaluasi, yaitu validitas teoritik (validitas logika) dan validitas empirik (validitas kriterium). 1. Validitas Teoritik (Validitas Logika) Validitas teoritik atau validitas logika lebih menekankan pada tingkat ketepatan alat evaluasi ditinjaui dari isi (materi) alat evaluasi tersebut. Oleh karena itu validitas teoritik lebih tepat dilakukan dengan meminta pertimbangan para pakar. Tentunya pakar yang dimaksud adalah orang-orang yang memiliki keahliaan pada bisangnya. Misalnya mengukur validitas sebuah media pembelajaran komputer, maka pakar yang dimaksud adalah ahli yang berkecimpung pada dunia media pembelajaran baik dari segi pekerjaan atau keahlian berdasarkan gelar tingkat pendidikan. Berikut jenis-jenis validitas teoritik: o Validitas Isi Validitas isi berkenan dengan tingkat ketepatan alat evaluasi tersebut ditinjau dari segi materi. Suatu alat evaluasi dikatakan memiliki validitas isi jika mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang dievaluasi. o Validitas Konstruksi Validitas konstruksi berkenan dengan kesesuaian butir dengan tujuan pembelajaran khusus (atau indikator hasil belajar). Suatu alat evalusi dikatakan memiliki validitas konstruksi jika butir-butir pertanyaan atau pernyataan pada alat evaluasi tersebut mengukur tujuan pembelajaran khusus (atau indikator hasil belajar) yang telah ditetapkan Beberapa diantaranya yang diukur validitasnya dalam validitas teoritik adalah tujuan, isi materi, bahasan, dll. Beberapa format validitas (lembaran penilaian) untuk/dari validator biasanya digabungkan antara validitas isi maupun validitas konstruksi. 2. Validitas Empirik (Validitas Kriterium) Validitas empirik atau validitas kriterium adalah validitas yang bertujuan untuk mengukur ketepatan sebuah alat evalusi berdasarkan kriterium tertentu. Validitas kriterium lebih banyak menggunakan validator dari subjek walaupun tidak menutup kemungkinan menggunakan (validatornya) adalah ahli. Validitas kriterium juga memliki dua jenis, yaitu: o Validitas Banding Validitas banding disebut demikian jika alat evaluasi tersebut tepat mengukur dengan berdsarakan pengalaman.

o

Validitas Ramalan Validitas ramalan adalah validitas yang tepat mengukur dalam memprediksi kejadian di masa mendatang.

Jika proses pengumpulan data hasil penilaian validator maka selanjutnya adalah menganalisis hasil penilaian tersebut. Analisis tersebut dimaksudkan untuk menentukan korelasi antara skor yang dikumpulkan melalui alat evaluasi tersebut dengan skor yang telah ada atau melalui alat ukur lainnya, tentunya alat ukur yang telah dibakukan dan diasumsikan memiliki tingkat validitas yang tinggi. Beberapa jenis analisis yang dapat digunakan untuk menentukan koefisien validitasnya, antara lain: 1. Korelasi Product Moment Korelasi Product Moment, dengan persamaan: dengan Simpangan

Keterangan: rxy adalah koefisien korelasi antara variabel X dan variabel Y o x adalah selilih antara X dengan X rata-rata (x =X-Xrata-rata) o y adalah selilih antara X dengan X rata-rata (y =Y-Yrata-rata) 2. Korelasi Product Moment dengan Angka Korelasi Product Moment dengan Angka Kasar, dengan persamaan:
o

Kasar

Keterangan, N adalah banyaknya subjek 3. Korelasi Metode Korelasi Metode Ranking, dengan persamaan: Ranking

Untuk menghindari rendahnya tingkat validitas terutama pada kategori valid Rendah dan Sangat Rendah atau berada pada koefisien validitas di bawah nilai 0.1.00 Kriteria Sangat tinggi Tinggi Sedang Rendah Sangat rendah Tidak valid Apakah dengan kriteria Sangat Rendah. yaitu: Koefisien validitas 0.Keterangan: N adalah jumlah subjek dan d adalah selisih rangking antara X dan Y Hasil analisis data dalam menentukan koefisien validitasnya selanjutnya dicocokan dengan kriteria validitas dari alat evaluasi tersebut. Rendah.40 0.80 .40 dikategorikan tidak valid hal ini bertujuan untuk mempertahankan tingkat kesahihan alat evaluasi tersebut.80 0.0.60 (kriteria sedang) dikategorikan valid setelah sebelumnya diadakan revisi terhadap alat evaluasi tersebut.0. sedangkan pada koefisien validitas 0.0.0.00 0.20 < 0. dan Sedang masuk pada kategori valid atau tidak?.40-0.40 .60 .00 .60 0.20 . .

maka obyek evaluasi pendidikan meliputi empat aspek. seperti calon siswa. dan Output. Alat Ukur yang digunakan untuk mengukur kemapuan ini disebut tes kemampuan atau aptitude test (Anas Sudijono : 2003). Kepribadian Kepribadian adalah sesuatu yang terdapat pada diri seseorang manusia dan menampakan bentuk dalam tingkah laku. Salah satu cara untuk mengenal atau mengetahui obyek dari evaluasi adalah dengan cara menyoroti dari tiga segi. Alat untuk mengetahui kepribadian seseorang disebut tes kepribadian atau personality test. (3) sikap. karena pihak penilai (evaluator) ingin memperoleh informasi tentang kegiatan atau proses pendidikan tersebut (Anas Sudijono : 2003). Dibawah ini akan diuraikan secara rinci tentang obyek dari evaluasi pendidikan. maka calon peserta didik harus memiliki kemampuan yang sesuai atau memadai. SUBYEK DAN ALAT-ALAT EVALUASI A. b. Sedangkan Suharmi Arikunto menjelaskan Obyek atau sasaran Penilaian adalah segala sesuatu yng menjadi titik pusat pengamatan karena penilai ingin informasi tentang sesuatu tersebut. tidak lain adalah para calon peserta didik. . dan (4) inteligensi. peserta didik tidak akan mengalami banyak hambatan atau esulitan.Rabu. Kemampuan Untuk dapat mengikuti program dalam suatu lembaga atau sekolah atau institusi. 07 Juli 2010 OBYEK. yaitu dari segi Input. Transpormasi. input atau bahan mentah yang siapa untuk diolah. (2) kepribadian. Dilihat dari segi input ini. calon mahasiswa dan sebagainya. yaitu (1) kemampuan. Sebelum mengikuti program pendidikan tertentu. Input Dalam dunia Pendidikan. sehingga dalam mengikuti proses pembelajaran pada program pendidikan tertentu itu nantinya. OBYEK EVALUASI PENDIDIKAN Yang dimaksud dengan obyek atau sasaran evaluasi pendidikan adalah segala sesuatu yang bertalian dengan kegiatan atau proses pendidikan. sebab baik buruknya kepribadian mereka secara psikologis akan dapat mempengaruhi keberhasilan mereka dalam mengikuti program pendidikan tertentu. khususnya dalam proses pembelajaran disekolah. para calon peserta didik perlu terlebih dahulu dievaluasi kepribadiannya masing-masing. 1. a. yang dijadikan titik pusat perhatian atau pengamatan.

Sistem administrasi e. Untuk menilai sikap tersebut digunaan alat berupa tes sikap (attitude test). IQ bukanlah inteligensi. Penggunaan metode-metode mengajar yang kurang tepat. teknik penilaian yang tidak memperhatikan memperhatikan prinsip-prinsip dasar evaluasi itu sendiri. semua itu akan sangat mempengaruhi proses “ pengolahan bahan mentah” menjadi “bahan jadi yang siap untuk dipakai”. Dari hasil tes akan diketahui IQ (inteligensi Quotien) orang tersebut. Transpormasi dapat di ibaratkan sebagai “mesin pengolah yang bertugas untuk mengubah bahan mentah menjadi bahan jadi”. IQ berbeda dengan inteligensi karena IQ hanyalah angka yang memberikan petunjuk tinggi rendahnya inteligensi seseorang. Transpormasi Apabila disoroti dari segi transpormasi. aan memegang peranan yang sangat penting. sebabb test tersebut berbentuk skala. . Tintum dan sebagainya. Dalam hal ini yang terkenal adalah tes buatan Binet dan Simon yang dikenal dengan test Binet-Simon. tenaga pengajar atau karyawan yang tidak professional. Ia dapat menjadi faktor penentu yang dapat menyebabkan keberhasilan atau kegagalan dalam upaya pencapaian tujuan pendidikan yang telah ditentukan. atau sering dikenal dengan skala sikap (attitude scale). Kurikulum atau materi pelajaran b. 2.c. Guru atau unsure-unsur personal lainnya yang terlibat dalam proses pendidikan. Sikap Sebenarnya sikap ini merupakan bagian dari tingkah laku manusia sebagai gejala atau gambaran kepribadian yang memancar keluar. dapat menyebabkan terjadinya kegagalan dalam pencapaian tujuan pendidikan tersebut. Inteligensi Untuk megetahui tingkat inteligensi ini menggunakan tes inteligensi yang sudah banyak diciptakan oleh para ahli. Karena itu maka aspek sikap perlu dinilai atau dievaluasi terlebih dahulu bagi para calon tenaga pendidik sebelum mengikuti program pendidian tertentu. karena itu obyek-obyek yang termasuk dalam transformasi itu perlu dinilai atau dievaluasi secara berkesinambungan. pimpinan lembaga pedidikan. Namun karena sikap ini merupakan sesuatu yang paling menonjol dan sangat dibutuhkan dalam pergaulan. Selain itu ada juga tes lainya seperti SPM. Sarana atau media pendidikan d. maka obyek dari evaluasi pendidikan itu meliputi: a. sarana pendidikan yang tidak atau kurang memadai. Metode mengajar atau teknik penilaian c. sistim administrasi yang bersifat acak-acakan. maka banyak orang yang mengiginkan informasi khusus tentangnya. d. Kurikulum yang tidak sejalan dengan tujuan pendidikan yang ingin dicapai.

Jika evaluasi yang dilakuakn tersebut sasarannya adalah sikap peserta didik. setelah mereka terlibat dalam proses pendidikan selama jangka waktu yang telah ditentukkan. dengan cara yang boleh dikatakan tepat dan cepat. Hal ini disebabkan oleh kenyataan bahwa disamping alat-alat evaluasi yang digunakan untuk mengukur kepribadian seseorang itu sifatnya rahasia. yang biasa dikenal dengan istilah tes pencapaian (achievement test). b. juga hasilhasil pengukuran yang diperoleh dari tes kepribadian itu. Dalam kegiatan evaluasi pendidikan dimana sasaran evaluasinya adalah prestasi belajar. Output Adapun yang dari segi output yang menjadi sasaran evaluasi pendidikan adalah tingkat pencapaian atau prestasi belajar yang behasil diraih oleh masing-masing peserta didik. digunakan alat yang berupa Test Prestasi Belajar atau Test Hasil Belajar. yaitu seorang yang memang telah dididik untuk menjadi tenaga ahli yang professional dibidang psikolog. maka subyek evaluasinya adalah guru atau dosen yang mengasuh mata pelajaran tertentu. tidak mungkin dapat dikerjakan oleh orang lain. maka subyek evaluasinya adalah guru atau petugas yang sebelum melaksanakan evaluasi tentang sikap itu. hanya dapat diiinterpretasikan dan disimpulkan oleh para psikolog tersebut. ALAT-ALAT EVALUASI Secara gasir besar. Drs. maka subbyek evaluasinya tidak bias lain kecuali seorang psikolog. Dalam bukunya “ Teknik-teknik Evaluasi”. yaitu tes dan non tes. a. . Amin Daien Indrakusuma mengatakan bahwa tes adalah suatu alat atau prosedur yang sistematis dan obyektif untuk memperoleh data-data atau keterangan-keterangan yang diinginkan tentang seseorang. terlebih dahulu telah memperoleh pendidikan atau latihan (training) mengenai cara-cara menilai sikap seseorang.adapun apabila yang dievaluasi adalah kepribadian peserta didik. Untuk mengetahui seberapa jauh tingkat pencapaian atau prestasi belajar yang diraih oleh peserta didik itu. SUBYEK EVALUASI PENDIDIKAN Subyek atau pelaku evaluasi pendidikan adalah orang yang melakuakan pekerjaan evaluasi dalam bidang pendidikan.3. C. B. maka alat-alat evaluasi yang digunakan dapat digolongkan menjadi dua macam. dimana pengukuran tentang kepribadian itu dilakukan dengan instrument berupa tes yang sifatnya baku (standardized test). Teknik Test Dibawah ini ada beberapa pendapat dari para ahli mengenai pengertian tes. Dibawah ini akan dijelaskan secara rinci macam-macam tes dan non tes 1. Dalam bukunya “ Evaluasi Pendidikan”. mucthar Bukhori mengatakan tes ialah suatu percobaan yang diadakan untuk mengetahui ada atau tidaknya hasil-hasil pelajaran tertentu pada seseorang murid atau kelompok murid.

mendiskusikan. Scarvia B. Test berfungsi untuk mengukur siswa dan untuk mengukur keberhasilan program pengajaran. Berdasarkan atas jumlah peserta atau pengikut tes. Dan pembagian jenis-jenis tes ini dapat ditinjau dari beberapa sudut pandang. dalam tes ini dituntut kemampuan siswa dalam mengekspresikan gagasannya melalui bahasa tulisan. yaitu: 1) Tes individual 2) Tes kelompok Ditinjau dari 1) Tes buatan guru segi penyusunannya. tes dibedakan atas tiga jenis yaitu: 2) Tes buatan orang lain yang tidak distandarisasi 3) Tes standar atau tes yang sudah distandarisasi Ditinjau dari bentuk pertanyan yang diberikan tes dapat dibedakan atas dua jenis. Interpretasi hubungan c. dan bentuk lain sejenis sesuai dengan tuntutan pertanyaan dengan menggunakan kata-kata dan bahasa sendiri.c. maka tes dibedakan atas dua jenis. Mangenal dan menyatakan informasi d. membandingkan. Dalam buku “Encyclopedia of Educational Evaluation”. Secara umum tes uraian ini adalah pertanyaan yang menuntut siswa menjawabnya dalam bentuk menguraikan. Anderson mengatakan Test is comprehensive assessment of an individual or to an antire program evaluation effort (tes adalah penilaian yang kompherensif-terhadap seorang individu atau keseluruhan usaha evaluasi program. Tes hasil belajar dibedakan atas beberapa jenis. memberi alasan. Dengan demikian. Mengenal relevansi dari suatu informasi . Aplikasi Prinsip b. penjelasan. yaitu: 1) Tes subjektif Tes ini sering pula diartikan sebagai tes essay yaitu tes hasil belajar yang terdiri dari suatu pertanyaan atau suruhan yang menghendaki jawaban yang bersifat uraian dan atau penjelasan. Kebaikan tes essay Dapat untuk mengukur hasil belajar yang kompleks antara lain : a.

Jika mengiginkan informasi tentang sikap. Yang terdiri dari item-item yang dapat dijawab dengan cara memilih diantara alternatif jawaban yang dianggap benar dan paling benar. Tes objektif disebut juga dengan istilah short answer test atau new type test. Merumuskan dan mengenal kesimpulan yang sahih g. yaitu: True-False (benar Salah) Multiple choice (pilihan ganda) Matching (mencocokan) Completion (penyelesaian) Kebaikan tes obyektif . nilai atau pendapat dari peserta tes 4.objektif ini jumlah soal yang diajukan jauh lebih banyak dari pada tes essay. Jika ingin memperoleh pengalaman belajar dari siswa 2) Tes obyektif Maksudnya adalah adalah tes yang dalam pemeriksaannya dapat dilakukan secara objektif. Jawaban erkadang seenaknya dan juga banyak membaca sehingga mubazir d. Jawaban peserta tes tidak mampu mewakili aspek tingkah laku atau sikap sebagai hasil belajar Penggunaan tes essay yang tepat : 1.e. Jumlah siswa relative sedikit 2. Jika waktu/ kesempatan untuk memprsiapkan soal-soal terbatas / sanggat mendesak 3. Hal ini memang dimaksudkan untuk mengatsi kelemahan-kelemahan dari tes bentuk essay. Dalam penggunaan tes. Reliabilitas rendah b. Perlu banyak waktu c. Tes obyektif ada beberapa jenis. Mengindentifikasi asumsi yang mendasarkan suatu kesimpulan Kelemahan tes essay a. Merumuskan dan mengenal hipotesis f.

Reliabilitas skor yang diberikan terhadap perkerjaan anak-anak dapat dijamin sepenuhnya. Dalam kedudukannya seperti ini tes formatif dapat juga dipandang sebagai tes diagnostik pada akhir pelajaran. maka tes obyektif dapat dijawab dengan cepat. Tes obyektif item-item yang dapat dijawab dengan memilih alternative-alternatif yang telah tersedia. Merupakan penguatan (reinforcement) bagi siswa. Sebagai diagnose. b) Manfaat bagi guru  Mengetahui sejauh mana bahan yang diajarkan sudah dapat diterima oleh siswa. Evaluasi formatif mempunyai manfaat baik bagi siswa. yaitu : 1) Tes Diagnostik Tes Diagnostik adalah tes yang digunakan untuk mengetahui kelemahan-kelemahan siswa sehingga berdasarkan kelemahan-kelemahan tersebut dapat dilakukan pemberian perlakuan yang tepat. Siswa akan menerka-nerka dalam menjawab soal. b. b. guru.  Dapat meramalkan sukses atau tidaknya seluruh program yang akn diketahui.  Mengetahui bagian mana dari bahan pelajaran yang belum pelajaran yang belum menjadi milik siswa. Di butuhkan biaya yang cukup besar untuk mencetak atau menstensil tes tersebut Ditinjau untuk mengukur siswa. Kelemahan tes obyektif a. c. dengan kunci jawaban yang sudah ada.a. Usaha perbaikan. maka dibedakan atas tiga macam test. a)     Manfaat bagi siswa Untuk mengetahui apakah siswa sudah menguasai bahan program secara menyeluruh. maupun bagi program itu sendiri. c) Manfaat bagi program itu . 2) Tes Formatif Dari kata “from” yang merupakan dasar dari istilah “foematif” maka evaluasi formatif dimaksudkan untuk mengetahui sejauh mana siswa telah terbentu setelah mengikuti sesuatu program tertentu. Dapat dikoreksi dengan cepat.

3. 2) Reliabilitas Berasal dari kata asal reliable yang artinya dapat dipercaya. Ditinjau jenis tes hasil belajar dari segi bentuk jawaban atau bentuk respon. untuk mengukur partisipasi siswa dalam proses belajar mengajar.     Apakah program yang diberikan merupakan program yang tepat dalam arti sesuai dengan kecakapan anak. yaitu memiliki: 1) Validitas Sebuah tes disebut valid apabila tes tersebut dapat tepat mengukur apa yang hendak diukur. Apakah metode. yaitu apabila jawaban atau respon yang diberikan oleh anak berbentuk bahasa lisan maupun bahasa tulisan. yaitu apabila jawaban atau respon yang diberikan oleh anak itu berbentuk tingkah laku. maka tes hasil belajar dibedakan atas dua jenis yaitu . Tes tidakan. 3) Tes Sumatif Evaluasi sumatif atau tes sumatif merupakan tes yang dilaksanakan setelah berakhirnya sekelompok program atau sebuah program yang lebih besar.Setelah diadakan test formatif maka diperoleh hasil. ketepatan menjawab pertanyaan-pertanyaan yang diajukan oleh guru dalam arti relevan pada permasalahannya. Untuk menentukan seorang anak dapat atau tidaknya mengikuti kelompok dalam menerima program berikutnya. Sebuah tes yang dapat dikatakan baik sebagai alat pengukur harus memilki persyaratan tes. Apakah diperlukan alat. 2. tetapi dilihat melalui: kehadiran. Tes dapat dikatakan dapat dipercaya jika memberikan hasil yang tetap apabila diteskan berkali-kali. terpusatnya perhatian pada pelajaran. sarana dan prasarana untuk mempertinggi hasil yang akan dicapai. Apakah program tersebut membutuhkan pengetahuan-pengetahuan prasyarat yang belum diperhitungkan. Tes verbal. ialah:   Untuk menentukan nilai. Contoh. Manfaat test sumatif. Dari hasil tersebut dapat diketahui. bukan diukur melalui nilai yang diperoleh pada waktu ulangan. Sebuah tes dikatakan reliabel . pendekatan dan alat evaluasi yang digunakan sudah tepat.

tes yang baik adalah yang: mudah dilaksanakan. dan waktu yang lama. tenaga yang banyak. Skala bertingkat (rating scala) Skala menggambaran suatu nilai yang berbentuk angka terhadap suatu hasil pertimbangan. 2. 4) Prakitikabilitas Sebuah tes dikatakan memiliki praktibilitas yang tinggi apabila tes tersebut bersifat praktis dan mudah pengadministrasiannya. maka suatu skala selalu disajikan dalam bentuk angka. Jika dihubungkan dengan validitas. Seperti Oppenheim mengatakan “Rating gives a numerical value to some kind of judgement”. hal ini terutama terjadipada sistem scoringnya. Apabila dikaitkan dengan reliabilitas maka objektivitas menekankan ketetapan pada sistem scoringnya.apabila hasil-hasil tes tersebut menunjukan ketetapan. sedangkan reliabilitas menekankan ketetapan dalam hasil tes. maka: Validitas adalah ketepatan dan reliabilitas adalah ketetapan. Atau dengan kata lain yang dimaksud dengan skala bertingkat atau rating scala adalah tes yang digunakan untuk mengukur kemampuan anak didik berdasarkan tingkat tinggi rendahnya penguasaan dan penghayatan pembelajaran yang telah diberikan b. Kuesioner (questioner) . mudah pemeriksaannya. Teknik Non Tes Yang tergolong teknik non tes adalah: Skala bertingkat (rating scala) Kuesioner (questioner) Daftar cocok (check-list) Wawancara (interview) Pengamatan (observation) Riwayat hidup Dibawah ini akan diuraikan secara rinci macam-macam teknik non test. a. 5) Ekonomis Yang dimaksud ekonomis disini ialah bahwa pelaksanaan tes tersebut tidak membutuhkan ongkos atau biaya yang mahal. dan dilengkapi dengan petunjuk-petunjuk yang jelas. 3) Objektivitas Sebuah dikatakan memiliki objektivitas apabila dalam melaksanakan tes itu tidak ada faktor subjektif yang mempengaruhi.

pengalaman. e.. mendengar dengan telinganya sendiri suaranya. c. 2) Ditinjau dari segi cara menjawab • Kuesioner terbuka adalah daftar pertanyaan dimana si penjawab diperkenankan memberikan jawaban dan pendapat nya secara terperinci sesuai dengan apa yang ia ketahui. apabila yang hendak dimintai jawaban adalah seseorang yang buta huruf maka. d. Pada dasarnya. maka pengamtan memiliki sifat kelebihan dari alat non tes lainnya. sikap atau pendapatnya dan lain-lain. tetangga atau anggota keluarganya. Oleh karena pengamatan ini bersifat langsung mengenai aspekaspek pribadi siswa. Dengan menggunakan alat indra dapat dilakukan pengamatan terhadap aspek-aspek tingkah laku siswa disekolah. kuesioner adalah sebuah daftar pertanyaan yang harus diisi oleh orang yang akan diukur (responden. • Kuesioner tertutup adalah daftar pertanyaan yang memiliki dua atau lebih jawaban dan si penjawab hanya memberikan tanda silang (X) atau cek (√) pada awaban yang ia anggap sesuai. pengetahuan. . Pengamatan atau observasi terdiri dari 3 macam yaitu : 1) observasi partisipan yaitu pengamat terlibat dalam kegiatan kelompok yang diamati. yaitu: 1) Ditinjau dari segi siapa yang menjawab • Kuesioner langsung adalah kuesioner yang dijawab langsung oleh orang yang diminta jawabannya.dapat dibantu oleh anak. Dengan kuesioner ini ini orang dapat diketahui tentang keadaan/data diri. pengamat tidak terlibat dalam kelompok yang diamati.Kuesioner (questioner) juga sering dikenal sebagai angket. Kuesioner dapat dibagi menjadi beberapa macam yang dapat dilihat dari beberapa segi. Pengamatan (observation) Pengamatan adalah teknik evaluasi yang dilakukan dengan cara meneliti secara cermat dan sistematis. dimana dua orang atau lebih berhadaphadapan secara fisik. • Kuesioner tidak langsung adalah kuesioner tidak langsung dijawab oleh secara tidak langsung oleh orang yang dekat dan mengetahui si penjawab seperti contoh. yang satu dapat melihat muka yang lain. 2) Observasi sistematik. Wawancara (interview) Wawancara adalah semua proses tanya jawab lisan. Daftar cocok (check-list) Daftar cocok adalah suatu tes yang berbentuk daftar pertanyaan yang akan dijawab dengan membubuhkan tad cocok (x) pada kolom yang telah disediakan.

f. .3) Observasi eksperimental. pengamat tidak berpartisipasi dalam kelompok. Riwayat hidup Riwayat hidup adalah salah satu tehnik non tes dengan menggunakan data pribadi seseorang sebagai bahan informasi penelitian. kebiasaan dan sikap dari objek yang dinilai. Dengan mempelajari riwayat hidup maka subjek evaluasi akan dpat menarik suatu kesimpulan tentang kepribadian.

Mengadakan pemeriksaan terhaadap butir soal secara rasional. Langkah-Langkah dalam Penyusunan Tes Hasil Belajar Adapun beberapa Langkah-langkah dalam penyusunan tes hasil belajar adalah : 1. membuat atau menulis soal sekaligus dengan kunci jawaban. Dalam hal ini testi melakukan suatu kegiatan berdasarkan intruksi atau petunjuk tertentu dan tester mengamati keterampilan testi dalam menyelesaikan tugas tersebut. Sedangakan didalalam tes lisan dilakukan dalam suatu komunikasi langsung antara tester dan testi. memperbanyak soal 2. menyusun kisi-kisi 3. tes lisan dan tes tindakan. Lazimnya tes tindakan ini disebut ujian praktek. 4. Perangkat yang digunakan adalah pokok-pokok pertanyaan yang akan diajukan dan pedoman penyekoran jawaban. serta pedoman pengamatan (pedoman penilaian). 5. mengorganisasikan tes menurut tipe-tipe soal yang dibuat. mendefinisikan tujuan-tujuan pembelajaran dan lingkup bahan ajar yang mestinya diungkap 2. mengorganisasikan kembali soal dalam bentuk final 9. Dalam tes tertulis ada dua perangkat alat yang harus disediakan yakni lembar soal yang sudah lengkap dengan petunjuk pegerjaannya dan lembar jawaban yang akan diisi oleh siswa. . mengadakan uji coba (try out) 7. Pemiihan jenis-jenis ts yang harus digunakan tergantung pada banyak factor yang perlu dipertimbangkan: Pertama : pertimbangan terhadap aspek perilaku atau bahan ajar yang akan diungkap. Jenis Tes Hasil Belajar Secara garis besar terdapat tiga jenis hasil belajar yakni : tes tertulis. dan perlengkapan atau alat-alat praktek yang diperlukan. merevisi soal 8. Pada tes ini tester mengajukan persoalan secara lisan dan testi harus menjawab pertanyaan-pertanyaan secara lisan pula.PROSEDUR PENYUSUNAN HASIL BELAJAR Posted on 30 Juni 2008 by Abdul Majid 1. Hal yang harus disiapkan disini adalah petunjuk atau intruksi tentang kegiatan yang harus dilakukan. membuat petunjuk pengerjaan soal. Berdeda dengan kedua tes diatas. isi uji dalam tes tindakan tidak disajikan dalam bentuk pertannyaan melainkan dalam bentuk tugas. 6.

Tes Uraian Tes uraian merupakan suatu bentuk soal yang harus dijawab atau dipecahkan oleh testi dengan cara mengemukan pendapat secara terurai. Tes Objektif . e. Dalam tes ini memungkinkan timbulnya variasi dalam jawaban yang diberikan oleh testi (siswa) karena jawaban yang diberikan bersifat subjektif. 1. b. 3. Proses penyekoran sering terganggu oeh factor-faktor lain diluar maksut pengukuran. Ruang lingkup yang diungkap sangat terbatas. Memungkinkan timbulnya keragaman dalam memberikan jawaban sehingga tidak ada rumusan benar yang pasti. Tidak memberi kesempatan kepada siswa untuk menebak jawaban. Dapat melihat jalan pikiran siswa dalam menjawab persoalan. misalnya keindahan dan kerapian tulisan. Tes uraian biasanya digunakan untuk mengukur kemampuan kognitif yang relative tinggi dan kompleks. Menunutut kreatifitas siswa untuk mengorganisasikan sendiri jawabannya. Lebih memberikan peluang untuk bersifat subjektif d. Peryusunan Tes Tertulis Pada dasarnya ada dua bentuk soal tes tertulis yang lazim kita gunakan yakni: tes uraian dan tes objektif. Kelemahan: a. d. Menuntut siswa untuk mengintegrasikan pengetahuan dalam menjawab persoalan c. Penyusunan Tes Hasil Belajar a.Kedua : pertimbangan terhadapa waktu yang tersedia. 2. Dapat mengungkap aspek-aspek pengetahuan atau perilaku yang kompleks secara leluasa b. Adapun keunggulan dan kelemahan tes uraian yaitu: Keunggulan : a. Ketiga : pertimbangan jumblah peserta tes. Keempat : pertimbangan terhadap kelengkapan fasilitas yang dibutuhkan. c.

Proses penilaian dapat dilakukan secara objektif karena kunci jawaban sudah dapat ditentukan secara pasti. Terdapat kemungkinan untuk dapat menebak jawaban dengan tepat. tetapi hal ini sulit untuk dilakukan secara serempak terhadap semua testi oleh tester yang sama. tugas-tugas dan persoalan-pesoalan dalam tes objektif sudah terstruktur. Adapun keunggulan-keunggulan dan kelemahan dari tes lisan adalah : Keunggulan : a. b. Tak ada kesempatan untuk menyontek . Tes lisan dilakukan dalam suatu komunikasi langsung antara tester dan testi.Berbeda dengan tes uraian. Kelemahan : a. Waktu yang dibutuhkan relative lebih singkat b. Mengukur kemampuan berpikir taraf tinggi secara lebih leluasa. b. perbedaannya terletak pada pelaksanaannya. Proses pensekoran dapat dilakukan secara mudah karena kunci jawaban dapat dibuat secara pasti d. Membatasi kreativitas siswa dalam menyusun jawaban sendiri. pada umumnya lebih terbatas pada hal-hal yang factual. 1. Tes lisan digunakan untuk mengevaluasi hasil belajar berupa kemampuan untuk mengemukakan pendapat-pendapat atau gagasan-gagasan secara lisan. Memungkinkan untuk melakukan pengecekan 3. Jika bahan ajar yang diajukan sama maka ideal sekali kalau siswa mendapat perangkat soal yang sama. Adapun keunggulan-keunggulan dan kelemahan-kelemahan tes objektif adalah : Keunggulan : a. Panjang pendeknya suatu tes (banyak sedikitnya butir soal) bisa berpengaruh terhadap kadar reliabilitas c. Tidak dapat mengetahui jalan pikiran testi dalam menjawab suatu pesoalan. Bahan ajar yang diungkap dengan ts objektif. 2. c. sehingga jawaban terhadap soal-soal tersebut sudah dapat ditentukan secara pasti. Penyusunan Tes Lisan Pada dasarnya tes lisan sama dengan tes uraian.

Memerlukan waktu yang relatif . Tak ada kesempatan untuk menyontek Kelemahan : 1. Adapun keunggulan dan kelemahan dari tes tindakan ini adalah : Keunggulan : 1. Lebih memungkinkan untuk terjadinya ketidakadilan Memungkinkan penguji untuk menyimpang dari lingkup bahan ajar yang diujikan Membutuhkan waktu yang relative lebih lama Memerlukan banyak format intrumen Peluang subjektivitas dalam penilaian lebih terbuka. 3. 2. Memerlukan biaya yang relative lebih besar 3. Dalam tes tindakan persoalan disajikan dalam bentuk tugas yang harus dikerjakan oleh testi. Pada intinya ada dua unsur yang yang bisa dijadikan bahan penilaian dalam tes tidakan yaitu: proses dan produk. teori. 4.Kelemahan : 1. 3. 5. Dapat digunakan untuk mengecek kesesuaian antara pengetahuan. Penyusunan Tes Tindakan Tes tindakan dimaksutkan untuk mengukur keterampilan siswa dalam melakukan suatu kegiatan. c. Cocok untuk mengukur aspek perilaku psikomotor 2. dan keterampilan mempraktekkannya. Lebih sulitdalam mengadakan pengukuran 2.

c. Pertanyaan-pertanyaan tersebut antara lain: 1) Apakah banyaknya soal untuk tiap topik sudah seimbang ? 2) Apakah semua soal menanyakan bahan yang telah diajarkan ? 3) Apakah soal yang kita susun tidak merupakan pertanyaan yang membingungkan (dapat disalah tafsirkan) ? 4) Apakah soal itu tidak sukar untuk dimengerti ? 5) Apakah soal itu dapat dikerjakan oleh sebagian besar siswa ? b. Mengadakan checking reliabilita. juga masih sukar menyadari bahwa tesnya masih belum sempurna. Mengadakan checking validitas. 3) Memperoleh gambaran secara selintas tentang keadaan yang kita susun.Menganalisis Hasil Test Posted on 20 Juni 2008 by Masyhuri Arifin MENGANALISIS HASIL TES 1. 2) Memperoleh informasi yang akan dapat digunakan untuk menyempurnakan soal-soal untuk kepentingan lebih lanjut. Ada 4 cara untuk menilai tes. Oleh karena itu cara yang paling baik adalah secara jujur melihat hasil yang diperoleh oleh siswa. yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita susun. Menilai tes yang dibuat sendiri Guru yang sudah banyak berpengalaman. Validitas yang paling penting dari tes buatan Guru adalah validitas kurikuler. dan lain-lain keadaan soal tersebut. mengajar dan menyusun soal-soal tes. Meneliti secara jujur soal-soal yang sudah disusun. taraf kesukaran. Mengadakan analisis soal (item analysis). Analisis soal adalah suatu prosedur Yang sistematis. yaitu: a. d. kadang-kadang dapat diperoleh jawaban tentang ketidak jelasan perintah atau bahasa. Faedah mengadakan analisis soal: 1) Membantu kita dalam mengidentifikasi butir-butir soal yang jelek. Salah satu indikator untuk tes yang .

Sabaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.Mempunyai realibilitas yang tinggi adalah bahwa kebanyakan dari soal-soal tes itu mempunyai daya pembeda yang tinggi. Taraf kesukaran Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar.0. Jawaban tesnya dianalisis dan jawaban tertera seperti berikut ini.0 menunjukkan bahwa soal itu terlalu sukar. Soal dengan indeks kesukaran 0. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. T yang mengajarkan tes yang terdiri dari 20 soal. 0 = jawaban salah) SISWA Nomor Soal Skor Siswa 1 A B C 2 3 4 5 6 7 8 9 10 11 1 1 0 0 1 0 1 1 0 1 0 1 0 0 1 0 1 1 0 0 1 1 0 0 1 1 1 1 0 1 12 13 14 15 1 0 1 0 1 1 1 1 1 0 0 1 1 0 1 16 17 18 19 1 1 1 0 1 0 0 1 1 1 1 0 1 1 1 20 13 11 14 : . Besarnya indeks kesukaran antara 0. Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut indeks kesukaran (difficulty index) dengan simbol P ”proporsi”. Analisis Butir Soal (Item Analysis) Tiga masalah yang berkaitan dengan analisis soal.d. Indeks kesukaran menunjukkan taraf kesukaran soal.0 menunjukkan bahwa soalnya terlalu mudah.00 sampai dengan 1. Rumus mencari P adalah : Dimana P = indeks kesukaran B = banyaknya siswa yang menjawab soal itu dengan betul JS = Jumlah seluruh siswa peserta tes Latihan : Ada 20 orang dengan nama kode A s. sebaliknya indeks 1. 2. yaitu : a. (1 = jawaban betul.

30 adalah soal 0. Kisaran indeks diskriminasi antara 0.70 adalah soal sbb: sukar sedang . Tetapi indeks kesukaran tidak mengenal tanda (-).00. Dari 40 orang siwa tersebut 12 orang yanh dapat mengerjakan soal nomor 1 dengan betul. Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi (D).70 sampai 1.00 adalah soal mudah b.D 0 1 0 0 1 1 0 1 0 0 0 1 1 1 E 1 1 0 0 1 0 1 1 0 1 1 1 1 1 F 0 0 0 1 1 1 0 1 0 0 1 1 1 0 G 1 0 0 1 0 0 1 1 0 1 0 1 1 1 H 0 0 0 1 0 0 1 1 0 0 0 1 1 0 I 1 1 1 1 1 0 1 1 0 1 0 1 1 0 J 0 1 1 1 1 0 1 1 0 0 1 1 1 1 K 1 1 0 0 0 0 1 1 0 1 0 1 1 0 L 0 0 1 0 0 1 0 0 0 0 0 0 1 0 M 1 0 0 0 1 0 1 1 1 1 1 1 1 0 N 0 1 1 0 1 1 1 1 0 1 1 1 1 1 O 1 1 0 0 1 0 1 0 1 0 0 1 1 0 P 0 1 0 1 1 1 1 0 0 0 0 1 1 1 Q 1 0 0 0 0 0 0 1 0 1 1 1 1 0 R 0 1 0 1 1 0 1 1 0 1 1 1 1 0 S 1 1 0 1 1 0 1 1 1 0 0 1 1 1 T 0 1 0 1 1 0 1 1 0 0 0 1 1 1 JUMLAH 10 14 4 9 15 6 18 17 3 11 10 18 20 10 9 7 10 14 13 13 Contoh penggunaan 0 0 0 1 1 0 0 0 0 1 1 1 0 0 0 1 0 0 1 0 1 0 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 1 1 1 1 1 0 0 0 1 0 1 1 0 0 0 0 1 0 0 1 1 1 0 1 1 1 1 1 1 0 1 1 1 1 1 0 0 1 1 1 1 0 0 0 0 0 0 1 1 0 0 0 0 1 1 0 1 1 1 1 1 9 14 8 13 9 17 13 10 4 13 16 12 10 9 11 14 10 Misalnya jumlah siswa peserta tes dalam suatu kelas ada 40 orang.00 sampai Soal dengan P 0. diklasifikasikan 0.00 sampai 1. dapat ditafsirkan bahwa: Soal nomor 1 mempunyai taraf kesukaran .Soal nomor 9 adalah soal yang tersukar karena hanya dapat dijawab betul oleh 2 orang Indeks kesukaran sering Soal dengan P 1. Daya Pembeda Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan rendah).30 sampai . Maka indeks kesukarannya adalah : Dari tabel yang disajikan tersebut.Soal dengan P 0.

Tanda negatif ini digunakan jika suatu soal ”terbalik” menunjukkan kualitas testee.Yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai. Pola jawaban soal : .dan indeks diskriminasi ada tanda negatif.00 Daya pembeda Negatif rendah (positif) daya pembeda daya pembeda tinggi Cara menentukan daya pembeda ( nilai D) Untuk ini perlu dibedakan antara kelompok kecil (kurang dari 100) dan kelompok besar (100 orang ke atas). c. b). Untuk kelompok kecil Seluruh kelompok testee dibagi dua sama besar.00 0. Untuk kelompok besar Untuk kelompok besar biasanya hanya diambil kedua kutubnya saja yaitu 27 % skor teratas sebagai kelompok atas (JA) dan 27 % skor terbawah sebagai terbawah (JB). Rumus Mencari D (Indeks diskriminasi) adalah : Keterangan J = Jumlah peserta tes JA = banyaknya peserta kelomppok atas JB = banyaknya peserta kelompok bawah BA = banyaknya peserta kelompok atas yang menjawab soal itu dengan benar BB = banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar PA = proporsi peserta kelompok atas yang menjawab benar PB = Proporsi peserta kelompok bawah yang menjawab benar. Ada tiga titik daya pembeda yaitu: -1.00 1. Kemudian seluruh pengikut tes . lalu dibagi 2.dideretkan mulai dari skor teratas sampai terbawah. a). 50 % kelompok atas dan 50 % kelompok bawah.

Pola jawaban soal diperoleh dengan menghitung banyaknya testee yang memilih jawaban a. Dengan melihat pola jawaban soal . dapat diketahui : 1) Taraf kesukaran soal. 2) Daya pembeda soal. Sesuatu distraktor dapat diperlakukan dengan tiga cara : a.b. Diterima. atau datau yang tidak memilih pilihan manapun (blangko). . c.c. Ditulis kembali. Ditolak. karena sudah baik. . b. 3) Baik dan tidaknya distraktor.Pola jawaban soal adalah distribusi testee dalam hal menentukan pilihan jawaban pada soal bentuk pilihan ganda. karena kurang baik. karena tidak baik.

Terdapat beberapa alasan mengapa mengukur pencapaian siswa. Pengertian mempunyai implikasi kemampuan mengekspresikan pengetahuan ini ke berbagai cara. contoh dan masalah. Hasil pencapaian tes dapat juga digunakan pada evaluasi pembelajaran. Pertama menginformasikan kepada guru dan siswa mengenai tingkat performance siswa pada suatu pembelajaran.BAB 1 PENDAHULUAN Guru tidak dapat efektif jika tidak dapat mengukur secara akurat pencapaian siswanya. Kita mengartikan pengetahuan sebagai bagian tertentu dari informasi. melihat hubungan dengan pengetahuan lain.. Umpan balik memberikan beberapa fungsi. menentukan peringkat. dan dapat mengaplikasikannya ke situasi baru. MENGUKUR PENCAPAIAN Yang dimaksud dengan pencapaian adalah pengetahuan. Kedua memberikan informasi diagnostic yang dapat digunakan untuk merencanaka pembelajaran selanjutnya. Ketrampilan kita artikan mengetahui bagaimana mengerjakan sesuatu . Informasi ini dapat dignakan untuk merencanakan pembelajaran selanjutnya dan memberikan nasehat untuk metode pembelajaran alternatif. Selain sebagai umpan balik alasan mengukur pencapaian adalah untuk memberikan motivasi. profisiensi adalah memberikan sertifikat bahwa siswa telah mencapai tingkat kemampuan (minimal ) dalam suau bidang tertentu. Hal yang sama pentingnya adalah guru tidak dapat memperbaiki jika tidak memperoleh indikasi efektifitas dalam mengajar. Mengapa mengukur Kita mengukur untuk menggambarkan pengetahuan dan ketrampilan siswa atau sebagai dasar untuk mengambil keputusan. kita dapat memperoleh pengukuran kemajuan dan perbaikan siswa. Pengetahuan pada performance siswa membantu guru untuk mengevaluasi pembelajaran mereka dengan menunjuk area dimana pembelajaran telah efektif dan area dimana siswa belum menguasai. . dan ketrampilan yang dikuasai sebagai hasil pengalaman pendidikan khusus. dan atau remedial. Ketiga dengan mempertimbangkan hasil beberapa tes. pengertian. Umpan Balik Fungsi penting pada tes pencapaian adalah memberikan umpan balik dengan mempertimbangkan efektifitas pembelajaran. Mengukur secara akurat ini penting sebab guru tidak dapat membantu siswanya secara efektif jika tidak mengetahui pengetahuan dan ketrampilan yang dikuasai siswanya dan pelajaran apa yang masih menjadi masalah bagi siswanya.

hal yang harus diperhatikan dalam merencanakan tes adalah : · Relevansi Tes harus mengukur hasil yang merefleksikan pencapaian tujuan dan tujuan khusus suatu kursus. Informasi ini kemudian dapat digunakn unuk memodifikasi pembelajaran langsung dan belajar. perbedaan faktor akan mempengaruhi . Selain itu informasi yang diperoleh adalah penguasaan materi prasyarat. Hal. Hal lain yang dapat disaring dari tes pencapaian ini adalah mengukur pengetahuan siswa mengenai materi yang telah diajarkan. tes unit dsb. . tingkat kesukaran dan content sama dsb ). MERENCANAKAN TES Dalam merencanakan tes kita harus mengetahui karakteristik instrumen mengukur yang baik. pertanyaan yang diajukan dsb. Dan hal ini digunakan sebagai evaluasi formative. pop kuis. Apa tujuan tes dan informasi apa yang ingin diperoleh dalam tes sangat penting diperhatikan dalam merencanakan tes. menjawab pertanyaan. Bagaimana mengukur pencapaian Beberapa metode yang tersedia adalah Informal dan metode Observasional contohnya pengetahuan yang terlihat dari performance verbal dalam kelas. Setiap item tes harus merefleksikan hasil pembelajaran yang diinginkan. guru membuat tes sendiri contoh dengan kuis mingguan. . Informasi ini dapat diperoleh dari tes pencapaian. · Selama pembelajaran. Untuk guru pengukuran ini digunakan sebagi evaluasi sumatif. Biasanya evaluasi ini digunakan sebagai dasar penentuan tingkatan ( grade ). Tes harus mengandung materi yang telah diajarkan.Kapan mengukur pencapaian · Pada permulaan pembelajaran Untuk merencanakan pembelajaran yang efektif kita harus mempertimbangakan kemampuan dan karakteristik siswa. Tes yang diberikan selama pembelajaran digunakan untuk menentukan bagaimana kemajuan pembelajaran. · Kondisi standar Jika pengguna tes tidak menggunakan tes dibawah kondisi yang sama ( waktu yang diberikan sama. dan tes standar. kontribusi dalam diskusi. · Pada akhir pembelajaran Tes ini akan mengukur seberapa bagus materi telah dipelajari dengan membandingkan satu siswa dengan siswa lain atau dengan beberapa profisiensi standar.selain tu tes juga mengukur hanya pengetahuan dan ketrampilan yang telah diajarkan dalam kursus · Pengambilan sampel yang tepat. Jika hal ni tidak mungin maka tes harus mencakup sampling representatitif hasil pembelajaran ang penting.

True -False item True False item adalah kalimat deklarative. SHORT ANSWER. Jika kita akan mengembangkan dimensi skill dalam perencanaan kita harus dapat mengidentifikasi dan mengklasifikasikan kognitif skill.CHOICE ITEM.Kesukaran item ditentukan beberapa hal antara lain umur siswa. item yang jelek harus di edit dan direvisi. skor yang akurat akan menggambarkan pencapaian siswa dan dapat digunakan untuk mengambil keputusan. item harus jelas dan sederhana. AND PROBLEM ITEMS Ketika membuat tes guru dapat memilih bermacam-macam tipe item seperti true false. analisis. ESSAY. yakin bagaimana siswa merespon. dan tujuan tes. flexibel. · Konsistensi Konsistensi atau reliability adalah hal penting dalam tes karena jika tes tidak menguur secar konsisten skor individu akan bervariasi dari waktu ke waktu. tugas siswa adalah melengkapi dengan pernyataan yang paling tepat. essay. Jika stem merupakan kalimat yang tidak lengkap. Metode ke II adalah sampling objective yang mengukur pencapaian hasil pembelajaran yang diinginkan dan lebih menekankan kepada tujuan khusus perilaku. Multiple choice item Multiple choice item terdiri dari stem dan nomor respon yang mungkin.s · Skor yang penuh arti Skor akan memberikan informasi yang berguna. sintesis. siswa.performance sehingga skor mereka tidak dapat langsung dibandingkan. kita harus memberikan alternatif jawaban yang mungkin. Siswa disuruh memilih alternatif yang benar atau paling tepat. aplikasi. tujuan testing untuk membedakan antara siswa yang memiliki berbagai tingkat pengetahuan mengenai suatu subyek. item harus independen. Dalam mastery testing item yang bagus akan dijawab benar oleh siswa yang menguasai materi. ALTERNATIVE . Pendekatan ketiga adalah pendekatan kombinasi dengan mengembangkan content/skill tes dengan mengidentifikasi perilaku yang tepat pada setiap sel konten/ skill. · Kesukaran yang sesuai Kesukaran item didefinisikan sebagai persentase manusia yang menjawab item dengan benar. pemahaman. Alternatif jawaban terdiri dari jawaban yang benar dan beberapa pengecoh. short answer. Dalam keadaan lain kesukaran item digunakan untuk menentukan grade. Untuk menghasilkan item yang bagus harus : mengambil materi penting. Format yang diseleksi tergantung pada subyek. Jika item merupakan pertanyaan. tujuan kursus. Metode I merencanakan tes content/ skill. Stem mungkin kalimat yang tidak lengkap atau pertanyaan. evaluasi. Pengukuran pencapaian disini dengan memperhatikan pengetahuan (dimensi isi) dan proses kognitif (dimensi skill). multiple choice. siswa menilai pernyataan yang disajikan benar atau . problem. Klasifikasi yang diberikan menggunakan Taxonomy of Educational Objectives : Cognitive Domain dari Bloom : pengetahuan. Dalam merencanakan suatu tes terdapat tiga metode.

Matching Item Matching terdiri dari dua paralel daftar. Stimulus dapat menggunakan pernyataan verbal. Bagaimanapun. Jawaban ini mungkin satu paragraf atau beberapa halaman. Perbedaan antara short answer dengan essay question adalah panjangnya respon yang dibutuhkan. pertama True-False item ini hanya dapat mengukur pengetahuan saja. Erdapat beberapa argumen mengenai True-False item ini. Short-answer item yang sering digunakan adalah melengkapi item dengan kalimat atau beberapa kata yang hilang.salah. Pada essay question lebih ditekankan pada mengorganisasikan dan menggabungkan materi. kalimat. Seringkali ke ambigo-an ini dirasakan oleh siswa yang tidak mempunyai pengetahuan yang dibutuhkan untuk menjawapab item. Problem dapat dilakukan pendekatan dengan berbagai cara. seringkali beberapa kalimat panjang yang menggambarkan situasi dan atau problem.Tugas siswa adalah mencocokkkan bentuk dari dua daftar. 20 mempersiapkan lembar jawaban. yang satu berisi stimulus atau stem yang lain berisi respon yang mngkin. 4) menentukan batasan waktu. . Essai question terdiri dari pernyataan. Menyusun Tes Memilih item dimana konten dan skill atau tujuan khusus mewakili proporsi seperti yang diinginkan. Problems Dalam beberapa cara problem memberikan fungsi yang sama dalam kursus matematika dan science sebagai essay question yang dikerjakan dalam studi sosial dan kursus humanity. hal ini adalah menyeleksi respon ang paling cocok untuk setiap stimulus. matching item cocock untuk beberapa tipe materi. Short answer Short answer memberikan beberapa tipe item yang akan direspon siswa dengan kata. Setelah itu yang perlu difikirkan adalah bagaimana menyajikan item kepada siswa. bebrapa langkah tambahan harus dilengkapi sebelum tes diadministrasikan : 1) menyeleksi bagian item untuk dirangkum pada tes dan menyusun dalam bentuk yang akan diberikan kepada siswa. Essay Question. Argumen kedua True-False item bersifat ambigo. Argumen ketiga pendidik yakin bahwa siswa dapat memperoleh skor tinggi dengan menebak. Tugas siswa adalah menulis essay untuk menjawab problem yang dituju. Situasi dan atau beberapa informasi disajikan dan tugas siswa adalah memberikan solusi. 5) mengembangkan prosedur skoring dan aturan. karena hanya dua pilihan maka siswa mempunyai kesempatan 50 % untuk mendapatkan jawaban benar atau salah dengan menebak. 3) menulis tujuan tes. simbol atau nomer. phrase. Mengadministrasikan dan Mensekor test Mempersiapkan tes Setelah anda menulis item.

kita dapat mengetahui mana soal yang sukar mana item yang mudah. Menggunakan jawaban yang terpisah akan memberi keuntungan. karena ini akan mengurangi jawaban yang salah dan tidak membuat bingung anak-anak. Menskor Tes Ketika menskor tujuannya adalah memperoleh tujuan dan skor yang adil. Petunjuk Jika siswa tidak mengenal prosedur testing. · Iklim Psikologi Membuat iklim positif dalam atmosfer kelas. ANALISA TES ITEM INDIVIDU Tujuan analisa item adalah mengevaluasi kualitas item tes.Lembar jawaban Terdapat pilihan antara merespon pada tes itu sendiri atau pada lembar jawaban terpisah. dimana guru dapat mengecek jawaban tanpa harus melihat materi tes. Tes akan diadministrasikan dalam kelas. Sebagai implikasinya siswa harus memperoleh cukup waktu untuk menyelesaikan tes. Mengadministrasikan Tes · Setting fisik. Ruang harus tenang. Pertama adalah kesukaran item. Bimbingan dan saran yang dibuat harus membantu pencapaian tujuan. Index pembeda item menyatakan apakah item membedakan antara siswa yang mempunyai pengetahuan banyak dan siswa dengan pengetahuan sedikit pada materi yang di tes kan. Komponen yang kedua adalah menentukan kekuatan item.Menjawab pada lembar tes hanya drekomendasikan pada siswa yang masih kecil. Hal ini dapat dilakukan dengan memberi pengertian alasan tes dilakukan dan meyakinkan siswa bahwa persiapan tes yang bagus akan membantu siswa. Kondisi sama yang mendukung efektifitas belajar harus dilanjutkan selama tes. Dengan mengobservasi bagaimana siswa merespon berbagai item. Batasan Waktu Ketika mengukur pencapaian. Analisa ini tepat digunakan pada pilihan ganda dan mencocokkan item. ventilasi bagus dan bebas interupsi. . kita lebih menginginkan keuatan tes dari pada kecepatannya. Komponen ketiga dari analisa item adalah evaluasi distraktor. Analisa item secara umum berkaitan dengan tiga aspek item. petunjuk harus diberikan pada permulaan tes. Index kesukaran item didefinisikan sebagai proporsi siswa yang menjawab item dengan benar. sehingga siswa dapat menghadapi situasi tes dengan relax. lampu terang.Seluruh proses harus dirancang untuk memberikan informasi apa yang dapat dilakukan siswa untuk membimbing mereka menuju studi selanjutnya.

Dalam mengukur konsistensi dikenal standar kesalahan pengukuran dimana hal ini sebagai index terdapat seberapa kesalahan pengukuran pada skor individu. yang memberikan spesifikasi mengenai pengetahuan dan ketrampilan apa yang ingin diukur. Metode ini digunakan untk melihat kemampuan dan ketrampilan yang tidak dapat diukur secara efektif dengan tes tertulis. dimana hal itu akan memberikan informasi yang dibutuhkan untuk memperbaiki kinerja siswa dan memfasilitasi belajar mereka. adalah menspesifikasi secara lebih . termasuk mengeliminasi peringkat. objective referenced. METODE LAIN YANG DIGUNAKAN UNTUK MENGUKUR PENCAPAIAN Selain menggunakan tes secara tertulis. Semua prosedur disarankan.Kelompok orang yang digunakan untuk pembanding dinamakan kelompok norma. Apakah siswa akan mendapat skor yang sama jika diberikan tes pada dua kejadian yang berbeda/. Apa yang dibutuhkan untuk memperbaiki proses penentuan peringkat. Content Referenced Test Pendekatan ini mempunyai beberapa nama seperti criterion reference. Pada CRT kita membuat beberapa item untuk mengukur setiap tujuan yang penting. Realibilitas Reliabilitas tes memberikan konsistensi pada apa yang diukur. hal ini memberikan bukti yang dibutuhkan untuk membuat beberapa keputusan penting dalam pendidikan. Validitas yang berhubungan dengan criterion yang berkaitan dengan seberapa bagus skor tes memprediksi kinerja (nn tes). Reliabilitas berkaitan dengan pertanyaan selanjutnya. domain referenced. guru dapat menilai pencapaian siswa. GRADING (memberikan peringkat) Walaupun penentuan peringkat yang digunakan pada saat ini jauh dari sempurna. apakah siswa mendapat skor sama jika diberikan dua bentuk tes yang berbeda. STANDAR PENCAPAIAN TES Norm Reference Tes Pada norm reference tes skor diinterpretasikan dengan membandingkan kinerja individu pada skor yang didapat pada peserta tes lain. Observasi ini akan mengenalkan kita pada proses atau metode dalam mempertunjukkan kinerja . Faktor penting yang ditekankan disini adalah skor diinterpretasikan kedalam terms tingkat penguasaan siswa pada konten domain spesifik. Validitas Disini dikenal konten validitas yang berkaitan dengan seberapa bagus contoh item tes mendefinisikan domain pengetahuan.RELIABILITAS DAN VALIDITAS. Metode yang dilakukan dengan melakukan observasi. tidak hanya contoh item yang menyajikan konten domain. ketrampilan atau kemampuan. Validitas konstruk berkaitan dengan seberapa bagus tes mengukur variabel psikologi. mengenalkan pada hasil.Tipe validitas yang relevan dengan tes pencapaian dalam kelas adalah konten validitas. seberapa stabil skor yang didapat.

Komentarku (My comment) Setelah membaca buku Frederick. dan ketrampilannya. pengetahuan. tes performance akan lebih tepat. MENGGUNAKAM TES PENCAPAIAN DALAM PMBELAJARAN Mengukur pencapaian adalah memperoleh informasi pada pembelajarab individu siswa. bagaimana kemajuan belajarnya dan sebagainya. penentuan peringkat dan penggunaan tes pencapaian dalam pembelajaran. penentuan peringkat akan dengan bagus mengukur pencapaian relatif siswa atau penguasaan isi. instrumen pengukuran biasanya akan ditentukan oleh tujuan pembelajaran pada suatu kursus. dan harus diinterpretasikan dengan cara norma refference. Informasi ketiga yang dibutuhkan adalah materi apa dalam pelajaran yang sudah diketahui siswa. penugasan dan tes harus mengacu pada content reference/ citerion reference. kita dapat menentukan materi apa yang telah dikuasai siswa. menganalisa skor. jenis-jenis tes. Infomasi kedua yang dibutuhkan adalah penguasaan pengetahuan prasyarat dan ketrampilan. standar tes pencapaian tes. Dalam evaluasi formatif. G. harus mempunyai distribusi skor yang luas. Pembahasan mengenai pengukuran pencapaian ini dimulai dari mengapa.. kapan. tidak membandingkan siswa dengan siswa lain. Evaluasi Pembelajaran. Brown yang berjudul Measuring Classroom Achievement dapat ditarik suatu kesimpulan bahwa buku ini memberikan suatu gambaran umum mengenai pengukuran pencapaian siswa dalam kelas. materi dan instruktur. Tetapi untuk tujuan lain dapat juga digunakan untuk mengukur efektifitas metode pembelajaran. Jika tujuan anda adalah merangking siswa. Jika tujuannya adalah mengajarkan motor skill. dan problem belajar apa yang dialami siswa. bagaimana menskor. . essay test akan lebih tepat. Pada evaluasi sumatif . Karena tujuan utama dari evaluasi formatif adalah mengidentifikasi problem belajar dan memodifikasi pembelajaran untuk membantu siswa belajar. Jika tujuannya adalah menilai kemampuan siswa untuk mengorganisasikan dan mengintegrasikan materi. apa yang mereka tahu. Informasi ini dapat digunakan untuk membantu kita merencanakan pembelajaran. apa yang dapat mereka lakukan. dan bagaimana mengukur pencapaian tersebut hingga bagaimana merencanakan sebuah tes. agar siswa lebih mudah beradaptasi pada pembelajaran kita yang berkaitan dengan kemampuan. Poin pertama dalam proses pembelajaran adalah kita membutuhkan informasi mengenai individu siswa pada permulaan pembelajaran. Jika standar prosedur diikuti. Tes pencapaian yang paling banyak digunakan adalah mengukur belajar individu sisiwa. tes harus dibuat lebih luas.jelas dasar dan arti dari peringkat dan prosedur lembaga untuk meyakinkan bahwa berbagai instruktur menggunakan prosedur yang dapat dibandingkan dalam penentuan peringkat.Hal ini difokuskan pada penguasaan siswaterhadap materi tujuan khusus. kesalahan apa yang dibuat siswa.

seperti dosen. ke tiga buku tersebut memberikan penjelasan yang hampir sama walaupun menggunakan bahasa yang berbeda. mahasiswa pendidikan dan orangorang yang mempunyai perhatian terhadap dunia pendidikan. hanya yang perlu dipertimbangkan adalah efisien dan efektifkah tes tersebut digunakan untuk mengukur tingkat cognitive yang diinginkan. true.False. Grondlund dalam bukunya Constructing Achievement Tes serta buku Evaluation to Improve Learning yang ditulis Benyamin S. analisa sistesa maupun evaluasi. Untuk orang-orang yang tidak mempunyai latar belakang ilmu pendidikan dan membuat langkah baru dalam dunia pendidikan. aplikasi. menganalisa dan mengevaluasinya. short answer hanya bagus untuk mengukur hasil belajar pada tingkat pengetahuan. karena multiple choice hanya bisa mengukur tiga level kognitif itu saja. guru. dan aplikasi saja. jenis-jenis tes. materi yang membahas mengenai tes pencapaian seperti bagaimna merencanakan tes. kriteria yang digunakan. Gronlund dalam bukunya Constructing Achievement Tests mengatakan bahwa objective tes seperti multiple choice. Jika terdapat pertanyaan buku manakah yang terbagus dari tiga buku tersebut maka saya akan mengatakan bahwa yang terbaik adalah jika kita menggabungkan inti materi yang terdapat pada ketiga materi tersebut dimana kita mengambil hal-hal yang cocok dengan pendapat kita. informasi maupun contoh. Brown tersebt bahwa semua jenis tes yang termasuk dalam kategori objective tes sebenarnya dapat digunakan untuk mengetahui hasil belajar siswa baik pada tingkat pengetahuan. Dalam membandingkan antara objective tes dan essay tes Frederick G. pemahaman. Sedangkan dalam buku Measuring Classroom Achievement dikatakan bahwa adalah salah jika ada pendapat bahwa multiple choice yang merupakan salah satu jenis dari objective tes hanya dapat digunakan untuk tes pengetahuan dan materi faktual.Secara umum buku ini cukup bagus digunakan sebagai pegangan untuk orang. Saya setuju dengan pendapat yang disampaikan oleh Frederick G. . Menurut saya semua jenis tes obyektif dapat mengukur 6 tingkat cognitive skill.buku lain seperti buku yang ditulis oleh Norman E. bagaimana menskor. Brown dan Norman E. Multiple choice dapat digunakan untuk mengukur level cognitive skill yang lebih tinggi yaitu dengan menggunakan pernyataan yang merupakan situasi baru. Banyak guru mengatakan bahwa di Indonesia untuk siswa tingkat sekolah dasar sampai sekolah menengah atas guru membuat tes hasil belajar hanya untuk mengukur pengetahuan. hanya untuk poin. pemahaman. menyusun tes. tetapi tidak tepat untuk sintesa dan evaluasi.soal tes multiple choice akan sangat menentukan apakah tes tersebut dapat digunakan untuk mengukur tingkat cognitif skill yang lebih tinggi atau tidak karena membuat tes untuk mengetahi hasil belajar pada tingkat pengetahuan akan lebih mudah. dan analisis. Bloom. Jika dibandingkan dengan buku. aplikasi. Norman E. buku ini akan sangat bermanfaat karena meskipun buku ini termasuk buku lama(1981) tetapi bahasa yang digunakan mudah di pahami serta mencakup substansi materi yang cukup luas.orang yang berkecimpung dalam dunia pendidikan.pon tertentu saja mereka mempunyai sedikit perbedaan. Ketrampilan dalam membuat stem pada soal. pemahaman.

Karena memberikan kemungkinan jawaban yang yang tidak menuju kesatu arah saja/ konvergen serta memberi kesempatan kepada siswa untuk merespon tanpa dibatasi maka tes essay ini dapat digunakan untuk mengukur cognitive pada level analisis. Akan tetapi penggunaan tes essay ini mempunyai kelemahan yaitu hanya mungkin memberikan materi yang terbatas serta butir soal yang tidak terlalu banyak mengingat jawabannya yang tak terstruktur. dimana hal ini sangat sukar dilakukan dalam tes multiple choice. Dengan mengetahui kompetensi siswa. sedangkan dalam essay tes item yang digunakan lebih terbatas sukar untuk mengambil sampel yang mewakili seluruh materi sehingga respon yang didapat akan lebih mendalam pada area yang ditanyakan. akan menentukan penilaian. kemampuan minimum siswa . maka kelemahan dan kekuatan akan dapat terdeteksi. Dalam penilaiannyapun cenderung besifat subyektif contohnya jika seorang guru mempunyai murid kesayangan maka nilai yang diberikan akan tinggi. Dalam evaluasi sumatif ini . Karena faktor tersebut maka penilaian dalam essay tes tidak reliabel. selain itu butir soal yang banyakpun tidak akan bermasalah. Dalam kaitannya dengan EBTANAS atau UMPTN dimana evaluasi yang dilakukan berguna untuk pengambilan keputusan maka evaluasi yang cocok digunakan adalah evaluasi sumatif. Evaluasi formatif sangat cocok menggunakan tes essay karena tes ini akan mengukur kemampuan /kinerja siswa disesuaikan dengan tujuan pembelajaran. Ketidak tepatan ini disebabkan tes multiple choice tidak mengukur kedalaman materi sehingga memberi kesempatan kepada siswa untuk menebak jawaban saja. Sedangkan dalam evaluasi formatif ini guru ingin mengetahui apa yang telah dicapai siswa dengan cara menggali lebih dalam kompetensi siswa yang merupakan manifestasi dari hasil belajar. Untuk mengukur kemampuan siswa tes yang paling tepat digunakan adalah multiple choice. dan reliabilitasnya tinggi. Sehingga untuk materi yang akan diukur siswa akan memberikan respon yang tak terbatas sesuai dengan pengetahuan dan kemampuan yang dimilikinya karena jawaban yang diberikan tidak terstruktur. Evaluasi formatif ini berfungsi sebagai umpan balik bagi guru dan siswa. Untuk mengadakan evaluasi formatif multile choice kurang cocok digunakan. Oleh karena itulah esay tes ini kurang reliabel dibandingkan multiple choice. kemampuan guru mengajar akan terlihat dalam evaluasi ini sehingga baik atau buruknya proses belajar akan terlihat disini. Pemberian materi serta butir soal yang banyak ini sangat diperlukan mengingat dalam evaluasi sumatif ini bertujuan untuk verifikasi apakah siswa akan lulus atau tidak lulus sehingga butir pertanyaan akan mencakup seluruh materi pelajaran yang sudah ditetapkan dalam kurikulum. kualitas tulisan. sintesis dan evaluasi. Dalam memberikan skoring objective tes lebih obyektif. atau jika dengan melihat tulisan yang jelek saja guru sudah enggan memerikasa sehingga nilai yang diperoleh siswa akan tidak memadai walaupun jawaban tersebut mencerminkan kompetensi siswa yang tinggi. sederhana.Grondlund memberikan pandangan yang sama bahwa dalam obyektif tes item yang digunakan bisa lebih luas dengan mengambil sampel konten yang mewakili. sedangkan essay tes penilaiannya lebih subyektif misalnya panjangnya respon. karena dalam tes multiple choice memberikan kemungkinan pemberian materi yang banyak. Kemajuan siswa. jika hasil belajar siswa bagus maka akan diadakan pembelajaran selanjutnya tetapi jika hasil belajar siswa buruk maka akan diadakan perbaikan dalam pembelajaran.

evaluasi formatif akan tepat menggunakan Criterion Refference dimana penilaian dilakukan tidak dengan membandingkan individu satu dengan individu lain dalam satu kelompok. Dalam penilaian. Tetapi seandainya anak hanya dapat mengerjakan 3 soal dari 10 soal yang ada. dan evaluasi. Untuk evaluasi sumatif. kriteria penilaian yang tepat adalah Norm Refference. Dalam tes diagnostik kriteria penilaian yang digunakan adalah Criterion Refference. tes multiple choice akan lebih mudah dilakukan karena sudah terdapat kunci jawaban sehingga penilaian akan lebih bersifat obyektif dan dengan sendirinya akan lebih reliabel dibandingkan dengan essay tes. Tes penempatan juga digunakan untuk menentukan entry performance pada tujuan kursus dengan cara menyeleksi sample yang representative pada tujuan kursus. .tidak perlu melihat kedalaman materi yang dikuasai siswa. yang terpenting bahwa siswa menguasai seluruh materi yang tercakup dalam kurikulum meskipun tidak secara mendalam karena respon yang harus diberikan pun terbatas. dimana kedudukan siswa satu dibandingkan dengan siswa lain dalam kelas. Seperti dalam penerimaan mahasiswa melalui UMPTN kriteria yang digunakan adalah Norm Refference serta evaluasi yang digunakan adalah evaluasi sumatif. tetapi mengukur kompetensi minimum anak dalam satu area tertentu. disini tipe item yang digunakan lebih luas dan lebih sukar serta dengan menggunakan kriteria penilaian Norm Reference. sehingga perlu dilakukan program perbaikan/ remedial. sintesis. Kriteria penilaian dengan menggunakan Criterion Refference dapat juga dilakukan untuk tes penempatan yaitu untuk mengukur prerequisit entry skill dimana sample mencakup prerequisit entry behavior dimana tes yang digunakan adalah tes yang mudah. Karena tes multiple choice membutuhkan pemikiran yang konvergen/menuju ke satu arah maka akan sangat sukar untuk mengukur cognitive pada level analisis. Jenis tes yang digunakan adalah tes obyektif dan tes essay dimana tujuannya adalah untuk menentukan kesukaran belajar sedangkan sample yang digunakan mencakup sampel tugas yang berdasar pada sumber kesalahan belajar. sehingga tidak membutuhkan pemikiran yang lebih meluas dan kreatif/divergen.teman dalam kelompoknya mendapat nilai 10 semua. karena teman. maka anak tersebut hanya menguasai 30 % saja dari materi pembelajaran tersebut. Contoh : seorang anak dengan nilai 9 belum tentu merupakan anak yang terpintar dikelas. maka anak tersebut dapat menguasai materi sebanya 60 %. Dengan emikian anak tersebut dapat melanjutkan pembelajaran selanjutnya karena dianggap telah mencapai kompetensi minimum dalam pembelajaran tersebut. Karena yang dilakukan adalah menyeleksi saja maka tidak akan mencerminkan kompetensi siswa pada bidang/ fakultas yang dipilihnya. Dalam kaitannya dengan kriteria penilaian. sehingga dianggap belum mempunyai kompetensi minimum dalam materi pembelajaran tersebut. Contoh: jika seorang anak mampu mengerjakan 6 soal dari 10 soal.

dengan mempertimbangkan bobot jawaban benarnya. Dalam hal pekerjaan menskor atau menentukan angka. Misalkan tes hasil belajar dalam bidang studi bahasa inggris menyajikan lima butir soal tes uraian dimana untuk setiap butir soal yang dijawab dengan benar diberikan bobot 10. padahal pengertian seperti itu belum tentu benar.5 = 30. dapat digunakan tiga macam alat bantu yaitu : Pembantu menentukan jawaban yang benar. 2. Dengan demikian untuk kelima butir tes uraian tersebut.5 Untuk butir soal no. ditambah dengan kebijaksanaan-kebijaksanaan tertentu. Nama lain dari menskor adalah memberi angka.hanya sekitar seperempat bagian saja yang dapat dijawab dengan benar. Contoh berikut ini kiranya akan memperjelas pernyataan di atas. disebut kunci scoring.3 . CARA MENGOLAH SKOR ATAU NILAI 1.5.2 hanya dijawab benar separohnya. sehingga skor yang diberikan adalah 5 Untuk butir soal no. Rina mendapatkan skor sebesar = 10 + 5 +2. Menskor dan Menilai Menskor dan menilai merupakan pekerjaan yang menuntut ketekunan yang luar biasa dari penilai. Angka 30 disini belum dapat disebut nilai. Hal ini didasarkan pada pertimbangan bahwa kadang-kadang orang menganggap bahwa skor itu sama dengan nilai. untuk kelima butir soal tes uraian tersebut memberikan jawaban sebagai berikut:     Untuk butir soal no.5 + 7. Untuk butir soal no. Pembantu menyeleksi jawaban yang benar dan salah. Siswa bernama Rina. Perbedaan antara Skor dan Nilai Sebelum sampai pada pembahasan tentang cara mengolah skor atau nilai.1 dapat dijawab dengan sempurna. Pembantu menentukan angka.5 dijawab benar sekitar tiga perempatnya. disebut pedoman penilaian. sehingga diberikan skor 7. perlu dijelaskan terlebih dahulu tentang perbedaan antara skor dan nilai. disebut kunci jawaban. sehingga diberikan skor 10. Skor adalah hasil pekerjaan menskor (= memberikan angka) yang diperoleh dengan jalan menjumlahkan angka-angka bagi setiap butir item yang oleh testee telah dijawab dengan benar. sehingga diberikan skor 2.CARA MENGOLAH SKOR/NILAI DAN MENCARI NILAI AKHIR A. sebab .

. Adapun yang dimaksud dengan nilai adalah angka (bias juga huruf). yang dalam uraian sebelum ini. Nilai pada dasarnya juga melambangkan penghargaan yang diberikan oleh tester kepada testee atas jawaban benar yang diberikan oleh testee dalam tes hasil belajar. misalnya gabungan antara nilai ulangan ke-1. Seorang siswa yang apabila terjun ke kelompok A termasuk “hebat”. 3. Didalam penggunaan criterion referenced. Itulah sebabnya mengapa nilai sering disebut skor standar. Ukurannya adalah relatife. ke-3. prestasi belajar seorang siswa dibandingkan dengan siswa lain dalam kelompoknya. yang merupakan catatan untuk dirata-rata dan menggambarkan penguasaan siswa terhadap materi yang diajarkan atau menggambarkan sejauh mana siswa mencapai tujuan intruksional umum dari satu unit bahan yang dipelajari dalam satu ukuran waktu. yakni acuan normal atau acuan standar. Nilai pada dasarnya adalah angka atau huruf yang melambangkan seberapa jauh atau seberapa besar kemampuan yang telah ditunjukan oleh testee terhadap materi atau bahan yang diteskan. yang merupakan hasil ubahan dari skor yang sudah dijadikan satu dengan skor-skor lainnya. serta disesuaikan pengaturannya dengan standar tertentu. mungkin jika pindah ke kelompok lain hanya menduduki kualitas “sedang” saja.angka 30 itu masih merupakan skor mentah. Untuk dapat disebut nilai masih memerlukan pengolahan atau pengubahan. dibandingkan dengan standar mutlak. Sebelum ini telah disinggung sedikit tentang penggunaan norm referenced dan criterion referenced. Oleh karena itu. siswa dibandingkan dengan sebuah standar tertentu. skor-skor hasil tes yang pada hakikatnya masih merupakan skor-skor mentah itu perlu diolah lebih dahulu sehingga dapat diubah menjadi skor yang sifatnya baku atau standar. Dari uraian diatas jelaslah bahwa untuk sampai kepada nilai. Pengubahan skor menjadi nilai dapat dilakukan untuk skor tunggal. dan seterusnya. misalnya sesudah memperoleh skor ulangan harian atau untuk skor gabungan dari beberapa ulangan dalam rangka memperoleh nilai. Kualitas seseorang sangat dipengaruhi oleh kualitas kelompoknya. ke-2. maka dikatakan pula diukur dengan standar-relatif atau norma kelompok. Norm – Referenced dan Criterion . Dalam penggunaan norm-referenced.Referenced Dari sederetan skor yang telah diubah maka dapat diperoleh gabungannya. sesuai dengan tujuan intruksional khusus yang telah ditentukan.1[1] Nilai adalah angka ubahan dari skor dengan menggunakan acuan tertentu.

Nilai dapat diperoleh dengan 2 cara : Mengubah skor dari tiap-tiap ulangan lalu diambil rata-ratanya. didasarkan atas pencapaian siswa terhadap tujuan yang ditentukan. memperoleh skor 50 (mencapai 50 % tujuan ) Maka nilai siswa tersebut : Dan dibulatkan menjadi 63.Dasar pikiran dari penggunaan standar ini adalah adanya asumsi bahwa disetiap populasi yang heterogen.3 b)   - Dengan standar relative Pemberian skor terhadap siswa juga didasarkan atas pencapaian siswa terhadap tujuan yang ditentukan. Menjumlah skor tiap-tiap ulangan. a) - Contoh : Dari ulangan ke-1. akan terlihat demikian : Dengan standar mutlak   Pemberian skor terhadap siswa. Mengolah Nilai Beberapa Skala Penilaian: Skala Bebas a. Nilai diperoleh dengan mencari skor rata-rata langsung dari skor asal (skor mentah).2[2] 4. . baru diubah kenilai. memperoleh skor 80 (mencapai 80 % tujuan ) Dari ulangan ke-3. memperoleh skor 60 (mencapai 60 % tujuan ) Dari ulangan ke-2. = 63. tentu terdapat: 1) 2) 3) Kelompok baik Kelempok sedang kelompok kurang Apabila standar relative dan standar mutlak ini dihubungkan dengan pengubahan skor menjadi nilai.

5. cara mana yang digunakan untuk memberi angka atau skor. Setelah tiba di luar kelas. guru tersebut barangkali perlu menerangkan kepada para siswanya. Baru sampai bertemu 4 kawannya. pekerjaan Tika yang mendapat angka 25 itulah yang betul.4 pun akan dibulatkan menjadi 6.20. Ia sudah bebas menggunakan skala bebas. Ternyata cara mengerjakan dan pendapatnya tidak sama dengan yang lain. guru memberikan angka paling tinggi 25 kepada mereka yang dapat mengerjakan seluruh soal dengan betul. misalnya 5.bahkan ada yang 25. Benar ia tidak salah liat! Pada sudut atas kertas itu tertulis angka 10. Adakalanya skor tertinggi 20. Oleh karena itu. Ini memang lazim. Ani berdiskusi dengan kawan-kawannya. Pada waktu ulangan memang Ani merasa ragu-ragu mengerjakannya. Jadi angka tertinggi dan skala yang digunakan tidak selalu sama. Ada kawannya yang mendapat 15. Padahal pada waktu ulangan matematika ini. Rumus yang digunakan sedikit ingat sedikit lupa.” Apa sebabnya ? Rupanya ia menyadari kebodohannya karena setelah melihat angka yang diperoleh keempat orang kawannya. ternyata kepunyaan Ani yang paling sedikit. Padahal angka 6.“Ani. pada suatu hari berlari-lari kegirangan setelah menerima kembali kertas ulangan dari guru Matematika.5 tersebut kemudian dibulatkan menjadi 6. Hanya sayangnya. guru jarang memberikan angka pecahan.5 . Angka 5. Seberapa selesai soal itu dikerjakan kertas ulangan harus dikumpulkan. Mungkin bukan hanya Ani saja yang berpikiran demikian. ia kegirangan. Ia baru pindah dari sekolah lain. sehingga memungkinkan bagi guru untuk memberikan penilaian yang lebih halus. Skala 1-10 Pada umumnya guru-guru di Indonesia mempunyai kebiasaan menggunaka skala 1 – 10 untuk laporan prestasi belajar siswa dalam rapor. seorang pelajar disuatu SMU. Dengan demikian maka rentangan angka 5. b. waktu yang disediakan telah habis. Adakalanya juga digunakan skala 1 – 100. Ditunjukannya kertas itu kepada kawan-kawannya. Dalam skala 1 – 10. Ini semua tergantung dari banyak dan bentuk soal. terpancang suatu pengertian bahwa anka 10 adalah angka tertinggi yang mungkin dicapai. lain kali 25. dan lain kali lagi 50. Diamatinya sekali lagi angka yang tertera dikertas itu. Dan ketika seluruh umus hampir teringat. Dan kata Guru. Tetapi mereka juga tidak yakin mana yang betul. wajahnya sudah menjadi malu tersipi-sipu. yaitu angka yang diperoleh Ani dengan ulangan itu. ketika kertas ulangan dikembalikan dan ia mendapat 10. Dan gambaran ini tampak bahwa dalam pikiran Ani. yaitu skala yang tidak tetap. Cara pemberian angka seperti ini tidak salah.

Untuk itulah maka dengan menggunakan skala 1 – 100.4 dalam skala 1 – 10 yang biasanya dibulatkan menjadi 6.3[3] Skala huruf Di samping penilaian yang dinyatakan dengan angka. Oleh karena itu. Distribusi Nilai Distribusi niali yang dimiliki oleh siswa-siswanya dalam suatu kelas didasarkan pada dua macam standar. Ada sebenarnya hasil prestasi yang berada diantara kedua angka bulat itu. . c.4[4] Penggunaan huruf dalam penilaian akan terasa lebih tepat digunakan karena tidak ditafsirkan sebagai arti perbandingan. akan dijumpai kesulitan. B. Dengan menggunakan skala 1 – 10 maka bilangan bulat yang ada masih menunjukan penilaian yang agak kasar. Padahal dalam pengisian rapor. Distribusi Nilai Berdasarkan Standar Mutlak Dengan dasar bahwa hasil belajar siswa dibandingkan dengan sebuah standar mutlak atau dalam hal ini skor tertinggi yang diharapkan. yaitu angka 6. sebagian besar siswa akan dapat berhasil mengerjakan soal-soal itu dan tingkat pencapaiannya tinggi.Nilai 5. Namun demikian dengan standar mutlak ini mungkin pula diperoleh gambar kurva d. dimungkinkan melakukan penilaian yang lebih halus karena terdapat 100 bilangan bulat. dalam skala 1 – 100 ini boleh dituliskan 55 dan 64. Skala 1 – 100 Memang di seyogiakan bahwa angka itu merupakan bilangan bulat. Huruf tidak menunjukan kuantitas. Seperti penilaian yang dilakukan oleh guru taman kanak.sampai dengan 6. kita tidak dapat terlepas dari pekerjaan mengambil rata-rata. C dan D. kita mengenal pula penilaian yang dinyatakan dengan huruf.5 dan 6. Sebaliknya apabila soal-soal tes termasuk yang sukar maka pencapaian siswa juga sebaliknya pula.kanak dan atau guru-guru disekolah dasar kelas I dan kelas II. yaitu: a. 5. tetapi dapat digunakan sebagai symbol untuk menggambarkan kualitas. Apabila soal-soal yang dibuat guru terlalu mudah. mereka menggunakan nilai huruf A. dalam mengambil jumlah rata-rata.4 ( selisih hampir 1 ) akan keluar dirapor dalam satu wajah. maka tingkat penguasaan siswa akan terlihat dalam berbagai bentuk kurva.

Dalam norm-referenced selalu tergambar dalam kurva normal. 2% 14% 34% 14% 2% Untuk melihat penyebaran atau distribusi nilai siswa-siswa dalam satu kelas. kedudukan seorang selalu dibandingkan dengan kawan-kawannya dalam kelompok. Berikut adalah kurva kemungkinan prestasi siswa berdasarkan standar mutlak: Kurva gambaran jika soal disusun dengan mudah. terlebih dahulu skor-skor yang diperoleh dari ulangan disusun urut dari yang paling tinggi ke yang paling rendah.nomal jika soal-soal tes disusun oleh guru dengan tepat seperti gambaran kecakapan siswa-siswanya. dengan sebagian besar terletak pada nilai sedang. Distribusi Nilai Berdasarkan Standar Relatif Menggunakan standar relative atau norm-referenced. b. Ubahan nilai dari skor-skor yang mengumpul dibawah atau pun diatas dapat dilihat dalam gambar-gambar berikut: . 10 Kurva yang disusun tepat. dan demikian pula sebaliknya. 1 10 1 Kurva gambaran jika soal disusun terlalu sulit. Dengan demikian nilai siswalalu direntangkan dari nilai tinggi ke nilai rendah. Hal ini didasarkan apabila distribusi skor tergambar dalam kurva juling positif. yang kurang sempurna adalah soal-soal tesnya. yaitu terlalu sukar.

berikut persentasi penyebaran nilainya: . nilai berdasarkan standar mutlak.= = 6. ada pula yang menggunakan standar enam. Dalam hal ini. b) Standar Enam. Selain dengan stanadar Sembilan (stanines). kita dapat membicarakan masalah standar nilai. nilai berdasarkan standar relative. Standar Nilai Dari distribusi nilai. a) Standard Nines/Stanines Menurut Gronlund dalam distribusi nilai ini skor-skor siswa direntangkan menjadi 9 nilai (Standard Nines/Stanines) seperti berikut: STANINE 9 4% 8 7% 7 12% 6 17% 5 20% 4 17% 3 12% 2 7% 1 4% INTERPRETASI Tinggi (4%) Diatas (19%) rata-rata Rata-rata (54%) Dibawah rata (19%) rata- Rendah (4%) Dengan adanya persentase yang ditentukan inilah maka semua situasi skor siswa dapat direntangkan menjadi nilai 1-9 diatas. hanya berkisar antara 4-9.

yang satu sama lain berjarak sama.55 SD . system penilaian membagi skala menjadi 11 golongan yaitu angka-angka dari 0-10.STANDAR ENAM 9 8 7 6 5 4 Interpretasi 5% 10% 20% 40% 20% 5% Baik sekali Baik Lebih dari cukup Cukup Kurang Kurang sekali Penyebaran nilai denga standar enam yang dimaksud. P92. Tiap-tiap angka menempati interval sebesar 0.55 SD. adalah berikut: 10% siswa yang mendapat nilai tertinggi diberi nilai 9 20% dibawahnya diberi 8 40% dibawahnya diberi 7 20% dibawahnya diberi 6 5% dibawahnya diberi 5 5% dibawahnya diberi 4 Dalam hal yang sangat khusus dimana siswa yang dianggap sangat cerdas ataupun sangat kurang. P8. 11 skala = 6 SD Skala = = 6/11 SD 0. P79. Dengan stanel ini.025 SD sampai +3. Bilangan-bilangan persentil untuk menentukan titik dalam Stanel ini adalah: P1. P39. c) Standar Eleven (Stanel) Standar ini dikembangkan oleh Fakultas Ilmu Pendidikan UGM yang sesuai dengan system penilaian di Indonesia. P97 & P99.025 SD. P3. dapat diberikan nilai 10 atau 3. Dasar pemikiran Stanel ini dalah bahwa jarak praktis dalam kurva normal adalah 6 SD yang terbagi atas 11 skala. P61. P21. bertitik tolak dari Mean = 5 yang menempati jarak antara -3.

2 .5 1. diperlukan dahulu: Mean (rata-rata skor) Deviasi Standar (simpangan Baku) Tabel konversi angka kedalam nilai berskala 1-10 Tahap-tahap yang dilalui dalam mengubah skor mentah menjadi nilai berskala 1-10 adalah sebagai berikut: Menyusun distribusi frekuensi dari angka-angka atau skor-skor mentah.5 0.5 F 7% B.STANEL .10 . 1. nilai mempunyai 4 fungsi: .9 . e) Standar Lima kembali kepada Grondlund selain ia mengemukakan penyebaran nilai dengan angka.6 . Menghitung Deviasi Standar.7 .3 .5 38% 24% MENCARI NILAI AKHIR Fungsi Nilai Akhir Secara garis besar. Menghitung rata-rata skor (mean).0 .5 .4 .8 .1 d) Standar Sepuluh Untuk mengubah skor menjadi nilai. juga mengemukakan penyebaran nilai dengan huruf yang digambarkan dengan kurva normal sebagai berikut5[5]: -1. Mentransformasi (mengubah) angka-angka mentah kedalam nilai skala 1-10. 24% D C B 7% A -0.

maka akan lebih mudah diketahui pula keberhasilan dan kegagalan siswa disetiap bagian tujuan. dorongan atau bimbingan. 2. c. Fungsi administrative Fungsi administrative dalam penilaian mencakup: Menentukan kenaikan dan kelulusan siswa. sajian terperinci nilai siswa dapat berfungsi menunjukkan bagian-bagian proses pengajaran mana yang perlu diperbaiki. Hubungan orang tua dengan sekolah menjadi baik. Faktor-Faktor yang Turut di Perhitungkan dalam Penilaian . jika disajikan dalam keadaan yang terperinci akan dapat membantu siswa dalam usaha memperbaiki dan member motivasi peningkatan prestasi berikutnya. petugas bimbingan akan segera tahu bagian-bagian mana dari usaha siswa disekolah yang masih memerlukan bantuan. Dengan perincian gambaran nilai siswa. Apabila pemberian nilai dapat dilakukan dengan cermat dan terperinci. Catatan lengkap yang juga mencakup tingkat (rating) dalam kepribadian siswa serta sifat-sifat yang berhubungan dengan rasa social akan sangat membantu siswa dalam pengarahannya sebagai pribadi seutuhnya. Memberikan nilai siswa kepada orang tuanya mempunyai arti bahwa orang tua siswa tersebut menjadi tahu akan kemajuan dan prestasi anak-anak mereka disekolah. Bagi pengelola pengajaran. Memberikan gambaran tentang prestasi siswa atau lulusan kepada para calon pemakai tenaga. Memindahakan atau menempatkan siswa. Memberiakn rekomendasi untuk melanjutkan belajar. Catatan ini akan sangat berguna. Nilai rendah yang diperoleh oleh seseorang atau beberapa siswa. d.a. Pemberian nilai merupakan suatu pekerjaan yang bertujuan untuk memberikan suatu balikan (feed back/ umpan balik) yang mencerminkan seberapa jauh seorang siswa telah mencapai tujuan yang ditetapkan dalam pengajaran atau system instruksional. b. Fungsi instruksional. Memberikan beasiswa. Fungsi informative. dengan catatan nilai untuk orang tua siswa maka: - Orang tua menjadi sadar akan keadaan putra-putri mereka untuk kemudian lebih baik memberikan bantuan berupa perhatian. Fungsi bimbingan Pemberian nilai kepada siswa akan mempunyai arti besar bagi pekerjaan bimbingan.

segera mengerjakan PR. Unsure pertimbangan atau kebijaksanaan guru tentang usaha dan tingkah laku siswa tidak boleh diikut sertakan. Yang dimaksudkan dengan kegiatan-kegiatan siswa misalnya: menyelesaikan tugas. Nilai prestasi harus mencerminkan tingkat-tingkatan siswa sejauh mana telah dapat mencapai tujuan yang ditetapkan disetiap bidang studi. guru dapat menyampaikan laporannya kepada orang tua siswa. Keuletan dalam usaha. Laporan atau nilai tidak boleh dicampuri dengan nilai prestasi sama sekali. dan sebagainya. Ada beberapa cara menentuakn nilai akhir. diantaranya: a. Untuk memperoleh nilai akhir. Misalnya. menghadiri pelajaran. Prestasi / pencapaian (achievement). baik huruf maupun angka hanya merupakan gambaran tetang prestasi saja. b. kegiatan yang dilakukan siswa. Kebiasaan bekerja. Lebih baik lagi jika diterangkan dengan khusus dan jelas sehingga mudah di mengerti oleh guru pembimbing dan siapa saja. Yang dimaksud disini adalah hal-hal yang berhubungan dengan kebiasaan melakukan tugas. mengikuti ujian. Penentuan nilai akhir ini dilakukan terutama pada waktu guru akan mengisi rapor atau STTB. Biasanya dalam menentukan nilai akhirini guru sudah dibimbing oleh suatu peraturan atau pedoman yang dikeluarkan oleh pemerintah atau kantor/badan yang membawahinya. Rentang nilai sebaiknya tidak usah lebar-lebar (lebih baik 610). Usaha (effort). bekerja teliti. Aspek pribadi dan social Unsure ini juga perlu dilaporkan terutama yang berhubungan dengan berlangsungnya proses belajar-mengajar. 3. Hal ini sangant dipengaruhi oleh pandanagn mereka terhadap pentingnya dan tidaknya bagian. . perlu diperlukan nilai tes formatif dan tes sumatif dengan rumus: c.Unsur umum dalam penilaian yang menyangkut faktor-faktor yang harus dipertimbangkan adalah: a. Cara Menentukan nilai Akhir Tiap guru mempunyai pendapatnya sendiri dalam menentukan nilai akhir. mengikuti diskusi. Usaha siswa Terpisah dari nilai prestasinya. kerapihan kerja dan sebagainya. Simbol yang digunakan untuk menyatakan nilai. d.

Nilai ulangan harian (rata-ratanya). b. 3. Nilai ulangan umum. nilai ulangan harian dan nilai ulangan umum dengan bobot 2. = = = Nilai tugas. Nilai Akhir untuk STTB diproleh dari rata-rata nilai ulangan harian (diberi bobot satu) dan nilai EBTA (diberi bobot 2) kemudian dibagi 3.Keterangan: NA = F S = = Nilai akhir. Rumus: Dimana : ΣH = jumlah nilai ulangan harian . NA = 2T + 3H + 5U 10 Nilai akhir diperoleh dari nilai tugas. dan 5. Nilai tes formatif. Jadi jika dituliskan dalam rumus menjadi: Keterangan: T H U c. Jadi nilai akhir diperoleh dari rata-rata nilai tes formtaif (diberikan bobot satu) dijumlahkan dengan nilai tes sumatif (diberi bobot dua) kemudian dibagi 3. Nilai tes sumatif.

Merata-ratakan hasil penilaian sumatif dengan hasil penilaian formatif. Nilai rata-rata ini selanjutnya dijumlahkan dengan nilai tes sumatif dan kemudian hasil penjumlahan dibagi dua. . Rumusnya : NA = 2p + 2q +r 5 Keterangan : p q r = = = nilai tes sub sumatif nilai tes sumatif nilai ko-kurikuler. Setelah hasil-hasil penilain formatif diubah kedalam nilai berskala 1 – 10.E nH = = nilai EBTA frekuensi ulangan harian Selanjutnya didalam kurikulum SMA tahun 1984 disebutkan cara menentukan nilai akhir bukan hanya didasarkan atas hasil kegiatan kurikuler saja. Perlu dikemukakan disini bahwa apabila pada nilai akhir terdapat pecahan kurang dari setengah. tetapi juga kokurikuler. Hasil yang terakhir inilah yang akan merupakan nilai akhir bagi setiap siswa yang nantinya dijadikan nilai raport. Kalau pecahannya setengah. kemudian untuk setiap siswa dicari rata-rata hasil penilaian formatif dalam semester yang bersangkutan. maka nilai itu di bulatkan kebawah.

Sedangkan dalam pecahan lebih dari setengah. sistem pembelajaran yang baik akan menghasilkan kualitas belajar yang baik. 2005:2). Salah satu faktor yang penting untuk mencapai tujuan pendidikan dengan demikian adalah proses pembelajaran yang dilakukan. sedangkan salah satu faktor penting untuk efektivitas pembelajaran adalah faktor evaluasi baik terhadap proses maupun hasil pembelajaran. Ngalim. Jakarta: Bumi Aksara. M.nilai akhir tetap seperti itu. yaitu siswa. Dasar-dasar Evaluasi Pendidikan. staf. Evaluasi dapat mendorong siswa untuk lebih giat belajar secara terus menerus dan juga mendorong guru untuk lebih meningkatkan kualitas proses pembelajaran serta mendorong sekolah untuk lebih meningkatkan fasilitas dan kualitas manajemen sekolah. dan kurikulum (Suhartoyo. Keduanya saling terkait. Pengantar Evaluasi Pendidikan. Suahrsimi. lingkungan (orangtua. guru. Selanjutnya sistem penilaian yang baik akan mendorong guru untuk menentukan strategi mengajar yang baik dan memotivasi siswa untuk belajar yang lebih baik. Jakarta: Raja Grafindo Persada EVALUASI PROGRAM PEMBELAJARAN 1.6[6] DAFTAR PUSTAKA Arikunto. 2010. 2010. 2001. Prinsip-prinsip dan Teknik Evaluasi Pengajaran. maka nilai dibulatkan ke atas. . masyarakat. dan dewan/komite sekolah). Anas. Bandung: Remaja Rosda karya. Purwanto. Sudijono. kualitas pembelajaran. pengelola sekolah (kepala sekolah. Pendahuluan Mutu pendidikan dipengaruhi banyak faktor. dan sekolah). Hal senada juga dikemukakan oleh Mardapi (2003:8) bahwa usaha peningkatan kualitas pendidikan dapat ditempuh melalui peningkatan kualitas pembelajaran dan kualitas sistem penilaian.

Sehubungan dengan hal tersebut, maka di dalam pembelajaran dibutuhkan guru yang tidak hanya mampu mengajar dengan baik tetapi juga mampu melakukan evaluasi dengan baik. Kegiatan evaluasi sebagai bagian dari program pembelajaran perlu lebih dioptimalkan. Evaluasi tidak hanya bertumpu pada penilaian hasil belajar, tetapi juga perlu penilaian terhadap input, output, maupun kualitas proses pembelajaran itu sendiri. Optimalisasi sistem evaluasi menurut Mardapi (2003:12) memiliki dua makna, yaitu 1) sistem evaluasi yang memberikan informasi yang optimal dan 2) manfaat yang dicapai dari evaluasi. Manfaat yang utama dari evaluasi adalah meningkatkan kualitas pembelajaran dan selanjutnya akan terjadi peningkatan kualitas pendidikan. Bidang pendidikan ditinjau dari sasarannya, evaluasi ada yang bersifat makro dan ada yang mikro. Evaluasi yang bersifat makro sasarannya adalah program pendidikan, yaitu program yang direncanakan untuk memperbaiki bidang pendidikan. Evaluasi mikro sering digunakan di tingkat kelas, khususnya untuk mengetahui pencapaian belajar peserta didik. Pencapaian belajar ini bukan hanya yang bersifat kognitif saja, tetapi juga mencakup semua potensi yang ada pada peserta didik. Jadi sasaran evaluasi mikro adalah program pembelajaran di kelas dan yang menjadi penanggungjawabnya adalah guru (Mardapi, 2000:2). Konteks program pembelajaran di sekolah menurut Mardapi (2003:8) bahwa keberhasilan program pembelajaran selalu dilihat dari hasil belajar yang dicapai siswa. Di sisi lain evaluasi pada program pembelajaran membutuhkan data tentang pelaksanaan pembelajaran dan tingkat ketercapaian tujuannya. Keberhasilan program pembelajaran selalu dilihat dari aspek hasil belajar, sementara implementasi program pembelajaran di kelas atau kualitas proses pembelajaran itu berlangsung jarang tersentuh kegiatan penilaian.

2. Pembelajaran Pembelajaran yang sering juga disebut dengan belajar mengajar, sebagai terjemahan dari istilah instructional terdiri dari dua kata, belajar dan mengajar. Belajar adalah suatu proses yang ditandai dengan adanya perubahan pada diri seseorang. Hal ini sesuai dengan pendapat Woolfolk dan Nicolich (1984:159) yang mengatakan bahwa learning is a change in a person that comes about as a result of experience. Belajar adalah perubahan dalam diri seseorang yang berasal dari hasil pengalaman. Perubahan sebagai hasil proses belajar dapat ditunjukkan dalam berbagai bentuk seperti berubah pengetahuan, kecakapan, dan kemampuan, daya reaksi, dan daya penerimaan yang ada pada individu (Sujana dan Ibrahim, 2004:28). Menurut aliran behavioristik, kegiatan belajar terjadi karena adanya kondisi/stimulus dari lingkungan. Kegiatan belajar merupakan respons/reaksi terhadap kondisi/stimulus lingkungannya. Belajar tidaknya seseorang tergantung kepada faktor kondisional dari

lingkungan. Lingkungan dapat berupa lingkungan keluarga, masyarakat maupun lingkungan sekolah. Lingkungan sekolah terdiri dari guru, media pembelajaran, buku teks, kurikulum, teman sekelas, peraturan sekolah, maupun sumber-sumber belajar lainnya. Salah seorang tokoh aliran behavioristik, Gagne dalam Gredeer dan Margaret (1986:121) mengemukakan bahwa belajar terdiri dari tiga komponen penting, yaitu kondisi internal (internal conditions of learning), kondisi eksternal (external conditions of learning), dan hasil belajar (outcomes of learning). Komponen-komponen tersebut dilukiskan dalam bentuk Gambar 1.

Gambar 1 Komponen Belajar (Gagne dalam Gredeer dan Margaret, 1986:121) Sama halnya dengan belajar, mengajar pun pada hakikatnya adalah suatu proses, yakni proses mengatur, mengorganisir lingkungan yang ada di sekitar siswa sehingga menumbuhkan dan mendorong siswa melakukan kegiatan belajar. Hal ini dipertegas oleh Sudjana (2002:29) yang menyatakan bahwa mengajar adalah suatu proses mengatur dan mengorganisasi lingkungan yang ada di sekitar siswa sehingga dapat menumbuhkan dan mendorong siswa melakukan kegiatan belajar. Berdasarkan tinjauan proses, pembelajaran terdapat dua kegiatan yang terjadi dalam satu kesatuan waktu dengan pelaku yang berbeda. Pelaku belajar adalah siswa sedangkan pelaku pengajar (pembelajar) adalah guru. Kegiatan siswa dan kegiatan guru berlangsung dalam proses yang bersamaan untuk mencapai tujuan instruksional tertentu. Jadi dalam proses pembelajaran terjadi hubungan yang interaktif antara guru dengan siswa dalam ikatan tujuan instruksional. Karena pelaku dalam proses pembelajaran adalah guru dengan siswa, maka keberhasilan proses pembelajaran tidak terlepas dari faktor guru dan siswa.

3. Evaluasi Program 1. Tes, Pengukuran, Penilaian, dan Evaluasi Ada tiga istilah yang sering digunakan dalam evaluasi, yaitu tes, pengukuran, dan penilaian (test, measurement, and assessment). Tes merupakan salah satu cara untuk menaksir besarnya kemampuan seseorang secara tidak langsung, yaitu melalui respons seseorang terhadap stimulus atau pertanyaan (Mardapi, 1999:2). Tes merupakan salah satu alat untuk melakukan pengukuran, yaitu alat untuk mengumpulkan informasi karakteristik suatu objek. Obyek ini bisa berupa kemampuan peserta didik, sikap, minat, maupun motivasi. Respons peserta tes terhadap sejumlah pertanyaan menggambarkan kemampuan dalam bidang tertentu. Tes merupakan bagian tersempit dari evaluasi. Pengukuran (measurement) dapat didefinisikan sebagai the process by which information about the attributes or characteristics of thing are determinied and differentiated (Oriondo dan Antonio, 1998:2). Guilford dalam Griffin dan Nix (1991:3) mendefinisi pengukuran dengan assigning numbers to, or quantifying, things according to a set of rules. Sementara itu Ebel dan Frisbie (1986:14) berpendapat pengukuran dinyatakan sebagai proses penetapan angka terhadap individu atau karakteristiknya menurut aturan tertentu. Hal senada dikemukakan Allen dan Yen dalam Mardapi (2000:1) mendefinisikan pengukuran sebagai penetapan angka dengan cara yang sistematik untuk menyatakan keadaan individu. Dengan demikian, esensi dari pengukuran adalah kuantifikasi atau penetapan angka tentang karakteristik atau keadaan individu menurut aturan-aturan tertentu. Keadaan individu ini bisa berupa kemampuan kognitif, afektif, dan psikomotor. Pengukuran memiliki konsep yang lebih luas dari pada tes. Guru dapat mengukur karakteristik suatu objek tanpa menggunakan tes, misalnya dengan pengamatan, rating scale atau cara lain untuk memperoleh informasi dalam bentuk kuantitatif. Penilaian (assessment) memiliki makna yang berbeda dengan evaluasi. The Task Group on Assessment and Testing (TGAT) mendeskripsikan asesmen sebagai semua cara yang digunakan untuk menilai unjuk kerja (performance) individu atau kelompok (Griffin dan Nix, 1991:3). Popham (1995:3) mendefinisikan asesmen dalam konteks pendidikan sebagai sebuah usaha secara formal untuk menentukan status siswa berkenaan dengan berbagai kepentingan pendidikan. Boyer dan Ewel dalam Stark dan Thomas (1994:46) mengemukakan assessment is processes that provide information about individual students, about curricula or programs, about institutions, or about entire systems of institutions. Asesmen sebagai proses yang menyediakan informasi tentang individu siswa, tentang kurikulum atau program, tentang institusi atau segala sesuatu yang berkaitan dengan sistem

Stufflebeam (2003) mengemukakan bahwa: Evaluation is the process of delineating. sedangkan penilaian didahului dengan pengukuran. and providing descriptive and judgmental information about the worth and merit of some object’s goals. design. Evaluasi merupakan suatu proses atau kegiatan pemilihan. Berdasarkan pendapat di atas disimpulkan bahwa asesmen atau penilaian merupakan kegiatan menafsirkan data hasil pengukuran. implementation. Evaluasi merupakan suatu proses menyediakan informasi yang dapat dijadikan sebagai pertimbangan untuk menentukan harga dan jasa (the worth and merit) dari tujuan yang dicapai. dan dampak untuk membantu membuat keputusan. assessment.institusi. Evaluasi didahului dengan penilaian (assessment). implementasi. sedangkan evaluasi merupakan penetapan nilai atau implikasi perilaku. analisis dan penyajian informasi yang dapat digunakan sebagai dasar pengambilan keputusan serta penyusunan program selanjutnya. penilaian (assessment) merupakan kegiatan menafsirkan dan mendeskripsikan hasil pengukuran. Hal ini dipertegas oleh Griffin dan Nix (1991:3) menyatakan: Measurement. obtaining. Pengukuran. membantu pertanggung jawaban dan meningkatkan pemahaman terhadap fenomena. The comparison of observation with the criteria is a measurement. and evaluation are hierarchial. desain.. Pengukuran diartikan sebagai kegiatan membandingkan hasil pengamatan dengan kriteria. the interpretation and description of the evidence is an assessment and the judgement of the value or implication of the behavior is an evaluation. pengumpulan. Brikerhoff dalam Mardapi (2000) . serve needs for accountability. penilaian. selecting appropriate information. pengukuran maupun tes. Evaluasi memiliki makna yang berbeda dengan penilaian. inti dari evaluasi adalah penyediaan informasi yang dapat dijadikan sebagai bahan pertimbangan dalam mengambil keputusan. dan evaluasi bersifat hierarkis. and promote understanding of the involved phenomena. and collecting and analyzing information in order to report summary data useful to decision makers in selecting among alternatives. Menurut rumusan tersebut. Sementara itu National Study Committee on Evaluation dalam Stark dan Thomas (1994:12) menyatakan bahwa evaluation is the process of ascertaining the decision of concern. and impact in order to guide decision making.

dan 7) evaluating evaluation (evaluasi untuk evaluasi). yaitu: 1) menunjuk pada penggunaan metode penelitian. efisiensi serta pemanfaatan hasil evaluasi yang difokuskan untuk program itu sendiri. evaluator pada tahap awal harus menentukan fokus yang akan dievaluasi dan desain yang akan digunakan. Lebih lanjut Brikerhoff dalam Mardapi (2000) mengemukakan dalam pelaksanaan evaluasi terdapat tujuh elemen yang harus dilakukan. menganalisis dan membuat interpretasi terhadap data yang terkumpul serta membuat laporan. evaluator juga harus melakukan pengaturan terhadap evaluasi dan mengevaluasi apa yang telah dilakukan dalam melaksanakan evaluasi secara keseluruhan. Hal ini berarti harus ada kejelasan apa yang akan dievaluasi yang secara implisit menekankan adanya tujuan evaluasi. menginterpretasikan dan menyajikan informasi untuk dapat digunakan sebagai dasar membuat keputusan. Selain itu. juga dipergunakan untuk kepentingan penyusunan program berikutnya maupun penyusunan kebijakan yang terkait dengan program. 2) menekankan pada hasil suatu program. Evaluasi yang bersifat makro sasarannya adalah program pendidikan. Weiss dalam Oriondo dan Antonio (1998) menyatakan the purpose of evaluation research is to measure the effect of program against the goals it set out accomplish as a means of contributing to subsuquest decision making about the program and improving future programming. 3) penggunaan kriteria untuk menilai. Adapun tujuan evaluasi adalah untuk memperoleh informasi yang akurat dan obyektif tentang suatu program. mendeskripsikan. Informasi tersebut dapat berupa proses pelaksanaan program. Pencapaian belajar ini . evaluasi ada yang bersifat makro dan ada yang mikro.menjelaskan bahwa evaluasi merupakan proses yang menentukan sejauh mana tujuan pendidikan dapat dicapai. Selanjutnya. dan 4) kontribusi terhadap pengambilan keputusan dan perbaikan program di masa mendatang. Berdasarkan pengertian tersebut menunjukkan bahwa dalam melakukan evaluasi. Ada empat hal yang ditekankan pada rumusan tersebut. dampak/hasil yang dicapai. yaitu untuk mengambil keputusan apakah dilanjutkan. Selain itu. khususnya untuk mengetahui pencapaian belajar siswa. 6) managing evaluation (pengelolaan evaluasi). 3) collecting information (pengumpulan informasi). yaitu: 1) focusing the evaluation (penentuan fokus yang akan dievaluasi). yaitu program yang direncanakan untuk memperbaiki bidang pendidikan. 2) designing the evaluation (penyusunan desain evaluasi). diperbaiki atau dihentikan. dilakukan pengumpulan data. 4) analyzing and interpreting (analisis dan interpretasi informasi). Evaluasi mikro sering digunakan di tingkat kelas. menyusun kebijakan maupun menyusun program selanjutnya. serta adanya perencanaan bagaimana melaksanakan evaluasi. Berdasarkan pendapat di atas disimpulkan bahwa evaluasi merupakan proses yang sistematis dan berkelanjutan untuk mengumpulkan. 5) reporting information (pembuatan laporan). Bidang pendidikan ditinjau dari sasarannya.

2. Outcome). 3. Jadi sasaran evaluasi mikro adalah program pembelajaran di kelas dan yang menjadi penanggungjawabnya adalah guru (Mardapi. 13. Daniel Stufflebeam’s CIPP Model (Context.bukan hanya yang bersifat kognitif saja. 6. Jack PhillPS’ Five Level ROI Model. Evaluasi terhadap efektivitas program pelatihan (training) menurut Kirkpatrick (1998) mencakup empat level evaluasi. Robert Stake’s Congruence-Contingency Model. Berbagai model tersebut di atas akan diuraikan model yang populer dan banyak dipakai sebagai strategi atau pedoman kerja dalam pelaksanaan evaluasi program pembelajaran. and Product). Eisner’s Connoisseurship Evaluation Models. 2000:2). Input. Input. 4. Alkins’ UCLA Model. Model-model Evaluasi Program Pembelajaran Ada banyak model evaluasi yang dikembangkan oleh para ahli yang dapat dipakai dalam mengevaluasi program pembelajaran. Michael Scriven’s Goal-Free Evaluation Approach. Provus’s Discrepancy Model. yaitu: level 1 reaction. 1. Prosess. 2) Evaluasi Model CIPP (Context. 11. Portraiture Model. CIRO (Context. Input. dan level 4 result. 5. Kaufman’s Five Levels of Evaluation. . yaitu 1) Evaluasi Model Kirkpatrick (Kirkpatrick Four Levels Evaluation Model). 2. 8. level 2 learning. PERT (Program Evaluation and Review Technique). tetapi juga mencakup semua potensi yang ada pada siswa. 12. Robert Stake’s Responsive Evaluation Model. 10. Process. Berbagai model sebagaimana yang dikemukakan oleh Kirkpatrick (2009) adalah: 1. 9. Reaction. dan 3) Evaluasi Model Stake (Model Couintenance). level 3 behavior. Model evaluasi yang dikembangkan oleh Kirkpatrick dikenal dengan istilah Kirkpatrick Four Levels Evaluation Model. Evaluasi Model Kirkpatrick Kirkpatrick salah seorang ahli evaluasi program pelatihan dalam bidang pengembangan sumber daya manusia (SDM). Product). Illuminative Evaluation Model. 7.

Evaluasi Reaksi (Evaluating Reaction) Mengevaluasi terhadap reaksi peserta pelatihan berarti mengukur kepuasan peserta (customer satisfaction). Tanpa adanya perubahan sikap. Orang akan belajar lebih baik manakala mereka memberi reaksi positif terhadap lingkungan belajar. Oleh karena itu dalam pengukuran hasil belajar (learning measurement) berarti penentuan satu atau lebih hal berikut: 1) pengetahuan yang telah dipelajari. Kepuasan peserta pelatihan dapat dikaji dari beberapa aspek. yaitu materi yang diberikan. perbaikan pengetahuan maupun peningkatan keterampilan. dan 3) keterampilan yang telah dikembangkan atau diperbaiki. sikap maupun keterampilan. Program pelatihan dianggap efektif apabila proses pelatihan dirasa menyenangkan dan memuaskan bagi peserta pelatihan sehingga mereka tertarik termotivasi untuk belajar dan berlatih. Disimpulkan bahwa keberhasilan proses kegiatan pelatihan tidak terlepas dari minat. improving knowledge. strategi penyampaian materi yang digunakan oleh instruktur.1. jadwal kegiatan sampai menu. perhatian. media pembelajaran yang tersedia. dan penyajian konsumsi yang disediakan. peningkatan pengetahuan maupun perbaikan keterampilan pada peserta pelatihan maka program dapat dikatakan gagal. attention and motivation of the participants are critical to the success of any training program. Partner (2009) mengemukakan the interest. Penilaian evaluating learning ini ada yang menyebut dengan penilaian hasil (output) belajar. Terdapat tiga hal yang dapat instruktur ajarkan dalam program pelatihan. fasilitas yang tersedia. Peserta pelatihan dikatakan telah belajar apabila pada dirinya telah mengalami perubahan sikap. . Oleh karena itu untuk mengukur efektivitas program pelatihan maka ketiga aspek tersebut perlu untuk diukur. and/or increase skill as a result of attending the program. Sebaliknya apabila peserta tidak merasa puas terhadap proses pelatihan yang diikutinya maka mereka tidak akan termotivasi untuk mengikuti pelatihan lebih lanjut. Evaluasi Belajar (Evaluating Learning) Kirkpatrick (1998:20) mengemukakan learning can be defined as the extend to which participans change attitudes. Dengan kata lain peserta pelatihan akan termotivasi apabila proses pelatihan berjalan secara memuaskan bagi peserta yang pada akhirnya akan memunculkan reaksi dari peserta yang menyenangkan. people learn better when they react positively to the learning environment. 2) perubahan sikap. 2. yaitu pengetahuan. Mengukur reaksi dapat dilakukan dengan reaction sheet dalam bentuk angket sehingga lebih mudah dan lebih efektif. dan motivasi peserta pelatihan dalam mengikuti jalannya kegiatan pelatihan.

Oleh karena itu evaluasi level 4 ini lebih sulit di bandingkan dengan evaluasi pada level-level sebelumnya. Input. Termasuk dalam kategori hasil akhir dari suatu program pelatihan di antaranya adalah kenaikan produksi. Dengan kata lain yang perlu dinilai adalah apakah peserta merasa senang setelah mengikuti pelatihan dan kembali ke tempat kerja? Bagaimana peserta dapat mentrasfer pengetahuan. sedangkan penilaian tingkah laku difokuskan pada perubahan tingkah laku setelah peserta kembali ke tempat kerja. Evaluasi Model CIPP Konsep evaluasi model CIPP (Context. Prosess. Penilaian sikap pada evaluasi level 2 difokuskan pada perubahan sikap yang terjadi pada saat kegiatan pelatihan dilakukan sehingga lebih bersifat internal. Evaluasi Hasil (Evaluating Result) Evaluasi hasil dalam level ke 4 ini difokuskan pada hasil akhir (final result) yang terjadi karena peserta telah mengikuti suatu program. Beberapa program mempunyai tujuan meningkatkan moral kerja maupun membangun teamwork (tim kerja) yang lebih baik. . and Product) pertama kali dikemukakan oleh Stufflebeam tahun 1965 sebagai hasil usahanya mengevaluasi ESEA (The Elementary and Secondary Education Act). sehingga penilaian tingkah laku ini lebih bersifat eksternal. penurunan kuantitas terjadinya kecelakaan kerja. Perubahan perilaku apa yang terjadi di tempat kerja setelah peserta mengikuti program pelatihan. penurunan biaya. peningkatan kualitas. Apakah perubahan sikap yang telah terjadi setelah mengikuti pelatihan juga akan diimplementasikan setelah peserta kembali ke tempat kerja. sikap dan keterampilan yang diperoleh selama pelatihan untuk diimplementasikan di tempat kerjanya? Karena yang dinilai adalah perubahan perilaku setelah kembali ke tempat kerja maka evaluasi level 3 ini dapat disebut sebagai evaluasi terhadap outcomes dari kegiatan pelatihan. Dengan kata lain adalah evaluasi terhadap impact program (pengaruh program). Konsep tersebut ditawarkan Stufflebeam dengan pandangan bahwa tujuan penting evaluasi adalah bukan membuktikan tetapi untuk memperbaiki.3. 4. Tidak semua pengaruh dari sebuah program dapat diukur dan juga membutuhkan waktu yang cukup lama. Evaluasi Tingkah Laku (Evaluating Behavior) Evaluasi pada level ke 3 (evaluasi tingkah laku) ini berbeda dengan evaluasi terhadap sikap pada level ke 2. 2. penurunan turnover (pergantian) dan kenaikan keuntungan.

Tabel 1 Aspek dan Prosedur Pelaksanaan Evaluasi Model CIPP Context Evaluation Obyek (sasaran) Mendefinisikan operasional context. strategi Process Evaluation Mengidentifikasi dan memperkirakan di dalam proses. komponen produk meliputi pengetahuan. Context. yaitu context. manajemen. program maupun institusi. Process. dan pelatihan. situasi atau latar belakang yang mempengaruhi jenis-jenis tujuan dan strategi pendidikan yang akan dikembangkan dalam sistem yang bersangkutan. tentang Product Evaluation Menghubungkan informasi outcomes dengan obyek dan informasi .Hal ini dipertegas oleh Madaus dkk (1983:118) yang mengemukakan the CIPP approach is based on the view that the most important purpose of evaluation is not to prove but to improve. process. sehingga model evaluasi yang ditawarkan diberi nama CIPP model yang merupakan singkatan ke empat dimensi tersebut. input. 3. kemampuan. dan sikap (siswa dan lulusan). guru. komponen proses meliputi kegiatan pembelajaran. Product. 4. perusahaan serta dalam berbagai jenjang baik itu proyek. 2. seperti pendidikan. Input. dan fasilitas. hasil yang dicapai baik selama maupun pada akhir pengembangan sistem pendidikan yang bersangkutan. dan product. desain. Dalam bidang pendidikan Stufflebeam (2003) menggolongkan sistem pendidikan atas empat dimensi. komponen input meliputi siswa. sarana/modal/bahan dan rencana strategi yang ditetapkan untuk mencapai tujuan pendidikan. dan pandangan hidup masyarakat. Sudjana dan Ibrahim (2004:246) menerjemahkan masing-masing dimensi tersebut dengan makna: 1. situasi ini merupakan faktor eksternal. Aspek yang dievaluasi dan prosedur pelaksanaan evaluasi model CIPP menurut Stufflebeam dalam Oliva (1992:491) seperti pada Tabel 1. keadaan ekonomi negara. mengidentifikasi dan Input Evaluation Mengidentifikasi dan memperkirakan kapabilitas sistem. seperti misalnya masalah pendidikan yang dirasakan. saran. pelaksanaan strategi dan penggunaan sarana/modal/bahan di dalam kegiatan nyata di lapangan. pembimbingan. Evaluasi model CIPP dapat diterapkan dalam berbagai bidang.

input. dan desain prosedur untuk relevansi. solusi strategis. dan mendeskripsikan proses yang aktual Product Evaluation context. membandingkan kemungkinan dan ketidakmungkinan sistem kerja. dan menganalisa penyebab ketidakmungkinan dan ketidaksesuaian kenyataan dengan tujuan (harapan) Mendeskripsikan dan menganalisis SDM dan sumber daya material yang tersedia. dan mendesain untuk implementasi strategi Process Evaluation kerusakan di dalam desain prosedur atau implementasi. dan process Metode Mendeskripsikan context. dan process Untuk memutuskan Hubungan pengambilan Memutuskan dalam hal Memilih sebagai SDM Untuk implementasi . input. dan memberikan tanda untuk antisipasi. dan kebutuhan ekonomi dalam rangkaian kegiatan Mendefinisikan operasional dan mengukur kriteria asosiasi dengan obyektif dan membandingkan hasil pengukuran dengan standar sebelum dilakukan antisipasi. membandingkan dengan yang sebenarnya dan mengawasi input dan output.Context Evaluation memperkirakan kebutuhan dan mendiagnosa masalah. untuk memperoleh informasi yang spesifik untuk memutuskan suatu program. kemungkinan kegiatan yang dapat dilaksanakan. memprediksi kebutuhan dan peluang Input Evaluation input yang sekarang tersedia. menyediakan informasi sebelum program diputuskan dan memperbaiki dokumen even prosedural dan aktivitas Memonitoring setiap aktivitas yang berpotensi terdapat tantangan secara prosedural. dan menginterpretasi outcomes berdasarkan dokumen informasi context.

solusi strategis. dan sasaran asosiasi untuk perubahan perencanaan kebutuhan Input Evaluation pendukung. yaitu description (deskripsi) dan judgement (pertimbangan). dan desain prosedural untuk perubahan struktur kerja (aktivitas) Process Evaluation dan memperbaiki desain program dan prosedur untuk efektivitas proses kontrol Product Evaluation dalam kegiatan secara kontinu. 2003:59-62). dan outcomes (hasil/result). Evaluasi Model Stake (Model Couintenance) Stake menekankan adanya dua dasar kegiatan dalam evaluasi. 3. memperluas makna evaluasi product menjadi impact evaluation (evaluasi pengaruh). sustainability evaluation (evaluasi keberlanjutan). Stake dalam Tayibnapis (2000:19) berpendapat menilai suatu program pendidikan harus melakukan perbandingan yang relatif antara program satu dan program yang lain. menghentikan (mengakhiri). effectiveness evaluation (evaluasi efektivitas). modifikasi. serta membedakan adanya tiga tahap dalam program pendidikan.Context Evaluation keputusan dengan proses perubahan menyajikan perangkat. . dengan mendiskusikan kebutuhan dan peluang. tujuan asosiasi. transaction (transaksi/kejadian/process). mengatur kembali fokus perubahan aktivitas dengan tahapan materi yang lain dalam proses perubahan untuk mengatur kembali aktivitas perubahan Stufflebeam dalam naskah yang dipresentasikan pada Annual Conference of the Oregon Program Evaluation Network (OPEN) Portland tahun 2003. atau perbandingan yang absolut yaitu membandingkan suatu program dengan standar tertentu. yaitu antecedent (program pendahulu/masukan/context). dan transportability evaluation (evaluasi transformasi) (Stufflebeam.

c) mampu menggambarkan dengan jelas perubahan tingkah laku yang diharapkan diri siswa. Cakupan Evaluasi Program Pembelajaran Evaluasi program pembelajaran menurut Soetopo (2007:137) adalah pemberian estimasi terhadap pelaksanaan pembelajaran untuk menentukan keefektifan dan kemajuan dalam rangka mencapai tujuan pembelajaran yang telah ditetapkan. khususnya kompetensi dasar dari mata pelajaran yang bersangkutan. Lebih lanjut Stake dalam Tayibnapis (2000:20) menyatakan bahwa description di satu pihak berbeda dengan judgement di lain pihak. yaitu a) kesesuaian dengan kompetensi yang akan dikembangkan. Ada beberapa kriteria yang dapat digunakan untuk menilai kompetensi dasar yang akan dikembangkan. dan c) hasil program pembelajaran yang dicapai. dan d) kemungkinan keterlaksanaan dalam kondisi dan alokasi waktu yang ada. b) kesesuaian dengan kondisi belajar mengajar yang diinginkan. tetapi juga dibandingkan dengan standar yang absolut untuk menilai manfaat program. . 3. 2. c) kejelasan rumusan. dan d) mempunyai kesesuaian dengan tingkat perkembangan siswa. terdapat tiga komponen yang perlu dijadikan obyek evaluasi. terutama mencakup aktivitas guru maupun siswa dalam proses pembelajaran. b) implementasi program pembelajaran. b) jelas rumusan yang digunakan (observable). yaitu a) menunjang pencapaian kompetensi standar kompetensi maupun kompetensi lulusan. Dalam model ini antecendent (masukan) transaction (proses) dan outcomes (hasil) data di bandingkan tidak hanya untuk menentukan apakah ada perbedaan antara tujuan dengan keadaan yang sebenarnya. Desain Program Pembelajaran Desain program pembelajaran dinilai dari 1) aspek tujuan yang ingin dicapai ataupun kompetensi yang akan dikembangkan.Penekanan yang umum atau hal yang penting dalam model ini adalah bahwa evaluator yang membuat penilaian tentang program yang dievaluasi. 1. 2) strategi pembelajaran yang akan diterapkan. dan 3) isi program pembelajaran. Kompetensi yang akan dikembangkan Salah satu aspek dari program pembelajaran yang dijadikan obyek evaluasi adalah kompetensi yang akan dikembangkan. yaitu a) desain program pembelajaran. 1. Strategi pembelajaran Ada beberapa kriteria yang dapat digunakan untuk menilai strategi pembelajaran yang direncanakan. Memperoleh gambaran yang komprehensif tentang efektivitas program pembelajaran.

khususnya proses belajar dan pembelajaran yang berlangsung di lapangan.3. Outcome program pembelajaran tidak kalah pentingnya dengan output. Hasil yang dicapai ini dapat mengacu pada pencapaian tujuan jangka pendek (ouput) maupun mengacu pada pencapaian tujuan jangka panjang (outcome). 6) kesempatan yang diberikan untuk menerapkan hasil pembelajaran dalam situasi yang nyata. 7) pola interaksi antara guru dan siswa. yaitu a) relevansi dengan kompetensi yang akan dikembangkan. komponen ketiga yang perlu dievaluasi adalah hasil-hasil yang dicapai oleh kegiatan pembelajaran. dan 8) kesempatan untuk mendapatkan umpan balik secara kontinu. b) relevansi dengan pengalaman murid dan lingkungan. 4. 2) keterlaksanaan oleh guru. 3) keterlaksanaan dari segi siswa. Penutup . Isi program pembelajaran Isi program pembelajaran yang dimaksud adalah pengalaman belajar yang akan disiapkan oleh guru maupun yang harus diikuti siswa. karena dalam outcome ini akan dinilai seberapa jauh siswa mampu mengimplementasikan kompetensi yang dipelajari di kelas ke dalam dunia nyata (realworld) dalam memecahkan berbagai persoalan hidup dan kehidupan dalam masyarakat. d) kesesuaian dengan alokasi waktu yang tersedia. Sedangkan mengenai standar evaluasi proses pembelajaran Sudjana dan Ibrahim (2004:230-232) menampilkan sejumlah kriteria yang dapat digunakan untuk mengevaluasi proses belajar dan pembelajaran yaitu 1) konsistensi dengan kegiatan yang terdapat dalam program pembelajaran. 3. Implementasi Program Pembelajaran Selain desain program pembelajaran. proses implementasi program atau proses pelaksanaan pun perlu dijadikan obyek evaluasi. Disimpulkan bahwa evaluasi dalam social studies seharusnya mengukur isi maupun proses pembelajaran. 4) perhatian yang diperlihatkan para siswa terhadap pembelajaran yang sedang berlangsung. dan e) keautentikan pengalaman dengan lingkungan hidup siswa. 5) keaktifan para siswa dalam proses belajar. c) kesesuaian dengan tingkat perkembangan siswa. Ada beberapa kriteria yang dapat digunakan untuk menilai isi program pembelajaran. Hasil Program Pembelajaran Selain desain program dan implementasi. 2. National Council for the Social Studies (2006:4) mengemukakan evaluation istrument should measure both content and process.

2) implementasi program pembelajaran atau kualitas pembelajaran. dan 3) hasil program pembelajaran. Sistem evaluasi harus difokuskan dengan jelas pada proses perbaikan daripada pertanggungjawaban untuk produk akhir. strategi pembelajaran yang dipilih. Penilaian terhadap hasil program pembelajaran tidak cukup terbatas pada hasil jangka pendek atau output tetapi sebaiknya juga menjangkau outcome dari program pembelajaran. yang meliputi kompetensi yang dikembangkan. Berbagai model evaluasi program dapat dipilih oleh guru maupun sekolah untuk mengadakan evaluasi terhadap keberhasilan program pembelajaran. Evaluasi terhadap program pembelajaran yang disusun dan dilaksanakan guru sebaiknya menjangkau penilaian terhadap: 1) desain pembelajaran. Sistem ini harus dioperasikan dekat dengan titik intervensi (obyek yaitu sekolah) untuk perubahan. tujuan evaluasi serta untuk siapa evaluasi itu dilaksanakan. . Pemilihan suatu model evaluasi akan tergantung pada kemampuan evaluator. Pendekatan analisis evaluasi pembelajaran dikembangkan dalam memenuhi kebutuhan sekolah. dan isi program.Mengevaluasi keberhasilan program pembelajaran tidak cukup hanya dengan mengadakan penilaian terhadap hasil belajar siswa sebagai produk dari sebuah proses pembelajaran. Kompleksitas permasalahan yang dihadapi evaluasi di bidang pendidikan harus ditangani dengan analisis multivariat sehingga dapat memberikan bimbingan kepada pengawas sebagai upaya perubahan. Kualitas suatu produk pembelajaran tidak terlepas dari kualitas proses pembelajaran itu sendiri.

Yogyakarta. B.htm. Educational Assessment and Reporting. A. L. Sydney: Harcout Brace Javanovich Publisher. . 1992. G. Viewpoints on Educational and Human Services Evaluation. Partner. (http://www... Essential of Educational Measurement. 1993. Yogyakarta. P.. 2009. Developing the Curriculum. L. Jakarta. Mardapi..DAFTAR RUJUKAN Ebel. Madaus. San Francisco: Berrett-Koehler Publisher. C. New York: Harper Collins Publishers. D. P. R. D. dan Frisbie. Inc. 19-23 September. D.wayne. 2009. Pengukuran.com/kirkpatricklearningevaluationmodel. dan Evaluasi. Learning and Instruction: Theory into Practice. 1991. L.coe. Griffin. New York: Macmillan Publising. Mardapi. Evaluasi Pendidikan. L. Implementing the Kirkpatrick Evaluation Model (http://www. 1998. D. Universitas Negeri Jakarta. Mardapi. Evaluation Models.. M. S. F. P. Makalah disajikan dalam Seminar Nasional Kurikulum 2004 Berbasis Kompetensi. Plus (online). E. Kirkpatrick’s Training Evaluation Model (online). 2003. New Jersey: Prentice Hall. D. D. and Evaluation). Kirkpatrick. PPPG Matematika Yogyakarta. 10 Januari. D. Scriven. 1986. dan Stuffebeam. F. Inc. diakses 23 Oktober 2009).edu/eval/pdf. E. 1986. Kurikulum 2004 dan Optimalisasi Sistem Evaluasi Pendidikan di Sekolah. diakses 23 Oktober 2009). L. dan Antonio. M. dan Margaret. Penilaian. 1998.. dan Nix. 2000. 1999. Boston: Kluwer-Nijhoff Publishing. 8-23 November.businessballs. L. Florentino St: Rex Printing Company. Makalah disajikan dalam Konvensi Pendidikan Nasional. Gredeer. Makalah disajikan dalam Penataran Evaluasi Pembelajaran Matematika SLTP untuk Guru Inti Matematika di MGMP SLTP. Evaluating Educational Outcomes (Test. Universitas Ahmad Dahlan. Measurment. D. Oliva. Oriondo. Evaluating Training Programs: The Four Levels. Kirkpatrick.

A.. Suhartoyo. M. A. Yogyakarta. Woolfolk. H. L. J. 2003. Burhanuddin. D. S.wmich. 2007. Evaluasi Program.). Malang: Fakultas Ilmu Pendidikan Universitas Negeri Malang. E. dan Maisyaroh (Eds. 1994. W. Diposkan oleh IMAM GUNAWAN di 16:52 . N.. Dasar-dasar Proses Belajar dan Mengajar. Sudjana. Bandung: Sinar Baru Algesindo. dan Thomas.edu. E. dan Ibrahim. Penelitian dan Penilaian Pendidikan.Popham. Sudjana. Pendekatan. diakses 23 Oktober 2009). 1984. Stufflebeam. Tayibnapis. Evaluasi Program Supervisi Pendidikan. The CIPP Model for Evaluation: the Article Presented at the 2003 Annual Conference of the Oregon Program Evaluators Network (OPEN) 3 October 2003 (online). (http://www. Universitas Negeri Yogyakarta. Jakarta: Rineka Cipta. Dalam Imron. Englewood Cliffs: Prentice Hall Inc. N. Classroom Assessment. Educational Psychology for Teacher. dan Nicolich. Soetopo. 1995. A. Makalah disajikan dalam Seminar Nasional Peningkatan Mutu Pendidikan melalui Pengembangan Budaya Sekolah. Needham Heights: Simon & Schuster Custom Publishing. 136-149). Assessment and Program Evaluation. Supervisi Pendidikan dan Pengajaran: Konsep. Y. 23 November. Stark. Pengalaman Peningkatan Mutu Pendidikan melalui Pengembangan Budaya Sekolah di SMAN 1 Kasihan Bantul. 2002. 2004. Bandung: Sinar Baru Algesindo. J.. L. dan Penerapan Pembinaan Profesional (hlm.. Boston: Allyn and Bacon. 2005. 2000. F.

solusi strategis. dan memberika n tanda untuk antisipasi. dan desain prosedur untuk relevansi.Context Evaluation kebutuhan dan mendiagnos a masalah. dan desain process prosedur atau implementa si. menyediak an informasi sebelum program diputuskan dan memperbai ki dokumen even prosedural dan aktivitas Memonitori ng setiap aktivitas yang berpotensi terdapat tantangan secara prosedural. untuk memperole Mendefinisi kan operasional dan mengukur kriteria asosiasi dengan obyektif dan membandin gkan hasil pengukuran dengan standar sebelum Metode Mendeskripsi kan context. memprediksi kebutuhan dan peluang Input Evaluation sekarang tersedia. kemungkin . membanding kan kemungkina n dan ketidakmung kinan sistem Mendeskrip sikan dan menganalisi s SDM dan sumber daya material yang tersedia. dan mendesain untuk implementa si strategi Process Evaluation Product Evaluation di dalam input. membanding kan dengan yang sebenarnya dan mengawasi input dan output.

mengatur kembali fokus perubahan aktivitas dengan tahapan materi yang lain dalam proses perubahan Hubunga n pengam bilan keputusa n dengan proses perubah an Memutuskan dalam hal menyajikan perangkat. dan desain prosedural untuk perubahan struktur kerja (aktivitas) . dan process Untuk memutuska n dalam kegiatan secara kontinu. dan mendeskrip sikan proses yang aktual Untuk implementa si dan memperbai ki desain program dan prosedur untuk efektivitas proses kontrol Product Evaluation dilakukan antisipasi. menghentik an (mengakhiri ). dan kebutuhan ekonomi dalam rangkaian kegiatan Process Evaluation h informasi yang spesifik untuk memutuska n suatu program. dan sasaran asosiasi untuk perubahan perencanaan kebutuhan Memilih SDM sebagai pendukung.Context Evaluation kerja. input. dan menganalisa penyebab ketidakmung kinan dan ketidaksesua ian kenyataan dengan tujuan (harapan) Input Evaluation an kegiatan yang dapat dilaksanaka n. solusi strategis. tujuan asosiasi. modifikasi. dengan mendiskusik an kebutuhan dan peluang. dan menginterp retasi outcomes berdasarka n dokumen informasi context.

Dalam model ini antecendent (masukan) transaction (proses) dan outcomes (hasil) data di bandingkan tidak hanya untuk menentukan apakah ada perbedaan antara tujuan dengan keadaan yang sebenarnya. serta membedakan adanya tiga tahap dalam program pendidikan. memperluas makna evaluasi product menjadi impact evaluation (evaluasi pengaruh). sustainability evaluation (evaluasi keberlanjutan). dan outcomes (hasil/result). tetapi juga dibandingkan dengan standar yang absolut untuk menilai manfaat program. transaction (transaksi/kejadian/process). dan transportability evaluation (evaluasi transformasi) (Stufflebeam. Penekanan yang umum atau hal yang penting dalam model ini adalah bahwa evaluator yang membuat penilaian tentang program yang dievaluasi. 3. yaitu description (deskripsi) dan judgement (pertimbangan). yaitu antecedent (program pendahulu/masukan/context). Cakupan Evaluasi Program Pembelajaran .Context Evaluation Input Evaluation Process Evaluation Product Evaluation untuk mengatur kembali aktivitas perubahan Stufflebeam dalam naskah yang dipresentasikan pada Annual Conference of the Oregon Program Evaluation Network (OPEN) Portland tahun 2003. 2003:59-62). atau perbandingan yang absolut yaitu membandingkan suatu program dengan standar tertentu. Stake dalam Tayibnapis (2000:19) berpendapat menilai suatu program pendidikan harus melakukan perbandingan yang relatif antara program satu dan program yang lain. Evaluasi Model Stake (Model Couintenance) Stake menekankan adanya dua dasar kegiatan dalam evaluasi. Lebih lanjut Stake dalam Tayibnapis (2000:20) menyatakan bahwa description di satu pihak berbeda dengan judgement di lain pihak. effectiveness evaluation (evaluasi efektivitas). 3.

yaitu a) relevansi dengan kompetensi yang akan dikembangkan. b) kesesuaian dengan kondisi belajar mengajar yang diinginkan. Ada beberapa kriteria yang dapat digunakan untuk menilai kompetensi dasar yang akan dikembangkan. Kompetensi yang akan dikembangkan Salah satu aspek dari program pembelajaran yang dijadikan obyek evaluasi adalah kompetensi yang akan dikembangkan. terdapat tiga komponen yang perlu dijadikan obyek evaluasi. khususnya kompetensi dasar dari mata pelajaran yang bersangkutan. b) relevansi dengan pengalaman murid dan lingkungan. c) mampu menggambarkan dengan jelas perubahan tingkah laku yang diharapkan diri siswa. c) kejelasan rumusan. d) kesesuaian dengan . terutama mencakup aktivitas guru maupun siswa dalam proses pembelajaran. dan d) mempunyai kesesuaian dengan tingkat perkembangan siswa. 2) strategi pembelajaran yang akan diterapkan. dan 3) isi program pembelajaran. dan c) hasil program pembelajaran yang dicapai. 3. yaitu a) kesesuaian dengan kompetensi yang akan dikembangkan. Memperoleh gambaran yang komprehensif tentang efektivitas program pembelajaran. c) kesesuaian dengan tingkat perkembangan siswa. Isi program pembelajaran Isi program pembelajaran yang dimaksud adalah pengalaman belajar yang akan disiapkan oleh guru maupun yang harus diikuti siswa. Desain Program Pembelajaran Desain program pembelajaran dinilai dari 1) aspek tujuan yang ingin dicapai ataupun kompetensi yang akan dikembangkan. yaitu a) menunjang pencapaian kompetensi standar kompetensi maupun kompetensi lulusan. 1. yaitu a) desain program pembelajaran. Strategi pembelajaran Ada beberapa kriteria yang dapat digunakan untuk menilai strategi pembelajaran yang direncanakan. b) jelas rumusan yang digunakan (observable).Evaluasi program pembelajaran menurut Soetopo (2007:137) adalah pemberian estimasi terhadap pelaksanaan pembelajaran untuk menentukan keefektifan dan kemajuan dalam rangka mencapai tujuan pembelajaran yang telah ditetapkan. Ada beberapa kriteria yang dapat digunakan untuk menilai isi program pembelajaran. 1. b) implementasi program pembelajaran. 2. dan d) kemungkinan keterlaksanaan dalam kondisi dan alokasi waktu yang ada.

Hasil yang dicapai ini dapat mengacu pada pencapaian tujuan jangka pendek (ouput) maupun mengacu pada pencapaian tujuan jangka panjang (outcome). proses implementasi program atau proses pelaksanaan pun perlu dijadikan obyek evaluasi. Kualitas suatu produk pembelajaran tidak terlepas dari kualitas proses pembelajaran itu sendiri.alokasi waktu yang tersedia. karena dalam outcome ini akan dinilai seberapa jauh siswa mampu mengimplementasikan kompetensi yang dipelajari di kelas ke dalam dunia nyata (realworld) dalam memecahkan berbagai persoalan hidup dan kehidupan dalam masyarakat. 3) keterlaksanaan dari segi siswa. Evaluasi terhadap program pembelajaran yang disusun dan dilaksanakan guru sebaiknya . 4) perhatian yang diperlihatkan para siswa terhadap pembelajaran yang sedang berlangsung. 2) keterlaksanaan oleh guru. Disimpulkan bahwa evaluasi dalam social studies seharusnya mengukur isi maupun proses pembelajaran. 4. komponen ketiga yang perlu dievaluasi adalah hasil-hasil yang dicapai oleh kegiatan pembelajaran. 3. 5) keaktifan para siswa dalam proses belajar. 6) kesempatan yang diberikan untuk menerapkan hasil pembelajaran dalam situasi yang nyata. Outcome program pembelajaran tidak kalah pentingnya dengan output. dan e) keautentikan pengalaman dengan lingkungan hidup siswa. Sedangkan mengenai standar evaluasi proses pembelajaran Sudjana dan Ibrahim (2004:230-232) menampilkan sejumlah kriteria yang dapat digunakan untuk mengevaluasi proses belajar dan pembelajaran yaitu 1) konsistensi dengan kegiatan yang terdapat dalam program pembelajaran. National Council for the Social Studies (2006:4) mengemukakan evaluation istrument should measure both content and process. 2. 7) pola interaksi antara guru dan siswa. dan 8) kesempatan untuk mendapatkan umpan balik secara kontinu. Implementasi Program Pembelajaran Selain desain program pembelajaran. khususnya proses belajar dan pembelajaran yang berlangsung di lapangan. Hasil Program Pembelajaran Selain desain program dan implementasi. Penutup Mengevaluasi keberhasilan program pembelajaran tidak cukup hanya dengan mengadakan penilaian terhadap hasil belajar siswa sebagai produk dari sebuah proses pembelajaran.

Pemilihan suatu model evaluasi akan tergantung pada kemampuan evaluator. Sistem ini harus dioperasikan dekat dengan titik intervensi (obyek yaitu sekolah) untuk perubahan. Kompleksitas permasalahan yang dihadapi evaluasi di bidang pendidikan harus ditangani dengan analisis multivariat sehingga dapat memberikan bimbingan kepada pengawas sebagai upaya perubahan. tujuan evaluasi serta untuk siapa evaluasi itu dilaksanakan. Pendekatan analisis evaluasi pembelajaran dikembangkan dalam memenuhi kebutuhan sekolah. . strategi pembelajaran yang dipilih. yang meliputi kompetensi yang dikembangkan. dan 3) hasil program pembelajaran. 2) implementasi program pembelajaran atau kualitas pembelajaran. Berbagai model evaluasi program dapat dipilih oleh guru maupun sekolah untuk mengadakan evaluasi terhadap keberhasilan program pembelajaran.menjangkau penilaian terhadap: 1) desain pembelajaran. Sistem evaluasi harus difokuskan dengan jelas pada proses perbaikan daripada pertanggungjawaban untuk produk akhir. dan isi program. Penilaian terhadap hasil program pembelajaran tidak cukup terbatas pada hasil jangka pendek atau output tetapi sebaiknya juga menjangkau outcome dari program pembelajaran.

Learning and Instruction: Theory into Practice. Jakarta. Mardapi. P. New Jersey: Prentice Hall. Partner.DAFTAR RUJUKAN Ebel. dan Nix. Boston: Kluwer-Nijhoff Publishing.. Madaus. Educational Assessment and Reporting. Implementing the Kirkpatrick Evaluation Model Plus (online). 1986. D. dan Antonio. D. 2009. D. L. M. and Evaluation). dan Evaluasi. Universitas Negeri Jakarta. 2009. diakses 23 Oktober 2009). L. L. Kirkpatrick.. Essential of Educational Measurement. Gredeer. Kurikulum 2004 dan Optimalisasi Sistem Evaluasi Pendidikan di Sekolah. dan Margaret. (http://www. dan Stuffebeam.. dan Frisbie. Yogyakarta. G.wayne. 1986. D. 10 Januari. Makalah disajikan dalam Konvensi Pendidikan Nasional. D. Evaluation Models. S. 8-23 November.. New York: Harper Collins Publishers.. New York: Macmillan Publising. L. 1998. Viewpoints on Educational and Human Services Evaluation. Oliva. San Francisco: Berrett-Koehler Publisher. PPPG Matematika Yogyakarta. 1993. 19-23 September. Universitas Ahmad Dahlan.coe. 1999. 1991. F.edu/eval/pdf. Kirkpatrick. P. Developing the Curriculum. D. C. Makalah disajikan dalam Penataran Evaluasi Pembelajaran Matematika SLTP untuk Guru Inti Matematika di MGMP SLTP. R.com/kirkpatricklearningevaluationmodel. F. Measurment. 1998. B. E. D. . 2000.htm . D. P. M.. Kirkpatrick’s Training Evaluation Model (online). Florentino St: Rex Printing Company. diakses 23 Oktober 2009). Scriven. Yogyakarta. 1992. Mardapi. Makalah disajikan dalam Seminar Nasional Kurikulum 2004 Berbasis Kompetensi. Evaluating Educational Outcomes (Test. A. Inc. Oriondo. Sydney: Harcout Brace Javanovich Publisher. Penilaian. E. Evaluating Training Programs: The Four Levels. Inc. Mardapi. Pengukuran. L. (http://www. Evaluasi Pendidikan.businessballs. Griffin. L. 2003.

A. Evaluasi Program. Englewood Cliffs: Prentice Hall Inc. Sudjana. Stark. Suhartoyo. Needham Heights: Simon & Schuster Custom Publishing. F. M. 2002. Pendekatan. Tayibnapis. A. J. 23 November. Supervisi Pendidikan dan Pengajaran: Konsep. Jakarta: Rineka Cipta. dan Thomas. Dasar-dasar Proses Belajar dan Mengajar. Diposkan oleh IMAM GUNAWAN di 16:52 . H. Assessment and Program Evaluation. Classroom Assessment.wmich. Bandung: Sinar Baru Algesindo. A.edu.).Popham. Burhanuddin. Dalam Imron. Pengalaman Peningkatan Mutu Pendidikan melalui Pengembangan Budaya Sekolah di SMAN 1 Kasihan Bantul.. W. Sudjana. dan Ibrahim. 1995. Yogyakarta.. D. Bandung: Sinar Baru Algesindo.. Universitas Negeri Yogyakarta. E. 1984. Educational Psychology for Teacher. dan Maisyaroh (Eds. Y. Malang: Fakultas Ilmu Pendidikan Universitas Negeri Malang. 1994. 2000. L. J. dan Penerapan Pembinaan Profesional (hlm. Penelitian dan Penilaian Pendidikan. 2003. Stufflebeam. The CIPP Model for Evaluation: the Article Presented at the 2003 Annual Conference of the Oregon Program Evaluators Network (OPEN) 3 October 2003 (online). 136-149). (http://www. dan Nicolich.. Makalah disajikan dalam Seminar Nasional Peningkatan Mutu Pendidikan melalui Pengembangan Budaya Sekolah. 2007. S. L. E. 2004. N. Boston: Allyn and Bacon. Woolfolk. Evaluasi Program Supervisi Pendidikan. diakses 23 Oktober 2009). Soetopo. 2005. N.

Sign up to vote on this title
UsefulNot useful