You are on page 1of 23

MAKALAH

PENGUKURAN DAN PENILAIAN PENDIDIKAN

Dosen Pengampu :

Prof. Dr. Nurhayati B, M,Pd

Oleh:

Kelas C 2022 Kelompok 5

Nurul Aqli 220013301049

Anna Majid 220013301071

Sari Utari 220013301057

PROGRAM STUDI PENDIDIKAN BIOLOGI

PROGRAM PASCASARJANA

UNIVERSITAS NEGERI MAKASSAR

2022

i
KATA PENGANTAR

Puji syukur penulis panjatkan atas kehadirat Tuhan yang Maha Esa. Berkat

rahmat, taufik dan hidayah-Nya penulis dapat menyelesaikan tugas mata kuliah

Psikologi Pendidikan yang berjudul Makalah Pengukuran Dan Penilaian

Pendidikan dengan lancar dan tepat pada waktu tanpa suatu kendala yang berarti.

Penulis mengucapkan terima kasih kepada Prof. Dr. Nurhayati, M. Pd.

Selaku dosen pengampu dari mata kuliah Psikologi Pendidikan atas bimbingannya

dalam proses penyusunan makalah ini. Penulis juga mengucapkan terima kasih

kepada seluruh anggota tim yang telah bekerja sama dalam penyusunan makalah

ini.

Penulis telah berusaha dengan maksimal dalam penyusunan makalah ini

dengan segala kekurangannya. Penulis menyadari sepenuhnya bahwa makalah ini

masih memiliki kekurangan, maka dari itu penulis berharap kritik, saran maupun

masukan yang bersifat membangun agar kedepannya penulis dapat membuat

karya-karya yang lebih baik lagi.

Makassar 24 Desember 2022

Kelompok Lima

ii
DAFTAR ISI

HALAMAN JUDUL .......................................................................................................... i


KATA PENGANTAR ....................................................................................................... ii
DAFTAR ISI..................................................................................................................... iii
BAB I PENDAHULUAN .................................................................................................. 1
A. Latar Belakang ...................................................................................................... 1
B. Rumusan Masalah ................................................................................................ 2
C. Tujuan Penulisan .................................................................................................. 2
BAB II PEMBAHASAN ................................................................................................... 3
A. Definisi Pengukuran Dan Penilaian Dalam Pendidikan.................................... 3
B. Fungsi Dan Tujuan Pengukuran dan Penilaian Dalam Pendidikan ................ 6
C. Asas Pengukuran dan Penilaian Dalam Pendidikan ......................................... 7
D. Syarat Alat Ukur Dalam Pendidikan .................................................................. 9
E. Macam-Macam Jenis Pengukuran Dan Penilaian Dalam Pendidikan .......... 11
BAB III PENUTUP ........................................................................................................... 3
A. Kesimpulan ............................................................................................................ 3
B. Saran ...................................................................................................................... 3
DAFTAR PUSTAKA ........................................................................................................ 4

iii
BAB I

PENDAHULUAN

A. Latar Belakang

Pengukuran dan penilaian dalam pendidikan merupakan suatu


rangkaian dari proses pendidikan. Penilaian dilakukan setalah proses
pendidikan usai atau telah selesai dilaksanakan. Penilaian digunakan untuk
mengetahui kualitas suatu proses pendidikan. Pendidikan dikatakan
berkualitas ketika terdapat evaluasi yang berbentuk hasil evaluasi pendidikan.

Mutu suatu sekolah atau lembaga pendidikan dapat ditengarai dengan


indikator berupa hasil out put pendidikan. Adapun out put dari proses
pendidikan dapat berupa nilai yang tertulis dalam lembar hasil penilaian,
raport, ataupun transkrip nilai. Hasil dari proses pendidikan yang berbentuk
soft skills dan hard skills, dengan penjabaran bahwa penilaian dapat ditinjau
dari beberapa aspek diantaranya yaitu aspek kognitif, afektif dan
psikomotorik. Ketrampilan peserta didik setelah mendapatkan pengalaman
“belajar” dapat berupa ketrampilan membaca, menulis, berbicara, memahami
suatu konsep keilmuan dari materi yang telah diajarkan oleh pendidik kepada
peserta didik.

Adapun bentuk-bentuk evaluasi dapat berupa pengukuran dan


penilaian. Pengukuran dilakukan untuk mengetahui kualitas secara kuantitatif
tanpa interpretasi, sedangkan penilaian dilakukan untk mengetahui kualitas
secara kualitatif yang telah menggunakan interpretasi sehingga pengukuran
yang dilakukan memiliki makna.

Dalam makalah ini akan dibahas tentang definisi penilaian dan


pengukuran beserta contohnya, tujuan dan fungsinya, asas pengukuran dan

1
2

penilaian, syarat alat ukur dan macam-macam jenis pengukuran dan


penilaian.

B. Rumusan Masalah

1. Apakah definisi dari pengukuran dan penilaian dalam pendidikan ?


2. Apakah fungsi dan tujuan pengukuran dan penilaian dalam pendidikan ?
3. Apa saja asas pengukuran dan penilaian dalam pendidikan ?
4. Bagaimana syarat alat ukur dalam pendidikan ?
5. Bagaimana macam-macam jenis pengukuran dan penilaian dalam
pendidikan ?

C. Tujuan Penulisan

1. Mengetahui definisi dari pengukuran dan penilaian dalam pendidikan


2. Mengetahui fungsi dan tujuan pengukuran dan penilaian dalam
pendidikan
3. Mengetahui asas pengukuran dan penilaian dalam pendidikan
4. Mengetahui syarat alat ukur dalam pendidikan
5. Mengetahui dan mendeskripsikan macam-macam jenis pengukuran dan
penilaiandalampendidikan.
BAB II

PEMBAHASAN

A. Definisi Pengukuran Dan Penilaian Dalam Pendidikan

1. Pengukuran (Measurement)
Sutrisno Hadi mendefinisikan pengukuran sebagai suatu tindakan
untuk mengidentifikasi besar kecilnya suatu gejala. Menurut Suharsimi
(1999:3), pengukuran merupakan proses membandingkan sesuatu dengan
satu ukuran tertentu dan bersifat kuantitatif. Pengukuran bersifat
kuantitatif, yakni untuk mengetahui atau menentukan luas, dimensi,
banyaknya dan serajat kesanggupan suatu hal atau benda. Tugas
pengukuran berhenti sampai mengetahui “berapa banyak pengetahuan
yang telah dimiliki siswa” tanpa memperhatikan arti dan penafsiran
terhadap banyaknya pengetahuan yang dimilikinya itu.
Hasil pengukuran dapat berupa angka atau uraian tentang
kenyataan atas sesuatu yang menggambarkan derajat kualitas, kuantitas,
dan eksistensi keadaan sesuatu yang diukur. Hasil pengukuran dapat
menjelaskan sesuatu bila telah ditafsirkan dengan cara membandingkan
dengan suatu patokan, norma, atau kriteria tertentu.
Dalam proses belajar mengajar, pengukuran dilakukan untuk
mengetahui seberapa perubahan tingkah laku siswa setelah mengikuti
proses belajar mengajar. Pengukuran hasil belajar umumnya
menggunakan tes sebagai alat pengukur.
Misalnya: untuk mengukur keberhasilan proses pembelajaran
Pendidikan Biologi, yang diikuti oleh 10 orang siswa dilakukan tes
dengan jumlah 10 soal dengan hasil sebagai berikut :

3
4

Tabel 2.1 Skor Hasil Pengukuran Ujian Biologi

No Nama Siswa Skor


1. Rio 6
2. Sari Utari 8
3. Maria Margaretha 9
4. Anna Majid 5
5. Rahmawati 6
6. Rasdianah 7
7. Winda 4
8. Sutrisno Hadi Ali 10
9. Winny Arianti 7
10. Rachmi 3
Total 65
Rata-Rata Kelas 6,5

Proses pembuatan soal, pelaksanaan tes, dan penskoran hasil tes


menrupakan rangkaian proses pelaksanaan pengukuran. Angka-angka
yang dicapai siswa pada tabel di atas merupakan contoh skor hasil
pengukuran yang berupa angka. Skor-skor tersebut belum memberikan
arti apapun secara lebih tentang kondisi siswa tersebut, hal ini disebabkan
belum dilakukan penilaian dengan cara membandingkan skor yang
diperoleh siswa dalam pengukuran tersebut dengan norma, patokan, atau
kriteria tertentu yang digunakan sebagai pembanding.
2. Penilaian (Evaluation)
Menurut Schwartz, penilaian adalah program untuk memberikan
pendapat dan penentuan arti atau faedah suatu pengalaman. Pengalaman
yang dimaksud adalah pengalaman yang diperoleh berkat proses
pendidikan. Pengalaman itu jelas tampak dalam perubahan pada perilaku
anak atau pola kepribadian anak. Dalam hal ini penilaian adalah usaha
untuk memeriksa sejauh mana anak telah mengalami kemajuan belajar
atau telah mencapai tujuan belajar.
Penilaian dalam kegiatan evaluasi hasil belajar merupakan
tindakan untuk memberikan interpretasi terhadap hasil pengukuran yang
telah dilakukan untuk memberikan interpretasi terhadap hasil pengukuran
yang telah dilakukan dengan menggunakan norma-norma tertentu dengan
5

tujuan untuk mengetahui tinggi rendah atau baik buruk tentang aspek-
apsek tertentu yang dievaluasi. Menurut Suharsimi (1999:3), penilaian
merupakan kegiatan pengambilan suatu keputusan terhadap sesuatu
dengan ukuran baik buruk dan penilaian lainnya yang bersifat kualitatif.
Hasil pengukuran tiada ada gunanya tanpa dinilai dengan
menggunakan norma sehingga semua usaha membandingkan hasil
pengukuran terhadap bahan pembanding berupa patokan atau norma
tertentu yang dikenal dengan istilah penilaian.
Untuk memberikan interpretasi hasil ujian Biologi terhadap 10
orang siswa, maka digunakan patokan nilai 6. Skor 6 ini menjadi patokan
nilai untuk menetapkan lulus atau tuntas tidaknya siswa atau dapat
digunakan untuk melihat baik buruk atau tinggi rendah kemampuan
penguasaan pelajaran Biologi, contoh hasil pengukurannya sebagai
berikut:

Tabel 2.2 Penilaian/Interpretasi Hasil Pengukuran Ujian Biologi

No Nama Siswa Skor Patokan Interpretasi


1. Ananda Maliana 6 6 Tuntas / Lulus
2. Beni Susanto 8 6 Tuntas / Lulus
3. Chelsea 9 6 Tuntas / Lulus
4. Dede Setianto 5 6 Tidak Tuntas
5. Evan Kurniawan 6 6 Tuntas/ Lulus
6. Fendy 7 6 Tuntas / Lulus
7. Galuh Hermawan 4 6 Tuntas / Lulus
8. Hilwan Hendrowo 10 6 Tuntas / Lulus
9. Imam Hanifuddin 7 6 Tuntas / Lulus
10. Joni Irwanto 3 6 Tidak Tuntas

Keterangan sangat tinggi, tinggi, sedang, dan rendah merupakan


hasil penilaian atau interpretasi hasil pengukuran. Begitu juga dengan
predikat lulus atau tidak lulus. Patokan atau norma memberi batas untuk
memberikan interpretasi nilai di atas dan di bawahnya. Skor di atas norma
dinilai baik atau tinggi, dan skor di bawah norma dinilai buruk atau
rendah. Melakukan sebuah penilaian harus memiliki patokan atau norma
sebagai acuan penilaian.
6

Jeanne Ellis Ormrod menyatakan dalam bukunya Educational


Psychology Developing Learners, penilaian atau assement adalah proses
mengamati sebuah sampel dari perilaku seorang siswa dan megambil
kesimpulan tentang pengetahuan dan kemampuan siswa tersebut. Pertama
assesment melibatkan pengamatan terhadap perilaku siswa. Seperti
dinyatakan kaum behavioris sangat mustahil melihat ke dalam kepala
siswa dan melihat pengetahuan apa yang mengendap di sana, kita dapat
melihat hanya bagaimana siswa berperilaku dalam situasi-situasi tertentu.
Kedua, assesment biasanya meliputi hanya sebuah sampel perilaku, kita
tentu saja tidak dapat mengamati dan melacak setiap hal yang dilakukan
setiap siswa di sekolah. Assesment juga melibatkan pengambilan
kesimpulan berdasarkan perilaku yang diamati untuk membuat assesment
tentang prestasi siswa secara keseluruhan di kelas. Penting kita memilih
perilaku yang dapat menyediakan perkiraan akurat tentang apa yang
diketahui dan dapat dilakukan siswa.

B. Fungsi Dan Tujuan Pengukuran dan Penilaian Dalam Pendidikan

Assesment dapat digunakan untuk berbagai tujuan. Dalam evaluasi


formatif, yang menilai apa yang diketahui dan dapat dilakukan siswa sebelum
atau selama pengajaran. Evaluasi formatif berkelanjutan dapat membantu
kita menetukan apa yang telah diketahui dan diyakini siswa tentang topik
yang akan dibahas. Apakah mereka membutuhkan praktek lebih lanjut untuk
ketrampilan tertentu dan sebagainya, dan kita dapat mengembangkan atau
memperbaiki rencana pelaksanaan pengajaran RPP. Disaat yang lain akan ada
evaluasi sumatif, dengan melakukan assement setelah pengajaran dalam
rangka membuat keputusan terakhir tentang apa yang telah dicapai siswa.
Evaluasi sumatif digunakan untuk menentukan apakah siswa telah menguasai
isi suatu pelajaran atau unit, berapa nilai akhir yang harus kita berikan, siswa
mana yang layak naik kelas dan sebagainya.
7

Dengan berdasarkan dua jenis evaluasi dasar ini, assesment dapat


digunakan untuk (a) meningkatkan pembelajaran, (b) memandu pembuatan
keputusan pengajaran, (c) mendiagnosa masalah pembelajaran dan performa,
(d) meningkatkan pengaturan diri (self regulation), atau (e) memutuskan apa
yang akhirnya telah dipelajari siswa. Adapun penjelasannya sebagai berikut:

a) Meningkatkan Pembelajaran
 Assesment dapat memotivasi siswa untuk belajar
 Assesment dapat mempengaruhi proses-proses kognitif tertentu di
dalamnya siswa terlibat
 Assesment dapat berperan sebagai pengalaman belajar dalam dan dari
dirinya sendiri
 Assesment dapat memberi siswa umpan balik yang berharga tentang apa
yang telah dan belum mereka kuasai
b) Memandu Pembuatan Keputusan Pengajaran
c) Mendiagnosa Masalah Pembelajaran dan Performa
d) Meningkatkan Pengaturan Diri (self regulation)
e) Memutuskan Apa yang Akhirnya Telah Dipelajari Siswa.

C. Asas Pengukuran dan Penilaian Dalam Pendidikan

Penilaian hasil belajar dilakukan berdasarkan asas-asas tertentu.


William R. Lucck dalam bukunya, An Introduction to Teaching,
mengemukakan bahwa penilaian harus berdasarkan asas-asas sebagai berikut:
1. Penilaian bersifat kuantitas atau kualitas. Penilaian bersifat kualitatif dan
kuantitatif berkenaan dengan mutu hasil belajar. Penilaian kuantitatif
berkenaan dengan banyaknya materi yang telah dipelajari
2. Penilaian dilaksanakan secara berkesinambungan. Penilaian dilakukan
sejak awal proses belajar, dilanjutkan sepanjang proses berlangsung, dan
diakhiri pada akhir pembelajaran
3. Penilaian bersifat keseluruhan. Penilaian dilakukan terhadap keseluruhan
aspek pribadi siswa yang mencakup aspek-apek intelektual, hubungan
8

sosial, sikap, watak, sifat kepemimpinan, hubungan personal sosial, moral


tanggung jawab, ketekunan bekerja, kejujuran, kesehatan jasmani, dan
semua aktivitasnya, hubungan, kesehatan rohani jasmani, dan semua
aktivitasnya, baik di dalam maupun luar sekolah.
4. Penilaian bersifat obyektif. Penilaian ditujukan ke arah pemeriksaan
perkembangan dan kemajuan siswa dalam hubungan dengan pencapaian
tujuan belajar. Penilaian diberikan sebagaimana adanya siswa, tidak
dipengaruhi oleh unsur-unsur emosi, hubungan sosial tertentu, atau sikap
guru terhadap siswa. Pendeknya subyektivitas guru tidak berpengaruh
terhadap hasil penilaian
5. Penilaian bersifat kooperatif. Kegiatan penilaian adalah tanggung jawab
bersama, baik para guru, orang tua, siswa maupun maysrakat. Jadi
penilaian itu merupakan hasil kerja sama antara semua pihak yang terkait,
baik di dalam lingkungan seolah maupun di luar sekolah.
Mehl Mills Douglass (1958) mengemukakan tujuh asas penilaian
sebagai berikut :
1. Penilaian harus dilakukan dalam kaitannya dengan tujuan-tujuan
pengajaran, yakni tujuan siswa, tujuan unit, dan tujuan pelajaran harian
2. Penilaian harus dilakukan terhadap hasil belajar sejak siswa melakukan
kagiatan belajarnya sampai akhir pelajaran
3. Penilaian bertalian dengan latar belakang dan potensi-potensi dalam diri
individu siswa. Siswa yang superior, yang memiliki latar belakang yang
baik, akan maju lebih cepat dan lebih baik untuk mencapai tujuan
instruksional
4. Penilaian berlangsung secara terus menurus sepnjang institusi belajar.
Penilaian direncanakan oleh guru dan siswa dan dilaksanakan secara
berkesinambungan terhadap kelompok dan individual siswa
5. Teknik dan alat penilaian yang digunakan harus disusun seobyektif
mungkin kendatipun mungkin segi seubyektivitas tak dapat dihindari
6. Penilaian sendiri oleh siswa perlu sebagaimana halnya penilaian oleh guru.
Dalam batas-batas tertentu banyak hal yang dapat diungkapkan sendiri
9

oleh masing-masing individu siswa yang bermanfaat untuk menentukan


keberhasilan belajar mereka
7. Penilaian bersifat konstruktif. Penilaian dimaksudkan untuk mengadakan
perbaikan serta membentuk meningkatkan kemajuan siswa.

D. Syarat Alat Ukur Dalam Pendidikan

Syarat alat ukur untuk assesment, atau karakteristik-karakteristik


penting assesment yang baik, memiliki beberapa persyaratan sebagai berikut :
a) Reliabilitas suatu instrumen atau prosedur, artinya sejauh mana
assesment tersebut memberikan informasi yang konsisten tentan
pengetahuan, keterampilan, atau karakteristik yang ingin kita ukur.
Sebuah instrumen assesment jarang memberikan hasil yang persis sama
untuk siswa yang sama pada dua kesempatan berbeda, bahkan kalaupun
pengetahuan atau kemampuan yang dinilai tetap sama. Banyak kondisi
temporer yang tidak berkaitan dengan kemampuan yang diukur
cenderung mempengaruhi performa siswa dan mengakibatkan fluktuasi
tertentu dalam hasil assesment. Faktor-faktor temporer seperti :
 Perubahan harian dalam diri siswa (misal : perubahan kondisi
kesehatan, motivasi, suasana hati dan tingkat energi)
 Variasi dalam lingkungan fisik (misal : variasi suhu ruangan, tingkat
kebisingan, dan distraksi di luar kelas)
 Variasi dalam pelaksanaan assesment (misal : variasi pengajaran,
penentuan waktu, dan jawaban guru terhadap pertanyaan siswa)
 Karakteristik instrumen assesment (misal : panjang, kejelasan, dan
kesulitan tugas)
 Subyektivitas dalam pemberian nilai (misalnya didasarkan pada
kriteria yang tidak jelas dan tidak tepat)

a.1) Menentukan Reliabilitas Secara Matematis

a.2) Mengestimasi Kesalahan Dalam Hasil Assesment


10

a.3) Meningkatkan Reliabilitas Assesment Kelas

b) Standarisasi, karakteristik assesment dikatakan baik apabila memenuhi


standarirasi, yaitu assesment mencakup isi dan format yang sama serta
dilaksanakan dan diskor dalam cara yang sama untuk setiap orang.
Misalnya di sebagian besar situasi semua siswa seharusnya memperoleh
instruksi yang sama, mengerjakan tugas yang sama atau mirip, memiliki
tengat waktu yang sama, serta bekerja dengan tantangan yang sama.
Jawaban siswa juga diskor sekonsisten mungkin, kecuali ada kondisi
yang memperingan, kita seharusnya tidak menggunakan standar yang
lebih ketat untuk seorang siswa dibandingkan siswa-siwa lainnya.
c) Validitas, suatu instrumen assesment dikatakan baik yaitu sejauh mana
instrumen tersebut mengukur apa yang ingin diukur dan memungkinkan
kita untuk menarik kesimpulan yang tepat tentang karakteristik atau
kemampuan yang dibicarakan.
1) Validitas Isi, yaitu sejauh mana berbagai pertanyaan kita akan sangat
terfokus pada validitas sampel yang representatif dari seluruh isi
pengetahuan dan keterampilan yang kita nilai. Validitas yang tinggi
sangat penting ketika kita menggunakan instrumen penelitian untuk
tujuan evaluasi sumatif, yaitu untuk menentukan pengetahuan dan
keterampilan apa yang telah dikuasai siswa dalam kaitannya dengan
tujuan-tujuan pengajaran yang penting.
2) Validitas Prediktif, yaitu sejauh mana instrumen assesment
memprediksi perfora masa depan di bidang tertentu.
3) Validitas Konstruk, sejauh mana suatu instrumen assesment benar-
benar mengukur karakteristik yang abstrak dan tidak dapat diamati.
Validitas konstruk berfokus utama ketika mencoba mengambil
kesimpulan umum tentang sifat dan kemampuan siswa sehingga kita
dapat menyesuaikan metode-metode dan bahan-bahan pengajaran
dengan lebih baik untuk memenuhi kebutuhan individual mereka.
11

d) Praktikalitas, yaitu sejauh mana instrumen dan prosedur assesment relatif


mudah digunakan. Praktikalitas meliputi masalah-masalah seperti :
 Berapa banyak waktu yang akan digunakan untuk mengembangkan
instrumen tersebut
 Dapatkah assement itu dilakukan untuk banyak siswa secara
bersamaan atau dilaksanakan satu persatu
 Apakah material yang dilibatkan
 Berapa banyak waktu aktivitas pengajaran akan berkurng untuk
assesment itu
 Seberapa cepat dan seberapa mudah performa siswa dapat dievaluasi

E. Macam-Macam Jenis Pengukuran Dan Penilaian Dalam Pendidikan

1. Tes Standar
Tes yang dibakukan mengandung prosedur yang seragam untuk
menentukan nilai dan administrasinya. Tes standar bisa membandingkan
kemampuan murid dengan murid lain pada usia atau level yang sama, dan
dalam banyak kasus perbandingan ini dilakukan di tingkat nasional. Soal
tes buatan guru cenderung difokuskan pada tujuan instruksional untuk
kelas tertentu. Sedangkan tes standar mencakup berbagai materi yang
lazimnya diajarkan di kebanyakan kelas (Airasian, 2001; Chatterji, 2003).
Adapun perbedaan lain antara tes standar dengan tes buatan guru adalah
banyak tes standar yang memiliki aturan umum dan kebanyakan telah
dievaluasi validitas dan reliabilitasnya.
Tujuan tes standar, tes standar biasanya bertujuan untuk :
 Memberikan informasi tentang kemajuan murid
 Mendiagnosis kekuatan dan kelamahan murid
 Memberikan bukti untuk penempatan murid dalam program khusus
 Memberi informasi untuk merencanakan dan meningkatkan
pengajaran atau instruksi
 Membantu administrator mengevaluasi program
 Memberikan akuntabilitas
12

Kriteria untuk mengevaluasi tes standar. Adapun kriteria yang


paling penting untuk mengevaluasi tes standar adalah validitas,
reliabilitas, dan keadilan.
 Norma, untuk memahami kinerja individual dalam suatu tes,
kinerjanya perlu dibandingkan dengan kinerja dari kelompok norma
(norm group) yakni kelompok dari individu yang sama seblumnya
telah diberi ujian oleh penguji. Tes ini dikatakan didasarkan pada
norma nasional (national norms) apabila kelompok norma itu terdiri
dari representasi murid secara nasional. Selain norma nasional, tes
standar juga dapat mengandung norma kelompok spesial dan norma
lokal. Norma kelompok spesial terdiri dari nilai tes untuk sub
kelompok dari sampel nasional. Misalnya norma kelompok spesial
mungkin tersedia untuk murid dari kelompok sosioekonomi rendah,
menengah, dan atas, untuk murid perkotaan, sub urban, dan
perdesaan, untuk sekolah swasta dan negeri, untuk siswa perempuan
dan laki-laki, dan untuk murid dari kelompok etnis yang berbeda-
beda. Norma lokal terkadang disediakan untuk tes standar. Norma ini
membandingkan kinerja murid dengan murid lain dari kelas yang
sama, sekolah yang sama, atau distrik yang sama. Jadi evaluasi
kinerja tes murid mungkin akan berbeda-beda tergantung kepada
norma kelompok yang dipakai.
 Validitas, adalah sejauh mana sebuah tes mengukur apa-apa yang
hendak diukur dan apakah inferensi nilai tes itu akurat atau tidak.
Tes standar yang valid harus mengandung validitas isi yang baik,
yakni kemampuan tes untuk mencakup sampel (to sample) isi yang
hendak diukur. Konsep ini sama dengan “fakta yang berkaitan
dengan isi”. Bentuk lain dari validitas adalah validitas kriteria, yakni
kemampuan tes untuk memprediksi kinerja murid saat diukur dengan
penilaian atau dengan kriteria lain. Validitas kriteria dapat bersifat
concurrent and predictive (Gregory, 2000; Krunger, 2000).
Concurrent validity adalah relasi antara nilai tes dengan kriteria lain
13

yang ada saat ini. Predictive validity adalah relasi antara nilai tes
dengan kinerja masa depan murid. Selanjutnya construct validity
yaitu sejauh mana ada bukti bahwa sebuah tes mengukur tertentu.
Sebuah konstruk adalah ciri atau karakteristik yang tidak bisa dilihat
dari seseorang, seperti intelegensi (kecerdasan), gaya belajar,
personalitas, atau lecemasan.
 Reliabilitas, berarti sejauh mana sebuah prosedur tes bisa
menghasilkan nilai yang konsisten dan dapat direproduksi. Agar bisa
disebut reliabel, nilai harus stabil, dependable, dan relatif bebas dari
kesalahan pengukuran (Fekken, 2000; Popham, 2002). Reliabilitas
dapat diukur dengan beberapa cara antara lain test restest reliability,
alternate forms reliability, dan split half reliabilty. Test retest
reliability adalah sejauh mana sebuah tes menghasilkan kinerja yang
sama ketika seorang siswa diberi tes yang sama dalam dua
kesempatan yang berbeda. Alternate form reliability ditentukan
dengan memberikan bentuk yang berbeda dari tes yang sama pada
dua kesempatan yang berbeda untuk kelompok murid yang sama dan
mengamati seberapa konsistenkah skornya. Split half reliabilty,
membagi item tes menjadi dua bagian, seperti item bernomor genap
dan ganjil. Nilai pada dua set itu itu dibandaingkan guna menentukan
seberapa konsistenkah kinerja murid di kedua set itu. Validitas dan
reliabilitas adalah saling terkait. Sebuah tes yang valid itu reliabel,
tetapi sebuah tes yang reliabel tidak selalu valid.
 Keadilan, tes yang adil (fair) adalah tes yang tidak bias (unbiased)
dan tidak diskriminatif (McMillan, 2001). Tes itu tidak dipengaruhi
oleh faktor-faktor seperti gender, etnis, atau faktor subyektif seperti
bias penilai.
2. Tes Kecakapan dan Prestasi
Ada dua tipe utama tes standar yaitu tes kecakapan (aptitude) dan
tes prestasi (achievement). Tes kecakapan (aptitude test) didesign guna
memprediksi kemampuan murid untuk mempelajari suatu keahlian atau
14

menguasai suatu keahlian atau menguasai sesuatu dengan pendidikandan


training tingkat lanjut. Tes kecakapan ini mencakup tes kemampuan
mental umum seperti tes kecerdasan (Stanford-Binet, Wechsler Scales,
dan sebagainya). Tes prestasi dimaksudkan untuk mengukur apa yang
telah dipelajari atau keahlian apa yang telah dikuasai murid (Andrews,
Sakloske & Janzen, 2001; Haladyna, 2002; Smith, 2001). Namun
perbedaan antara tes prestasi dengan tes kecakapan terkadang kabur.
Kedua jenis tes ini menilai status murid, pertanyaan yang dipakai
kebanyakan mirip, dan biasanya hasil dari dua jenis tes ini mempunyai
korelasi yang tinggi.
Jenis-jenis tes prestasi standar, ada bebarapa tipe tes prestasi
standar. Salah satu cara umum untuk mengklasifikasikannya adalah
sebagai survey batterie, spesific subject test, or diagnostic tests (Payne,
1997). Survey battery (baterai survei) adalah sekelompok tes pokok
persoalan individual yang didesign untuk murid level tertentu. Survey
batteries adalah tes standar nasional yang banyak digunakan (McMillan,
2001). Tes untuk subyek spesifik, dimaksudkan untuk menilai keahlian di
bidang tertentu seperti membaca atau matematika. Karena tes ini
difokuskan pada area spesifik, tes ini biasanya menialai suatu keahlian
secara lebih mendetail dan ekstensif ketimbang survey battery. Tes
diagnostik, adalah fungsi penting dari tes standar. Diagnostic testing
terdiri dari evaluasi area pembelajaran spesifik secara mendalam.
Tujuannya adalah menetukan kebutuhan pembelajaran spesifik dari murid
sehingga kebutuhan itu dapat dipenuhi melalui instruksi reguler atau
remidial. Membaca dan matematika adalah dua area di mana tes standar
paling banyak dipakai untuk diagnosis (Berniger, dkk., 2001).
3. Ujian Negara Beresiko Tinggi (high stakes)
Setelah publik dan pemerintah menuntut pertanggungjawaban
terhadap efektivitas sekolah dalam mendidik anak-anak bangsa, tes atau
ujian yang diwajibkan negara (ujian negara) semakin kuat perannya
(Hambleton, 2002;Olson, 2001). Negara telah lama mewajibkan ujian atau
15

tes, tetapi penekanannya berubah belakangan ini (Airasian, 2001).


Sebelum 1990-an, isinya tidak berhubungan erat dengan apa yang
diajarkan dan dipelajari di kelas. Ujian negara hanya memberikan tinjauan
umum atas seberapa baik murid di suatu negara bagian dalam mata
pelajaran tertentu, terutama membaca dan matematika.
Tahun 1990-an, dimulailah usaha untuk menghubungkan ujian
negara dengan sasaran instruksional yang didukung negara. Kebanyakan
negara bagian di AS punya atau sedang dalam proses identifikasi sasaran
yang harus dicapai oleh setiap murid di suatu negara. Sasaran ini menjadi
basis bukan hanya untuk ujian negara, tetapi juga untuk menjadi pedoman
aktivitas seperti pendidikan guru dan penentuan kurikulum (Whitford &
Jones, 2000).
Adapun format ujian negara ditinjau dari sudut pandang
konstruktivis, ujian yang diwajibkan negara ini menggunakan format yang
salah, terdiri dari soal pilihan berganda. Hanya tujuh negara bagian yang
belakangan ini menggunakan soal model esai atau soal kinerja (Quality
Couns, 2001). Ketika penilaian berbasis konstruksi dipakai, penilaian itu
biasanya menggunakan soal jawaban pendek atau soal menulis. Hanya
sedikit negara bagian yang memasukkan pertofolio sebagai bagian dari
penilaiannya. Hampir semua negara bagian menggunakan penilaian yang
mengacu pada kriteria, yang berarti bahwa nilai murid dievaluasi
berdasarkan standar yang telah ditetapkan. Kebanyakan negara
menggunakan nilai dasar (seperti jawaban benar sampai 70 persen) yang
harus dicapai murid agar lulus. Tes semacam itu juga memberikan nilai
komparatif.
Keuntungan dan penggunaan tes beresiko tinggi. Sejumlah
pembuat kebijakan berpendapat bahwa ujian negara berisiko tinggi (high
stakes) memberikan sejumlah efek posistif diantaranya :
 Meningkatkan kinerja murid
 Lebih banyak waktu untuk mengajarkan pelajaran yang diujikan
 Ekspektasi tinggi untuk semua murid
16

 Identifikasi sekolah, guru, dan administrasi yang berkinerja payah


 Meningkatkan rasa percaya diri di sekolah setelah nilai ujian naik.
Kritik terhadap ujian negara. Kritik terhadap ujian yang diwajibkan
negara ini menyatakan bahwa ujian negara akan menimbulkan akibat
negatif (McMillan, 2002) yaitu :
 Menumpulkan kurikulum dengan penekanan lebih besar pada hafalan
ketimbang pada keahlian berpikir dan memecahkan masalah. Dalam
sebuah analisis, kebanyakan ujian negara lebih difokuskan pada
pengetahuan dan keahlian yang cenderung gampang ketimbang
kognitif yang lebih kompleks (Quality Counts, 2001). Ini akan
mempersempit kurikulum dan lebih fokus pada keahlian kognitif yang
rendah (Linn, 2000).
 Mengajar demi ujian, guru akan mengajar pengetahuan dan keahlian
yang akan diujikan saja (Gallagher, 2000). Mereka menghabiskan
banyak waktu untuk berlatih soal-soal ujian. Dalam sebuah survei,
lebih dari enam dari sepuluh guru sekolah publik mengatakan bahwa
ujian negara ini menyebabkan pengajaran difokuskan pada ujian
(Quality Counts, 2001).
 Diskriminasi terhadap murid dari status sosioekonomi (SES) rendah
dan minoritas. Hal ini terjadi ketika jumlah anak-anak dari kelompok
ini tidak memenuhi standar negara ini sangat besar, sedangkan murid
SES yang lebih tinggi dan kulit putih bisa memenuhi standar. Para
riset telah menemukan bahwa murid yang ditempatkan di jalur lambat
atau program remidial, murid dari keluarga muskin dan etnis
minoritas, lebih mungkin mendapatkan pengajaran yang buruk dan
berprestasi berprestasi rendah (Cooper & Sherk, 1989 ; Oakes, 1990).
4. Tes Distrik dan Nasional
Selain ujian negara, sebuah distrik atau kabupaten mungkin
mewajibkan tes standar, murid mungkin juga harus mengikuti ujian
naisonal.
17

Ujian Distrik (Lokal). Di Spencerport, New York, distrik sekolah


mengumpulkan isnformasi tentang kinerja murid dengan tes berikut ini :
Standford Achievement Test in Reading (grade 2-8) and Math (grade 1-
8); New York Satae Pupil Evaluation Test in Reading (grade 3-6),
Written Expression (grade 5), and Mathematics (grade 3 dan 6); New
York State Program Evaluation Test, yang menilai program sainsdan studi
ssosial; New York Preliminary Competency Test, yang dipakai untuk
memprediksi kesuksesan masa depan di pelajaran membaca, menulis, dan
matematika (diberikan untuk setiap grade); New York States Regents
Competency Test, yang menilai kompetensi untuk pelajaran matematika,
sains, studi global, dan sejarah dan pemerintahan AS (diberikan di SMA
untuk murid yang tidak mengikuti Regent Test); Scholastic Assessment
Tes (SAT) dan American Collage Test (ACT), diberikan kepada murid
yang berencana masuk ke universitas atau akademik dan Advance
Placement Test untuk bidang sejarah AS, biologi, kimia, sastra dan
bahasa Inggris, Perancis, Spanyol, kalkulus, dan teori musik yang dapat
diikuti oleh murid untuk memasuki kelas tertentu berdasarkan level
pengetahuan dan kemampuan yang mereka miliki. Pada tahun 1999,
Spenceport juga mulai menilai kemampuan murid untuk mengaplikasikan
pengetahuan dan keahlian memecahkan masalah dalam sejumlah bidang.
Tes tipe standar dapat bervariasi antardistrik. Akan tetapi, seperti dalam
dalam sekolah distrik Spencerport, jumlah keseluruhannya banyak.
Penilaian Nasional dan Standar Kelas Dunia, pemerintah federal
juga dilibatkan dalam menstandarisasikan ujian melalui National
Assessment of Educational Progress (NAEP). Negara bagian tidak
diwajibkan ikut berpatisipasi dalam penilaian naional, walaupun banyak
yang ikut (misalnya, lebih dari 40 negara bagian telah mewajibkan murid
di sana untuk mengikuti ujian). NAEP adalah penelitian mirip sensus
terhadap pengetahuan, keahlian, pemahaman, dan sikap generasi muda
Amerika (Bourque, 1999; Payne, 1997). Area subyek mencakup bidang
membaca, menulis, sastra, matematika, sains, studi sosial, seni,
18

kewarganegaraan, dan perkembangan karier dan pekerjaan. Murid,


sekolah, kota, atau negara bagian tidak disebutkan dalam kajian ini,
walaupun negara bagian boleh meminta agar namanya dicantumkan.
Setiap murid yang mengikuti NAEP hanya merespons sebagian dari
seluruh penilaian.
Temuan dari NAEP (2000) menunjukkan trend sebagai berikut :
 Membaca. Tidak ada peningkatan dari tahun 1992 sampai 2000
untuk anak grade empat dan tidak ada perkembangan untuk anak
grade delapan sampai dua belas dari 1992 sampai 1998.
 Matematika. Dari tahun 1990 sampai 2000 terdapat kenaikan nilai
untuk anak grade empat dan grade delapan, tetpi menunjukkan
penurunan pada tahun 2000 untuk anak grade 12.
 Sains. Tidak ada perubahn nilai dari 1996 sampai 2000 untuk anak
grade empat dan delapan, namun nilai anak grade dua belas
menurun dalam rentang waktu tersebut.
BAB III

PENUTUP

A. Kesimpulan

1. Pengukuan dan penilaian dalam pendidikan merupakan rangkaian dari


proses pendidikan. Pengukuran memiliki arti proses membandingkan
sesuatu dengan satu ukuran tertentu dan bersifat kuantitatif. Sedangkan
penilaian merupakan kegiatan pengambilan suatu keputusan terhadap
sesuatu dengan ukuran baik buruk dan penilaian lainnya yang bersifat
kualitatif.
2. Evaluasi atau assesment dapat digunakan untuk (a) meningkatkan
pembelajaran, (b) memandu pembuatan keputusan pengajaran, (c)
mendiagnosa masalah pembelajaran dan performa, (d) meningkatkan
pengaturan diri (self regulation), atau (e) memutuskan apa yang
akhirnya telah dipelajari siswa.
3. Pengukuran dan penilaian memiliki asas-asas tertentu, memiliki syarat
alat ukur untuk pengukuran dan penilaian, juga mempunyai jenis dan
macam yang berbeda-beda yang disesuaikan dengan tujuan dari
pengukuran dan penilaian.

B. Saran

Dengan mengucap syukur alhamdulillah pada Allah SWT, kami dapat


menyelesaikan makalah ini dengan baik dan tentunya masih banyak
kekurangan. Oleh karena itu kami masih memerlukan kritik dan saran yang
membangun serta bimbingan, terutama dari Dosen. Semoga makalah ini
bermanfaat bagi pembaca dan bagi kami sebagai penyusun.

19
DAFTAR PUSTAKA

Hamalik, Oemar, Psikologi Belajar & Mengajar, Bandung : Sinar Baru Algesindo, 2009.

Muhamad Irham dan Novan Ardy Wiyani, Psikologi Pendidikan : Teori dan Aplikasi
dalam Proses Pembelajaran, Yogyakarta : Ar-Ruzz Media, 2013.

Ormrod, Jeanne Ellis, Psikologi Pendidikan : Membantu Siswa Tumbuh dan


Berkembang, Edisi Keenam terj. Amitya Kumara, Jakarta : Erlangga,
2008.

Santrock, John W., Psikologi Pendidikan, Edisi Kedua Terj. Tri Wibowo B.S, Jakarta :
Kencana, 2007.

20

You might also like