Terje Mah

TUGAS TEORI RESPON BUTIR
TERJEMAHAN BUKU
Tugas ini disusun untuk memenuhi tugas Mata Kuliah Teori Dan Teknik Pengukuran
Dosen Pengampu: Dr. Edi Istiyono, M.Si
Disusun oleh:
Nama : Ayu Tri Astuti

NIM : 15302241027
Kelas : Pendidikan Fisika A’15
JURUSAN PENDIDIKAN FISIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI YOGYAKARTA
YOGYAKARTA
2018
6.0 BAB GAMBARAN UMUM DAN KONSEP UTAMA
persyaratan untuk model pengukuran

kesalahan standar
item yang cocok
cocok responden
Bab ini membahas dua masalah utama yang harus ditangani ketika seseorang mengukur.
Pertama, apa model pengukuran yang harus dipilih pengukur? Kedua, mengingat bahwa
pilihan telah dibuat, bagaimana pengukur memutuskan apakah model bekerja untuk data
spesifik di tangan?
6.1 PERSYARATAN UNTUK MODEL PENGUKURAN

Persyaratan untuk model pengukuran yang merupakan yang terakhir dari empat blok
bangunan ini adalah:
1. model pengukuran harus memungkinkan seseorang untuk menginterpretasi jarak antara
responden dan respon pada peta konstruk, dan
2. model pengukuran harus memungkinkan seseorang untuk menginterpretasi jarak antara
tanggapan yang berbeda pada peta konstruk, dan juga perbedaan antara responden yang
berbeda (Wilson, 2004). Untuk memahami persyaratan ini, kita harus melihat dengan hati-
hati apa arti jarak dalam konteks peta konstruksi. Pada peta geografis, jarak dan arah di peta
memiliki makna di permukaan bumi: Sebagai contoh, 1 mil utara mungkin sama dengan 1
inci "naik" peta. Pada peta konstruk, jarak antara responden dan tanggapan menunjukkan
kemungkinan untuk membuat respons tersebut. Untuk menyatakan ini sebagai persamaan,
asumsikan bahwa posisi responden diwakili oleh 6 dan lokasi respon item diwakili oleh 8.
Maka probabilitas respon (Pr (respon)) diberikan oleh beberapa fungsi (f) dari perbedaan
antara responden dan respon:
Pr (respons) = f (ϴ-δ). (6.1)
Itu bisa ditafsirkan demikian:
(i) jarak nol antara seseorang dan tanggapan akan berarti bahwa orang tersebut kemungkinan
akan mendukung pernyataan dengan probabilitas tertentu (katakanlah, 0,50),
(ii) tanggapan responden di atas akan menunjukkan probabilitas yang lebih besar, dan
(iii) tanggapan responden di bawah ini akan menunjukkan probabilitas yang lebih rendah.
Oleh karena itu, kita dapat mengatakan bahwa model harus memiliki fitur kualitatif (i) hingga
(iii). Namun, fitur kualitatif ini tidak cukup untuk mempertahankan gagasan "peta." Untuk itu
persyaratan (ii) dan (iii) perlu lebih rinci, memberikan bentuk metrik tertentu. Pertimbangkan
sekarang apa artinya bagi interpretasi dari peta konstruk. Gambar 6.1 mengilustrasikan situasi
untuk seseorang kira-kira di tengah-tengah konstruk. Untuk orang ini, item yang pada tingkat
yang sama akan diharapkan untuk menghasilkan kesepakatan sekitar .50 kemungkinan,
sedangkan item yang di atas akan cenderung menghasilkan respons positif dengan
probabilitas yang lebih rendah dan sebaliknya bagi mereka di bawah. Kami juga dapat
mempertimbangkan jarak antara respons barang. Gambar 6.2 mengilustrasikan jarak antara
dua respon item, yang dianggap oleh
Gambar 6.1 Buatlah peta yang mengilustrasikan interpretasi dari lokasi-lokasi yang berbeda
dengan memperhatikan satu orang.
orang pada titik yang berbeda dalam skala — katakanlah Orang X dan Y Perhatikan bahwa
jarak antara "kegiatan yang lebih keras dan lebih giat" dan "aktivitas sedang" adalah sama
tidak peduli apakah Anda mencari dari perspektif orang yang lebih rendah dalam skala atau
mereka yang lebih tinggi dalam skala. Hal ini sangat jelas terlihat aneh bahkan untuk
menunjukkannya, tetapi pada dasarnya sangat penting untuk jenis interpretasi yang dapat
dibuat dengan menggunakan peta: Ide lokasi dari respon barang sehubungan dengan lokasi
respon item lain hanya masuk akal jika
Gbr. 6.2 Buatlah peta yang mengilustrasikan interpretasi lokasi-lokasi yang berbeda dengan
memperhatikan dua orang.
bahwa makna relatif tidak bergantung pada lokasi responden yang terlibat (yaitu, interpretasi
lokasi relatif perlu seragam di mana pun responden berada). Cara lain untuk menempatkan ini
adalah artinya sama di mana pun Anda berada di peta. Persyaratan invarian ini sesuai dengan
gagasan bahwa "inci mewakili satu mil" di mana pun Anda berada di peta geografis. Salah
satu konsekuensi kualitatif spesifik dari ini adalah bahwa urutan (pada peta) dari respon item
harus tetap sama untuk semua responden, dan urutan responden (di peta) harus tetap sama
untuk semua respon item. Kebutuhan ingat kembali 2 — itu lebih kuat: tidak adil pesanan
dipertahankan, tetapi juga properti metrik. Untuk mencapai hal ini dalam kerangka
pemodelan respon-item, model item harus memiliki properti bahwa bentuk fungsi respon-
item (IRF) adalah sama untuk semua item, seperti pada Gambar 6.3. Dalam gambar ini, item
selalu memiliki urutan yang sama dalam hal probabilitas di mana pun responden berada.
Misalnya, di ϴ= 0,0, lokasi responden terendah di peta, barang-barangnya dipesan dalam
kesulitan (dari tertinggi ke terendah) sebagai Item 1, Item 2, dan Item 3, masing-masing.
Melewati hingga ϴ = 1,0 dan ϴ = 2.2, orang dapat melihat bahwa urutan kesulitan item
adalah identik. Pada ekstrem, perbedaan ini menjadi sangat kecil, akhirnya lebih kecil
daripada batas akurasi yang diberikan. Namun demikian, dalam arti matematika, mereka
selalu diperintahkan pada titik yang terbatas pada skala. Orang dapat melihat bahwa, untuk
kesulitan memesan barang yang relatif berubah, IRF ini harus memiliki bentuk yang berbeda.
Pertimbangkan konteks pemodelan respon-barang, di mana IRF diberikan hubungan yang
lebih kompleks daripada itu untuk model Rasch — apa yang disebut fungsi logistik dua-
parameter:
Jika αi tidak sama, maka respon barang akan (setidaknya di suatu tempat) menukar pesanan
mereka. Ini diilustrasikan pada Gambar. 6.4. Dalam gambar ini, pertimbangkan tiga orang di
lokasi yang berbeda dalam skala: At -3.0, urutan item adalah 1, 3, 2 (dari yang paling sulit
hingga paling mudah); pada 0,0, urutan item adalah 1, 2, 3; dan pada 4.0, urutan item adalah
2, 1, 3.
Konsekuensi dari perbedaan-perbedaan dalam bentuk IRFs adalah bahwa perintah invarian
tersirat oleh Persyaratan 1 dan 2 tidak ada dalam set item; karenanya, interpretasi yang
diberikan oleh peta Wright (dan peta konstruksi) tidak tersedia. Pada dasarnya, ada
pemesanan barang yang berbeda (yaitu skala yang berbeda) di lokasi yang berbeda. Ini tidak
mungkin untuk mewakili dalam cara itu dilakukan sebelumnya, jadi tidak ada angka yang
diberikan yang setara dengan 7,2 atau 7,3. Kembali ke analogi peta geografis, memiliki lokasi
relatif item tergantung pada seberapa tinggi atau rendah responden pada konstruk seperti
mengatakan bahwa jarak antara Berlin dan Roma (dan bahkan yang berada di utara yang lain)
tergantung apakah Anda melihatnya dari Washington atau Istanbul. Peta geografis tidak akan
banyak berguna jika ada ketidakkonsistenan urutan seperti itu, dan hal yang sama berlaku
untuk peta Wright. Oleh karena itu, untuk meringkas, argumennya adalah bahwa, jika Anda
ingin menggunakan alat interpretasi seperti peta Wright, Anda harus memiliki sebagai
persyaratan untuk item Anda yang mereka sesuaikan dengan ("cocok") model statistik seperti
yang diberikan dalam Persamaan 6.3. Alternatifnya, jika kekuatan interpretasi dari peta
Wright tidak diinginkan dalam aplikasi tertentu, maka seseorang tidak perlu memaksakan
persyaratan ini. Perhatikan bahwa model Rasch memiliki fitur kuat lainnya, yang banyak
ditemukan menarik (misalnya, lihat Fischer & Molenaar, 1995, hanya untuk kasus semacam
itu), tetapi argumen di sini adalah yang agak lebih sederhana - fitur dari model Rasch yang
dikapitalisasi adalah salah satu yang dibagikan dengan banyak orang lain, termasuk kasus
khusus dari model probit (kasus "kemiringan sama"), serta ketidakterbatasan orang lain
(termasuk model nonparametrik).
Jika satu set item benar-benar memiliki karakteristik seperti pada Gambar 6.4, apa yang
dapat dilakukan untuk mengatasi masalah kurangnya invariance ini? Beberapa kemungkinan
strategi yang dapat dipertimbangkan diberikan berikutnya:
(A) Seseorang bisa mengembangkan interpretasi konstruk yang lebih kompleks, di mana teori
yang mendasari adalah (pada kenyataannya memprediksi) bahwa urutan item harus berubah
untuk orang-orang di berbagai titik konstruk. Ini adalah pendekatan yang tidak lazim
terutama karena melibatkan pembuatan interpretasi yang cukup kompleks - lebih kompleks
daripada yang biasanya dijamu dalam konteks psikometrik. Beberapa contoh adalah: (i)
interpretasi Yen (1985) tentang perbedaan lereng sebagai bukti "peningkatan kompleksitas
kognitif," dan (ii) ekstensi Wilson pemodelan Rasch untuk memasukkan unsur-unsur tahap
Piaget (model "saltus"; Mislevy & Wilson , 1996; Wilson, 1989; Wilson & Draney, 1997).
Ini bisa disebut "membuat konstruksimu lebih rumit."
(B) Orang bisa berpura-pura masalah ini tidak masalah dan menemukan cara untuk mencapai
sesuatu yang tampak sama. Contoh ini diberikan oleh penggunaan konvensi "Response
Probability 80" (RP-80) (mis., Kolstad, Cohen, Baldi, Chan, deFur, & Angeles, 1998). Di
bawah konvensi ini, seseorang menggunakan lokasi di mana orang memiliki kemungkinan
menanggapi 0,80. Pendekatan ini hanya mengabaikan ketidakkonsistenan dengan pemesanan
pada tingkat probabilitas kriteria lainnya. Ini bisa disebut "bersembunyi di balik kerumitan
statistik."
(C) Orang bisa mengabaikan masalah interpretability substantif dari parameter item. Yaitu,
parameter item dan interpretasi probabilitas penampungnya diabaikan dalam hal validitas
konstruk internal — mereka diizinkan untuk menjadi apa pun yang mereka inginkan. Ini
kadang-kadang disebut sebagai pilihan antara "membuat data sesuai model" dan "membuat
model sesuai dengan data" (dengan Opsi [c] menjadi yang terakhir), tetapi itu tidak cukup
representasi akurat karena apa yang benar-benar menjadi dicari adalah bahwa barang sesuai
dengan konstruk. Mengabaikan interpretasi substantif dari parameter item tidak konsisten
dengan pengukuran yang menonjol teori dan juga dengan standar pengujian saat ini
(American EducationalResearch Association, American Psychological Association, National
Council for Measurement in Education, 1999). Ini bisa disebut "biarkan data memberi tahu
Anda apa yang seharusnya menjadi bobot."
(D) Akhirnya, seseorang dapat bekerja untuk memperbaiki set item sehingga IRFs tidak
menyeberang (mis., model Rasch memang berlaku). Ini masuk akal dalam hal kelangkaan
barang dan konstruksi relatif; Lagi pula, ada banyak item daripada konstruksi suara. Ini akan
dilakukan dengan (i) menghapus item dengan kemiringan rendah (yaitu, mereka dengan
koefisien korelasi biserial titik rendah), dan / atau (ii) menambahkan item baru yang dapat
diuji untuk lereng yang masuk akal. Ini bisa disebut "membuat set item sesuai dengan
konstruk." Mengingat bahwa seseorang bekerja dalam kerangka "membangun peta", (d)
adalah satu-satunya alternatif yang layak.
Dengan demikian, konsekuensi untuk model pengukuran adalah bahwa estimasi parameter
yang paling sesuai perlu dilakukan di bawah batasan yang tersirat dalam Persamaan. 6.3.
Tidak masalah bahwa Anda mungkin lebih cocok dengan memperkirakan terpisah sebagai-
model-model tidak akan diterima sebagai bagian dari keluarga model yang memberikan
interpretasi peta membangun. Posisi semacam ini sama sekali tidak konsisten dengan praktik
pemodelan statistik yang baik. Pertimbangkan yang berikut ini:
Kriteria untuk model yang baik adalah yang "menjelaskan" sebagian besar variabilitas ini ....
Dalam prakteknya ini harus diseimbangkan dengan kriteria lain seperti kesederhanaan.
Occam's Razor menunjukkan bahwa model parsimonius yang menggambarkan data secara
memadai mungkin lebih baik ke yang rumit yang menyisakan sedikit variabilitas "tidak
terjelaskan." (Dobson, 1983, hal 8)
Sebenarnya strategi pertama yang dijelaskan oleh Dobson benar-benar hanya strategi parsial -
orang harus selalu mempertimbangkan perlunya parsimoni, serta kebutuhan untuk
mendasarkan model statistik pada konteks interpretasi, yang menentukan bahwa beberapa
model dapat diterima dan yang lain tidak . Tentu saja dalam melaksanakan Strategi (d),
adalah penting bahwa batasan yang sama (X cukup baik tercermin dalam data. Itulah
mengapa kita perlu menguji aspek fit tertentu menggunakan teknik yang menyelidiki
kemiringan barang, seperti " cocok "statistik yang dikembangkan oleh Wright dan rekan-
rekannya (misalnya, Wright & Masters, 1981; Wright & Stone, 1979; juga lihat bagian
selanjutnya). Teknik ini menunjukkan item masalah, dan dengan demikian dapat membantu
dalam mendiagnosis penyebab masalah ini, sehingga memudahkan untuk datang dengan
barang pengganti yang tidak memiliki masalah yang sama.
Dalam tinjauan, pertanyaan yang model pengukuran untuk memilih telah disusun kembali
sebagai pertanyaan tentang apa yang merupakan kendala interpretasi apriori yang harus
dikenakan pada model untuk membuatnya masuk akal dalam cara yang Anda inginkan.
Masalah ini telah diperdebatkan dalam literatur statistik arus utama. Sebagai contoh,
perhatikan apa yang dikatakan Gershenfeld pada tahun 1998: "... dua tugas utama selalu
memilih bentuk fungsional dari model dan menggunakan data untuk menentukan parameter
yang dapat disesuaikan dari model" (hal. 113). Apa yang terkonsentrasi pada bab ini adalah
yang pertama — bentuk fungsional dari model. Gershenfeld melanjutkan:
Mengurangi satu jenis kesalahan kemungkinan akan meningkatkan jenis lainnya. Ini disebut
tradeoff bias / varians — jika Anda ingin lebih sedikit bias dalam perkiraan parameter model,
biasanya biaya beberapa varians. Model yang lebih fleksibel yang dapat mewakili data
dengan lebih baik mungkin juga lebih mudah disesatkan oleh kebisingan dalam data.
(Gershenfeld, 1998, hal. 113) Dengan demikian, pertanyaannya menjadi, haruskah seseorang
membuat model dengan skor terbatas sesuai dengan data, atau haruskah seseorang membuat
model dengan skor yang tidak dibatasi sesuai dengan data? Dengan kata lain, haruskah Anda
membuat item sesuai dengan konstruk atau konstruksinya sesuai dengan item? Setelah
diskusi sebelumnya, jika pengukur ingin mempertahankan makna dari
jarak dalam peta konstruksi, pengukur tidak memiliki pilihan tetapi untuk mencari set item
yang sesuai dengan model yang dibatasi. Dalam prakteknya, dalam area pemodelan respon-
item, ini menjadi strategi untuk menemukan cara-cara untuk menggunakan keluarga Rasch
dari berbagai model untuk menghadapi banyak kerumitan situasi pengukuran. Secara teori,
model nonparametrik juga dapat digunakan, tetapi ada batasan untuk apa yang dapat Anda
capai dengan model tersebut.
6.2 MENGUKUR
Tujuan peta Wright adalah untuk membantu menginterpretasikan lokasi responden dan
ambang batas item pada konstruk. Namun tujuan dari instrumen (biasanya) adalah untuk
mengukur responden. Pada peta, setiap responden dapat ditempatkan pada titik tertentu pada
skala logit — ini disebut dalam buku ini sebagai langkah-langkah responden. Dalam Gambar
6.5, misalnya, responden yang mendapat nilai 1 berada di -4,40 logit, sedangkan mereka yang
mendapat nilai 19 ditempatkan di
4.78 logit. Seperti disebutkan sebelumnya, logit-logit ini sering diterjemahkan ke dalam unit
yang berbeda sebelum dikomunikasikan kepada konsumen. Setiap transformasi linier
mempertahankan interpretasi probabilitas dari logit yang diberikan sebelumnya. Beberapa
konsumen memilih untuk tidak berurusan dengan angka negatif, dan beberapa tidak
menyukai pecahan desimal. Oleh karena itu, terjemahan umum adalah untuk membuat mean
baru 500 dan deviasi standar baru 100-untuk sebagian besar instrumen, yang membuat semua
angka positif dan menghilangkan kebutuhan untuk desimal.2 Semua yang diperlukan adalah
versi modifikasi dari Tabel 5.1 yang menggunakan unit yang diinginkan daripada logits.

Terje Mah

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Terje Mah

Uploaded by

Copyright:

Available Formats

TUGAS TEORI RESPON BUTIR

Nama : Ayu Tri Astuti

JURUSAN PENDIDIKAN FISIKA

persyaratan untuk model pengukuran

6.1 PERSYARATAN UNTUK MODEL PENGUKURAN

You might also like