PENERAPAN
GENERALIZED PARTIAL CREDIT MODEL
DALAM
TEORI RESPON BUTIR UNTUK MENDUGA KEMAMPUAN
HASIL TES URAIAN
(Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat
Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012)
SARTIKA LESTARI
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
RINGKASAN
SARTIKA LESTARI. Penerapan Generalized Partial Credit Model dalam Teori Respon Butir untuk Menduga Kemampuan Hasil Tes Uraian (Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012). Dibimbing oleh BUDI SUSETYO dan TONI BAKHTIAR.
Pada pelaksanaan tes uraian, penskoran biasanya dilakukan secara parsial bersadarkan langkah-langkah yang harus ditempuh untuk menjawab benar suatu butir soal. Penskoran dilakukan perlangkah dan skor perbutir soal diperoleh peserta dengan menjumlah skor tiap langkah, dan kemampuan diduga dengan skor mentah. Model penskoran seperti ini belum tentu tepat karena tingkat kesukaran tiap langkah tidak diperhitungkan. Pendekatan alternatif yang dapat digunakan yaitu pendekatan teori respon butir untuk penskoran politomi, salah satunya dengan generalized partial credit model (GPCM). Oleh karena itu, tujuan dari penelitian ini ialah menduga kemampuan peserta tes uraian mata kuliah Kalkulus Tingkat Persiapan Bersama (TPB) Tahun Ajaran 2011/2012 menggunakan GPCM.
Tahapan yang dilakukan ialah pemeriksaan asumsi, pemeriksaan reliabilitas skor tes, pendugaan karakteristik butir soal dan kemampuan peserta, pemeriksaan nilai fungsi informasi, pemeriksaan kesesuaian model, dan kriteria butir soal. Berdasarkan hasil pendugaan parameter daya pembeda, soal nomor 1 dan 5 memerlukan revisi atau disisihkan, soal nomor 2 memerlukan revisi sedikit, soal nomor 3, 4, 6, 7, 8, dan 9 memiliki daya pembeda yang cukup baik, dan soal nomor 10 memiliki daya pembeda yang baik sekali artinya soal mampu membedakan kemampuan peserta tes. Berdasarkan hasil pendugaan parameter indeks kesukaran butir soal, soal nomor 1 termasuk kriteria soal mudah, soal nomor 2, 3, 4, 5, dan 6 termasuk kriteria soal sedang dan soal nomor 7, 8, 9, dan 10 termasuk kriteria soal sukar. Berdasarkan hasil, semua butir soal dapat dikategorikan soal dengan kualitas cukup baik. Total informasi yang dihasilkan sebesar 72.470%, artinya tes mampu memberikan informasi tentang pendugaan tingkat kemampuan peserta tes pada rentang kemampuan dari tingkat terendah hingga tertinggi sebesar 72.470% dan model GPCM cukup informatif mampu menjelaskan tingkat kemampuan peserta tes. Hasil uji kesesuain model menunjukkan bahwa 100% soal dapat digambarkan dengan model. Hal ini terlihat dari nilai khi-kuadrat empiris butir soal tidak melebihi nilai khi-khi-kuadrat teoritis (nilai p > 0.05). Dari 10 butir soal mata kuliah Kalkulus tidak ada butir soal yang tidak dapat digambarkan oleh model.
Kata kunci: Penskoran Politomi, Teori Respon Butir (IRT), Generalized Partial Credit Model
PENERAPAN
GENERALIZED PARTIAL CREDIT MODEL
DALAM
TEORI RESPON BUTIR UNTUK MENDUGA KEMAMPUAN
HASIL TES URAIAN
(Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat
Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012)
Oleh:
SARTIKA LESTARI
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Judul : Penerapan Generalized Partial Credit Model dalam Teori Respon Butir untuk Menduga Kemampuan Hasil Tes Uraian (Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012)
Nama : Sartika Lestari NIM : G14080020
Menyetujui:
Pembimbing I,
Dr. Ir. Budi Susetyo, M.S. NIP : 196211301986031003
Pembimbing II,
Dr. Toni Bakhtiar, M.Sc. NIP : 197206271997021002
Mengetahui:
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto, M.Si. NIP : 196504211990021001
PRAKATA
Alhamdulillah, segala puji hanya bagi Allah SWT yang telah melimpahkan segala nikmat dan karunia-Nya, sehingga penulis dapat menyelesaikan karya ilmiah. Karya ilmiah ini berjudul
”Penerapan Generalized Partial Credit Model dalam Teori Respon Butir untuk Menduga
Kemampuan Hasil Tes Uraian (Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012)”.
Karya ilmiah ini penulis susun sebagai salah satu kewajiban yang harus dipenuhi dan merupakan syarat untuk mendapatkan gelar Sarjana Statistika (S. Stat) pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Penulisan karya ilmiah ini dapat diselesaikan oleh penulis tidak lepas dari dukungan, bimbingan dan bantuan dari banyak pihak yang sangat berarti bagi penulis. Oleh karena itu, penulis mengucapkan terima kasih atas segala bantuan dan bimbingan yang diberikan kepada:
1. Bapak Dr. Ir. Budi Susetyo, M.S. dan Dr. Toni Bakhtiar, M.Sc. selaku dosen pembimbing telah memberikan bimbingan, masukan dan arahan selama penulisan karya ilmiah ini. 2. Bapak Dr. Ir. Hari Wijayanto, M.Si. selaku Ketua Departemen Statistika FMIPA IPB. 3. Bapak Ir. Bambang Sumantri selaku dosen penguji luar yang telah memberikan beberapa
masukan dan arahan kepada penulis.
4. Seluruh Dosen Statistika yang telah memberikan ilmu dan wawasan selama penulis menuntut ilmu di Departemen Statistika serta seluruh staf Departemen Statistika yang telah banyak membantu penulis, terutama Ibu Markonah dan Ibu Tri yang telah memberikan pelayanan terbaik.
5. Seluruh Dosen dan Staf Departemen Matematika yang telah mengizinkan penulis menggunakan data ujian tengah semester mata kuliah Kalkulus Tingkat Persiapan Bersama.
6. Kedua orang tua, kakak, dan adik yang telah memberikan doa, kasih sayang serta dorongan baik moril maupun materil.
7. Dony Bayu Dewantoro yang telah memberikan doa, kasing sayang, serta dukungannya. 8. Oktaviani Prihatiningsih dan Umi Nur Chasanah sebagai teman satu bimbingan yang
telah memberikan dukungan selama menyelesaikan karya ilmiah ini.
9. Dilla, Betha, Arima, Mia, Ratih, Vita, Gusti, Anni, Sella, dan teman-teman STK’45 atas dukungan dan kebersamaannya selama tiga tahun ini dalam segala suka maupun duka. 10. Teman-teman seperjuangan statistika yang telah bersama-sama menuntut ilmu di
Departemen Statistika.
Semoga bantuan yang telah diberikan kepada penulis mendapat balasan dari Allah SWT. Penulis menyadari bahwa karya ilmiah ini jauh dari sempurna. Oleh karena itu, Penulis memohon maaf atas segala kekurangan dan kesalahan yang terdapat di dalam penyusunan karya ilmiah ini. Semoga karya ilmiah ini dapat bermanfaat bagi pihak yang membutuhkan.
Bogor, 2012
RIWAYAT HIDUP
Penulis dilahirkan di Sumedang pada tanggal 25 Januari 1990 sebagai anak ke tiga dari lima bersaudara dari pasangan Dedi Supriadi, S.Pd. dan W. Rohyawati, S.Pd.
Pada tahun 2002 penulis berhasil menyelesaikan pendidikan sekolah dasar di SD Negeri 1 Selaawi, kemudian melanjutkan di SMP Negeri 1 Sumedang dan lulus pada tahun 2005. Penulis menyelesaikan pendidikannya di SMA Negeri 3 Sumedang pada tahun 2008. Kemudian, pada tahun yang sama, penulis diterima sebagai mahasiswa Departemen Statistika melalui jalur Undangan Seleksi Masuk IPB (USMI) dengan minor Matematika Keuangan dan Aktuaria Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
DAFTAR ISI
Halaman
DAFTAR GAMBAR ... viii
DAFTAR TABEL ... viii
DAFTAR LAMPIRAN ... viii
PENDAHULUAN ... 1
Latar Belakang ... 1
Tujuan ... 1
TINJAUAN PUSTAKA ... 1
Teori Respon Butir ... 1
Reliabilitas Skor Tes ... 2
Generalized Partial Credit Model (GPCM) ... 2
Pendugaan Parameter ... 4
Grafik Categorical Response Function (CRF) ... 4
Fungsi Informasi ... 4
Uji Kesesuaian Model ... 5
Kriteria Butir Soal ... 5
METODOLOGI ... 6
Data ... 6
Metode ... 6
HASIL DAN PEMBAHASAN ... 6
Eksplorasi Data ... 6
Asumsi-asumsi Model IRT ... 7
Reliabilitas Skor Tes ... 7
Model Teori Respon Butir GPCM ... 7
Fungsi Informasi ... 9
KESIMPULAN DAN SARAN ... 9
Kesimpulan ... 9
Saran ... 10
DAFTAR PUSTAKA ... 10
DAFTAR GAMBAR
Halaman
1. Bagan klasifikasi model IRT ... 2
2. Grafik CRF pada 4 kategori ... 4
3. Scree plot hasil analisis faktor ... 7
4. Grafik CRF butir soal nomor 10... 9
5. Grafik fungsi informasi ... 9
DAFTAR TABEL
Halaman 1. Kriteria indeks kesukaran butir soal ... 32. Kriteria daya pembeda butir soal ... 4
3. Materi soal UTS TPB IPB mata kuliah Kalkulus ... 6
4. Statistik skor mahasiswa UTS TPB IPB mata kuliah Kalkukus ... 6
5. Reliabilitas skor tes butir soal mata kuliah Kalkulus ... 7
6. Hasil pendugaan dan kriteria indeks daya pembeda butir soal ... 8
7. Hasil pendugaan dan kriteria indeks kesukaran butir soal ... 8
8. Kriteria butir soal ... 8
9. Statistik parameter kemampuan peserta tes mata kuliah Kalkulus pada model GPCM ... 8
10.Fungsi informasi model GPCM mata kuliah Kalkulus ... 9
DAFTAR LAMPIRAN
Halaman 1. Tabulasi data mata kuliah Kalkulus UTS TPB IPB Tahun Ajaran 2011/2012 ... 122. Proporsi peserta tes menjawab benar per kategori soal ... 13
3. Nilai parameter butir soal Ujian Tengah Semester mata kuliah Kalkulus model GPCM ... 15
1
PENDAHULUAN
Latar Belakang
Pada bidang pendidikan, kegiatan penilaian hasil belajar peserta didik merupakan salah satu tugas penting yang harus dilakukan oleh pendidik. Penilaian keberhasilan studi semester dilakukan pada tiap pertengahan dan akhir semester. Ujian Tengah Semester merupakan salah satu upaya untuk mengetahui kemajuan mahasiswa terhadap kurikulum yang telah diajarkan. Proses pengukuran hasil belajar sangat penting dilakukan mahasiswa Tingkat Persiapan Bersama (TPB) yang merupakan langkah awal bagi mahasiswa sebelum memasuki departemen. Penilaian keberhasilan studi semester dilakukan dengan pemberian soal kepada peserta tes. Akan tetapi, pemberian soal yang terlalu sukar dan mudah menyebabkan pendidik sulit membedakan kemampuan mahasiswa. Oleh karena itu, diperlukan analisis terhadap soal ujian dengan harapan hasil ujian dapat merepresentasikan kemampuan mahasiwa.
Peningkatan mutu pendidikan tidak terlepas dari penerapan penilaian yang dapat secara tepat mengukur hasil akhir dari suatu proses pembelajaran. Artinya untuk menilai hasil akhir dalam pembelajaran diperlukan alat penilaian yang berkualitas. Tes merupakan salah satu alat penilaian yang sering digunakan.
Kegiatan evaluasi dilakukan menyeluruh terhadap berbagai aspek, yaitu aspek kognitif, afektif, dan psikomotorik. Evaluasi terhadap aspek kognitif dalam pendidikan khususnya pembelajaran Kalkulus akan memerlukan instrumen diantaranya berupa tes. Tes dapat diklasifikasikan dalam beberapa macam tergantung dari bentuk, tipe, dan ragamnya (Zainul & Nasution 2011). Fungsi tes hasil belajar adalah sebagai alat untuk penempatan, fungsi formatif, fungsi diagnostik, dan fungsi sumatif.
Berdasarkan bentuknya, tes hasil belajar dapat dikelompokkan menjadi tiga jenis yaitu objektif pilihan ganda dua pilihan, objektif pilihan ganda lebih dari dua pilihan dan uraian (Gronlund & Linn 1990). Tes uraian biasa dilakukan dengan model politomi. Pada model ini, penskoran dilakukan dengan melihat tahap-tahap peserta tes dalam menyelesaikan soal. Penskoran dengan menggunakan skor menjawab benar pada jawaban peserta tes dengan model politomi tidak sepenuhnya tepat. Hal ini disebabkan oleh tingkat kesukaran tiap langkah tidak diperhitungkan.
Selain itu, peluang menjawab benar seorang peserta tes berdasarkan respon tertentu tidak dapat diduga. Terkait dengan hal tersebut, perlunya pendekatan lain, diantaranya menggunakan teori respon butir Generalized Partial Credit Model (GPCM). Pada GPCM, tingkat kesulitan tiap langkah diperhitungkan untuk menduga kemampuan peserta tes.
Tujuan
Tujuan yang ingin dicapai dalam penelitian ialah:
1. Menerapkan GPCM untuk menduga kemampuan peserta tes uraian Ujian Tengah Semester mata kuliah Kalkulus Tingkat Persiapan Bersama Institut Pertanian Bogor (UTS TPB IPB) tahun ajaran 2011/2012 dengan pendekatan pensokran politomi teori respon butir. 2. Memberikan masukan kepada Departemen
Matematika IPB terhadap soal UTS Kalkulus TPB IPB tahun ajaran 2011/2012.
TINJAUAN PUSTAKA
Teori Respon Butir
Teori respon butir merupakan metode pengukuran modern yang biasa digunakan dalam analisis butir soal. Teori respon butir dilihat dari karakteristik butir soal ditentukan oleh respon para peserta tes (baik yang berkemampuan tinggi maupun rendah). Teori respon butir dikenal juga dengan nama seperti
Item Response Theory (IRT) atau Latent Trait Theory (LTT). Nama yang paling banyak digunakan adalah Item Response Theory atau Teori Respon Butir.
Pengembangan IRT didasarkan kepada dua ciri yaitu latent trait atau abilities dan
Item Characteristics Curve (ICC). Latent trait
adalah kemampuan peserta tes pada suatu butir soal dapat diduga oleh seperangkat faktor yaitu kemampuan verbal, kemampuan psikomotor, kemampuan kognitif, dan sebagainya. ICC menunjukan hubungan antara kemampuan peserta tes pada suatu butir soal dan perangkat kemampuan laten yang mendasarinya (Hambleton & Swaminathan 1985).
2
setiap skor kemampuan yakni ada hubungan fungsional antara peserta tes terhadap tingkat kemampuan yang dimiliki.
Model-model karakteristik butir soal bergantung pada bentuk matematis fungsi karakteristik butir soal dan banyaknya parameter yang dilibatkan dalam model yang digunakan. Hal ini dikarenakan tidak semua model IRT cocok untuk perangkat data tes yang lain (Widhiararso 2010).
Gambar 1 Bagan klasifikasi model IRT Keterangan
UIRT : Unidimensional IRT MIRT : Multidimensional IRT
Berdasarkan Gambar 1, model IRT dibagi menjadi dua, yaitu IRT satu dimensi (UIRT) dan IRT multidimensi (MIRT). UIRT hanya menganalisis satu karakteristik soal dengan satu dimensi kemampuan yang dominan. UIRT ini menggunakan data dikotomi seperti benar (1) dan salah (0), dan data politomi untuk data berskala ordinal. UIRT data dikotomi bisa menggunakan model logistik satu parameter, model logistik dua parameter, dan model logistik tiga parameter. Sedangkan untuk UIRT data politomi, model yang bisa digunakan adalah graded response model
(GRM), modified graded response model
(MGRM), partial credit model (PCM),
generalized partial credit model (GPCM), dan
rating scale model (RSM). Dalam penelitian ini digunakan data politomi dengan metode
generalized partial credit model (GPCM).
Reliabilitas Skor Tes
Tujuan utama menghitung reliabilitas skor tes adalah untuk mengetahui tingkat ketepatan dan kekonsistenan skor tes. Indeks reliabilitas berkisar antara 0 − 1. Semakin
tinggi koefisien reliabilitas suatu tes (mendekat 1), makin tinggi pula ketepatannya. Reliabilitas dapat dihitung dengan koefisien yang dalam Crocker & Algina (1986) didefinisikan sebagai berikut:
2 1 1 2 1 n i n i n X
, dengann = jumlah butir soal,
= ragam skor per butir soal,
= ragam skor total.
GPCM
Model yang lebih dikenal pada awal perkembangan teori respon butir politomi ialah Partial Credit Model (PCM). PCM merupakan model penskoran politomi yang merupakan perluasan dari model dengan menggunakan dua parameter logistik pada data dikotomi (model Rasch). Asumsi pada PCM adalah setiap butir soal memunyai daya beda butir soal yang sama.
Pengembangan lebih lanjut penskoran politomi adalah GPCM. Muraki & Bock (1997) mendefinisikan GPCM sebagai bentuk umum dari PCM, mengembangkan kembali model kredit parsial yang memungkinkan butir soal di dalam skala memiliki perbedaan dalam hal parameter kemiringan.
Dalam Hambleton & Swaminathan (1985), dalam metode GPCM asumsi yang harus dipenuhi adalah asumsi dimensi tunggal (unidimensional) dan kebebasan lokal (local independence). Asumsi dimensi tunggal dapat diperiksa dengan akar ciri dalam analisis faktor, menghitung rasio antara akar ciri yang pertama dan kedua. Jika rasionya tinggi, maka modelnya bersifat unidimensional. Kebebasan lokal (local independence) merupakan respon peserta tes terhadap suatu butir soal tidak berhubungan dengan butir soal lainnya dalam tes tersebut. IRT membebaskan peserta tes dan butir soal dari interdependensi, sehingga taraf sukar butir soal tidak lagi bergantung kepada kemampuan peserta tes, kemampuan peserta tes tidak lagi bergantung kepada taraf sukar butir soal.
GPCM memiliki kemiripan dengan PCM hanya berbeda pada pelibatan parameter kemiringan (slope) yang disimbolkan dengan
3
Berikut fungsi karakteristik operasi (Operating Characteristic Functions/OCF).
| -1, , -1 exp 1 exp Pjk Pjk k kPj k Pjk
Daj bjk
Daj bjk
, exp 0 exp 0 0 exp 0 exp 0 0 kDaj bjv
v
P m
jk j c
D b jv
c v
k
Daj bj dv
v
m j c
D bj dv
c v
0,1, 2, ...,
k m j
di mana
= peluang peserta berkemampuan
θmemperoleh skor kategori k
butir soal ke-j
= peluang peserta berkemampuan
θ memperoleh skor kategori k
butir soal ke-j jika peluang peserta berkemampuan θ memperoleh skor kategori k-1 sudah didapatkan
θ = kemampuan peserta
aj = indeks daya beda butir soal ke-j
bjk = indeks kesukaran kategori k
butirsoal ke-j
bj = indeks kesukaran butir soal ke-j
dv = parameter kategori
D = parameter kemiringan (D = 1.7)
mj = skor kategori
Parameter bjk merupakan parameter tahap
butir soal. Parameter ini merupakan titik potong antara kurva dengan Pj,k-1(θ).
Kedua kurva hanya berpotongan di satu titik pada skala θ.
Jika θ = bjk, maka (θ) = Pj,k-1(θ)
Jika θ> bjk, maka (θ) > Pj,k-1(θ)
Jika θ< bjk, maka (θ) < Pj,k-1(θ),
dengan k = 0,1,2,3,..., mj.
Persamaan peluang peserta dapat dijabarkan berdasarkan jumlah kategori di dalam butir soal. Jika sebuah skala memiliki k kategori dengan skor 0,1,2,...,mj, maka akan didapatkan
k buah persamaan dengan peluang individu peserta tes pada setiap kategori.
Kategori 0:
, 1 0 1 exp 0 0Pj m
j c
Daj bjv
c v Kategori 1
, exp 1 1 1 exp 0 0Daj bj
Pj m
j c
Daj bjv
c v
Kategori k
. exp 0 exp 0 0 kDaj bjv
v
Pjk m
j k
Daj bjv
c v
(Muraki & Bock 1997) Parameter yang digunakan dalam GPCM yaitu indeks kesukaran butir soal (bjk) dan (bj),
indeks daya beda butir soal (aj), dan
kemampuan peserta tes ( ) (Hambleton & Swaminathan 1985).
a. Indeks Kesukaran Butir Soal
Indeks kesukaran butir soal merupakan salah satu faktor yang mempengaruhi peluang peserta tes untuk merespon butir soal dengan cara tertentu. Butir soal yang memiliki indeks kesukaran yang tinggi akan cenderung diisi dengan benar daripada butir soal yang memiliki tingkat kesukaran yang rendah. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal menurut Hambleton & Swaminathan (1985).
Tabel 1 Kriteria indeks kesukaran butir soal
Indeks kesukaran Kriteria
0 ≤ b < 0.3 Soal Sukar
0.3 ≤ b≤ 0.7 Soal Sedang
0.7 < b≤ 1 Soal Mudah
b. Indeks Daya Pembeda Butir Soal
4
rendah. Daya pembeda suatu butir soal ini didasarkan pada hasil tes suatu kelompok sehingga daya pembeda tersebut belum tentu berlaku pada kelompok yang lain. Indeks daya pembeda soal berkisar antara
−1 sampai dengan 1. Semakin tinggi nilai daya pembeda soal, maka semakin baik soal tersebut menurut Hambleton & Swaminathan (1985).
Tabel 2 Kriteria daya pembeda butir soal
Indeks Daya
Pembeda Kriteria
0.7 ≤ aj≤ 1.0 memiliki daya pembeda
baik sekali
0.4 ≤ aj≤ 0.69 memiliki daya pembeda
cukup baik
0.3 ≤ aj≤ 0.39 memerlukan revisi
sedikit atau tidak
0.2 ≤ aj ≤ 0.29 memerlukan revisi atau
disisihkan
−1 ≤aj ≤ 0.19 disisihkan atau revisi
total
c. Kemampuan peserta ()
Kemampuan peserta tes pada suatu butir soal dapat diprediksi oleh seperangkat faktor yaitu kemampuan verbal, kemampuan psikomotor, kemampuan kognitif, dan sebagainya.
Pendugaan Parameter
Langkah pertama dan paling penting dalam aplikasi IRT adalah pendugaan parameter, baik parameter kemampuan peserta tes (θ) maupun parameter karakteristik butir soal ( , ). Pendekatan yang dapat digunakan untuk pendugaan parameter butir soal yaitu metode kemungkinan maksimum (maximum likelihood estimation, MLE) (Matthew 2007).
Prinsip dasar dari metode MLE dalam Hogg & Craig (1978) adalah jika terdapat contoh acak x1, x2, ..., xn dari sebuah sebaran
yang memiliki suatu fungsi kepekatan peluang
f(x;θ), θ ϵ Ω. Fungsi kepekatan peluang
bersama dari x1, x2, ..., xn adalah f(x1;θ), f(x2;θ),
..., f(xn;θ). Fungsi kepekatan peluang bersama
ini dipandang sebagai fungsi dari θ. Muraki & Wang (1992) mendefinisikan fungsi kepekatan peluang bersama untuk model IRT GPCM adalah sebagai berikut:
x |
x |
P i Pi jk
|
1 0 x x m j n jkiPi jk Pjk
j k
, jika memperoleh skor kategori k pada
butir soal ke-j
0, jika selainnya
Dengan definisi yang telah dijelaskan maka fungsi nisbah kemungkinan (L) dapat dinotasikan sebagai berikut:
,
; 1 , 2 , ..., 1 ; 2 ;
, .., ;
x x
x
L xki x ki xjki f ki f ki
f jki
Muraki & Wang (1992) mendefinisikan fungsi likelihood untuk model IRT adalah sebagai berikut:
1, , ..., | 1
1 2 1 0
x
mj jki x
n jki
L xk x k xjk Pjk Pjk
j k
| ln 1 , 2 , ..., |
1
ln 1
1 0
ln 1 ln 1 1 0
l x L xki x ki xjki
m j
n x x
jki jki
Pjk Pjk
j k m j n
xjki Pjk xjki Pjk
j k
dengan l 0,
aj,bj,bjk
di mana , adalah parameter butir soal.
Grafik Categorical Response Function
(CRF)
Grafik Categorical Respone Function
(CRF) dalam du Toit (2003) adalah hubungan antara peluang menjawab benar memperoleh skor kategori k pada butir ke-j dengan kemampuan peserta tes (θ). Semakin tinggi kemampuan peserta tes, maka peluang untuk menjawab benar sebuah butir soal dengan benar akan semakin meningkat.
Gambar 2 Grafik CRF pada 4 kategori
5
dilihat untuk butir soal ke-j memiliki daya pembeda (aj) sebesar 2.0 dan tingkat
kesukaran pada kategori menjawab sebesar (bj1= −0.5, bj2= 0.5, bj3= 1.5).
Fungsi Informasi
Fungsi Informasi (IF) adalah sebuah fungsi yang mengukur sampai sejauh mana model yag dipilih mampu memberikan informasi tentang pendugaan tingkat kemampuan sepanjang skala latent
kemampuan. Semakin tinggi puncak IF, semakin informatif model yang dipilih mampu menjelaskan traits-level para peserta tes. Fungsi informasi (IF) memenuhi persamaan sebagai berikut:
2 ln
2 0
m j
Ij Pjk Pjk
k
dengan Pjk(θ) merupakan proporsi menjawab
benar butir soal ke-j memperoleh kategori k
pada tingkat kemampuan θ. Sebagai akumulasi keseluruhan fungsi informasi butir soal, maka akan diperoleh fungsi informasi tes atau test information (TI), yang secara matematis formulanya adalah:
1 n
TI I j
j
Informasi tes menjelaskan sejauh mana tes mampu mengukur tingkat kemampuan tertentu dengan cermat. Apakah tes yang dikembangkan mampu mengukur dengan baik kelompok peserta tes dengan kemampuan rendah, sedang, dan tinggi saja atau justru mampu mengukur dengan semua tingkat kemampuan. Nilai informasi yang besar menunjukkan bahwa kemampuan kelompok peserta tes dengan kemampuan tertentu dapat diduga dengan baik, yaitu semua hasil pendugaan akan memiliki nilai yang cukup dekat dengan nilai sebenarnya. Jika nilai informasi yang didapatkan kecil, maka kemampuan tidak dapat diduga dengan tepat dan nilai pendugaan akan tersebar luas pada semua tingkat kemampuan (Baker 2001).
Sedangkan untuk simpangan baku pengukuran (SE) dapat dihitung untuk tiap-tiap kemampuan θ, dengan formula:
1 SE TI Simpangan baku pengukuran merupakan fungsi yang berkebalikan dengan IF. Makin tinggi IF, maka makin rendah simpangan baku pengukuran (Widhiararso 2010).
Uji Kesesuaian Model
IRT merupakan pemodelan terhadap respon-respon para peserta tes. Berdasarkan model yang dipilih, model manakah yang paling mampu menjelaskan data respon tersebut. Oleh karena itu, diperlukan uji kesesuaian model. Uji kesesuaian model IRT digunakan untuk menguji karakteristik butir soal setelah direspon oleh berbagai kemampuan peserta tes. Uji kesesuaian (goodness of fit test) model IRT dilakukan untuk setiap butir soal yang direspon oleh berbagai kemampuan peserta tes. Pengujian menggunakan statistika yang berdistribusi khi-kuadrat (chi-square) (Hambleton & Swaminathan 1985). Dengan rumus kesesuaian model sebagai berikut:
| 1 |
|
|
1 0
1
jk
E k E k
Pjk E k
Zjk
m j n
E k kPjk
j k
N
dengan 2 ~ 2 ,
1 m
Zjk m x
j
di mana
Pjk (θ) = peluang peserta berkemampuan θ
memperoleh skor kategori k pada butir soal ke-j
E(k|θ) = nilai harapan
Njk = banyaknya peserta tes memperoleh
skor kategori k pada butir soal ke-j
x = banyaknya parameter dalam
model
m = banyaknya kategori kemampuan yang bergantung pada pendugaan kemampuan peserta tes.
Hipotesis nol dalam pengujian ini menyatakan bahwa kurva CRF sesuai untuk data respon butir soal ke-j. Kesesuaian model untuk suatu butir soal ditunjukkan oleh nilai khi-kuadrat empiris butir soal yang tidak melebihi nilia khi-kuadrat teoritis.
Kriteria Butir Soal
6
1. Soal yang baik adalah model setiap soal yang sesuai dengan model jika nilai khi- kuadrat empiris butir soal tidak melebihi nilai khi-kuadrat teoritis (nilai-p > 0.05), memiliki nilai daya pembeda lebih dari 0.5, dan tingkat kesukaran butir soal
berada di antara −2 sampai dengan 2.
2. Soal cukup baik adalah soal yang sesuai model jika nilai khi-kuadrat empiris butir soal tidak melebihi nilai khi-kuadrat teoritis (nilai-p > 0.05) dan salah satu kriteria soal baik tidak dipenuhi.
3. Soal yang belum dapat digambarkan adalah soal yang tidak sesuai dengan model yang digambarkan jika nilai khi- kuadrat empiris butir soal lebih besar nilai khi- kuadrat teoritis (nilai-p < 0.05).
METODOLOGI
Data
Penelitian ini menggunakan data yang diperoleh dari hasil jawaban Ujian Tengah Semester (UTS) mata kuliah Kalkulus TPB IPB yang dilaksanakan pada tanggal 3 April 2012. Jumlah peserta ujian sebanyak 1702 mahasiswa. Jumlah butir soal sebanyak 10 butir soal uraian. Penilaian dilakukan dengan pemberian skor maksimal untuk masing-masing butir soal, skor 10 untuk jawaban benar kecuali untuk nomor 8 memiliki skor 15 jika butir soal dijawab dengan benar berdasarkan urutan atau langkah dalam menjawab butir soal. Total nilai maksimum yaitu 105 jika butir soal terjawab dengan benar dan lengkap sesuai langkah menjawab soal. Penyajian data mata kuliah Kalkulus dapat dilihat pada Lampiran 1.
Soal UTS TPB IPB mata kuliah Kalkulus terdiri dari 10 soal:
Tabel 3 Materi soal UTS TPB IPB mata kuliah Kalkulus
Nomor
Soal Materi
1 Nilai minimum maksimum 2 Rumus turunan
3 Turunan implisit 4 Aturan rantai
5 Turunan sebagai fungsi 6 Turunan fungsi trigonometri 7 Laju terkait
8 Limit takhingga, asimtot 9 Teorema nilai rata-rata 10 Aplikasi Turunan
(pengoptimuman)
Metode
Tahapan-tahapan yang dilakukan dalam penelitian ini adalah:
1. Penyiapan data hasil jawaban peserta UTS TPB IPB untuk mata kuliah Kalkulus pada tahun ajaran 2011/2012
2. Melakukan eksplorasi data, statistika deskriptif terhadap skor yang diperoleh mahasiswa
3. Melakukan pengujian asumsi teori respon butir terhadap skor yang diperoleh mahasiswa, meliputi uji asumsi dimensi tunggal dengan melihat akar ciri dalam analisis faktor dan uji asumsi kebebasan lokal antara butir soal
4. Menghitung reliabilitas skor tes
5. Menghitung parameter karakteristik butir soal:
a. indeks daya pembeda butir soal ke-j
(aj )
b. indeks kesukaran butir soal ke-j (bj)
c. indeks kesukaran kategorik k butir soal ke-j (bjk )
6. Menghitung parameter kemampuan ( ) 7. Penaksiran Generalized Partial Credit
Model disajikan dalam grafik Categorical Response Function (CRF) untuk masing-masing butir soal
8. Menghitung nilai Fungsi Informasi (IF) 9. Uji kesesuaian model untuk menguji
karakteristik setiap butir soal 10.Pengklasifikasian kriteria butir soal 11.Interpretasi hasil yang telah didapatkan.
Perangkat lunak yang digunakan dalam penelitian adalah PARSCALE 4 dan R.2.15.0.
HASIL DAN PEMBAHASAN
Eksplorasi Data
Nilai statistik skor mahasiswa dalam UTS TPB IPB mata kuliah Kalkulus dapat dilihat pada Tabel 4. Skor maksimum yang diperoleh peserta tes adalah 97 dan skor minimum peserta tes adalah 1. Rata-rata skor peserta tes dalam menjawab soal adalah 45. 593.
Tabel 4 Statistik skor mahasiswa UTS TPB IPB mata kuliah Kalkulus
Statistik Skor Nilai Mahasiswa
Rataan Skor 45.593
Standar Deviasi 20.286
Nilai Minimum 1
Nilai Maksimum 97
7
Dilihat dari proporsi mahasiswa dalam menjawab soal, untuk soal nomor 1 dari 1702 mahasiswa, kategori skor yang dihasilkan mahasiswa lebih banyak mendapatkan skor kategori nilai 10 yaitu sebanyak 75.210%, begitupun untuk nomor 2, 3, 4, dan 5, mahasiswa lebih banyak mendapatkan skor kategori nilai 10 yaitu sebanyak 45.060%, 50.590%, 37.600%, 35.310%. Soal nomor 6, mahasiswa lebih banyak mendapatkan skor kategori nilai 6 yaitu sebanyak 18.040%. Soal nomor 7, mahasiswa lebih banyak mendapatkan skor kategori nilai 1 sebanyak 49.880%. Soal nomor 8, 9, dan 10, mahasiswa lebih banyak mendapatkan skor kategori nilai 0 yaitu sebanyak 18.160%, 27.260%, dan 56.690%. Untuk selengkapnya dapat dilihat pada Lampiran 2.
Asumsi-asumsi Model IRT
Asumsi dimensi tunggal dapat diperiksa dengan melihat akar ciri dalam analisis faktor, menghitung rasio antara akar ciri yang pertama dan kedua. Jika rasionya tinggi, maka modelnya bersifat dimensi tunggal.
Gambar 3 Scree plot hasil analisis faktor
Hasil analisis faktor dapat dilihat pada Gambar 3. Faktor pertama memiliki akar ciri sebesar 4.302. Akar ciri pada faktor kedua sebesar 1.045. Faktor-faktor lainnya memiliki akar ciri kurang dari satu. Berdasarkan hasil analisis faktor, perbandingan akar ciri pertama dengan akar ciri kedua lebih besar yaitu 4.117. Hal ini sudah cukup mengindikasikan bahwa ada satu faktor yang dianggap paling dominan yang mendasari para peserta tes memberikan respon pada butir soal atau asumsi dimensi tunggal terpenuhi. Kebebasan lokal antara butir soal sudah diasumsikan dari awal oleh pakar pembuat soal bahwa tidak ada satu pun soal yang memberikan petunjuk menjawab untuk soal yang lain. Artinya antara butir soal sudah diasumsikan saling bebas.
Reliabilitas Skor Tes
Reliabilitas skor tes dengan 10 butir soal dapat dilihat pada Tabel 5. Semakin tinggi koefisien reliabilitas skor tes (mendekati 1), makin tinggi pula ketepatan dan kekonsistenan skor tes.
Reliabilitas skor tes dilihat menggunakan koefisien . Berdasarkan Tabel 5 dapat dilihat bahwa setiap butir soal memiliki nilai koefisien yang mendekati satu, dengan nilai koefisien sebesar 0.846 untuk semua butir soal. Hal ini menunjukkan bahwa butir soal mata kuliah Kalkulus memiliki tingkat ketepatan dan kekonsistenan peserta tes dalam menjawab soal sudah cukup baik.
Tabel 5 Reliabilitas skor tes butir soal mata kuliah Kalkulus
Reliabilitas Skor Tes
Nomor Soal Koefisien
1 0.847
2 0.840
3 0.829
4 0.819
5 0.825
0.836 6
7 0.823
8 0.840
9 0.824
10 0.829
Semua butir soal 0.846
Model Teori Respon Butir GPCM
Hasil pendugaan parameter karakteristik butir soal ujian mata kuliah Kalkulus menggunakan model GPCM (Lampiran 3) menunjukkan bahwa soal-soal mata kuliah Kalkulus mempunyai nilai daya pembeda dan tingkat kesukaran butir soal yang beragam. Hasil pendugaan dan kriteria daya pembeda soal disajikan pada Tabel 6.
Berdasarkan Tabel 6, nilai aj (daya
pembeda) berkisar di antara 0.238 sampai dengan 0.721. Berdasarkan hasil pendugaan parameter aj (daya pembeda), soal nomor 1
8
nilai daya pembeda baik sekali. Sehingga soal nomor 10 mengindikasikan nilai indeks yang dapat membedakan kelompok peserta tes yang berkemampuan tinggi dan berkemampuan rendah.
Tabel 6 Hasil pendugaan dan kriteria daya pembeda butir soal
Soal aj Kriteria Daya Pembeda
1 0.278 memerlukan revisi atau disisihkan
2 0.374 memerlukan revisi sedikit / tidak
3 0.492 memiliki daya pembeda cukup baik
4 0.400 memiliki daya pembeda cukup baik
5 0.238 memerlukan revisi atau disisihkan
6 0.430 memiliki daya pembeda cukup baik
7 0.407 memiliki daya pembeda cukup baik
8 0.547 memiliki daya pembeda cukup baik
9 0.587 memiliki daya pembeda cukup baik
10 0.721 memiliki daya pembeda baik sekali
Hasil pendugaan dan kriteria indeks kesukaran butir soal disajikan pada Tabel 7. Berdasarkan Tabel 7, soal nomor 1 memiliki nilai indeks kesukaran sebesar 0.886 yang nilainya lebih dari 0.7, artinya soal memiliki kriteria mudah. Soal nomor 2, 3, 4, 5, dan 6 memiliki nilai indeks kesukaran berada diantara 0.3 sampai 0.7, artinya soal memiliki kriteria sedang. Sedangkan untuk soal nomor 7, 8, 9, dan 10 memiliki nilai indeks kesukaran kurang dari 0.3, artinya soal memiliki kriteria sukar.
Tabel 7 Hasil pendugaan dan kriteria indeks kesukaran butir soal
Butir Soal
Indeks
Kesukaran Kriteria
1 0.886 Mudah
2 0.698 Sedang
3 0.681 Sedang
4 0.533 Sedang
5 0.627 Sedang
6 0.539 Sedang
7 0.208 Sukar
8 0.240 Sukar
9 0.259 Sukar
10 0.069 Sukar
Hasil pendugaan parameter daya pembeda, indeks kesukaran butir soal, dan nilai-p ( chi-square) disajikan pada Tabel 8.
Berdasarkan Tabel 8, tipe soal dibedakan menjadi tiga yaitu soal baik, cukup baik, dan belum dapat digambarkan. Berdasarkan hasil pendugaan parameter model GPCM, semua butir soal memiliki kriteria soal yang cukup baik. Dengan nilai khi-kuadrat empiris butir soal tidak melebihi nilai khi-kuadrat teoritis (nilai-p > 0.05). Soal nomor 1, 2, 3, 4, 5, 6, dan 7 memiliki nilai daya pembeda yang kurang dari 0.5 dan nilai indeks kesukaran per kategori butir soal (b11,b12, b13,..., b710) tidak berada pada rentang −2 sampai dengan 2. Soal nomor 8, 9, dan 10 memiliki nilai daya pembeda yang lebih dari 0.5 dan nilai indeks kesukaran per kategori butir soal (b81,b82, b83, ..., b108) tidak berada pada rentang −2 sampai dengan 2.
Tabel 8 Kriteria butir soal
Soal
Indeks Daya
pembeda
Nilai-p
Kriteria Soal Kesukaran
1 0.886 0.278 0.720 CB 2 0.698 0.374 0.710 CB 3 0.681 0.492 0.670 CB 4 0.533 0.400 0.610 CB 5 0.627 0.238 0.680 CB 6 0.539 0.430 0.640 CB 7 0.208 0.407 0.470 CB 8 0.240 0.547 0.500 CB 9 0.259 0.587 0.440 CB 10 0.069 0.721 0.260 CB Keterangan
CB : Cukup baik
Sedangkan statistik nilai dugaan parameter kemampuan disajikan pada Tabel 9. Rataan kemampuan peserta tes sebesar 0.032 dengan kemampuan diantara −2.680 sampai dengan 2.248.
Tabel 9 Statistik parameter kemampuan peserta tes mata kuliah Kalkulus pada model GPCM
Nilai Statistik Kemampuan Peserta
Tes
Rataan 0.032
Ragam 0.745
Standar Deviasi 0.863
Minimum −2.680
Maksimum 2.248
Penaksiran GPCM disajikan dalam grafik
9
Gambar 4 Grafik CRF butir soal nomor 10 Grafik CRF pada butir soal nomor 10, pada gambar dapat dilihat untuk butir soal ke- 10 memiliki daya pembeda (a10) sebesar 0.721
dan tingkat kesukaran pada kategori menjawab sebesar (b10(1)= 1.153, b10(2)=
2.117, b10(3)= 1.832, b10(4)=2.189, b10(5)=
1.299, b10(6)= 4.231, b10(7)=2.479, b10(8)=
0.225). Untuk nomor 1, 2, 3, 4, 5, 6, 7, 8, dan 9 dapat dilihat pada lampiran 4.
Berdasarkan hasil uji kesesuaian model yang disajikan pada lampiran 3, menunjukkan bahwa 100% soal dapat digambarkan dengan model. Hal ini terlihat dari kriteria butir soal yang dihasilkan. Dari 10 butir soal mata kuliah Kalkulus, soal tidak ada yang menunjukkan butir soal tidak dapat digambarkan oleh model, hal ini terlihat dari nilai khi-kuadrat empiris butir soal tidak melebihi nilai khi-kuadrat teoritis (nilai-p > 0.05).
Fungsi Informasi
Nilai informasi yang dapat dihitung untuk setiap level kemampuan pada rentang kemampuan dari tingkat terendah hingga tertinggi. Karena kemampuan merupakan peubah kontinu, maka nilai informasi juga akan menjadi peubah kontinu. Jika jumlah informasi diplot terhadap kemampuan tertentu, hasilnya adalah grafik fungsi informasi seperti ditunjukkan di bawah ini.
Gambar 5 Grafik fungsi informasi
Gambar 5 menunjukkan bahwa dari rentang kemampuan dari tingkat terendah hingga tertinggi, nilai informasi yang diberikan oleh tes mata kuliah Kalkulus telah menghasilkan nilai informasi maksimum pada level kemampuan 0.5. Dalam rentang ini, kemampuan peserta tes telah diperkirakan dengan tingkat ketepatan atau presisi tertentu. Di luar rentang ini, nilai informasi yang diberikan oleh tes cenderung menurun dengan drastis. Hasil fungsi informasi yang dapat dihitung untuk setiap level kemampuan pada rentang kemampuan dari tingkat terendah hingga tertinggi disajikan pada Tabel 10. Tabel 10 Fungsi informasi model GPCM mata kuliah Kalkulus
Fungsi Informasi
Tes Informasi 45.790
Simpangan Baku 0.148
Total Informasi (%) 72.470
Berdasarkan Tabel 10 nilai tes informasi (IF) sebesar 45.790 dan simpangan baku pengkukuran sebesar 0.148. Tes informasi (IF) memiliki fungsi yang berkebalikan dengan simpangan baku pengukuran, semakin tinggi nilai IF maka semakin rendah nilai simpangan baku pengukuran. Total informasi yang dihasilkan sebesar 72.470%, artinya tes mampu memberikan informasi tentang pendugaan tingkat kemampuan peserta tes pada rentang kemampuan dari tingkat terendah hingga tertinggi sebesar 72.470 % dan model GPCM cukup informatif mampu menjelaskan tingkat kemampuan peserta tes.
KESIMPULAN DAN SARAN
Kesimpulan
Berdasarkan hasil analisis, parameter daya pembeda dan indeks kesukaran butir soal memiliki nilai yang beragam. Hasil pendugaan parameter daya pembeda, soal nomor 1 dan 5 memerlukan revisi atau disisihkan, soal nomor 2 memerlukan revisi sedikit, soal nomor 3, 4, 6, 7, 8, dan 9 memiliki daya pembeda yang cukup baik, dan soal nomor 10 memiliki daya pembeda yang baik sekali artinya soal mampu membedakan kemampuan peserta tes. Berdasarkan hasil pendugaan parameter indeks kesukaran, soal nomor 1 termasuk kriteria soal mudah, soal nomor 2, 3, 4, 5, dan 6 termasuk kriteria soal sedang dan soal nomor 7, 8, 9, dan 10 termasuk kriteria soal sukar. Berdasarkan
-4 -2 0 2 4
0 .0 0 .2 0 .4 0 .6 0 .8 1 .0
Item Response Category Characteristic Curves - Item: No10
Ability P r o b a b il it y 1 2
3 4 5 6 7 8
9
-3 -2 -1 0 1 2 3
0 .0 0 .1 0 .2 0 .3 0 .4
Kernel Density Estimation for Ability Estimates
10
hasil, semua butir soal dapat dikategorikan soal dengan kualitas cukup baik
Total informasi yang dihasilkan sebesar 72.470%, artinya tes mampu memberikan informasi tentang pendugaan tingkat kemampuan peserta tes pada rentang kemampuan dari tingkat terendah hingga tertinggi sebesar 72.470% dan model GPCM cukup informatif mampu menjelaskan tingkat kemampuan peserta tes.
Berdasarkan hasil uji kesesuain model, menunjukkan bahwa 100% soal dapat digambarkan dengan model. Hal ini terlihat dari nilai-p > 0.05. Dari 10 butir soal mata kuliah Kalkulus tidak ada butir soal tidak dapat digambarkan oleh model.
Saran
Kasus tes uraian dengan data politomi menggunakan metode Teori Respon Butir (IRT), selain menggunakan metode
Generalized Partial Credit Model (GPCM) bisa dilakukan dengan pendekatan lain yaitu dengan metode Partial Credit Model (PCM) dengan diasumsikan memiliki daya pembeda soal yang sama.
DAFTAR PUSTAKA
Baker FB. 2001. The Basic of Item response Theory. University of Maryland: ERIC Clearinghouse on asessment and Evaluation.
Bjorner JB. 2007. A Macro for Item Fit and Local Dependence Test under IRT Model. School of Education University of Pittsburgh: Quality Metric Incorporated.
Crocker L, Algina J. 1986. Introduction to Classical and Modern Test Theory.
New York: Holt Rinehart and Winston, Inc..
Du Toit M. 2003. IRT from SSi: BILOG-MG,
MULTILOG, PARSCALE,
TESTFACT. Lincolnwood: Scientific Software International. Inc.
Gronlund NE, Linn RL. 1990. Measurement and evaluation in teaching (6th ed).
New York: Collier Macmillan Publishers.
Hambleton RK, Swaminathan H. 1985. Item Response Theory. Boston, MA: Kluwer Inc.
Hogg RV, Craig AT. 1978. Introduction to Mathematical Statistics. New York: Macmillan Publishing Co Inc. Lord ML. 1980. Application of Item Response
Theory to practical testing problems.
New Jersey: Lawrence Erlbaum Assosiates, Publisher,.
Matthew SJ. 2007. Marginal Maximum Likelihood Estimation of Item Response Model in R. Journal of
Statistical Software.
http://www.jstatsoft.org/ [27 April 2012].
Muraki E, Bock RD. 1997. Parscale 3: IRT based test scoring and item analysis for graded items and rating scales. Chicago: Scientific Software International, Inc.
Muraki E, Wang M. 1992. Issues relating to the marginal maximum likelihood estimation of the partial credit model. San Francisco CA: Paper presented at the annual meeting of the American Educational Research Association.
Widhiararso W. 2010. Model Politomi dalam Teori Respon Butir. Yogyakarta: Fakultas Psikologi, UGM.
12
Lampiran 1 Tabulasi data mata kuliah Kalkulus UTS TPB IPB Tahun Ajaran 2011/2012
NRP Mahasiswa Soal No.1 Soal No.2 Soal No.3 Soal No.4 Soal No.5 Soal No.6 Soal No.7 Soal No.8 Soal No.9
Soal No.10
Tolal skor
A14090001 6 4 7 2 2 1 0 0 0 0 22
A14090089 0 5 1 0 2 0 1 0 0 0 9
A14090093 4 7 1 0 5 0 0 0 0 0 17
A14100005 0 0 0 0 0 0 1 0 0 0 1
A14100038 7 0 3 0 10 0 1 0 0 0 21
A24090124 10 0 1 2 1 0 1 0 0 0 15
A24090171 10 4 10 10 9 6 0 4 3 0 56
A24090192 10 5 0 0 2 0 1 0 0 0 18
A24100010 10 0 2 0 1 0 1 0 0 0 14
A34090017 4 5 4 2 2 0 0 0 0 0 17
A34090049 10 5 1 0 6 1 1 0 1 0 25
A44090001 5 0 6 0 5 2 1 0 0 0 19
... ... ...
... ... ...
... ... ...
... ... ...
13
Lampiran 2 Proporsi peserta tes menjawab benar per kategori skor
Soal No 1 Soal No 2 Soal No 3 Soal No 4 Soal No 5
Kategori Proporsi Kategori Proporsi Kategori Proporsi Kategori Proporsi Kategori Proporsi
0 0.710% 0 5.880% 0 6.170% 0 22.090% 0 3.410%
1 2.700% 1 2.000% 1 9.400% 1 7.870% 1 12.930%
2 2.760% 2 0.760% 2 7.050% 2 12.870% 2 10.990%
3 0.820% 3 2.230% 3 2.410% 3 0.410% 3 3.880%
4 2.880% 4 3.700% 4 2.350% 4 5.990% 4 6.520%
5 1.880% 5 33.670% 5 7.640% 5 0.060% 5 5.520%
6 1.180% 6 1.000% 6 9.400% 6 3.940% 6 4.000%
7 2.940% 7 0.940% 7 1.650% 7 0.240% 7 1.590%
8 5.930% 8 1.470% 8 1.350% 8 8.230% 8 3.700%
9 3.000% 9 3.290% 9 2.000% 9 0.710% 9 12.160%
10 75.210% 10 45.060% 10 50.590% 10 37.600% 10 35.310%
14
Lampiran 2 (Lanjutan) Proporsi peserta tes menjawab benar perkategori skor
Soal No 6 Soal No 7 Soal No 8 Soal No 9 Soal No 10
Kategori Proporsi Kategori Proporsi Kategori Proporsi Kategori Proporsi Kategori Proporsi
0 8.520% 0 18.450% 0 18.160% 0 27.260% 0 59.690%
1 13.810% 1 49.880% 1 16.980% 1 23.440% 1 25.790%
2 6.640% 2 5.410% 2 10.750% 2 13.810% 2 7.700%
3 3.110% 3 1.880% 3 11.280% 3 8.810% 3 3.410%
4 1.650% 4 1.290% 4 8.340% 4 5.990% 4 1.410%
5 2.880% 5 15.920% 5 8.520% 5 3.350% 5 1.350%
6 18.040% 6 3.000% 6 6.930% 6 2.120% 6 0.240%
7 17.570% 7 0.710% 7 5.760% 7 3.580% 7 0.120%
8 9.690% 8 0.290% 8 4.050% 8 6.170% 8 0.000%
9 8.400% 9 0.120% 9 3.170% 9 1.060% 9 0.000%
10 9.690% 10 3.060% 10 2.530% 10 4.410% 10 0.290%
11 0.880%
12 1.470%
13 0.470%
14 0.410%
15 0.290%
15
Lampiran 3 Nilai Parameter butir soal Ujian Tengah Semester mata kuliah Kalkulus untuk model GPCM
Keterangan
aj : indeks daya pembeda butir soal ke-j
bj : indeks kesukaran butir soal ke-j
bjk : indeks kesukaran kategorik k butir soal ke-j
CB : Cukup Baik*
Daya Pembeda
a j bj bj1 bj2 bj3 bj4 bj5 bj6 bj7 bj8 bj9 bj10 bj11 bj12 bj13 bj14 bj15
1 Nilai minimum maksimum 0,278 0,886 -6,441 -1,682 2,461 -5,014 0,559 0,814 -3,444 -2,647 2,017 -10,939 0,720 CB 2 Rumus turunan 0,374 0,698 1,385 1,153 -3,550 -2,052 -6,182 8,800 0,491 -0,960 -1,850 -6,465 0,710 CB 3 Turunan implisit 0,492 0,681 -2,152 -0,401 1,383 -0,477 -2,668 -0,565 3,450 0,552 -0,544 -5,916 0,670 CB 4 Aturan rantai 0,400 0,533 1,651 -1,558 6,819 -5,382 7,107 -5,997 5,238 -6,453 5,255 -7,782 0,610 CB 5 Turunan sebagai fungsi 0,238 0,627 -6,366 -0,080 3,615 -2,326 0,515 1,346 3,509 -2,920 -4,454 -3,894 0,680 CB 6 Turunan fungsi trigonometri 0,430 0,539 -2,190 0,903 1,212 1,122 -1,374 -4,122 0,398 1,840 0,953 0,465 0,640 CB 7 Laju terkait 0,407 0,208 -2,882 5,343 2,740 1,170 -5,297 4,759 4,289 3,120 2,141 -5,014 0,470 CB 8 Limit takhingga, asimtot 0,547 0,240 -0,542 0,409 -0,156 0,737 0,283 0,835 1,014 1,460 1,387 1,471 3,062 0,406 3,632 1,841 2,137 0,500 CB 9 Teorema nilai rata-rata 0,587 0,259 -0,228 0,881 0,938 1,016 1,495 1,430 -0,050 0,062 3,981 -1,020 0,440 CB 10 Aplikasi Turunan (pengoptimuman) 0,721 0,069 1,153 2,117 1,832 2,189 1,299 4,231 2,479 0,225 0,260 CB
Nilai maksimum 0,721 0,886 1,651 5,343 6,819 2,189 7,107 8,800 5,238 3,120 5,255 1,471 3,062 0,406 3,632 1,841 2,137 Nilai minimum 0,238 0,069 -6,441 -1,682 -3,550 -5,382 -6,182 -5,997 -3,444 -6,453 -4,454 -10,939 3,062 0,406 3,632 1,841 2,137
Soal Deskripsi Soal
Model GPCM
16
Lampiran 4 Grafik CRF butir soal
-4 -2 0 2 4
0 .0 0 .2 0 .4 0 .6 0 .8 1 .0
Item Response Category Characteristic Curves - Item: No1
Ability P ro b a b il it y 1 2 3
4 5 6
7 8 9 10
11
-4 -2 0 2 4
0 .0 0 .2 0 .4 0 .6 0 .8 1 .0
Item Response Category Characteristic Curves - Item: No2
Ability P ro b a b il it y 1 2
3 4 5
6
7 8 9 10
11
-4 -2 0 2 4
0 .0 0 .2 0 .4 0 .6 0 .8 1 .0
Item Response Category Characteristic Curves - Item: No3
Ability P ro b a b il it y 1 2 3 4 5 6 7
8 9 10
11
-4 -2 0 2 4
0 .0 0 .2 0 .4 0 .6 0 .8 1 .0
Item Response Category Characteristic Curves - Item: No4
Ability P ro b a b il it y 1 2 3 4 5
6 7 8
9
10
17
Lampiran 4 (Lanjutan) Grafik CRF butir soal
-4 -2 0 2 4
0 .0 0 .2 0 .4 0 .6 0 .8 1 .0
Item Response Category Characteristic Curves - Item: No5
Ability P ro b a b il it y 1 2 3
4 5 6 7
8 9
10
11
-4 -2 0 2 4
0 .0 0 .2 0 .4 0 .6 0 .8 1 .0
Item Response Category Characteristic Curves - Item: No6
Ability P ro b a b il it y 1 2 3
4 5 6
7 8
9 10
11
-4 -2 0 2 4
0 .0 0 .2 0 .4 0 .6 0 .8 1 .0
Item Response Category Characteristic Curves - Item: No7
Ability P ro b a b il it y 1 2
3 4 5
6
7 8 9 10
11
-4 -2 0 2 4
0 .0 0 .2 0 .4 0 .6 0 .8 1 .0
Item Response Category Characteristic Curves - Item: No8
Ability P ro b a b il it y 1 2 3 4
5 6 7 8 9 10 11 12
13 14
15
18
Lampiran 4 (Lanjutan) Grafik CRF butir soal
-4 -2 0 2 4
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
Item Response Category Characteristic Curves - Item: No9
Ability
P
ro
b
a
b
il
it
y
1
2
3 4
5 6 7
8
9
10 11
-4 -2 0 2 4
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
Item Response Category Characteristic Curves - Item: No10
Ability
P
ro
b
a
b
il
it
y
1
2
3 4 5 6 7 8