Penerapan Generalized Partial Credit Model dalam Teori Respon Butir untuk Menduga Kemampuan Hasil Tes Uraian (Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012)

(1)

PENERAPAN

GENERALIZED PARTIAL CREDIT MODEL

DALAM

TEORI RESPON BUTIR UNTUK MENDUGA KEMAMPUAN

HASIL TES URAIAN

(Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat

Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012)

SARTIKA LESTARI

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(2)

RINGKASAN

SARTIKA LESTARI. Penerapan Generalized Partial Credit Model dalam Teori Respon Butir untuk Menduga Kemampuan Hasil Tes Uraian (Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012). Dibimbing oleh BUDI SUSETYO dan TONI BAKHTIAR.

Pada pelaksanaan tes uraian, penskoran biasanya dilakukan secara parsial bersadarkan langkah-langkah yang harus ditempuh untuk menjawab benar suatu butir soal. Penskoran dilakukan perlangkah dan skor perbutir soal diperoleh peserta dengan menjumlah skor tiap langkah, dan kemampuan diduga dengan skor mentah. Model penskoran seperti ini belum tentu tepat karena tingkat kesukaran tiap langkah tidak diperhitungkan. Pendekatan alternatif yang dapat digunakan yaitu pendekatan teori respon butir untuk penskoran politomi, salah satunya dengan generalized partial credit model (GPCM). Oleh karena itu, tujuan dari penelitian ini ialah menduga kemampuan peserta tes uraian mata kuliah Kalkulus Tingkat Persiapan Bersama (TPB) Tahun Ajaran 2011/2012 menggunakan GPCM.

Tahapan yang dilakukan ialah pemeriksaan asumsi, pemeriksaan reliabilitas skor tes, pendugaan karakteristik butir soal dan kemampuan peserta, pemeriksaan nilai fungsi informasi, pemeriksaan kesesuaian model, dan kriteria butir soal. Berdasarkan hasil pendugaan parameter daya pembeda, soal nomor 1 dan 5 memerlukan revisi atau disisihkan, soal nomor 2 memerlukan revisi sedikit, soal nomor 3, 4, 6, 7, 8, dan 9 memiliki daya pembeda yang cukup baik, dan soal nomor 10 memiliki daya pembeda yang baik sekali artinya soal mampu membedakan kemampuan peserta tes. Berdasarkan hasil pendugaan parameter indeks kesukaran butir soal, soal nomor 1 termasuk kriteria soal mudah, soal nomor 2, 3, 4, 5, dan 6 termasuk kriteria soal sedang dan soal nomor 7, 8, 9, dan 10 termasuk kriteria soal sukar. Berdasarkan hasil, semua butir soal dapat dikategorikan soal dengan kualitas cukup baik. Total informasi yang dihasilkan sebesar 72.470%, artinya tes mampu memberikan informasi tentang pendugaan tingkat kemampuan peserta tes pada rentang kemampuan dari tingkat terendah hingga tertinggi sebesar 72.470% dan model GPCM cukup informatif mampu menjelaskan tingkat kemampuan peserta tes. Hasil uji kesesuain model menunjukkan bahwa 100% soal dapat digambarkan dengan model. Hal ini terlihat dari nilai khi-kuadrat empiris butir soal tidak melebihi nilai khi-khi-kuadrat teoritis (nilai p > 0.05). Dari 10 butir soal mata kuliah Kalkulus tidak ada butir soal yang tidak dapat digambarkan oleh model.

Kata kunci: Penskoran Politomi, Teori Respon Butir (IRT), Generalized Partial Credit Model

(3)

PENERAPAN

GENERALIZED PARTIAL CREDIT MODEL

DALAM

TEORI RESPON BUTIR UNTUK MENDUGA KEMAMPUAN

HASIL TES URAIAN

(Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat

Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012)

Oleh:

SARTIKA LESTARI

Skripsi

sebagai salah satu syarat untuk memperoleh gelar

Sarjana Statistika pada

Departemen Statistika

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(4)

Judul : Penerapan Generalized Partial Credit Model dalam Teori Respon Butir untuk Menduga Kemampuan Hasil Tes Uraian (Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012)

Nama : Sartika Lestari NIM : G14080020

Menyetujui:

Pembimbing I,

Dr. Ir. Budi Susetyo, M.S. NIP : 196211301986031003

Pembimbing II,

Dr. Toni Bakhtiar, M.Sc. NIP : 197206271997021002

Mengetahui:

Ketua Departemen Statistika

Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor

Dr. Ir. Hari Wijayanto, M.Si. NIP : 196504211990021001

(5)

PRAKATA

Alhamdulillah, segala puji hanya bagi Allah SWT yang telah melimpahkan segala nikmat dan karunia-Nya, sehingga penulis dapat menyelesaikan karya ilmiah. Karya ilmiah ini berjudul

”Penerapan Generalized Partial Credit Model dalam Teori Respon Butir untuk Menduga

Kemampuan Hasil Tes Uraian (Studi Kasus: Soal Ujian Tengah Semester Mata Kuliah Kalkulus Tingkat Persiapan Bersama Institut Pertanian Bogor Tahun Ajaran 2011/2012)”.

Karya ilmiah ini penulis susun sebagai salah satu kewajiban yang harus dipenuhi dan merupakan syarat untuk mendapatkan gelar Sarjana Statistika (S. Stat) pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

Penulisan karya ilmiah ini dapat diselesaikan oleh penulis tidak lepas dari dukungan, bimbingan dan bantuan dari banyak pihak yang sangat berarti bagi penulis. Oleh karena itu, penulis mengucapkan terima kasih atas segala bantuan dan bimbingan yang diberikan kepada:

1. Bapak Dr. Ir. Budi Susetyo, M.S. dan Dr. Toni Bakhtiar, M.Sc. selaku dosen pembimbing telah memberikan bimbingan, masukan dan arahan selama penulisan karya ilmiah ini. 2. Bapak Dr. Ir. Hari Wijayanto, M.Si. selaku Ketua Departemen Statistika FMIPA IPB. 3. Bapak Ir. Bambang Sumantri selaku dosen penguji luar yang telah memberikan beberapa

masukan dan arahan kepada penulis.

4. Seluruh Dosen Statistika yang telah memberikan ilmu dan wawasan selama penulis menuntut ilmu di Departemen Statistika serta seluruh staf Departemen Statistika yang telah banyak membantu penulis, terutama Ibu Markonah dan Ibu Tri yang telah memberikan pelayanan terbaik.

5. Seluruh Dosen dan Staf Departemen Matematika yang telah mengizinkan penulis menggunakan data ujian tengah semester mata kuliah Kalkulus Tingkat Persiapan Bersama.

6. Kedua orang tua, kakak, dan adik yang telah memberikan doa, kasih sayang serta dorongan baik moril maupun materil.

7. Dony Bayu Dewantoro yang telah memberikan doa, kasing sayang, serta dukungannya. 8. Oktaviani Prihatiningsih dan Umi Nur Chasanah sebagai teman satu bimbingan yang

telah memberikan dukungan selama menyelesaikan karya ilmiah ini.

9. Dilla, Betha, Arima, Mia, Ratih, Vita, Gusti, Anni, Sella, dan teman-teman STK’45 atas dukungan dan kebersamaannya selama tiga tahun ini dalam segala suka maupun duka. 10. Teman-teman seperjuangan statistika yang telah bersama-sama menuntut ilmu di

Departemen Statistika.

Semoga bantuan yang telah diberikan kepada penulis mendapat balasan dari Allah SWT. Penulis menyadari bahwa karya ilmiah ini jauh dari sempurna. Oleh karena itu, Penulis memohon maaf atas segala kekurangan dan kesalahan yang terdapat di dalam penyusunan karya ilmiah ini. Semoga karya ilmiah ini dapat bermanfaat bagi pihak yang membutuhkan.

Bogor, 2012

(6)

RIWAYAT HIDUP

Penulis dilahirkan di Sumedang pada tanggal 25 Januari 1990 sebagai anak ke tiga dari lima bersaudara dari pasangan Dedi Supriadi, S.Pd. dan W. Rohyawati, S.Pd.

Pada tahun 2002 penulis berhasil menyelesaikan pendidikan sekolah dasar di SD Negeri 1 Selaawi, kemudian melanjutkan di SMP Negeri 1 Sumedang dan lulus pada tahun 2005. Penulis menyelesaikan pendidikannya di SMA Negeri 3 Sumedang pada tahun 2008. Kemudian, pada tahun yang sama, penulis diterima sebagai mahasiswa Departemen Statistika melalui jalur Undangan Seleksi Masuk IPB (USMI) dengan minor Matematika Keuangan dan Aktuaria Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

(7)

DAFTAR ISI

Halaman

DAFTAR GAMBAR ... viii

DAFTAR TABEL ... viii

DAFTAR LAMPIRAN ... viii

PENDAHULUAN ... 1

Latar Belakang ... 1

Tujuan ... 1

TINJAUAN PUSTAKA ... 1

Teori Respon Butir ... 1

Reliabilitas Skor Tes ... 2

Generalized Partial Credit Model (GPCM) ... 2

Pendugaan Parameter ... 4

Grafik Categorical Response Function (CRF) ... 4

Fungsi Informasi ... 4

Uji Kesesuaian Model ... 5

Kriteria Butir Soal ... 5

METODOLOGI ... 6

Data ... 6

Metode ... 6

HASIL DAN PEMBAHASAN ... 6

Eksplorasi Data ... 6

Asumsi-asumsi Model IRT ... 7

Reliabilitas Skor Tes ... 7

Model Teori Respon Butir GPCM ... 7

Fungsi Informasi ... 9

KESIMPULAN DAN SARAN ... 9

Kesimpulan ... 9

Saran ... 10

DAFTAR PUSTAKA ... 10

(8)

DAFTAR GAMBAR

Halaman

1. Bagan klasifikasi model IRT ... 2

2. Grafik CRF pada 4 kategori ... 4

3. Scree plot hasil analisis faktor ... 7

4. Grafik CRF butir soal nomor 10... 9

5. Grafik fungsi informasi ... 9

DAFTAR TABEL

Halaman 1. Kriteria indeks kesukaran butir soal ... 3

2. Kriteria daya pembeda butir soal ... 4

3. Materi soal UTS TPB IPB mata kuliah Kalkulus ... 6

4. Statistik skor mahasiswa UTS TPB IPB mata kuliah Kalkukus ... 6

5. Reliabilitas skor tes butir soal mata kuliah Kalkulus ... 7

6. Hasil pendugaan dan kriteria indeks daya pembeda butir soal ... 8

7. Hasil pendugaan dan kriteria indeks kesukaran butir soal ... 8

8. Kriteria butir soal ... 8

9. Statistik parameter kemampuan peserta tes mata kuliah Kalkulus pada model GPCM ... 8

10.Fungsi informasi model GPCM mata kuliah Kalkulus ... 9

DAFTAR LAMPIRAN

Halaman 1. Tabulasi data mata kuliah Kalkulus UTS TPB IPB Tahun Ajaran 2011/2012 ... 12

2. Proporsi peserta tes menjawab benar per kategori soal ... 13

3. Nilai parameter butir soal Ujian Tengah Semester mata kuliah Kalkulus model GPCM ... 15

(9)

1

PENDAHULUAN

Latar Belakang

Pada bidang pendidikan, kegiatan penilaian hasil belajar peserta didik merupakan salah satu tugas penting yang harus dilakukan oleh pendidik. Penilaian keberhasilan studi semester dilakukan pada tiap pertengahan dan akhir semester. Ujian Tengah Semester merupakan salah satu upaya untuk mengetahui kemajuan mahasiswa terhadap kurikulum yang telah diajarkan. Proses pengukuran hasil belajar sangat penting dilakukan mahasiswa Tingkat Persiapan Bersama (TPB) yang merupakan langkah awal bagi mahasiswa sebelum memasuki departemen. Penilaian keberhasilan studi semester dilakukan dengan pemberian soal kepada peserta tes. Akan tetapi, pemberian soal yang terlalu sukar dan mudah menyebabkan pendidik sulit membedakan kemampuan mahasiswa. Oleh karena itu, diperlukan analisis terhadap soal ujian dengan harapan hasil ujian dapat merepresentasikan kemampuan mahasiwa.

Peningkatan mutu pendidikan tidak terlepas dari penerapan penilaian yang dapat secara tepat mengukur hasil akhir dari suatu proses pembelajaran. Artinya untuk menilai hasil akhir dalam pembelajaran diperlukan alat penilaian yang berkualitas. Tes merupakan salah satu alat penilaian yang sering digunakan.

Kegiatan evaluasi dilakukan menyeluruh terhadap berbagai aspek, yaitu aspek kognitif, afektif, dan psikomotorik. Evaluasi terhadap aspek kognitif dalam pendidikan khususnya pembelajaran Kalkulus akan memerlukan instrumen diantaranya berupa tes. Tes dapat diklasifikasikan dalam beberapa macam tergantung dari bentuk, tipe, dan ragamnya (Zainul & Nasution 2011). Fungsi tes hasil belajar adalah sebagai alat untuk penempatan, fungsi formatif, fungsi diagnostik, dan fungsi sumatif.

Berdasarkan bentuknya, tes hasil belajar dapat dikelompokkan menjadi tiga jenis yaitu objektif pilihan ganda dua pilihan, objektif pilihan ganda lebih dari dua pilihan dan uraian (Gronlund & Linn 1990). Tes uraian biasa dilakukan dengan model politomi. Pada model ini, penskoran dilakukan dengan melihat tahap-tahap peserta tes dalam menyelesaikan soal. Penskoran dengan menggunakan skor menjawab benar pada jawaban peserta tes dengan model politomi tidak sepenuhnya tepat. Hal ini disebabkan oleh tingkat kesukaran tiap langkah tidak diperhitungkan.

Selain itu, peluang menjawab benar seorang peserta tes berdasarkan respon tertentu tidak dapat diduga. Terkait dengan hal tersebut, perlunya pendekatan lain, diantaranya menggunakan teori respon butir Generalized Partial Credit Model (GPCM). Pada GPCM, tingkat kesulitan tiap langkah diperhitungkan untuk menduga kemampuan peserta tes.

Tujuan

Tujuan yang ingin dicapai dalam penelitian ialah:

1. Menerapkan GPCM untuk menduga kemampuan peserta tes uraian Ujian Tengah Semester mata kuliah Kalkulus Tingkat Persiapan Bersama Institut Pertanian Bogor (UTS TPB IPB) tahun ajaran 2011/2012 dengan pendekatan pensokran politomi teori respon butir. 2. Memberikan masukan kepada Departemen

Matematika IPB terhadap soal UTS Kalkulus TPB IPB tahun ajaran 2011/2012.

TINJAUAN PUSTAKA

Teori Respon Butir

Teori respon butir merupakan metode pengukuran modern yang biasa digunakan dalam analisis butir soal. Teori respon butir dilihat dari karakteristik butir soal ditentukan oleh respon para peserta tes (baik yang berkemampuan tinggi maupun rendah). Teori respon butir dikenal juga dengan nama seperti

Item Response Theory (IRT) atau Latent Trait Theory (LTT). Nama yang paling banyak digunakan adalah Item Response Theory atau Teori Respon Butir.

Pengembangan IRT didasarkan kepada dua ciri yaitu latent trait atau abilities dan

Item Characteristics Curve (ICC). Latent trait

adalah kemampuan peserta tes pada suatu butir soal dapat diduga oleh seperangkat faktor yaitu kemampuan verbal, kemampuan psikomotor, kemampuan kognitif, dan sebagainya. ICC menunjukan hubungan antara kemampuan peserta tes pada suatu butir soal dan perangkat kemampuan laten yang mendasarinya (Hambleton & Swaminathan 1985).

(10)

2

setiap skor kemampuan yakni ada hubungan fungsional antara peserta tes terhadap tingkat kemampuan yang dimiliki.

Model-model karakteristik butir soal bergantung pada bentuk matematis fungsi karakteristik butir soal dan banyaknya parameter yang dilibatkan dalam model yang digunakan. Hal ini dikarenakan tidak semua model IRT cocok untuk perangkat data tes yang lain (Widhiararso 2010).

Gambar 1 Bagan klasifikasi model IRT Keterangan

UIRT : Unidimensional IRT MIRT : Multidimensional IRT

Berdasarkan Gambar 1, model IRT dibagi menjadi dua, yaitu IRT satu dimensi (UIRT) dan IRT multidimensi (MIRT). UIRT hanya menganalisis satu karakteristik soal dengan satu dimensi kemampuan yang dominan. UIRT ini menggunakan data dikotomi seperti benar (1) dan salah (0), dan data politomi untuk data berskala ordinal. UIRT data dikotomi bisa menggunakan model logistik satu parameter, model logistik dua parameter, dan model logistik tiga parameter. Sedangkan untuk UIRT data politomi, model yang bisa digunakan adalah graded response model

(GRM), modified graded response model

(MGRM), partial credit model (PCM),

generalized partial credit model (GPCM), dan

rating scale model (RSM). Dalam penelitian ini digunakan data politomi dengan metode

generalized partial credit model (GPCM).

Reliabilitas Skor Tes

Tujuan utama menghitung reliabilitas skor tes adalah untuk mengetahui tingkat ketepatan dan kekonsistenan skor tes. Indeks reliabilitas berkisar antara 0 − 1. Semakin

tinggi koefisien reliabilitas suatu tes (mendekat 1), makin tinggi pula ketepatannya. Reliabilitas dapat dihitung dengan koefisien  yang dalam Crocker & Algina (1986) didefinisikan sebagai berikut:

2 1 1 ₂ 1 n i n _i n X        





















, dengan

n = jumlah butir soal,

= ragam skor per butir soal,

= ragam skor total.

GPCM

Model yang lebih dikenal pada awal perkembangan teori respon butir politomi ialah Partial Credit Model (PCM). PCM merupakan model penskoran politomi yang merupakan perluasan dari model dengan menggunakan dua parameter logistik pada data dikotomi (model Rasch). Asumsi pada PCM adalah setiap butir soal memunyai daya beda butir soal yang sama.

Pengembangan lebih lanjut penskoran politomi adalah GPCM. Muraki & Bock (1997) mendefinisikan GPCM sebagai bentuk umum dari PCM, mengembangkan kembali model kredit parsial yang memungkinkan butir soal di dalam skala memiliki perbedaan dalam hal parameter kemiringan.

Dalam Hambleton & Swaminathan (1985), dalam metode GPCM asumsi yang harus dipenuhi adalah asumsi dimensi tunggal (unidimensional) dan kebebasan lokal (local independence). Asumsi dimensi tunggal dapat diperiksa dengan akar ciri dalam analisis faktor, menghitung rasio antara akar ciri yang pertama dan kedua. Jika rasionya tinggi, maka modelnya bersifat unidimensional. Kebebasan lokal (local independence) merupakan respon peserta tes terhadap suatu butir soal tidak berhubungan dengan butir soal lainnya dalam tes tersebut. IRT membebaskan peserta tes dan butir soal dari interdependensi, sehingga taraf sukar butir soal tidak lagi bergantung kepada kemampuan peserta tes, kemampuan peserta tes tidak lagi bergantung kepada taraf sukar butir soal.

GPCM memiliki kemiripan dengan PCM hanya berbeda pada pelibatan parameter kemiringan (slope) yang disimbolkan dengan

(11)

3

Berikut fungsi karakteristik operasi (Operating Characteristic Functions/OCF).

 









| -1, , -1 exp 1 exp P_jk P_{jk k} _k

P_{j k} P_jk

Da_j b_jk

           

























 

















, exp 0 exp 0 0 exp 0 exp 0 0 k

Da_j b_jv

v

P _m

jk _j _c

D _{b jv}

c v

k

Da_j b_j _dv

v

m j c

D b_j _dv

c v                                                 

0,1, 2, ...,

k _{m j}

di mana

= peluang peserta berkemampuan

θmemperoleh skor kategori k

butir soal ke-j

= peluang peserta berkemampuan

θ memperoleh skor kategori k

butir soal ke-j jika peluang peserta berkemampuan θ memperoleh skor kategori k-1 sudah didapatkan

θ = kemampuan peserta

aj = indeks daya beda butir soal ke-j

bjk = indeks kesukaran kategori k

butirsoal ke-j

bj = indeks kesukaran butir soal ke-j

dv = parameter kategori

D = parameter kemiringan (D = 1.7)

mj = skor kategori

Parameter bjk merupakan parameter tahap

butir soal. Parameter ini merupakan titik potong antara kurva dengan Pj,k-1(θ).

Kedua kurva hanya berpotongan di satu titik pada skala θ.

Jika θ = bjk, maka (θ) = Pj,k-1(θ)

Jika θ> bjk, maka (θ) > Pj,k-1(θ)

Jika θ< bjk, maka (θ) < Pj,k-1(θ),

dengan k = 0,1,2,3,..., mj.

Persamaan peluang peserta dapat dijabarkan berdasarkan jumlah kategori di dalam butir soal. Jika sebuah skala memiliki k kategori dengan skor 0,1,2,...,mj, maka akan didapatkan

k buah persamaan dengan peluang individu peserta tes pada setiap kategori.

Kategori 0:

 





, 1 0 1 exp 0 0

P_j _m

j c

Da_j b_jv

c v                Kategori 1

 









, exp ₁ 1 1 exp 0 0

Da_j b_j

P_j _m

j c

Da_j b_jv

c v                     

Kategori k

 









. exp 0 exp 0 0 k

Da_j b_jv

v

P_jk _m

j k

Da_j b_jv

c v                        

(Muraki & Bock 1997) Parameter yang digunakan dalam GPCM yaitu indeks kesukaran butir soal (bjk) dan (bj),

indeks daya beda butir soal (aj), dan

kemampuan peserta tes ( ) (Hambleton & Swaminathan 1985).

a. Indeks Kesukaran Butir Soal

Indeks kesukaran butir soal merupakan salah satu faktor yang mempengaruhi peluang peserta tes untuk merespon butir soal dengan cara tertentu. Butir soal yang memiliki indeks kesukaran yang tinggi akan cenderung diisi dengan benar daripada butir soal yang memiliki tingkat kesukaran yang rendah. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal menurut Hambleton & Swaminathan (1985).

Tabel 1 Kriteria indeks kesukaran butir soal

Indeks kesukaran Kriteria

0 ≤ b < 0.3 Soal Sukar

0.3 ≤ b≤ 0.7 Soal Sedang

0.7 < b≤ 1 Soal Mudah

b. Indeks Daya Pembeda Butir Soal

(12)

4

rendah. Daya pembeda suatu butir soal ini didasarkan pada hasil tes suatu kelompok sehingga daya pembeda tersebut belum tentu berlaku pada kelompok yang lain. Indeks daya pembeda soal berkisar antara

−1 sampai dengan 1. Semakin tinggi nilai daya pembeda soal, maka semakin baik soal tersebut menurut Hambleton & Swaminathan (1985).

Tabel 2 Kriteria daya pembeda butir soal

Indeks Daya

Pembeda Kriteria

0.7 ≤ aj≤ 1.0 memiliki daya pembeda

baik sekali

0.4 ≤ aj≤ 0.69 memiliki daya pembeda

cukup baik

0.3 ≤ aj≤ 0.39 memerlukan revisi

sedikit atau tidak

0.2 ≤ aj ≤ 0.29 memerlukan revisi atau

disisihkan

−1 ≤aj ≤ 0.19 disisihkan atau revisi

total

c. Kemampuan peserta ()

Kemampuan peserta tes pada suatu butir soal dapat diprediksi oleh seperangkat faktor yaitu kemampuan verbal, kemampuan psikomotor, kemampuan kognitif, dan sebagainya.

Pendugaan Parameter

Langkah pertama dan paling penting dalam aplikasi IRT adalah pendugaan parameter, baik parameter kemampuan peserta tes (θ) maupun parameter karakteristik butir soal ( , ). Pendekatan yang dapat digunakan untuk pendugaan parameter butir soal yaitu metode kemungkinan maksimum (maximum likelihood estimation, MLE) (Matthew 2007).

Prinsip dasar dari metode MLE dalam Hogg & Craig (1978) adalah jika terdapat contoh acak x1, x2, ..., xn dari sebuah sebaran

yang memiliki suatu fungsi kepekatan peluang

f(x;θ), θ ϵ Ω. Fungsi kepekatan peluang

bersama dari x1, x2, ..., xn adalah f(x1;θ), f(x2;θ),

..., f(xn;θ). Fungsi kepekatan peluang bersama

ini dipandang sebagai fungsi dari θ. Muraki & Wang (1992) mendefinisikan fungsi kepekatan peluang bersama untuk model IRT GPCM adalah sebagai berikut:



x |





x |



P _i  P_i _jk 



|



 

1 0 x x m j n jki

P_i _jk P_jk

j k

    

   

, jika memperoleh skor kategori k pada

butir soal ke-j

0, jika selainnya

Dengan definisi yang telah dijelaskan maka fungsi nisbah kemungkinan (L) dapat dinotasikan sebagai berikut:







 



 

,

; ₁ , ₂ , ..., ₁ ; ₂ ;

, .., ;

x x

x

L x_ki x _ki x_jki f _ki f _ki

f _jki

  

 

Muraki & Wang (1992) mendefinisikan fungsi likelihood untuk model IRT adalah sebagai berikut:





 

1

, , ..., | 1

1 2 ₁ ₀

x

mj jki x

n _jki

L x_k x _k x_jk P_jk P_jk

j k              

 





   



 







| ln ₁ , ₂ , ..., |

1

ln 1

1 0

ln 1 ln 1 1 0

l x L x_ki x _ki x_jki

m j

n _x _x

jki jki

P_jk P_jk

j k m j n

x_jki P_jk x_jki P_jk

j k       _   _ _ _ _   __{  } _ _ _ _            

dengan l 0,



a_j,b_j,b_jk







 



di mana , adalah parameter butir soal.

Grafik Categorical Response Function

(CRF)

Grafik Categorical Respone Function

(CRF) dalam du Toit (2003) adalah hubungan antara peluang menjawab benar memperoleh skor kategori k pada butir ke-j dengan kemampuan peserta tes (θ). Semakin tinggi kemampuan peserta tes, maka peluang untuk menjawab benar sebuah butir soal dengan benar akan semakin meningkat.

Gambar 2 Grafik CRF pada 4 kategori

(13)

5

dilihat untuk butir soal ke-j memiliki daya pembeda (aj) sebesar 2.0 dan tingkat

kesukaran pada kategori menjawab sebesar (bj1= −0.5, bj2= 0.5, bj3= 1.5).

Fungsi Informasi

Fungsi Informasi (IF) adalah sebuah fungsi yang mengukur sampai sejauh mana model yag dipilih mampu memberikan informasi tentang pendugaan tingkat kemampuan sepanjang skala latent

kemampuan. Semakin tinggi puncak IF, semakin informatif model yang dipilih mampu menjelaskan traits-level para peserta tes. Fungsi informasi (IF) memenuhi persamaan sebagai berikut:

 

2 ln

 

2 0

m j

I_j P_jk P_jk

k          _













dengan Pjk(θ) merupakan proporsi menjawab

benar butir soal ke-j memperoleh kategori k

pada tingkat kemampuan θ. Sebagai akumulasi keseluruhan fungsi informasi butir soal, maka akan diperoleh fungsi informasi tes atau test information (TI), yang secara matematis formulanya adalah:

 

1 n

TI _{I j}

j

   



Informasi tes menjelaskan sejauh mana tes mampu mengukur tingkat kemampuan tertentu dengan cermat. Apakah tes yang dikembangkan mampu mengukur dengan baik kelompok peserta tes dengan kemampuan rendah, sedang, dan tinggi saja atau justru mampu mengukur dengan semua tingkat kemampuan. Nilai informasi yang besar menunjukkan bahwa kemampuan kelompok peserta tes dengan kemampuan tertentu dapat diduga dengan baik, yaitu semua hasil pendugaan akan memiliki nilai yang cukup dekat dengan nilai sebenarnya. Jika nilai informasi yang didapatkan kecil, maka kemampuan tidak dapat diduga dengan tepat dan nilai pendugaan akan tersebar luas pada semua tingkat kemampuan (Baker 2001).

Sedangkan untuk simpangan baku pengukuran (SE) dapat dihitung untuk tiap-tiap kemampuan θ, dengan formula:

 

1 SE TI   

Simpangan baku pengukuran merupakan fungsi yang berkebalikan dengan IF. Makin tinggi IF, maka makin rendah simpangan baku pengukuran (Widhiararso 2010).

Uji Kesesuaian Model

IRT merupakan pemodelan terhadap respon-respon para peserta tes. Berdasarkan model yang dipilih, model manakah yang paling mampu menjelaskan data respon tersebut. Oleh karena itu, diperlukan uji kesesuaian model. Uji kesesuaian model IRT digunakan untuk menguji karakteristik butir soal setelah direspon oleh berbagai kemampuan peserta tes. Uji kesesuaian (goodness of fit test) model IRT dilakukan untuk setiap butir soal yang direspon oleh berbagai kemampuan peserta tes. Pengujian menggunakan statistika yang berdistribusi khi-kuadrat (chi-square) (Hambleton & Swaminathan 1985). Dengan rumus kesesuaian model sebagai berikut:

  



 





 

| 1 |

|

1 0

1

jk

E k E k

P_jk E k

Z_jk

m j n

E k kP_jk

j k

N

 

     ___ __         

dengan 2 ~ 2 ,

1 m

Z_jk _{m x}

j  

di mana

Pjk (θ) = peluang peserta berkemampuan θ

memperoleh skor kategori k pada butir soal ke-j

E(k|θ) = nilai harapan

Njk = banyaknya peserta tes memperoleh

skor kategori k pada butir soal ke-j

x = banyaknya parameter dalam

model

m = banyaknya kategori kemampuan yang bergantung pada pendugaan kemampuan peserta tes.

Hipotesis nol dalam pengujian ini menyatakan bahwa kurva CRF sesuai untuk data respon butir soal ke-j. Kesesuaian model untuk suatu butir soal ditunjukkan oleh nilai khi-kuadrat empiris butir soal yang tidak melebihi nilia khi-kuadrat teoritis.

Kriteria Butir Soal

(14)

6

1. Soal yang baik adalah model setiap soal yang sesuai dengan model jika nilai khi- kuadrat empiris butir soal tidak melebihi nilai khi-kuadrat teoritis (nilai-p > 0.05), memiliki nilai daya pembeda lebih dari 0.5, dan tingkat kesukaran butir soal

berada di antara −2 sampai dengan 2.

2. Soal cukup baik adalah soal yang sesuai model jika nilai khi-kuadrat empiris butir soal tidak melebihi nilai khi-kuadrat teoritis (nilai-p > 0.05) dan salah satu kriteria soal baik tidak dipenuhi.

3. Soal yang belum dapat digambarkan adalah soal yang tidak sesuai dengan model yang digambarkan jika nilai khi- kuadrat empiris butir soal lebih besar nilai khi- kuadrat teoritis (nilai-p < 0.05).

METODOLOGI

Data

Penelitian ini menggunakan data yang diperoleh dari hasil jawaban Ujian Tengah Semester (UTS) mata kuliah Kalkulus TPB IPB yang dilaksanakan pada tanggal 3 April 2012. Jumlah peserta ujian sebanyak 1702 mahasiswa. Jumlah butir soal sebanyak 10 butir soal uraian. Penilaian dilakukan dengan pemberian skor maksimal untuk masing-masing butir soal, skor 10 untuk jawaban benar kecuali untuk nomor 8 memiliki skor 15 jika butir soal dijawab dengan benar berdasarkan urutan atau langkah dalam menjawab butir soal. Total nilai maksimum yaitu 105 jika butir soal terjawab dengan benar dan lengkap sesuai langkah menjawab soal. Penyajian data mata kuliah Kalkulus dapat dilihat pada Lampiran 1.

Soal UTS TPB IPB mata kuliah Kalkulus terdiri dari 10 soal:

Tabel 3 Materi soal UTS TPB IPB mata kuliah Kalkulus

Nomor

Soal Materi

1 Nilai minimum maksimum 2 Rumus turunan

3 Turunan implisit 4 Aturan rantai

5 Turunan sebagai fungsi 6 Turunan fungsi trigonometri 7 Laju terkait

8 Limit takhingga, asimtot 9 Teorema nilai rata-rata 10 Aplikasi Turunan

(pengoptimuman)

Metode

Tahapan-tahapan yang dilakukan dalam penelitian ini adalah:

1. Penyiapan data hasil jawaban peserta UTS TPB IPB untuk mata kuliah Kalkulus pada tahun ajaran 2011/2012

2. Melakukan eksplorasi data, statistika deskriptif terhadap skor yang diperoleh mahasiswa

3. Melakukan pengujian asumsi teori respon butir terhadap skor yang diperoleh mahasiswa, meliputi uji asumsi dimensi tunggal dengan melihat akar ciri dalam analisis faktor dan uji asumsi kebebasan lokal antara butir soal

4. Menghitung reliabilitas skor tes

5. Menghitung parameter karakteristik butir soal:

a. indeks daya pembeda butir soal ke-j

(aj )

b. indeks kesukaran butir soal ke-j (bj)

c. indeks kesukaran kategorik k butir soal ke-j (bjk )

6. Menghitung parameter kemampuan ( ) 7. Penaksiran Generalized Partial Credit

Model disajikan dalam grafik Categorical Response Function (CRF) untuk masing-masing butir soal

8. Menghitung nilai Fungsi Informasi (IF) 9. Uji kesesuaian model untuk menguji

karakteristik setiap butir soal 10.Pengklasifikasian kriteria butir soal 11.Interpretasi hasil yang telah didapatkan.

Perangkat lunak yang digunakan dalam penelitian adalah PARSCALE 4 dan R.2.15.0.

HASIL DAN PEMBAHASAN

Eksplorasi Data

Nilai statistik skor mahasiswa dalam UTS TPB IPB mata kuliah Kalkulus dapat dilihat pada Tabel 4. Skor maksimum yang diperoleh peserta tes adalah 97 dan skor minimum peserta tes adalah 1. Rata-rata skor peserta tes dalam menjawab soal adalah 45. 593.

Tabel 4 Statistik skor mahasiswa UTS TPB IPB mata kuliah Kalkulus

Statistik Skor Nilai Mahasiswa

Rataan Skor 45.593

Standar Deviasi 20.286

Nilai Minimum 1

Nilai Maksimum 97

(15)

7

Dilihat dari proporsi mahasiswa dalam menjawab soal, untuk soal nomor 1 dari 1702 mahasiswa, kategori skor yang dihasilkan mahasiswa lebih banyak mendapatkan skor kategori nilai 10 yaitu sebanyak 75.210%, begitupun untuk nomor 2, 3, 4, dan 5, mahasiswa lebih banyak mendapatkan skor kategori nilai 10 yaitu sebanyak 45.060%, 50.590%, 37.600%, 35.310%. Soal nomor 6, mahasiswa lebih banyak mendapatkan skor kategori nilai 6 yaitu sebanyak 18.040%. Soal nomor 7, mahasiswa lebih banyak mendapatkan skor kategori nilai 1 sebanyak 49.880%. Soal nomor 8, 9, dan 10, mahasiswa lebih banyak mendapatkan skor kategori nilai 0 yaitu sebanyak 18.160%, 27.260%, dan 56.690%. Untuk selengkapnya dapat dilihat pada Lampiran 2.

Asumsi-asumsi Model IRT

Asumsi dimensi tunggal dapat diperiksa dengan melihat akar ciri dalam analisis faktor, menghitung rasio antara akar ciri yang pertama dan kedua. Jika rasionya tinggi, maka modelnya bersifat dimensi tunggal.

Gambar 3 Scree plot hasil analisis faktor

Hasil analisis faktor dapat dilihat pada Gambar 3. Faktor pertama memiliki akar ciri sebesar 4.302. Akar ciri pada faktor kedua sebesar 1.045. Faktor-faktor lainnya memiliki akar ciri kurang dari satu. Berdasarkan hasil analisis faktor, perbandingan akar ciri pertama dengan akar ciri kedua lebih besar yaitu 4.117. Hal ini sudah cukup mengindikasikan bahwa ada satu faktor yang dianggap paling dominan yang mendasari para peserta tes memberikan respon pada butir soal atau asumsi dimensi tunggal terpenuhi. Kebebasan lokal antara butir soal sudah diasumsikan dari awal oleh pakar pembuat soal bahwa tidak ada satu pun soal yang memberikan petunjuk menjawab untuk soal yang lain. Artinya antara butir soal sudah diasumsikan saling bebas.

Reliabilitas Skor Tes

Reliabilitas skor tes dengan 10 butir soal dapat dilihat pada Tabel 5. Semakin tinggi koefisien reliabilitas skor tes (mendekati 1), makin tinggi pula ketepatan dan kekonsistenan skor tes.

Reliabilitas skor tes dilihat menggunakan koefisien . Berdasarkan Tabel 5 dapat dilihat bahwa setiap butir soal memiliki nilai koefisien  yang mendekati satu, dengan nilai koefisien  sebesar 0.846 untuk semua butir soal. Hal ini menunjukkan bahwa butir soal mata kuliah Kalkulus memiliki tingkat ketepatan dan kekonsistenan peserta tes dalam menjawab soal sudah cukup baik.

Tabel 5 Reliabilitas skor tes butir soal mata kuliah Kalkulus

Reliabilitas Skor Tes

Nomor Soal Koefisien 

1 0.847

2 0.840

3 0.829

4 0.819

5 0.825

0.836 6

7 0.823

8 0.840

9 0.824

10 0.829

Semua butir soal 0.846

Model Teori Respon Butir GPCM

Hasil pendugaan parameter karakteristik butir soal ujian mata kuliah Kalkulus menggunakan model GPCM (Lampiran 3) menunjukkan bahwa soal-soal mata kuliah Kalkulus mempunyai nilai daya pembeda dan tingkat kesukaran butir soal yang beragam. Hasil pendugaan dan kriteria daya pembeda soal disajikan pada Tabel 6.

Berdasarkan Tabel 6, nilai aj (daya

pembeda) berkisar di antara 0.238 sampai dengan 0.721. Berdasarkan hasil pendugaan parameter aj (daya pembeda), soal nomor 1

(16)

8

nilai daya pembeda baik sekali. Sehingga soal nomor 10 mengindikasikan nilai indeks yang dapat membedakan kelompok peserta tes yang berkemampuan tinggi dan berkemampuan rendah.

Tabel 6 Hasil pendugaan dan kriteria daya pembeda butir soal

Soal aj Kriteria Daya Pembeda

1 0.278 memerlukan revisi atau disisihkan

2 0.374 _{memerlukan revisi sedikit /} tidak

3 0.492 memiliki daya pembeda cukup baik

4 0.400 _{memiliki daya pembeda} cukup baik

5 0.238 memerlukan revisi atau disisihkan

10 0.721 _{memiliki daya pembeda} baik sekali

Hasil pendugaan dan kriteria indeks kesukaran butir soal disajikan pada Tabel 7. Berdasarkan Tabel 7, soal nomor 1 memiliki nilai indeks kesukaran sebesar 0.886 yang nilainya lebih dari 0.7, artinya soal memiliki kriteria mudah. Soal nomor 2, 3, 4, 5, dan 6 memiliki nilai indeks kesukaran berada diantara 0.3 sampai 0.7, artinya soal memiliki kriteria sedang. Sedangkan untuk soal nomor 7, 8, 9, dan 10 memiliki nilai indeks kesukaran kurang dari 0.3, artinya soal memiliki kriteria sukar.

Tabel 7 Hasil pendugaan dan kriteria indeks kesukaran butir soal

Butir Soal

Indeks

Kesukaran Kriteria

1 0.886 Mudah

2 0.698 Sedang

3 0.681 Sedang

4 0.533 Sedang

5 0.627 Sedang

6 0.539 Sedang

7 0.208 Sukar

8 0.240 Sukar

9 0.259 Sukar

10 0.069 Sukar

Hasil pendugaan parameter daya pembeda, indeks kesukaran butir soal, dan nilai-p ( chi-square) disajikan pada Tabel 8.

Berdasarkan Tabel 8, tipe soal dibedakan menjadi tiga yaitu soal baik, cukup baik, dan belum dapat digambarkan. Berdasarkan hasil pendugaan parameter model GPCM, semua butir soal memiliki kriteria soal yang cukup baik. Dengan nilai khi-kuadrat empiris butir soal tidak melebihi nilai khi-kuadrat teoritis (nilai-p > 0.05). Soal nomor 1, 2, 3, 4, 5, 6, dan 7 memiliki nilai daya pembeda yang kurang dari 0.5 dan nilai indeks kesukaran per kategori butir soal (b11,b12, b13,..., b710) tidak berada pada rentang −2 sampai dengan 2. Soal nomor 8, 9, dan 10 memiliki nilai daya pembeda yang lebih dari 0.5 dan nilai indeks kesukaran per kategori butir soal (b81,b82, b83, ..., b108) tidak berada pada rentang −2 sampai dengan 2.

Tabel 8 Kriteria butir soal

Soal

Indeks Daya

pembeda

Nilai-p

Kriteria Soal Kesukaran

1 0.886 0.278 0.720 CB 2 0.698 0.374 0.710 CB 3 0.681 0.492 0.670 CB 4 0.533 0.400 0.610 CB 5 0.627 0.238 0.680 CB 6 0.539 0.430 0.640 CB 7 0.208 0.407 0.470 CB 8 0.240 0.547 0.500 CB 9 0.259 0.587 0.440 CB 10 0.069 0.721 0.260 CB Keterangan

CB : Cukup baik

Sedangkan statistik nilai dugaan parameter kemampuan disajikan pada Tabel 9. Rataan kemampuan peserta tes sebesar 0.032 dengan kemampuan diantara −2.680 sampai dengan 2.248.

Tabel 9 Statistik parameter kemampuan peserta tes mata kuliah Kalkulus pada model GPCM

Nilai Statistik Kemampuan Peserta

Tes

Rataan 0.032

Ragam 0.745

Standar Deviasi 0.863

Minimum −2.680

Maksimum 2.248

Penaksiran GPCM disajikan dalam grafik

(17)

9

Gambar 4 Grafik CRF butir soal nomor 10 Grafik CRF pada butir soal nomor 10, pada gambar dapat dilihat untuk butir soal ke- 10 memiliki daya pembeda (a10) sebesar 0.721

dan tingkat kesukaran pada kategori menjawab sebesar (b10(1)= 1.153, b10(2)=

2.117, b10(3)= 1.832, b10(4)=2.189, b10(5)=

1.299, b10(6)= 4.231, b10(7)=2.479, b10(8)=

0.225). Untuk nomor 1, 2, 3, 4, 5, 6, 7, 8, dan 9 dapat dilihat pada lampiran 4.

Berdasarkan hasil uji kesesuaian model yang disajikan pada lampiran 3, menunjukkan bahwa 100% soal dapat digambarkan dengan model. Hal ini terlihat dari kriteria butir soal yang dihasilkan. Dari 10 butir soal mata kuliah Kalkulus, soal tidak ada yang menunjukkan butir soal tidak dapat digambarkan oleh model, hal ini terlihat dari nilai khi-kuadrat empiris butir soal tidak melebihi nilai khi-kuadrat teoritis (nilai-p > 0.05).

Fungsi Informasi

Nilai informasi yang dapat dihitung untuk setiap level kemampuan pada rentang kemampuan dari tingkat terendah hingga tertinggi. Karena kemampuan merupakan peubah kontinu, maka nilai informasi juga akan menjadi peubah kontinu. Jika jumlah informasi diplot terhadap kemampuan tertentu, hasilnya adalah grafik fungsi informasi seperti ditunjukkan di bawah ini.

Gambar 5 Grafik fungsi informasi

Gambar 5 menunjukkan bahwa dari rentang kemampuan dari tingkat terendah hingga tertinggi, nilai informasi yang diberikan oleh tes mata kuliah Kalkulus telah menghasilkan nilai informasi maksimum pada level kemampuan 0.5. Dalam rentang ini, kemampuan peserta tes telah diperkirakan dengan tingkat ketepatan atau presisi tertentu. Di luar rentang ini, nilai informasi yang diberikan oleh tes cenderung menurun dengan drastis. Hasil fungsi informasi yang dapat dihitung untuk setiap level kemampuan pada rentang kemampuan dari tingkat terendah hingga tertinggi disajikan pada Tabel 10. Tabel 10 Fungsi informasi model GPCM mata kuliah Kalkulus

Fungsi Informasi

Tes Informasi 45.790

Simpangan Baku 0.148

Total Informasi (%) 72.470

Berdasarkan Tabel 10 nilai tes informasi (IF) sebesar 45.790 dan simpangan baku pengkukuran sebesar 0.148. Tes informasi (IF) memiliki fungsi yang berkebalikan dengan simpangan baku pengukuran, semakin tinggi nilai IF maka semakin rendah nilai simpangan baku pengukuran. Total informasi yang dihasilkan sebesar 72.470%, artinya tes mampu memberikan informasi tentang pendugaan tingkat kemampuan peserta tes pada rentang kemampuan dari tingkat terendah hingga tertinggi sebesar 72.470 % dan model GPCM cukup informatif mampu menjelaskan tingkat kemampuan peserta tes.

KESIMPULAN DAN SARAN

Kesimpulan

Berdasarkan hasil analisis, parameter daya pembeda dan indeks kesukaran butir soal memiliki nilai yang beragam. Hasil pendugaan parameter daya pembeda, soal nomor 1 dan 5 memerlukan revisi atau disisihkan, soal nomor 2 memerlukan revisi sedikit, soal nomor 3, 4, 6, 7, 8, dan 9 memiliki daya pembeda yang cukup baik, dan soal nomor 10 memiliki daya pembeda yang baik sekali artinya soal mampu membedakan kemampuan peserta tes. Berdasarkan hasil pendugaan parameter indeks kesukaran, soal nomor 1 termasuk kriteria soal mudah, soal nomor 2, 3, 4, 5, dan 6 termasuk kriteria soal sedang dan soal nomor 7, 8, 9, dan 10 termasuk kriteria soal sukar. Berdasarkan

-4 -2 0 2 4

0 .0 0 .2 0 .4 0 .6 0 .8 1 .0

Item Response Category Characteristic Curves - Item: No10

Ability P r o b a b il it y 1 2

3 4 5 6 7 8

9

-3 -2 -1 0 1 2 3

0 .0 0 .1 0 .2 0 .3 0 .4

Kernel Density Estimation for Ability Estimates

(18)

10

hasil, semua butir soal dapat dikategorikan soal dengan kualitas cukup baik

Total informasi yang dihasilkan sebesar 72.470%, artinya tes mampu memberikan informasi tentang pendugaan tingkat kemampuan peserta tes pada rentang kemampuan dari tingkat terendah hingga tertinggi sebesar 72.470% dan model GPCM cukup informatif mampu menjelaskan tingkat kemampuan peserta tes.

Berdasarkan hasil uji kesesuain model, menunjukkan bahwa 100% soal dapat digambarkan dengan model. Hal ini terlihat dari nilai-p > 0.05. Dari 10 butir soal mata kuliah Kalkulus tidak ada butir soal tidak dapat digambarkan oleh model.

Saran

Kasus tes uraian dengan data politomi menggunakan metode Teori Respon Butir (IRT), selain menggunakan metode

Generalized Partial Credit Model (GPCM) bisa dilakukan dengan pendekatan lain yaitu dengan metode Partial Credit Model (PCM) dengan diasumsikan memiliki daya pembeda soal yang sama.

DAFTAR PUSTAKA

Baker FB. 2001. The Basic of Item response Theory. University of Maryland: ERIC Clearinghouse on asessment and Evaluation.

Bjorner JB. 2007. A Macro for Item Fit and Local Dependence Test under IRT Model. School of Education University of Pittsburgh: Quality Metric Incorporated.

Crocker L, Algina J. 1986. Introduction to Classical and Modern Test Theory.

New York: Holt Rinehart and Winston, Inc..

Du Toit M. 2003. IRT from SSi: BILOG-MG,

MULTILOG, PARSCALE,

TESTFACT. Lincolnwood: Scientific Software International. Inc.

Gronlund NE, Linn RL. 1990. Measurement and evaluation in teaching (6th ed).

New York: Collier Macmillan Publishers.

Hambleton RK, Swaminathan H. 1985. Item Response Theory. Boston, MA: Kluwer Inc.

Hogg RV, Craig AT. 1978. Introduction to Mathematical Statistics. New York: Macmillan Publishing Co Inc. Lord ML. 1980. Application of Item Response

Theory to practical testing problems.

New Jersey: Lawrence Erlbaum Assosiates, Publisher,.

Matthew SJ. 2007. Marginal Maximum Likelihood Estimation of Item Response Model in R. Journal of

Statistical Software.

http://www.jstatsoft.org/ [27 April 2012].

Muraki E, Bock RD. 1997. Parscale 3: IRT based test scoring and item analysis for graded items and rating scales. Chicago: Scientific Software International, Inc.

Muraki E, Wang M. 1992. Issues relating to the marginal maximum likelihood estimation of the partial credit model. San Francisco CA: Paper presented at the annual meeting of the American Educational Research Association.

Widhiararso W. 2010. Model Politomi dalam Teori Respon Butir. Yogyakarta: Fakultas Psikologi, UGM.

(19)

(20)

12

Lampiran 1 Tabulasi data mata kuliah Kalkulus UTS TPB IPB Tahun Ajaran 2011/2012

NRP Mahasiswa Soal No.1 Soal No.2 Soal No.3 Soal No.4 Soal No.5 Soal No.6 Soal No.7 Soal No.8 Soal No.9

Soal No.10

Tolal skor

A14090001 6 4 7 2 2 1 0 0 0 0 22

A14090089 0 5 1 0 2 0 1 0 0 0 9

A14090093 4 7 1 0 5 0 0 0 0 0 17

A14100005 0 0 0 0 0 0 1 0 0 0 1

A14100038 7 0 3 0 10 0 1 0 0 0 21

A24090124 10 0 1 2 1 0 1 0 0 0 15

A24090171 10 4 10 10 9 6 0 4 3 0 56

A24090192 10 5 0 0 2 0 1 0 0 0 18

A24100010 10 0 2 0 1 0 1 0 0 0 14

A34090017 4 5 4 2 2 0 0 0 0 0 17

A34090049 10 5 1 0 6 1 1 0 1 0 25

A44090001 5 0 6 0 5 2 1 0 0 0 19

... ... ...

(21)

13

Lampiran 2 Proporsi peserta tes menjawab benar per kategori skor

Soal No 1 Soal No 2 Soal No 3 Soal No 4 Soal No 5

Kategori Proporsi Kategori Proporsi Kategori Proporsi Kategori Proporsi Kategori Proporsi

0 0.710% 0 5.880% 0 6.170% 0 22.090% 0 3.410%

1 2.700% 1 2.000% 1 9.400% 1 7.870% 1 12.930%

2 2.760% 2 0.760% 2 7.050% 2 12.870% 2 10.990%

3 0.820% 3 2.230% 3 2.410% 3 0.410% 3 3.880%

4 2.880% 4 3.700% 4 2.350% 4 5.990% 4 6.520%

5 1.880% 5 33.670% 5 7.640% 5 0.060% 5 5.520%

6 1.180% 6 1.000% 6 9.400% 6 3.940% 6 4.000%

7 2.940% 7 0.940% 7 1.650% 7 0.240% 7 1.590%

8 5.930% 8 1.470% 8 1.350% 8 8.230% 8 3.700%

9 3.000% 9 3.290% 9 2.000% 9 0.710% 9 12.160%

10 75.210% 10 45.060% 10 50.590% 10 37.600% 10 35.310%

(22)

14

Lampiran 2 (Lanjutan) Proporsi peserta tes menjawab benar perkategori skor

Soal No 6 Soal No 7 Soal No 8 Soal No 9 Soal No 10

Kategori Proporsi Kategori Proporsi Kategori Proporsi Kategori Proporsi Kategori Proporsi

0 8.520% 0 18.450% 0 18.160% 0 27.260% 0 59.690%

1 13.810% 1 49.880% 1 16.980% 1 23.440% 1 25.790%

2 6.640% 2 5.410% 2 10.750% 2 13.810% 2 7.700%

3 3.110% 3 1.880% 3 11.280% 3 8.810% 3 3.410%

4 1.650% 4 1.290% 4 8.340% 4 5.990% 4 1.410%

5 2.880% 5 15.920% 5 8.520% 5 3.350% 5 1.350%

6 18.040% 6 3.000% 6 6.930% 6 2.120% 6 0.240%

7 17.570% 7 0.710% 7 5.760% 7 3.580% 7 0.120%

8 9.690% 8 0.290% 8 4.050% 8 6.170% 8 0.000%

9 8.400% 9 0.120% 9 3.170% 9 1.060% 9 0.000%

10 9.690% 10 3.060% 10 2.530% 10 4.410% 10 0.290%

11 0.880%

12 1.470%

13 0.470%

14 0.410%

15 0.290%

(23)

15

Lampiran 3 Nilai Parameter butir soal Ujian Tengah Semester mata kuliah Kalkulus untuk model GPCM

Keterangan

aj : indeks daya pembeda butir soal ke-j

bj : indeks kesukaran butir soal ke-j

bjk : indeks kesukaran kategorik k butir soal ke-j

CB : Cukup Baik*

Daya Pembeda

a j bj bj1 bj2 bj3 bj4 bj5 bj6 bj7 bj8 bj9 bj10 bj11 bj12 bj13 bj14 bj15

1 Nilai minimum maksimum 0,278 0,886 -6,441 -1,682 2,461 -5,014 0,559 0,814 -3,444 -2,647 2,017 -10,939 0,720 CB 2 Rumus turunan 0,374 0,698 1,385 1,153 -3,550 -2,052 -6,182 8,800 0,491 -0,960 -1,850 -6,465 0,710 CB 3 Turunan implisit 0,492 0,681 -2,152 -0,401 1,383 -0,477 -2,668 -0,565 3,450 0,552 -0,544 -5,916 0,670 CB 4 Aturan rantai 0,400 0,533 1,651 -1,558 6,819 -5,382 7,107 -5,997 5,238 -6,453 5,255 -7,782 0,610 CB 5 Turunan sebagai fungsi 0,238 0,627 -6,366 -0,080 3,615 -2,326 0,515 1,346 3,509 -2,920 -4,454 -3,894 0,680 CB 6 Turunan fungsi trigonometri 0,430 0,539 -2,190 0,903 1,212 1,122 -1,374 -4,122 0,398 1,840 0,953 0,465 0,640 CB 7 Laju terkait 0,407 0,208 -2,882 5,343 2,740 1,170 -5,297 4,759 4,289 3,120 2,141 -5,014 0,470 CB 8 Limit takhingga, asimtot 0,547 0,240 -0,542 0,409 -0,156 0,737 0,283 0,835 1,014 1,460 1,387 1,471 3,062 0,406 3,632 1,841 2,137 0,500 CB 9 Teorema nilai rata-rata 0,587 0,259 -0,228 0,881 0,938 1,016 1,495 1,430 -0,050 0,062 3,981 -1,020 0,440 CB 10 Aplikasi Turunan (pengoptimuman) 0,721 0,069 1,153 2,117 1,832 2,189 1,299 4,231 2,479 0,225 0,260 CB

Nilai maksimum 0,721 0,886 1,651 5,343 6,819 2,189 7,107 8,800 5,238 3,120 5,255 1,471 3,062 0,406 3,632 1,841 2,137 Nilai minimum 0,238 0,069 -6,441 -1,682 -3,550 -5,382 -6,182 -5,997 -3,444 -6,453 -4,454 -10,939 3,062 0,406 3,632 1,841 2,137

Soal Deskripsi Soal

Model GPCM

(24)

16

Lampiran 4 Grafik CRF butir soal

-4 -2 0 2 4

0 .0 0 .2 0 .4 0 .6 0 .8 1 .0

Item Response Category Characteristic Curves - Item: No1

Ability P ro b a b il it y 1 2 3

4 5 ₆

7 8 9 10

11

-4 -2 0 2 4

0 .0 0 .2 0 .4 0 .6 0 .8 1 .0

Ability P ro b a b il it y 1 2

3 4 5

6

7 8 9 10

11

-4 -2 0 2 4

0 .0 0 .2 0 .4 0 .6 0 .8 1 .0

Ability P ro b a b il it y 1 2 3 4 5 6 7

8 9 10

11

-4 -2 0 2 4

0 .0 0 .2 0 .4 0 .6 0 .8 1 .0

Ability P ro b a b il it y 1 2 3 4 5

6 7 8

9

10

(25)

17

Lampiran 4 (Lanjutan) Grafik CRF butir soal

-4 -2 0 2 4

0 .0 0 .2 0 .4 0 .6 0 .8 1 .0

4 5 6 ₇

8 9

10

11

-4 -2 0 2 4

0 .0 0 .2 0 .4 0 .6 0 .8 1 .0

4 ₅ 6

7 8

9 10

11

-4 -2 0 2 4

0 .0 0 .2 0 .4 0 .6 0 .8 1 .0

Item Response Category Characteristic Curves - Item: No7

Ability P ro b a b il it y 1 2

3 ₄ ₅

6

7 ₈ ₉ 10

11

-4 -2 0 2 4

0 .0 0 .2 0 .4 0 .6 0 .8 1 .0

Ability P ro b a b il it y 1 2 3 ₄

5 6 7 8 9 10 11 12

13 14

15

(26)

18

Lampiran 4 (Lanjutan) Grafik CRF butir soal

-4 -2 0 2 4

0

.0

0

.2

0

.4

0

.6

0

.8

1

.0

Ability

P

ro

b

a

b

il

it

y

1

2

3 ₄

5 6 7

8

9

10 11

-4 -2 0 2 4

0

.0

0

.2

0

.4

0

.6

0

.8

1

.0

Ability

P

ro

b

a

b

il

it

y

1

2

3 4 5 6 7 8

(27)