• Tidak ada hasil yang ditemukan

KAJIAN PUSTAKA

A. Kajian Butir Soal

2. Model Pengukuran Rasch

Misalnya, program Bilog-MG keluaran Ph1 dengan pendekatan TTK akan membantu sekaligus memahami keluaran Ph2 dan Ph3 dengan pendekatan MTT.

Ciri-ciri MTT memiliki kemiripan dengan model Rasch. Model MTT merupakan model statistik sedangkan model Rasch merupakan model pengukuran walaupun kurva fungsinya sama-sama monotonik. Artinya semakin tinggi kemampuan peserta tes maka peluang untuk menjawab benar suatu butir soal semakin tinggi tanpa memperhatikan daya beda dan peluang tebakan.

2. Model Pengukuran Rasch

a. Asumsi Item Characteristic Curva (ICC)

Model ICC pada MTT mempunyai tiga model, yakni model logistik tiga parameter (3PL), model logistik dua parameter (2PL), dan model logistik satu parameter (1PL). Model Rasch atau model pengukuran Rasch ditemukan oleh George Rasch. Hambleton, et al. (1991: 14) mengemukakan bahwa model Rasch berbeda dengan model pendekatan MTT walaupun secara matematik bentuknya equivalen dengan IPL. Model tersebut mempunyai ICC yang beda dengan model 1PL yakni model 1PL mempunyai nilai D =1,7 sehingga lebih bentuknya lebih curam sedangkan model Rasch mempunyai nilai D = 1 sehingga bentuknya lebih landai. Haley dalam Hambleton & Swaminathan (1985: 37) dan Kolen & Brennan (2004: 158) mengemukakan bahwa hubungan antara fungsi normal kumulatif dengan model logistik dilakukan dengan penambahan faktor D = 1,7 pada model logistik sehingga selisih nilai absolut Pi() pada kedua model untuk semua peserta tes lebih kecil dari 0,01 sehingga dianggap sama. Walaupun demikian Linacre (2005) menguraikan bahwa perbedaan antara keduanya bukan hanya aspek kuantitatif yakni selisih 0,01 namun juga berbeda pada beberapa aspek antara lain seperti pada Tabel 2.

25

Tabel 2.

Perbedaan Model Rasch dan Model 1PL

No Aspek Model Dikotomi Rasch Model Satu Parameter

1 Singkatan Rasch 1PL

2 Alasan (Dasar)

Preskriptif: Taksiran kemampuan dan butir soal distribusinya bebas

Deskriptif: Lebih mendekati model Ogive Normal

3 Peserta Tes

n kemampuan peserta tes Bn

atau ν kemampuan peserta tes  di dalam logits v

Sampel peserta tes berdistribusi normal dari distribusi kemampuan theta (θ). Dikonseptualisasikan sebagai N(0,1).

4 Butir soal

Tingkat kesukaran butir ke-i Di atau tingkat kesukaran butir ke ι  di dalam logits

Butir ke-i dari tingkat kesukaran bi di dalam probits 5 Formula:Bentuk exponensial e = 2.71828 n i i n D B D B ni e e P   1 1,7( ) ) ( 7 , 1 1 i i b b ni e e P   6 Formula:Bentuk logit-linear loge = natural logarithm ni n i ni e B D P P          1 log 1,7( ) ) ( 1 ) ( log i i i e b P P             7 Daerah asal skala: titik nol taksiran parameter

Rerata tingkat kesukaran butir atau tingkat kesukaran butir soal yang dispesifikkan (acuan kriteria)

Rerata kemampuan peserta tes (acuan norma)

8 Daya beda butir

Kurva karakteristik butir dimodelkan menjadi paralel dengan nilai slop 1 (Ogif logistik alam (natural)

Kurva karakteristiknya paralel dengan slope 1,7 (mendekati slop ogif normal kumulatif)

9

Mising data yang diijinkan

Bergantung pada metode penaksiran

Bergantung pada metode penaksiran

10

Fixed

(anchored) nilai parameter untuk peserta tes dan

butir soal Bergantung pada software

Butir: bergantung pada software dan peserta tes hanya bergantung pada bentuk distribusi

11

Evaluasi

Kecocokan (fit)

Kecocokan data pada model. Local, satu parameter pada satu waktu

Kecocokan model pada data. Global, menerima atau menolak model

12

Ketidakcocokan data dan model

Data cacat tidak mendukung pemisahan parameter

didalam kerangka kerja aditif. Pertimbangkan mengedit data

Data cacat tidak cukup mendekripsikan data. Pertimbangkan menjumlah parameter daya beda (2-PL), peluang tebakan (3PL)

26 Sambungan Tabel 2

No Aspek Model Dikotomi Rasch Model Satu Parameter

13

Pertama menampilkan

Rasch, George (1960). Model probabilistik untuk beberapa tes inteligensi dan prestasi (attainment). Kopenhagen: Danish Institute for Educational Research

Birnbaum, Allan (1968). Beberapa model

kemampuan laten. Dalam F.M. Lord &M.R. Novick, (Eds), Statistical theories of mental; test scores. Reading, MA: Addison-Wesley. 14 Pendukung Pertama Benjamin D. Wright, University of Chicago Frederic M. Lord,

Educatioal Testing Service

15 Otoritas aktif yang berwewenang secara langsung David Andrich,University of Western Australia, Perth, Australia

Ronald Hambleton,

University of Massachusetts

16

Buku teks yang memperkenalkan

Applying the Rasch Model. T.G. Bond and C.M. Fox

Fundamentals of Item Response Theory. R.K. Hambleton, H. Swaminathan, and H.J. Rogers. 17 Software yang digunakan secara luas Winsteps, RUMM, ConQuest Logist, BILOG

Tabel 2 menggambarkan perbedaan antara kedua model dimana model Rasch lebih banyak digunakan pada tes prestasi dan digunakan pada acuan kriteria (patokan). Jika data tidak cocok dengan model maka model dapat dipertimbangkan dan diganti dengan model lain. Pergantian model tersebut tetap memperhatikan distribusinya. Oleh karena itu, penaksiran kemampuan peserta tes dan butir soal tidak bergantung pada distribusi normal namun bebas. Lebih lanjut, model Rasch merupakan model pengukuran bukan merupakan model statistik sehingga bagaimana proses data tersebut diperoleh lebih diperhatikan dibandingkan bagaimana data tersebut dianalisis.

Model Rasch menghubungkan setiap peserta tes sebagai individu (Bn) sebagai suatu logistik ogive dengan tingkat kesukaran butir soal sedangkan model 1PL

27

menghubungkan theta (θ) sebagai sebuah distribusi normal ogive dengan tingkat kesukaran soal. Adapun formula model Rasch dan model 1PL masing-masing sebagai berikut: i n i n D B D B ni e e P   1 ……….………. (1) ) ( 7 , 1 ) ( 7 , 1 1 i i b b ni e e P   ……….…...………... (2)

dimana e = 2.71828 dan Pni merupakan peluang peserta tes menjawab butir ke-i benar. Kurva kedua model pada range kemampuan [-4,4] seperti pada Gambar 1.

Gambar 1.

Perbandingan Kurva Model 1PL dan Model Rasch

Gambar 1 menunjukkan bahwa kurva model 1PL lebih tajam daripada kurva model Rasch karena mempunyai perbedaan nilai D dimana model 1PL mempunyai nilai D = 1,7 sedangkan model Rasch mempunyai nilai D = 1. Hal tersebut menunjukkan perbedaan antara model logistik ogive dan model normal ogive.

Model 1 PL Model Rasch

28 b. Asumsi Independensi Lokal

Independensi lokal diartikan sebagai ketidakbergantungan suatu butir soal dengan butir soal yang lain dalam pengukuran kemampuan peserta tes. Artinya, butir soal yang satu tidak sama dengan butir soal yang lain dalam mengukur suatu trait (kemampuan). Secara analogi matematik, tidak ada irisan objek kemampuan yang diukur. Selanjutnya, secara statistik dapat dikatakan tidak ada korelasi signifikan antara butir soal yang satu dengan butir soal lain dalam rentang kemampuan.

Independensi menurut Hulin et al. (1983: 43) dan Hambleton (1989: 151) bahwa pada tingkatan kemampuan dan sikap, sebarang dua butir soal tidak berkorelasi pada sub populasi yang homogen. Sebaliknya, pada sub populasi yang heterogen dengan kemampuan yang bervariasi, respon dua butir berkorelasi. Hal tersebut tidak berarti bahwa respon pada sebarang dua butir tidak berkorelasi secara umum. Berdasarkan hal tersebut, subjek pada penelitian ini mempunyai sarana dan prasarana pendidikan yang relatif sama sehingga kemampuan peserta tes dianggap setara. Implikasinya, pada penelitian ini sebarang respon dua butir soal tidak berkorelasi.

c. Asumsi Unidimensi

Unidimensi mengacu satu dimensi suatu tes dimana domain yang akan diukur. Jika butir soal tes mengukur kemampuan matematika, maka butir soal yang ada pada tes tersebut mengacu pada kemampuan mengukur matematika, sedangkan pada analisis faktor sering disebut sebagai komponen dominan. Menurut Hambleton,

et al. (1991: 9-10) pada pengukuran psikologi, karakteristik butir soal yang

membentuk tes tidak tepat secara eksak berdimensi satu (unidimensi) tetapi hanya dominan terhadap suatu unjuk kerja. Jadi bila tes mengukur lebih dari satu dimensi atau tidak dominan maka jawaban peserta tes terhadap butir soal akan merupakan

29

kombinasi dari berbagai kemampuan, sehingga sulit untuk mengetahui kontribusi dari setiap butir soal terhadap kemampuan peserta tes. Kalau hal tersebut terjadi maka dikatakan tes berdimensi dua atau lebih (multidimensi) sehingga perlu diketahui dimensi suatu tes. Dimensi suatu tes dapat diketahui dengan metode fuzzy c-means. Metode tersebut sederhana dan tidak memerlukan asumsi yang ketat dalam menentukan dimensi suatu tes (Rukli, 2011).

Ada beberapa mekanisme untuk mengukur kemampuan peserta tes kalau tes multidimensi. Misalnya, dimensi dalam tes tersebut dipisahkan dengan suatu persamaan linier yang mewakili setiap dimensi dalam hal ini variabel sedangkan parameternya merupakan pembobotan sehingga diperoleh informasi secara keseluruhan dari kemampuan peserta tes yang diukur oleh tes tersebut. Unidimensi atau multidimensi suatu tes dipengaruhi oleh kisi-kisi yang membangun tes tersebut. Djemari Mardapi (1996: 15-19) mengemukakan bahwa pembuatan kisi-kisi tes mengacu pada konsep bahwa materi pokok bahasan pada materi tes bisa tidak sama, namun memiliki substansi pokok yang sama, dan penilaian pada ranah kognitif cenderung berdimansi satu. Oleh karena hanya satu dimensi yang diukur yaitu pada ranah kognitif sehingga tes UN SD adalah merupakan tes yang dominan dimana kisi-kisi UN SD pada mata pelajaran matematika dibuat oleh Pusat Penilaian Pendidikan (Puspendik). Walaupun demikian, butir soal UN SD menggunakan kisi-kisi yang spesifik bukan pada tingkatan mata pelajaran namun pada tingkatan Standar Kompetensi Lulusan (SKL) sehingga informasi berapa banyak butir soal yang direspon peserta tes selama ujian per SKL memerlukan kajian lebih dalam. Seberapa besar prosentase butir soal diharapakan muncul dalam setiap SKL perlu diperhatikan prioritasnya dengan tetap memperhatikan faktor lain yakni tingkat kesukaran butir soal yang paling adaptif terhadap kemampuan peserta tes saat ini. Jadi pembuatan

30

kisi-kisi butir soal tes yang meliputi pokok bahasan pada hakekatnya mengacu pada substansi pokok yang sama namun materi tes tidak sama dimana mengungkapkan satu kemampuan umum sehingga pokok bahasan, SKL, atau content area perlu diperhatikan dan ditegaskan dimana komponen dominan mengacu pada analisis faktor.

Berdasarkan uraian ciri butir soal yang dependen dan asumsi yang melandasi konsep TTK jika dibandingkan dengan ciri butir soal dan asumsi yang melandasi konsep model Rasch maka konsep model Rasch lebih cocok dalam pengembangan

CAT dibandingkan dengan konsep TTK. Begitu juga konsep 1PL merupakan model

statistik bergantung pada distribusi sampel yang berdistribusi normal dibandingkan model Rasch berdistribusi bebas lebih cocok dalam pengembangan CAT.

d. Fungsi Informasi Butir

Birnbaun dalam Hambleton et al. (1991: 92) mengemukakan bahwa kemampuan peserta tes secara maksimum pada model 3PL dapat dihitung dengan formula sebagai berikut:

0.5(1 (1 8 ))

ln 1 i i i c Da b      ..…………...……… (3)

Jika peluang tebakan ci 0 maka  bi. Secara umum, jika ci 0 maka fungsi informasi butir soal mempunyai tingkatan kemampuan lebih tinggi daripada tingkat kesukaran butir. Implikasinya, pemberian butir soal pada tahap awal proses pengujian selayaknya menggunakan tingkat kesukaran butir lebih rendah dibandingkan dengan tingkat kemampuan peserta tes agar supaya secara psikologis peserta tes mendapat butir ransangan untuk menjawab butir yang lebih tinggi tingkat kesukarannya.

31

Pada model 2PL ditetapkan c = 0 dan 1PL ditetapkan c = 0 dan a = konstan, sedangkan model Rasch ditetapkan c = 0 dan a = 1. Bila model Rasch diterapkan pada persamaan (3) maka kemampuan peserta tes sama dengan tingkat kesukaran butir soal tanpa memperhatikan variasi nilai a dan psikologis peserta tes. Oleh karena itu, pembentukan basis pengetahuan pada model tersebut menggunakan pendekatan

adjustment bahwa bagaimanapun dalam merespon butir soal berpeluang munculnya

kendala-kendala sehingga kemampuan peserta tes tetap lebih tinggi jika dibandingkan dengan tingkat kesukaran butir soal bila diharapkan peserta tes merespon secara benar suatu butir soal. Gambaran tersebut lebih dijelaskan pada persamaan fungsi informasi butir soal.

Fungsi informasi butir soal maksimum menurut Lord dalam Hambleton dan Swaminathan (1985:107) bahwa model 2 PL dan 1PL masing-masing mempunyai nilai

2 2 4 1 a D dan 2 4 1

D . Jika D = 1 sesuai dengan model Rasch maka fungsi informasi

maksimum mempunyai nilai

4 1

. Fungsi informasi butir soal pada model Rasch mempunyai nilai yang sama yakni 0,25 dan bergerak ke kanan dan ke kiri searah dengan tingkat kesukaran butir dan kemampuan peserta tes. Fungsi informasi butir soal jika peserta tes merespon butir soal ke-i sebagai berikut:

)]} ( 1 )[ ( { )] ( [ ) ( 2 ' i i i i P P P I ………….……… (4)

Fungsi informasi tes merupakan penjumlahan fungsi informasi butir soal yang terjadi secara independen. Fungsi informasi tes terdapat pada persamaan (5).

n i i I I 1 ) ( ) (  ……….. (5)

32

e. Galat Baku Penaksiran Parameter Kemampuan

Parameter kemampuan peserta tes tidak dapat diketahui secara pasti sehingga perlu dilakukan penaksiran. Penaksiran kemampuan menggunakan metode tertentu tidak lepas dari galat sehingga penaksiran tersebut menghasilkan nilai pendekatan. Artinya, jika nilai penaksiran semakin mendekati nilai kemampuan peserta tes maka penaksiran semakin akurat dimana galat baku penaksiran parameter kemampuan semakin kecil. Kedekatan tersebut tercermin dari nilai galat baku penaksiran parameter kemampuan yang semakin kecil.

Penaksiran parameter butir soal terhadap parameter kemampuan peserta tes dapat menggunakan hasil respon peserta tes. Menurut Hambleton et al. (1991: 95) besarnya kesalahan baku bergantung beberapa hal. Pertama, jumlah butir soal yakni semakin panjang tes semakin kecil galat baku. Kedua, kualitas butir tes yakni semakin tinggi daya beda butir soal maka jawaban peserta tes secara benar tidak dapat diperoleh dengan menebak. Ketiga, pemadanan antara kesukaran butir soal dengan kemampuan peserta tes.

Galat baku penaksiran parameter kemampuan peserta tes adalah perbandingan terbalik akar dari jumlah informasi parameter butir soal yang direspon peserta tes. Berdasarkan hal tersebut, galat baku penaksiran parameter kemampuan dirumuskan sebagai berikut: ) ( 1 ) (   I SE  ……… (6) dimana ( )

SE adalah galat baku penaksiran parameter kemampuan sedangkan I()

adalah jumlah fungsi informasi butir yang direspon peserta tes atau sama dengan persamaan (5). Galat baku parameter kemampuan peserta tes bergantung pada keakuratan penaksiran parameter butir dan keakuratan parameter butir menaksir

33

parameter kemampuan peserta tes. Hasil penaksiran parameter butir pada penelitian ini dilakukan dengan program Bilog-MG. Ukurann sampel model Rasch adalah sekitar 500 respon butir soal.

Penaksiran parameter kemampuan peserta tes terkait dengan penaksiran parameter butir soal. Penaksiran parameter butir soal bergantung pada metode yang dipakai. Misalnya, metode penaksiran kebolehjadian maksimum, semakin besar ukuran sampel menaksir parameter butir maka galat baku penaksiran semakin kecil. Penaksiran parameter butir soal pada penelitian ini tidak diuraikan lebih lanjut, namun penelitian Rukli (1998: 77) menggunakan program ASCAL dengan ukuran sampel 2000 menemukan bahwa penaksiran parameter butir pada bagian akhir tes kurang akurat karena tingkat kesukaran butir soal lebih besar jika dibandingkan dengan tingkat kemampuan peserta tes. Hal tersebut disebabkan peluang tebakan butir soal cukup tinggi disamping penaksiran daya beda butir soal dan tingkat kesukaran butir soal kurang akurat serta waktu respon tes terbatas.