K E M E N T E RIAN P E N DIDIK AN N AS ION AL
D IRE K T O RA T J E N D E R A L M A N A JE M E N P E N DIDIKAN DAS AR DAN ME N E N G A H D IRE K T O RA T P E MB IN AAN S E K O L A H ME N E N GAH P E RT AMA
Didik Suhardi, SH., M.Si.
NIP. 19631203 198303 1 004
Nomor: 0630/C3/KP/2010
Diberikan kepada
IKama
: <Dr
:
SamsuCjfadi, ‘M.Kpm
Vnit %erja
: VNYYogyakarta, %a6upaten SCeman
, ©./
Yogyakarta
JZtas partisipasi aktif se6agai
y/arasum6er
(PeCatihan Calon (Pe(atifi(Training o f drainer) 6agi Tun Pengembang Kjiri^uCum (Propinsi
yang diselenggarakan diInaSimpang - SuraSaya, JL (jubenurSuryo 1- 3, Sura6aya -Jawa 'Hmur
Jakarta, 25 Maret 2010
a.n. Direktur Jenderal
Manajemen Pendidikan Dasar dan Menengah
Direktur Pembinaan Sekolah Menengah Pertama
STRUKTUR PROGRAM
ToT Tim Pengembang Kurikulum (TPK) Propinsi Tahun 2010
NO. PROGRAM DAN MATERI JUMLAH JAM
A. PROGRAM UMUM
1
.
Kebijakan Direktorat Pembinaan SMP 2 JP2. Ujian Nasional 2009/ 2010 2 JP
3. Karakteristik SMP Terbuka 3 JP
B. PROGRAM INTI
4. Identifikasi Materi UN yang Sulit Dikuasai Siswa 2 JP
5. Pengkajian dan Pendalaman Materi UN yang Sulit Dikuasai Siswa 8 JP
6. Penjabaran Kisi-Kisi UN 2009/ 2010 4 JP
7. Pengembangan dan Pembahasan Soal sesuai Kisi-Kisi UN
2009/ 2010 16 JP
8. Teori Respon Butir 2 JP
9. Praktik Analisis Soal dengan Pendekatan Teori Respon Butir 4 JP
10. Rancangan Bimbingan/ Pendampingan Teknis untuk Peningkatan
Rerata Nilai UN dan Angka Kelulusan SMP 4 JP
11. Pre & Post test 2 JP
12. Evaluasi Bimtek (Direktorat) 1 JP
PENGANTAR
TEORI RESPONS BUTIR
M ateri D isam paikan pada
Training o f Trainer
T im Pengem bang Propinsidi H otel Ina Sim pang Surabaya 25 M aret 2010
Oleh:
Sam sul H adi
(Fakultas T eknik U niversitas N egeri Y ogyakarta)
Kementerian Pendidikan Nasional
Direktur Jenderal Manajemen Pendidikan Dasar dan Menengah
Direktorat Pembinaan Sekolah Menengah Pertama
PENGANTAR TEORI RESPONS BUTIR
Sam sul H adi
(Fakultas T eknik U niversitas N egeri Y ogyakarta)
A. Pendahuluan
Tes yang dilalukan oleh guru digunakan untuk m engetahui pencapaian
standar kom petensi lulusan atau turunannya berupa standar kom petensi,
kom petensi dasar, atau indikator dari suatu m ata pelajaran yang harus dikuasai
oleh siswa. Supaya tes dapat m engukur pencapaan kom petensi, m aka tes harus
dibuat m em enuhi validitas isi, yaitu butir-butir soal yang ada harus benar-benar
diturunkan dari standar kom petensi lulusan, standar kom petensi, kom petensi
dasar, atau indikator dari suatu m ata pelajaran.
Supaya tes m em enuhi validitas isi penyusunan butir soal diaw ali dengan
m engkaji standar kom petensi lulusan, standar kom petensi, kom petensi dasar, atau
indikator dari suatu m ata pelajaran. Berdasarkan kisi-kisi tersebut kem udian
dibuat butir-butir soal. B utir-butir soal yang sudah jad i kem udian dim inta untuk
ditelaah oleh pihak lain yang dianggap m am pu dengan m em perhatikan: m ateri,
konstruksi, dan bahasa yang digunakan dalam butir soal.
Telaah m ateri bertujuan untuk m elihat kesesuaian soal sudah sesuai
dengan indikator, kesesuaian m ateri soal dengan tuntutan kom petensi (urgensi,
relevansi, kontinyuitas, keterpakaian yang tinggi), dan kesesuaian m ateri dengan
jenjang jenis sekolah atau tingkat kelas. Telaah konstruksi bertujuan untuk
m enjam in bahw a soal telah dirum uskan dengan singkat, bebas dari pernyaatn
pernyataan yang m ulti interpretasi. Telaah bahasa dilakukan agar soal kom unikatif
dan sesuai dengan jenjang pendidikan sisw a serta m enggunakan bahasa Indonesia
yang baku.
H asil telaah m ateri, konstruksi, dan bahasa dijadikan m asukan perbaikan
terhadap butir soal yang ada. Setelah perbaikan dilakukan berdasarkan telaat
ketiga hal tersebut, soal siap diujicobakan kepada siswa. D ata yang diperoleh dari
hasil ujicoba perlu dianalisis untuk m engetahui karakteristik soal atau butir soal
secara em piris. A da dua pendekatan untuk m enganalisis data hasil ujicoba soal,
yaitu m enggunakan teori tes klasik dan m enggunakan teori respons butir.
A. Teori Tes Klasik
K ualitas tes atau butir soal penyusun tes yang baik dapat dilihat dari
karakteristikya. K arakteristik tes atau butir dapat diketahui dengan dua
pendekatan teori. K edua pendekatan tersebut yakni teori tes klasik dan teori
respons butir. Teori tes klasik, atau disebut ju g a teori tes skor m urni klasik,
didasarkan pada m odel aditif, yaitu skor am atan m erupakan penjum lahan dari
skor sebenarnya dan skor kesalahan pengukuran (Allen & Yen, 1979: 57).
Secara m atem atis pernyataan tersebut dapat dirum uskan sebagai berikut.
X = T + E
dengan :
X
: skor amatan,T
: skor murni,Kesalahan pengukuran dalam teori tes klasik m erupakan kesalahan yang tidak sistem atis atau acak. K esalahan pengukuran m erupakan penyim pangan
secara teoretis dari skor am atan yang diperoleh dengan skor am atan yang
diharapkan. K esalahan pengukuran yang sistem atis dianggap bukan m erupakan
kesalahan pengukuran.
A sum si-asum si yang m endasari teori tes klasik tersebut dijadikan dasar
untuk m engem bangkan rum us-rum us m atem atis untuk m engestim asi validitas dan
koefisien reliabilitas tes. V aliditas dan koefisien reliabilitas pada perangkat tes
digunakan untuk m enilai kualitas tes. K ualitas tes dalam teori tes klasik ju g a dapat
ditentukan dengan indeks kesukaran dan daya pem beda.
1. Tingkat Kesukaran
Tingkat kesukaran, disim bolkan dengan p , m erupakan salah satu
param eter butir soal yang sangat berguna dalam analisis soal. Tingkat kesukaran
dapat dihitung dengan berbagai cara, yaitu (a) skala kesukaran linear, (b) skala
bivariat, (c) indeks D avis, dan (d) proporsi m enjaw ab benar (B ahrul H ayat, dkk.,
1999). Secara m atem atis tingkat kesukaran yang dihitung dengan proporsi
m enjaw ab benar dirum uskan dengan:
I B
P =
—dengan keterangan B adalah banyak peserta tes yang m enjaw a benar, dan N
jum lah peserta tes yang m enjaw ab. D engan rum us tersebut, m aka dapat diketahui
bahw a jik a p m endekati 0, m aka soal tersebut terlalu sukar, sedang jik a p
terlalu sukar tidak dapat m em bedakan kem am puan peserta tes sehingga perlu
dibuang.
M enurut A llen dan Y en (1979) tingkat kesukaran butir soal sebaiknya
antara 0,3 - 0,7. Pada rentang tersebut inform asi tentang kem am puan sisw a akan
diperoleh secara m aksim al. N am un angka tersebut perlu disesuaikan dengan
tujuan pengem bangan soal. Soal untuk keperluan seleksi, rem idi, atau ulangan
um um seharusnya m em punyai p yang berbeda-beda untuk m encapai tujuan yang
m aksim al.
2. Daya Beda
D aya beda m erupakan param eter butir soal yang m em berikan inform asi
tentang seberapa besar butir soal tersebut dapat m em bedakan peserta tes yang
skornya tinggi dan peserta tes yang skornya rendah. D aya beda dapat dihitung
dengan beberapa cara antara lain dengan m enghitung koefisien korelasi
point
biserial
dan koefisien korelasibiserial.
K orelasipoint biserial
secara m atem atisdirum uskan sebagai berikut.
Mp — Mq -
---rpbis
n Vp 9^t
dim ana:
rpbis
: koefisien korelasipoint biserial
Mp
:mean
skor pada tes dari peserta tes yang m em iliki jaw aban benar padabutir soal
Mq
:mean
skor pada tes dari peserta tes yang m em iliki jaw aban salah padap : proporsi peserta tes yang m enjaw ab benar pada butir soal
q : 1 - p
St : standar deviasi seluruh skor tes
K orelasi
biserial
secara m atem atis dinyatakan dengan rumus sebagaiberikut.
M
v- M
t pdengan keterangan
rbis
adalah koefisien korelasibiserial, y
adalah ordinat pdalam distribusi norm al, sedangkan sim bol lain sama dengan keterangan
sebelumnya. N ilai korelasi
point biserial
selalu lebih rendah dibanding dengannilai korelasi
biserial.
H ubungan antara keduanya dinyatakan dengan rumus:y
rpbis rb is ■
i
---v p . q
3. Efektivitas Distraktor
Soal pilihan ganda perlu m em iliki pengecoh, yaitu jaw aban yang tidak
bernilai benar. Pengecoh perlu dibuat sedem ikian rupa sehingga m enarik
perhatian peserta tes yang belum m em iliki konsep yang baik terhadap m ateri yang
diujikan. A llen dan Y en (1979) m enyatakan bahw a pengecoh yang baik m inim um
berindeks 0,1 yang berupa koefisien korelasi point biserial, bernilai p o sitif untuk
kunci jaw aban dan bernilai negatif untuk pengecoh.
4. Kesalahan Pengukuran
K esalahan Pengukuran
(Standard Error o f Measurement,
SEM ) m em bantuskor peserta tes. K esalahan pengukuran dihitung dengan rum us sebagai berikut
(B ahrul H ayat, dkk., 1999):
°
e = ° x V 1 — p xx'dengan keterangan
ox
adalah standar deviasi dari skor total dan p x x ' adalahkoefisien reliabilitas tes.
5. Reliabilitas Tes
R eliabilitas tes dapat diartikan sebagai keajegan atau konsistensi hasil
pengukuran atau hasil tes yang dilakukan pada w aktu yang berbeda pada subjek
yang sama. A llen dan Y en (1979) m enyatakan bahw a tes disebut reliabel jik a skor
am atan m em punyai korelasi yang tinggi dengan skor yang sebenarnya. M ereka
ju g a m enyatakan bahw a reliabilitas m erupakan koefisien korelasi antara dua skor
am atan yang diproleh dari hasil pengukuran m enggunakan tes yang paralel.
Reliabilitas suatu tes dapat dihitung dengan beberapa cara dan form ula.
Cara atau form ula belah dua, alfa (a ) Cronbach, G uttm an, dan paralel dapat
digunakan. N ilai hasil perhitungan dari form ula tersebut sering dikatakan sebagai
koefisien reliabilitas. M ehrens dan Lehm ann (1973) m enyatakan bahw a m eskipun
tidak ada ketentuan um um , tetapi secara luas dapat diterim a bahw a untuk tes yang
digunakan untuk m em buat keputusan secara perorangan harus m em iliki koefisien
reliabilitas m inim al 0,85.
K eterbatasan pada teori tes klasik adalah adanya sifat
group dependent
danitem dependent
(H am bleton, Swam inathan, & Rogers, 1991: 2-5), ju g a indeksdaya pem beda, tingkat kesulitan, dan koefisien reliabilitas tes ju g a tergantung
Untuk m engatasi kelem ahan-kelem ahan yang ada pada teori tes klasik, para ahli pengukuran m encari m odel alternatif. H am bleton, Sw am inathan, &
Rogers (1991: 2-5) serta H ulin, D rasgow , & Parsons (1983), m enyatakan
seharusnya m odel alternatif ini m em iliki sifat : (a) statistik butir tidak tergantung
pada kelom pok subjek, (b) skor tes dapat m enggam barkan kem am puan subjek, (c)
m odel dinyatakan dalam tingkatan butir, tidak dalam tingkatan tes, d) m odel tidak
m em erlukan tes paralel untuk m enghitung koefisien reliabilitas, dan e) m odel
m enyediakan ukuran yang tepat untuk setiap skor kem am puan. M odel alternatif
ini adalah m odel pengukuran yang disebut dengan teori respons butir
(Item
Response Theory).
B. Teori Respons Butir
H am bleton, Swam inathan, & Rogers (1991: 2-5) m enyatakan bahw a teori
respons butir didasarkan pada dua buah postulat, yaitu : (a) prestasi subjek pada
suatu butir soal dapat diprediksikan dengan seperangkat faktor yang disebut
kem am puan laten
(latent traits),
dan (b) hubungan antara prestasi subjek padasuatu butir soal dan perangkat kem am puan yang m endasarinya sesuai dengan
grafik fungsi naik m onoton tertentu, yang disebut kurva karakteristik butir
(item
characteristic curve, ICC).
K urva karakteristik butir ini m enggam barkan bahw asem akin tinggi level kem am puan peserta tes, sem akin m eningkat pula peluang
m enjaw ab benar suatu butir.
A da tiga m odel logistik dalam teori respons butir, yaitu m odel logistik satu
param eter (1 PL), m odel logistik dua param eter (2 PL), dan m odel logistik tiga
param eter yang digunakan dalam m enggam barkan karakteristik butir dalam m odel
yang digunakan. Param eter-param eter yang digunakan tersebut adalah indeks
kesukaran, indeks daya beda butir dan indeks tebakan semu
(pseudoguessing).
Sesuai dengan nam anya, m odel logistik tiga param eter ditentukan oleh tiga
karakteristik butir yaitu indeks kesukaran butir soal, indeks daya beda butir, dan
indeks tebakan sem u (
pseudoguessing
). D engan adanya indeks tebakan sem u padam odel logistik tiga param eter, m em ungkinkan subjek yang m em iliki kem am puan
rendah m em punyai peluang untuk m enjaw ab butir soal dengan benar. Secara
m atem atis, m odel logistik tiga param eter dapat dinyatakan sebagai berikut
(H am bleton, & Sw am inathan, 1985 : 49; H am bleton, Sw am inathan, & Rogers,
1991: 17).
( 1 - c . ) e D a i ( 6 - b i)
^ ( 0 ) = Q + 1 + gDai(6-6i)
K eterangan :
6
: tingkat kem am puan(ability)
peserta tesP (6) : probabilitas peserta tes yang m em iliki kem am puan 6 dapat m enjaw ab
butir i dengan benar
ai
: indeks daya pem bedabi
: indeks kesukaran butir ke-ici
: indeks tebakan sem u butir ke-ie
: bilangan natural yang nilainya m endekati 2,718K urva karakteristik butir soal yang dianalisis dengan m odel 3 param eter logistik yang m em iliki a = 1,00; b = 0,50; dan c = 0,13 ditunjukkan pada G am bar
1. G am bar ini m enunjukkan bahw a probabilitas m enjaw ab benar tidak beraw al
dari 0, tetapi beraw al dari 0,13. Jadi jaw aban yang sifatnya tebakan m em punyai
kem ungkinan benar 13,0%. D aya beda pada kurva karakteristik butir ditunjukkan
dengan kem iringan grafik yang ada. Sem akin vertikal kurva karakteristik suatu
butir soal, berarti butir soal tersebut sem akin bisa m em bedakan peserta pandai
atau kurang pandai.
</> c o Q. CO 0> cr <£>
o °
<D
O
0
1 5
.Qro
n
o
p d
l l l I l
-4 -2 0 2 4
Achievem ent Index (Theta)
G am bar 1. K urva K arakteristik B utir Soal dengan a = 1,00; b = 0,50; dan c = 0,13
M odel 2 param eter dan 1 param eter m erupakan bagian dari m odel 3
param eter. M odel 2 param eter m erupakan kasus khusus dari m odel 3 param eter,
yakni ketika c = 0. M odel 1 param eter m erupakan kasus khusus dari m odel 2
[image:12.595.145.460.335.553.2]tes. M odel 2 param eter logistik secara m atem atika dapat dirum uskan sebagai
sedagkan m odel 1 param eter logistik rumus m atem atikanya adalah sebagai
Estim asi param eter dapat dilakukan dengan m enggunakan bantuan
program kom puter. N ilai-nilai indeks param eter butir dan kem am puan peserta
m erupakan hasil estim asi. K arena m erupakan hasil estim asi, m aka kebenarannya
bersifat probabilistik dan tidak terlepaskan dengan kesalahan pengukuran. Dalam
teori respons butir, kesalahan pengukuran standar
(Standard Error o f
Measurement, SE)
berkaitan erat dengan fungsi inform asi.Fungsi inform asi dengan
SE
m em punyai hubungan yang berbandingterbalik kuadratik, sem akin besar fungsi inform asi m aka
SE
sem akin kecil atausebaliknya (H am bleton, Swam inathan, & Rogers, 1991, 94). Jika nilai fungsi inform asi dinyatakan dengan
I (
0 ) , nilai estim asi SE dinyatakan denganSE (0),dan
N
adalah jum lah butir yang ada, hubungan keduanya m enurut H am bleton,Swam inathan, & Rogers (1991 : 94) dan B aker (2001, 119) dinyatakan dengan
C. Kesimpulan
Teori tes klasik punya kelem ahan pada
group dependent
danitem
dependent
. Ini berarti indeks daya pem beda, tingkat kesulitan, dan koefisienberikut:
eDai(9-bi)
berikut:
g (0
b{)
reliabilitas tes tergantung kepada peserta tes yang m engerjakan tes tersebut, selain
dipengaruhi oleh soal atau butir soal yang ada. K arena itu indeks daya pem beda,
tingkat kesulitan, dan koefisien reliabilitas tes berbeda jik a soal yang sama
dikerjakan oleh dua kelom pok sisw a yang berbeda, m isalnya kelom pok siswa
yang pandai dan kelom pok sisw a yang kurang pandai.
Teori respons butir m engatasi m asalah tersebut. M aksudnya, hasil
perhitungan indeks kesukaran butir soal, indeks daya beda butir, dan indeks
tebakan sem u (
pseudoguessing
) akan m enghasilkan angka yang sam a m eskipunditerapkan pada kelom pok sisw a yang berbeda. Tetapi karena indeks param eter
butir dan kem am puan peserta m erupakan hasil estim asi, m aka kebenarannya
bersifat probabilistik dan m engandung kesalahan pengukuran. Tetapi karena bebas
dari
group dependent
danitem dependent,
teori respons butir dapat digunakanuntuk m engetahui karakteristik soal ata butir soal secara lebih m eyakinkan
DAFTAR PUSTAKA
A llen, M. J & Yen, W . M. (1979).
Introduction to measurement theory.
Belm ont:W adsw orth.
Bahrul H ayat, Sum arno S. Pranata, dan H erw indo H aribow o. (1999).
Manual item
and test analysis (ITEMAN).
Jakarta: Pusbang Sisjian Depdikbud.Ham bleton, R.K. & Swam inathan, H. (1985).
Item response theory.
Boston, MA: K luw er Inc.H am bleton, R.K ., Swam inathan, H., & Rogers, H.J. (1991).
Fundamental o f item
response theory.
N ew bury Park, CA: Sage Publication Inc.H ulin, C.L., D rasgow , F. & Parsons, C.K. (1983).
Item response theory:
Application to psychological measurement.
H om ew ood, IL: D ow Jones-Irwin.
M ehrens, W . A. & Lehm ann, I. J. (1973).