pengabdian masyarakat pengantar teori respons butir 25 maret 2010

(1)

K E M E N T E RIAN P E N DIDIK AN N AS ION AL

D IRE K T O RA T J E N D E R A L M A N A JE M E N P E N DIDIKAN DAS AR DAN ME N E N G A H D IRE K T O RA T P E MB IN AAN S E K O L A H ME N E N GAH P E RT AMA

Didik Suhardi, SH., M.Si.

NIP. 19631203 198303 1 004

Nomor: 0630/C3/KP/2010

Diberikan kepada

IKama

: <Dr

:

SamsuCjfadi, ‘M.Kpm

Vnit %erja

: VNYYogyakarta, %a6upaten SCeman

, ©./

Yogyakarta

JZtas partisipasi aktif se6agai

y/arasum6er

(PeCatihan Calon (Pe(atifi(Training o f drainer) 6agi Tun Pengembang Kjiri^uCum (Propinsi

yang diselenggarakan diInaSimpang - SuraSaya, JL (jubenurSuryo 1- 3, Sura6aya -Jawa 'Hmur

Jakarta, 25 Maret 2010

a.n. Direktur Jenderal

Manajemen Pendidikan Dasar dan Menengah

Direktur Pembinaan Sekolah Menengah Pertama

(2)

STRUKTUR PROGRAM

ToT Tim Pengembang Kurikulum (TPK) Propinsi Tahun 2010

NO. PROGRAM DAN MATERI JUMLAH JAM

A. PROGRAM UMUM

1

.

Kebijakan Direktorat Pembinaan SMP 2 JP

2. Ujian Nasional 2009/ 2010 2 JP

3. Karakteristik SMP Terbuka 3 JP

B. PROGRAM INTI

4. Identifikasi Materi UN yang Sulit Dikuasai Siswa 2 JP

5. Pengkajian dan Pendalaman Materi UN yang Sulit Dikuasai Siswa 8 JP

6. Penjabaran Kisi-Kisi UN 2009/ 2010 4 JP

7. Pengembangan dan Pembahasan Soal sesuai Kisi-Kisi UN

2009/ 2010 16 JP

8. Teori Respon Butir 2 JP

9. Praktik Analisis Soal dengan Pendekatan Teori Respon Butir 4 JP

10. Rancangan Bimbingan/ Pendampingan Teknis untuk Peningkatan

Rerata Nilai UN dan Angka Kelulusan SMP 4 JP

11. Pre & Post test 2 JP

12. Evaluasi Bimtek (Direktorat) 1 JP

(3)

PENGANTAR

TEORI RESPONS BUTIR

M ateri D isam paikan pada

Training o f Trainer

T im Pengem bang Propinsi

di H otel Ina Sim pang Surabaya 25 M aret 2010

Oleh:

Sam sul H adi

(Fakultas T eknik U niversitas N egeri Y ogyakarta)

Kementerian Pendidikan Nasional

Direktur Jenderal Manajemen Pendidikan Dasar dan Menengah

Direktorat Pembinaan Sekolah Menengah Pertama

(4)

PENGANTAR TEORI RESPONS BUTIR

Sam sul H adi

(Fakultas T eknik U niversitas N egeri Y ogyakarta)

A. Pendahuluan

Tes yang dilalukan oleh guru digunakan untuk m engetahui pencapaian

standar kom petensi lulusan atau turunannya berupa standar kom petensi,

kom petensi dasar, atau indikator dari suatu m ata pelajaran yang harus dikuasai

oleh siswa. Supaya tes dapat m engukur pencapaan kom petensi, m aka tes harus

dibuat m em enuhi validitas isi, yaitu butir-butir soal yang ada harus benar-benar

diturunkan dari standar kom petensi lulusan, standar kom petensi, kom petensi

dasar, atau indikator dari suatu m ata pelajaran.

Supaya tes m em enuhi validitas isi penyusunan butir soal diaw ali dengan

m engkaji standar kom petensi lulusan, standar kom petensi, kom petensi dasar, atau

indikator dari suatu m ata pelajaran. Berdasarkan kisi-kisi tersebut kem udian

dibuat butir-butir soal. B utir-butir soal yang sudah jad i kem udian dim inta untuk

ditelaah oleh pihak lain yang dianggap m am pu dengan m em perhatikan: m ateri,

konstruksi, dan bahasa yang digunakan dalam butir soal.

Telaah m ateri bertujuan untuk m elihat kesesuaian soal sudah sesuai

dengan indikator, kesesuaian m ateri soal dengan tuntutan kom petensi (urgensi,

relevansi, kontinyuitas, keterpakaian yang tinggi), dan kesesuaian m ateri dengan

jenjang jenis sekolah atau tingkat kelas. Telaah konstruksi bertujuan untuk

m enjam in bahw a soal telah dirum uskan dengan singkat, bebas dari pernyaatn

(5)

pernyataan yang m ulti interpretasi. Telaah bahasa dilakukan agar soal kom unikatif

dan sesuai dengan jenjang pendidikan sisw a serta m enggunakan bahasa Indonesia

yang baku.

H asil telaah m ateri, konstruksi, dan bahasa dijadikan m asukan perbaikan

terhadap butir soal yang ada. Setelah perbaikan dilakukan berdasarkan telaat

ketiga hal tersebut, soal siap diujicobakan kepada siswa. D ata yang diperoleh dari

hasil ujicoba perlu dianalisis untuk m engetahui karakteristik soal atau butir soal

secara em piris. A da dua pendekatan untuk m enganalisis data hasil ujicoba soal,

yaitu m enggunakan teori tes klasik dan m enggunakan teori respons butir.

A. Teori Tes Klasik

K ualitas tes atau butir soal penyusun tes yang baik dapat dilihat dari

karakteristikya. K arakteristik tes atau butir dapat diketahui dengan dua

pendekatan teori. K edua pendekatan tersebut yakni teori tes klasik dan teori

respons butir. Teori tes klasik, atau disebut ju g a teori tes skor m urni klasik,

didasarkan pada m odel aditif, yaitu skor am atan m erupakan penjum lahan dari

skor sebenarnya dan skor kesalahan pengukuran (Allen & Yen, 1979: 57).

Secara m atem atis pernyataan tersebut dapat dirum uskan sebagai berikut.

X = T + E

dengan :

X

: skor amatan,

T

: skor murni,

(6)

Kesalahan pengukuran dalam teori tes klasik m erupakan kesalahan yang tidak sistem atis atau acak. K esalahan pengukuran m erupakan penyim pangan

secara teoretis dari skor am atan yang diperoleh dengan skor am atan yang

diharapkan. K esalahan pengukuran yang sistem atis dianggap bukan m erupakan

kesalahan pengukuran.

A sum si-asum si yang m endasari teori tes klasik tersebut dijadikan dasar

untuk m engem bangkan rum us-rum us m atem atis untuk m engestim asi validitas dan

koefisien reliabilitas tes. V aliditas dan koefisien reliabilitas pada perangkat tes

digunakan untuk m enilai kualitas tes. K ualitas tes dalam teori tes klasik ju g a dapat

ditentukan dengan indeks kesukaran dan daya pem beda.

1. Tingkat Kesukaran

Tingkat kesukaran, disim bolkan dengan p , m erupakan salah satu

param eter butir soal yang sangat berguna dalam analisis soal. Tingkat kesukaran

dapat dihitung dengan berbagai cara, yaitu (a) skala kesukaran linear, (b) skala

bivariat, (c) indeks D avis, dan (d) proporsi m enjaw ab benar (B ahrul H ayat, dkk.,

1999). Secara m atem atis tingkat kesukaran yang dihitung dengan proporsi

m enjaw ab benar dirum uskan dengan:

I B

P =

—

dengan keterangan B adalah banyak peserta tes yang m enjaw a benar, dan N

jum lah peserta tes yang m enjaw ab. D engan rum us tersebut, m aka dapat diketahui

bahw a jik a p m endekati 0, m aka soal tersebut terlalu sukar, sedang jik a p

(7)

terlalu sukar tidak dapat m em bedakan kem am puan peserta tes sehingga perlu

dibuang.

M enurut A llen dan Y en (1979) tingkat kesukaran butir soal sebaiknya

antara 0,3 - 0,7. Pada rentang tersebut inform asi tentang kem am puan sisw a akan

diperoleh secara m aksim al. N am un angka tersebut perlu disesuaikan dengan

tujuan pengem bangan soal. Soal untuk keperluan seleksi, rem idi, atau ulangan

um um seharusnya m em punyai p yang berbeda-beda untuk m encapai tujuan yang

m aksim al.

2. Daya Beda

D aya beda m erupakan param eter butir soal yang m em berikan inform asi

tentang seberapa besar butir soal tersebut dapat m em bedakan peserta tes yang

skornya tinggi dan peserta tes yang skornya rendah. D aya beda dapat dihitung

dengan beberapa cara antara lain dengan m enghitung koefisien korelasi

point

biserial

dan koefisien korelasi

biserial.

K orelasi

point biserial

secara m atem atis

dirum uskan sebagai berikut.

Mp — Mq -

---rpbis

n Vp 9

^t

dim ana:

rpbis

: koefisien korelasi

point biserial

Mp

:

mean

skor pada tes dari peserta tes yang m em iliki jaw aban benar pada

butir soal

Mq

:

mean

skor pada tes dari peserta tes yang m em iliki jaw aban salah pada

(8)

p : proporsi peserta tes yang m enjaw ab benar pada butir soal

q : 1 - p

St : standar deviasi seluruh skor tes

K orelasi

biserial

secara m atem atis dinyatakan dengan rumus sebagai

berikut.

M

v

- M

t p

dengan keterangan

rbis

adalah koefisien korelasi

biserial, y

adalah ordinat p

dalam distribusi norm al, sedangkan sim bol lain sama dengan keterangan

sebelumnya. N ilai korelasi

point biserial

selalu lebih rendah dibanding dengan

nilai korelasi

biserial.

H ubungan antara keduanya dinyatakan dengan rumus:

y

rpbis rb is ■

i

---v p . q

3. Efektivitas Distraktor

Soal pilihan ganda perlu m em iliki pengecoh, yaitu jaw aban yang tidak

bernilai benar. Pengecoh perlu dibuat sedem ikian rupa sehingga m enarik

perhatian peserta tes yang belum m em iliki konsep yang baik terhadap m ateri yang

diujikan. A llen dan Y en (1979) m enyatakan bahw a pengecoh yang baik m inim um

berindeks 0,1 yang berupa koefisien korelasi point biserial, bernilai p o sitif untuk

kunci jaw aban dan bernilai negatif untuk pengecoh.

4. Kesalahan Pengukuran

K esalahan Pengukuran

(Standard Error o f Measurement,

SEM ) m em bantu

(9)

skor peserta tes. K esalahan pengukuran dihitung dengan rum us sebagai berikut

(B ahrul H ayat, dkk., 1999):

°

e_{= ° x V 1 — p xx'}

dengan keterangan

ox

adalah standar deviasi dari skor total dan p x x ' adalah

koefisien reliabilitas tes.

5. Reliabilitas Tes

R eliabilitas tes dapat diartikan sebagai keajegan atau konsistensi hasil

pengukuran atau hasil tes yang dilakukan pada w aktu yang berbeda pada subjek

yang sama. A llen dan Y en (1979) m enyatakan bahw a tes disebut reliabel jik a skor

am atan m em punyai korelasi yang tinggi dengan skor yang sebenarnya. M ereka

ju g a m enyatakan bahw a reliabilitas m erupakan koefisien korelasi antara dua skor

am atan yang diproleh dari hasil pengukuran m enggunakan tes yang paralel.

Reliabilitas suatu tes dapat dihitung dengan beberapa cara dan form ula.

Cara atau form ula belah dua, alfa (a ) Cronbach, G uttm an, dan paralel dapat

digunakan. N ilai hasil perhitungan dari form ula tersebut sering dikatakan sebagai

koefisien reliabilitas. M ehrens dan Lehm ann (1973) m enyatakan bahw a m eskipun

tidak ada ketentuan um um , tetapi secara luas dapat diterim a bahw a untuk tes yang

digunakan untuk m em buat keputusan secara perorangan harus m em iliki koefisien

reliabilitas m inim al 0,85.

K eterbatasan pada teori tes klasik adalah adanya sifat

group dependent

dan

item dependent

(H am bleton, Swam inathan, & Rogers, 1991: 2-5), ju g a indeks

daya pem beda, tingkat kesulitan, dan koefisien reliabilitas tes ju g a tergantung

(10)

Untuk m engatasi kelem ahan-kelem ahan yang ada pada teori tes klasik, para ahli pengukuran m encari m odel alternatif. H am bleton, Sw am inathan, &

Rogers (1991: 2-5) serta H ulin, D rasgow , & Parsons (1983), m enyatakan

seharusnya m odel alternatif ini m em iliki sifat : (a) statistik butir tidak tergantung

pada kelom pok subjek, (b) skor tes dapat m enggam barkan kem am puan subjek, (c)

m odel dinyatakan dalam tingkatan butir, tidak dalam tingkatan tes, d) m odel tidak

m em erlukan tes paralel untuk m enghitung koefisien reliabilitas, dan e) m odel

m enyediakan ukuran yang tepat untuk setiap skor kem am puan. M odel alternatif

ini adalah m odel pengukuran yang disebut dengan teori respons butir

(Item

Response Theory).

B. Teori Respons Butir

H am bleton, Swam inathan, & Rogers (1991: 2-5) m enyatakan bahw a teori

respons butir didasarkan pada dua buah postulat, yaitu : (a) prestasi subjek pada

suatu butir soal dapat diprediksikan dengan seperangkat faktor yang disebut

kem am puan laten

(latent traits),

dan (b) hubungan antara prestasi subjek pada

suatu butir soal dan perangkat kem am puan yang m endasarinya sesuai dengan

grafik fungsi naik m onoton tertentu, yang disebut kurva karakteristik butir

(item

characteristic curve, ICC).

K urva karakteristik butir ini m enggam barkan bahw a

sem akin tinggi level kem am puan peserta tes, sem akin m eningkat pula peluang

m enjaw ab benar suatu butir.

A da tiga m odel logistik dalam teori respons butir, yaitu m odel logistik satu

param eter (1 PL), m odel logistik dua param eter (2 PL), dan m odel logistik tiga

(11)

param eter yang digunakan dalam m enggam barkan karakteristik butir dalam m odel

yang digunakan. Param eter-param eter yang digunakan tersebut adalah indeks

kesukaran, indeks daya beda butir dan indeks tebakan semu

(pseudoguessing).

Sesuai dengan nam anya, m odel logistik tiga param eter ditentukan oleh tiga

karakteristik butir yaitu indeks kesukaran butir soal, indeks daya beda butir, dan

indeks tebakan sem u (

pseudoguessing

). D engan adanya indeks tebakan sem u pada

m odel logistik tiga param eter, m em ungkinkan subjek yang m em iliki kem am puan

rendah m em punyai peluang untuk m enjaw ab butir soal dengan benar. Secara

m atem atis, m odel logistik tiga param eter dapat dinyatakan sebagai berikut

(H am bleton, & Sw am inathan, 1985 : 49; H am bleton, Sw am inathan, & Rogers,

1991: 17).

( 1 - c . ) e D a i ( 6 - b i)

^ ( 0 ) = Q + 1 + gDai(6-6i)

K eterangan :

6

: tingkat kem am puan

(ability)

peserta tes

P (6) : probabilitas peserta tes yang m em iliki kem am puan 6 dapat m enjaw ab

butir i dengan benar

ai

: indeks daya pem beda

bi

: indeks kesukaran butir ke-i

ci

: indeks tebakan sem u butir ke-i

e

: bilangan natural yang nilainya m endekati 2,718

(12)

K urva karakteristik butir soal yang dianalisis dengan m odel 3 param eter logistik yang m em iliki a = 1,00; b = 0,50; dan c = 0,13 ditunjukkan pada G am bar

1. G am bar ini m enunjukkan bahw a probabilitas m enjaw ab benar tidak beraw al

dari 0, tetapi beraw al dari 0,13. Jadi jaw aban yang sifatnya tebakan m em punyai

kem ungkinan benar 13,0%. D aya beda pada kurva karakteristik butir ditunjukkan

dengan kem iringan grafik yang ada. Sem akin vertikal kurva karakteristik suatu

butir soal, berarti butir soal tersebut sem akin bisa m em bedakan peserta pandai

atau kurang pandai.

</> c o Q. CO 0> cr <£>

o °

<D

O

0

1 5

.Q_ro

n

o

p d

l l l I l

-4 -2 0 2 4

Achievem ent Index (Theta)

G am bar 1. K urva K arakteristik B utir Soal dengan a = 1,00; b = 0,50; dan c = 0,13

M odel 2 param eter dan 1 param eter m erupakan bagian dari m odel 3

param eter. M odel 2 param eter m erupakan kasus khusus dari m odel 3 param eter,

yakni ketika c = 0. M odel 1 param eter m erupakan kasus khusus dari m odel 2

[image:12.595.145.460.335.553.2]

(13)

tes. M odel 2 param eter logistik secara m atem atika dapat dirum uskan sebagai

sedagkan m odel 1 param eter logistik rumus m atem atikanya adalah sebagai

Estim asi param eter dapat dilakukan dengan m enggunakan bantuan

program kom puter. N ilai-nilai indeks param eter butir dan kem am puan peserta

m erupakan hasil estim asi. K arena m erupakan hasil estim asi, m aka kebenarannya

bersifat probabilistik dan tidak terlepaskan dengan kesalahan pengukuran. Dalam

teori respons butir, kesalahan pengukuran standar

(Standard Error o f

Measurement, SE)

berkaitan erat dengan fungsi inform asi.

Fungsi inform asi dengan

SE

m em punyai hubungan yang berbanding

terbalik kuadratik, sem akin besar fungsi inform asi m aka

SE

sem akin kecil atau

sebaliknya (H am bleton, Swam inathan, & Rogers, 1991, 94). Jika nilai fungsi inform asi dinyatakan dengan

I (

0 ) , nilai estim asi SE dinyatakan denganSE (0),

dan

N

adalah jum lah butir yang ada, hubungan keduanya m enurut H am bleton,

Swam inathan, & Rogers (1991 : 94) dan B aker (2001, 119) dinyatakan dengan

C. Kesimpulan

Teori tes klasik punya kelem ahan pada

group dependent

dan

item

dependent

. Ini berarti indeks daya pem beda, tingkat kesulitan, dan koefisien

berikut:

eDai(9-bi)

berikut:

g (0

b{)

(14)

reliabilitas tes tergantung kepada peserta tes yang m engerjakan tes tersebut, selain

dipengaruhi oleh soal atau butir soal yang ada. K arena itu indeks daya pem beda,

tingkat kesulitan, dan koefisien reliabilitas tes berbeda jik a soal yang sama

dikerjakan oleh dua kelom pok sisw a yang berbeda, m isalnya kelom pok siswa

yang pandai dan kelom pok sisw a yang kurang pandai.

Teori respons butir m engatasi m asalah tersebut. M aksudnya, hasil

perhitungan indeks kesukaran butir soal, indeks daya beda butir, dan indeks

tebakan sem u (

pseudoguessing

) akan m enghasilkan angka yang sam a m eskipun

diterapkan pada kelom pok sisw a yang berbeda. Tetapi karena indeks param eter

butir dan kem am puan peserta m erupakan hasil estim asi, m aka kebenarannya

bersifat probabilistik dan m engandung kesalahan pengukuran. Tetapi karena bebas

dari

group dependent

dan

item dependent,

teori respons butir dapat digunakan

untuk m engetahui karakteristik soal ata butir soal secara lebih m eyakinkan

(15)

DAFTAR PUSTAKA

A llen, M. J & Yen, W . M. (1979).

Introduction to measurement theory.

Belm ont:

W adsw orth.

Bahrul H ayat, Sum arno S. Pranata, dan H erw indo H aribow o. (1999).

Manual item

and test analysis (ITEMAN).

Jakarta: Pusbang Sisjian Depdikbud.

Ham bleton, R.K. & Swam inathan, H. (1985).

Item response theory.

Boston, MA: K luw er Inc.

H am bleton, R.K ., Swam inathan, H., & Rogers, H.J. (1991).

Fundamental o f item

response theory.

N ew bury Park, CA: Sage Publication Inc.

H ulin, C.L., D rasgow , F. & Parsons, C.K. (1983).

Item response theory:

Application to psychological measurement.

H om ew ood, IL: D ow Jones-

Irwin.

M ehrens, W . A. & Lehm ann, I. J. (1973).

pengabdian masyarakat pengantar teori respons butir 25 maret 2010

K E M E N T E RIAN P E N DIDIK AN N AS ION AL

Didik Suhardi, SH., M.Si.

JZtas partisipasi aktif se6agai

y/arasum6er

(PeCatihan Calon (Pe(atifi(Training o f drainer) 6agi Tun Pengembang Kjiri^uCum (Propinsi

Jakarta, 25 Maret 2010

B. PROGRAM INTI

PENGANTAR

PENGANTAR TEORI RESPONS BUTIR

A. Teori Tes Klasik

1. Tingkat Kesukaran

2. Daya Beda

point

biserial

4. Kesalahan Pengukuran

group dependent

Response Theory).

characteristic curve, ICC).

pseudoguessing

(Standard Error o f

group dependent

pseudoguessing

group dependent

and test analysis (ITEMAN).

Measurement and evaluation in