PENYETARAAN SEKOR ANTARA DUA PERANGKAT TES BAHASA INGGRIS DENGAN DESAIN BUTIR ANCHOR BERSAMA
TESIS
Diajukan untuk Memenuhi Sebagian dari Syarat untuk Memperoleh Gelar Magister Pendidikan Program Studi Penelitian dan Pengukuran Pendidikan
Oleh
DESI SUSANTI 1202654
SEKOLAH PASCASARJANA
UNIVERSITAS PENDIDIKAN INDONESIA
PENYETARAAN SEKOR ANTARA DUA PERANGKAT TES BAHASA INGGRIS DENGAN DESAIN BUTIR ANCHOR BERSAMA
Oleh: Desi Susanti
Sarjana Pendidikan Universitas PGRI Palembang, 2005
Sebuah Tesis yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Magister Pendidikan (M.Pd.) pada Program Studi Penelitian dan Pengukuran
Pendidikan
© Desi Susanti 2014 Universitas Pendidikan Indonesia
Juli 2014
Hak Cipta dilindungi undang – undang
Tesis ini tidak boleh diperbanyak seluruhnya atau sebagian
LEMBAR PENGESAHAN
Disetujui dan disahkan oleh pembimbing:
Pembimbing,
Prof. DR. H. Asmawi Zainul, M.Ed.
Mengetahui,
Ketua Program Studi Penelitian dan Pengukuran Pendidikan
PENYETARAAN SEKOR ANTARA DUA PERANGKAT TES BAHASA INGGRIS DENGAN DESAIN BUTIR ANCHOR BERSAMA
DESI SUSANTI 1202654
ABSTRAK
Penelitian ini bertujuan untuk (1) menganalisis karakteristik dari dua perangkat tes bahasa inggris (2) menemukan rumusan persamaan konversi yang digunakan untuk menyetarakan sekor-sekor dari dua perangkat tes yang berbeda hingga menghasilkan sekor yang setara. Metode yang di gunakan dalam penelitian ini adalah deskriptif exploratif, variabel bebas adalah metode penyetaraan linier dan variabel terikat sekor hasil penyetaraan. Instrumen yang digunakan adalah dua perangkat tes dengan pilihan ganda sebanyak 35 butir soal pada mata pelajaran Bahasa Inggris untuk siswa SMA kelas XI, di mana dua perangkat tes mengandung butir anchor yang menyebar di antara kedua perangkat tes tersebut. Data penelitian berupa skor siswa kelas XI SMA di kabupaten Bangka Tengah, yang diambil menggunakan teknik penarikan sampel yaitu cluster random
sampling sebanyak 200 orang siswa untuk setiap instrumen penelitian. Desain
yang digunakan dalam penyetaraan ini adalah desain common item nonequivalent
groups. Dari hasil analisis data di dapat rumusan persamaan konversi sekor yaitu
Y*=0,94(X-51,82)+49,08 dan X*=1,15(Y-49,1)+51. Berdasarkan hasil penyetaraan sekor dengan rumusan persamaan konversi ini di dapatkan sekor-sekor tes siswa yang setara.
THE EQUITING OF SCORES
BETWEEN TWO OF INSTRUMENT ENGLISH TEST BY ANCHOR INTERNAL ITEM DESIGN
DESI SUSANTI 1202654
ABSTRACTS
This research was aimed to analyze the characteristics of two instrument English test (2) to find the conversion formula of equiting were used to equite the scores came from two of different instrument test until produced an equivalent scores. The method of study was descriptive exploratory. The independent variable was a
linear equiting method and the dependent variable was score’s result from
equiting. The instruments of the study were two of instruments with multiple-choice tests as many as 35 items on the subjects of English for the high school students of class XI, in which two of device test contains of anchor items were spread between both the device test. The data of research data was score of the high school students in Central Bangka regency, which was taken using sampling techniques, namely cluster random sampling as many as 200 students for each instrument. The design was used in this equiting was a common item nonequivalent groups design. From the analysis of data obtained the score conversion formula equation is Y * = 0.94 (X-51, 82) +49.08 and X * = 1.15 (Y-49, 1) +51. Based on the results of the equiting using the conversion formula was found that the equivalent of score test.
DAFTAR ISI
B. Identifikasi Masalah ... 7
C. Pembatasan Masalah ... 8
D. Rumusan Masalah ... 8
E. Tujuan Penelitian ... 9
F. Manfaat Penelitian ... 9
BAB II PENYUSUNAN KERANGKA TEORITIK, KERANGKA BERPIKIR DAN PENGAJUAN HIPOTESIS
8. Rancangan Penyetaraan Sekor ... 22
a. Rancangan A ... 24
b. Rancangan B ... 24
c. Rancangan C ... 25
9. Metode Penyetaraan Sekor ... 27
a. Penyetaraan Linier Rancangan A ... 28
b. Penyetaraan Linier Rancangan B ... 29
c. Penyetaraan Linier Rancangan C dan D ... 29
10.Butir Anchor ... 30
B. Penelitian Yang Relevan ... 32
BAB III METODE PENELITIAN
F. Rancangan Prosedur Penelitian ... 36
G. Teknik Pengumpulan Data ... 38
H. Teknik Analisis Data ... 38
1. Menghitung Reliabilitas ... 38
2. Tingkat Kesukaran ... 38
3. Daya Pembeda ... 39
4. Penyetaraan Sekor ... 40
BAB IV HASIL PENELITIAN DAN PEMBAHASAN A. Deskripsi Data ... 41
1. Deskripsi Data Responden ... 41
a. Sekor Hasil Tes Siswa pada Instrumen X ... 41
b. Sekor Hasil Tes Siswa pada Instrumen Y ... 42
2. Deskripsi Karakteristik Instrumen Tes ... 44
a. Reliabilitas ... 44
b. Taraf kesukaran Butir Soal... 44
c. Daya Beda ... 48
B. Deskripsi Data Hasil Penyataraan ... 52
C. Pembahasan Hasil Penelitian ... 53
1. Pembahasan Karakteristik perangkat tes ... 53
2. Pembahasan Penyetaraan Sekor ... 54
BAB V KESIMPULAN DAN SARAN A. Kesimpulan ... 56
B. Saran dan Rekomendasi ... 57
BAB 1 PENDAHULUAN
A. LATAR BELAKANG MASALAH
Pengukuran merupakan suatu proses pemberian angka kepada suatu atribut
atau karakteristik tertentu yang dimiliki oleh orang, hal atau objek tertentu
menurut aturan atau formulasi yang jelas. Berdasarkan pandangan tersebut,
tampak bahwa semua kegiatan didunia ini tidak bisa lepas dari pengukuran.
Keberhasilan suatu program dapat diketahui melalui suatu pengukuran, begitu
juga perkembangan ilmu pengetahuan dan teknologi. Penelitian-penelitian yang
dilakukan dalam semua bidang selalu melibatkan kegiatan pengukuran, baik yang
bersifat kualitatif maupun kuantitatif. Oleh karena itu, pengukuran memegang
peranan penting, baik untuk pengembangan ilmu pengetahuan dan teknologi
maupun untuk penyajian informasi bagi pembuat kebijakan (Mardapi, 2008:2).
Pada dasarnya pengukuran merupakan kegiatan penentuan angka bagi
suatu objek secara sistematik. Penentuan angka ini merupakan usaha untuk
menggambarkan karakteristik suatu objek. Kemampuan seseorang dalam bidang
tertentu dinyatakan dengan angka. Kesalahan yang terjadi pada pengukuran
ilmu-ilmu sosial biasanya disebabkan oleh alat ukur, cara mengukur dan keadaan objek
yang diukur. Masalah evaluasi hasil belajar meliputi alat ukur yang digunakan,
cara menggunakan, cara penilaian dan evaluasinya.
Pengukuran yang tepat dapat memberikan informasi yang akurat mengenai
penguasaan seseorang atau sekelompok orang terhadap materi yang dipelajari, dan
informasi itu berguna untuk mengambil sebuah keputusan. Kesahihan alat ukur
dapat dilihat dari konstruk alat ukur, yaitu mengukur seperti yang direncanakan.
Alat ukur yang baik memberi hasil yang konstan bila digunakan berulang-ulang,
asalkan kemampuan yang diukur tidak berubah. Pengukuran hasil belajar di
sekolah dilakukan dengan menggunakan alat ukur yaitu berupa instrumen yang
2
Tes sebagai alat bantu mengukur berisikan serangkaian pertanyaan atau
tugas yang harus dijawab, dikerjakan atau dilaksanakan oleh responden yang dites
(Susetyo,2011:2). Kemampuan kognitif seseorang atau sekelompok diketahui
melalui tes prestasi belajar. Tes prestasi belajar memuat butir-butir soal yang
disusun untuk mengukur kemampuan siswa terhadap materi pelajaran yang
diberikan. Hasil tes merupakan informasi tentang karakteristik seseorang atau
sekelompok orang. Tes merupakan salah satu cara untuk menaksir besarnya
tingkat kemampuan siswa secara langsung, yaitu melalui respon siswa terhadap
sejumlah stimulus atau pertanyaan. Oleh karena itu agar diperoleh informasi yang
akurat dibutuhkan tes yang handal (Rasyid dan Mansur, 2007:9).
Supaya hasil dari pengukuran tersebut menggambarkan yang
sesungguhnya, maka dalam pengelolaannya dan termasuk penyelenggaraanya
harus dilakukan secara profesional, akurat, objektif dan adil. Rendahnya mutu
pendidikan berhubungan dengan rendahnya hasil belajar, dan berhubungan pula
dengan kemampuan guru dalam melaksanakan proses pembelajaran serta
membuat evaluasi belajar. Guru merasa kurang terampil dalam menyusun tes hasil
belajar yang benar dan bermakna (Supriyati, 2003:4).
Kenyataan yang dihadapi sekarang tes yang dipergunakan di sekolah saat
ini pada umumnya dibuat oleh guru. Masih banyak guru tidak mengetahui
prosedur pembuatan tes yang baik. Kebanyakan tes disusun dalam jangka waktu
yang sangat singkat bahkan ada juga yang mengadopsi langsung butir-butir tes
yang telah tersedia dibuku panduan belajar, dan perangkat tersebut langsung
diberikan sebagai perangkat tes untuk melakukan evaluasi baik sumatif maupun
formatif, tidak menutup kemungkinan alat tes yang digunakan oleh guru sebagai
evaluasi tidak dapat mengukur apa yang sebenarnya akan diukur.
Kesalahan pengukuran ini mengakibatkan kekeliruan dalam pengambilan
keputusan, maka dalam melaksanakan evalusi pembelajaran guru memerlukan alat
ukur yang dapat mengukur dengan tepat keberhasilan siswa dalam pembelajaran.
Hasil tes yang diperolah dengan cara tidak adil, tidak dapat memberikan informasi
untuk mengetahui prestasi siswa yang sebenarnya, dan hasil tes seperti itu dapat
3
Oleh karena itu guru harus mempersiapkan perangkat tes yang sahih dan
terandal untuk mengukur keberhasilan belajar siswa. Seorang tenaga pengajar
haruslah mengetahui dasar-dasar penyusunan tes prestasi belajar yang baik agar
dapat memperoleh hasil ukur yang akurat (valid) dan dapat dipercaya (reliabel).
Mereka harus pula mengetahui aspek-aspek penggunaannya yang layak di kelas,
mengetahui cara-cara pemberian angka, dan yang paling penting adalah
mengetahui pula cara interpretasi hasil pengukuran tersebut (Azwar, 1987:9).
Dalam penyelenggaraan evaluasi hasil belajar, guru terkadang mendapat
kesulitan untuk menyelenggarakan tes, diantaranya tes formatif dan sumatif.
Permasalahannya adalah guru memiliki kelas pararel yang cukup banyak.
Contohnya Tes formatif biasanya diselenggarakan sesuai dengan jam pelajaran
masing-masing. Jika hanya menggunakan satu instrumen saja tidak menutup
kemungkinan saling mencontek dan kebocoran soal antar sesama murid tidak
dapat dihindari. Maka untuk menghindari situasi demikian para guru membuat
lebih dari satu perangkat tes yang tujuannya untuk mengatasi permasalahan
tersebut. Perangkat-perangkat tes yang lebih dari satu tersebut dibuat dari kisi-kisi
yang sama dan untuk mengukur tingkat kemampuan yang sama, namun tidak
menutup kemungkinan memiliki karakteristik soal yang berbeda yaitu dari segi
validitas, reliabilitas soal, tingkat kesukaran maupun daya pembedanya.
Menurut Hambleton yang dikutif oleh Rustam (2000) Sebenarnya tidak
pernah dua perangkat atau lebih mempunyai item yang sama tingkat
kesukarannya. Maka dalam hal ini ada siswa yang dirugikan karena mengerjakan
soal yang sulit, ada juga siswa yang beruntung karena mendapatkan soal yang
mudah. Malahan hasil sekor-sekor dari evaluasi tersebut diperbandingkan untuk
menentukan prestasi siswa atau penentuan kenaikan kelas, hal ini merupakan hal
yang tidak adil maka pemberian nilai terhadap hasil belajar siswa tidak
mencerminkan prestasi yang sebenarnya.
Jika permasalahan ini dibiarkan berlarut-larut tanpa ditanggulangi maka
sistem evaluasi yang digunakan oleh para pendidik sebagai pembuat keputusan
atas prestasi siswa memiliki kecacatan. Jadi perlu ada terobosan yang bisa
4
Sudah saatnya para penerima didikan mendapatkan perlakuan yang adil yang bisa
mencerminkan dan menentukkan prestasi yang telah menjadi hak mereka. Untuk
mendapatkan informasi yang adil bagi setiap siswa selain diperlukan alat ukur
yang baik juga proses perhitungan sekor tes yang baik. Pendapat Setiadi yang
dikutip oleh Supriyati (2003:7) bahwa alat ukur yang baik meliputi perangkat tes
yang dapat mengestimasi kemampuan seseorang dengan kesalahan pengukuran
yang sekecil-kecilnya.
Proses perhitungan sekor tes yang baik adalah suatu proses yang mana
seluruh siswa bisa mendapatkan perlakuan yang adil dari hasil evaluasi tersebut.
Lagi pula proses ini dapat mengukur prestasi yang sebenarnya sesuai dengan
kemampuan siswa dan dapat membedakan yang mana siswa yang pandai atau
yang tidak. Untuk mengatasi permasalahan didalam pemberian sekor tes yang
adil maka dapat dilakukan cara melakukan penyetaraan sekor, yaitu menyetarakan
sekor-sekor tes yang didapat dari kedua perangkat atau lebih yang berbeda
Penyetaraan sekor merupakan proses secara statistik untuk menentukan
hubungan antar skala sekor dari dua atau lebih tes agar sekor-sekor tersebut
diperlakukan secara adil (Weiss, 1983:147). Dengan melalui proses penyetaraan
sekor maka peserta tes tidak merasa dirugikan atau diuntungkan karena
mendapatkan perangkat tes yang sulit atau mudah. Penyetaraan sekor ini
memberlakukan pensekoran yang dapat mengestimasi kesalahan pengukuran
sekecil-kecilnya. Menggunakan penyetaraan sekor dapat memberikan informasi
hasil tes yang objektif, artinya siswa yang pandai hendaknya mendapatkan sekor
lebih tinggi daripada siswa yang berkemampuan sedang dan rendah (Supriyati,
2003:13).
Dalam pengukuran tes klasik penyetaraan sekor terdapat dua arah yaitu
penyetaraan horizontal dan vertikal. Penyetaraan horizontal dilakukan untuk
mengukur responden yang setara dan juga atribut yang setara, sementara
penyetaraan vertikal dilakukan untuk mengukur responden yang tidak setara
(Dali, 2012:350). Sesuai permasalahan yang telah diuraikan diatas maka
5
Didalam penyetaraan sekor tes horizontal terdapat beberapa rancangan
yang dapat dipakai dalam menyamakan sekor yaitu penyetaraan pada kelompok
tunggal, kelompok bersama dan kelompok butir anchor. Rancangan yang cukup
cermat dalam mengatasi kelas pararel yang banyak yaitu dengan rancangan
kelompok butir anchor. Pada rancangan ini perangkat tes yang lebih dari satu
dikemas secara pararel dengan butir anchor. Butir anchor yang dimaksud adalah
dimana terdapat butir yang sama dibeberapa perangkat tes tersebut dan berbaur
dengan butir yang non anchor. Belum bisa dipastikan dengan jelas berapa jumlah
anchor yang dapat digunakan pada perangkat-perangkat tes tersebut. Namun
sekor-sekor yang berasal dari perangkat tes yang berbeda harus berasal dari
perangkat tes yang memiliki reabilitas yang sama merata, dan juga taraf kesukaran
yang merata (Dali, 1992:347). Jadi sebelum dilakukan penyetaraan sekor pada
penelitian ini perlu peninjauan terhadap karakteristik kedua instrumen tersebut
yang meliputi reliabilitas, tingkat kesukaran dan daya beda.
Dalam penyetaraan sekor secara klasik terdapat dua metode penyetaraan
diantaranya adalah metode penyetaraan linier dan metode penyetaraan
ekipersentil. Metode penyetaraan secara linier hubungan sekor setara dan sekor
asal linier. Pada penyetaraan secara ekipersentil, peringkat secara persentil pada
sekor setara disamakan dengan peringkat persentil pada sekor asal sehingga
hubungan mereka menjadi pada umumnya nonlinier (Dali, 2012:356). Penelitian
ini terfokus hanya pada metode penyetaraan linier. Menurut Weiss (1983,148)
asumsi penyetaraan dengan cara linier adalah sekor tes distribusinya berbeda,
distribusi tersebut terkait dengan rerata dan simpangan bakunya.
Kebutuhan akan betapa pentingnya penyetaraan sekor memang telah lama
disadari dan sangat bermanfaat untuk dikembangkan dalam pengukuran
pendidikan. Namun karena pemikiran dan penelitian terhadap penyetaraan sekor
ini yang masih sangat terbatas. Adapun beberapa penelitian-penelitian yang
telah ada sekarang ini kebanyakan penyetaraan sekor hanya dilakukan dalam
ruang lingkup pengukuran dalam pembelajaran sain saja, jarang sekali atau
bahkan belum ditemukan penelitian penyetaraan sekor dalam pengukuran
6
Seharusnya penyetaraan sekor ini harus bisa diterapkan dalam pengukuran
pendidikan semua bidang ilmu. Diantara beberapa penelitian tersebut melakukan
penyetaraan sekor terhadap perangkat-perangkat tes untuk menemukan persamaan
konversinya.
Diantaranya seperti Rustam (2000) meneliti penyetaraan terhadap
perangkat tes Matematika, dari hasil penelitiannya ditemukan suatu formula
penyetaraan terhadap dua perangkat tes program D2 UT untuk wilayah kota
Bogor dan Bandar Lampung. Selanjutnya Syahril (1998) yang mana dari hasil
penelitiannya menunjukkan dari beberapa perangkat tes Kimia SMU untuk
kotamadya Banjarmasin sebelum dilakukan penyetaraan memiliki tingkat
kesukaran yang berbeda maka harus beberapa perangkat tersebut harus dilakukan
kesetaraan sekor untuk menentukan prestasi siswa.
Berpijak dari beberapa penelitian-penelitian yang telah ada ini lah maka
peneliti tertarik untuk melakukan pengukuran terhadap kedua perangkat tes
Bahasa Inggris yang berbeda dalam bentuk penyetaraan sekor. Mengingat
penelitian-penelitian mengenai penyetaraan sekor sebelumnya diteliti banyak
dalam pengukuran pelajaran sain dan sangat jarang ditemukan dalam pengukuran
pada bidang ilmu bahasa. Maka sesuai dengan latar belakang peneliti seorang
guru Bahasa Inggris maka dalam penelitian ini pelajaran Bahasa Inggris yang
7
B. IDENTIFIKASI MASALAH
Berdasarkan paparan yang telah dikemukakan didalam latar belakang
masalah diatas dapat diidentifikasikan diantaranya adalah:
1. Bahwa tes yang digunakan di sekolah-sekolah pada umumnya dibuat oleh
guru. Namun, masih banyak para guru kurang mengetahui prosedur
pembuatan tes yang baik.
2. Bahwa kebanyakan alat evaluasi yang digunakan oleh guru disusun dalam
waktu yang sangat singkat bahkan mengadopsi dari buku panduan belajar
tanpa dianalisis terlebih dahulu, dan langsung diberikan kepada siswa sebagai
tes sumatif dan formatif untuk menentukkan keberhasilan peserta didiknya.
3. Bahwa guru sering mendapatkan kesulitan dalam menyelenggarakan tes
formatif atau tes sumatif karena memiliki kelas pararel yang begitu banyak.
Kalau hanya memiliki satu instrumen saja maka saling mencontek dan
kebocoran soal antar murid tidak dapat dihindari. Untuk mengatasi hal
tersebut guru membuat tes lebih dari satu perangkat tes.
4. Bahwa perangkat-perangkat tes yang dibuat lebih dari satu tidak menutup
kemungkinan memiliki karakterisitik yang berbeda dari segi reliabilitas,
validitas, tingkat kesukaran dan juga daya pembedanya.
5. Bahwa sekor-sekor dari perangkat tes yang berbeda jika diperbandingkan
sebagai penentuan prestasi peserta didik maka akan memberikan perlakuan
yang tidak adil.
6. Bahwa penyetaraan sekor pada saat ini banyak dilakukan dalam pengukuran
pembelajaran sains, sangat sulit ditemukan penyetaraan sekor dalam
8
C. PEMBATASAN MASALAH
Dari yang telah dikemukakan didalam indentifikasi masalah penelitian
mengingat begitu banyak permasalahan yang muncul terhadap evaluasi
pembelajaran. Maka penelitian ini dibatasi pada pengukuran hasil belajar siswa
terhadap sekor yang berasal dari kedua perangkat tes yang berbeda dikategorikan
dengan perangkat tes (X) dan perangkat tes (Y). Dimana kedua perangkat tes ini
disusun secara pararel dan memiliki butir anchor (internal).
Butir anchor yang dimaksud adalah butir yang sama yang mana menyebar
diantara kedua perangkat tes tersebut. Perangkat tes yang dimaksud adalah
perangkat tes Bahasa Inggris yang dibuat dalam bentuk pilihan ganda dengan lima
pilihan jawaban. Sebelum dilakukan proses penyetaraan perlu peninjauan
terhadap karakteristik kedua instrumen tersebut atau dianalisis untuk menentukan
bagaimana reliabilitas, tingkat kesukaran dan daya pembeda dari perangkat tes.
Dan juga akan dianalisis tingkat kesukaran dan daya pembeda dari butir anchor
tersebut.
Skor-skor mentah yang dihasilkan dari kedua perangkat tes yang berbeda
itu dikonversikan dengan penyetaraan sekor dengan arah penyetaraan horizontal
dalam metode penyetaraan linier dan menggunakan rancangan common item
nonequivalent groups design.
D. PERUMUSAN MASALAH
Berdasarkan pembatasan masalah diatas maka dapat dirumuskan sebagai
berikut:
1. Bagaimanakah karakteristik kedua perangkat tes Bahasa Inggris X dan Y
tersebut ?
2. Bagaimanakah persamaan atau rumusan konversi penyetaraan sekor dari
9
E. TUJUAN PENELITIAN
Adapun tujuan dari penelitian ini adalah untuk:
1. Menganalisikan karakteristik dari kedua perangkat tes Bahasa Inggris X dan
Y.
2. Menemukan persamaan konversi penyetaraan sekor dari dua perangkat tes
Bahasa Inggris X dan Y.
F. MANFAAT PENELITIAN
Secara teoritis, hasil penelitian ini diharapkan dapat memberikan
kontribusi yang menyangkut pengukuran dan evaluasi pendidikan. Hasil
penelitian ini juga dapat digunakan sebagai masukan awal bagi peneliti-peneliti
lanjutan sebagai bahan kajian untuk mengelaborasi lebih mendalam terhadap
variabel yang diteliti, meskipun sedikit hasil penelitian ini dapat memberikan
sumbangan. Secara praktis, hasil penelitian ini dapat menjadi masukan bagi para
guru-guru bidang studi yang memiliki kelas pararel dalam menyelenggarakan tes,
agar dapat membuat tes yang benar-benar mengukur kemampuan siswa yang bisa
membedakan antara siswa yang pandai dan tidak pandai. Selain itu dengan
penyetaraan sekor dapat memberikan penilaian yang akurat dan memberikan
BAB V
KESIMPULAN DAN SARAN
A. Kesimpulan
Berdasarkan hasil penelitian dan pembahasan yang telah dikemukakan
bahwa kedua instrumen X dan Y memiliki karakteristik soal yang tidak sama,
baik dari tingkat kesukaran dan juga daya pembeda. Kedua instrumen ini
mempunyai data empiris yang cukup baik karena mempunyai tingkat kesukaran
rata-rata sedang, dan memiliki kemampuan sedang untuk membedakan antara
siswa yang pandai dan tidak pandai. Sementara butir anchor yang tersebar dari
kedua perangkat tes X dan Y, berfungsi dengan cukup baik dan berkategori
sedang, baik dari tingkat kesukaran dan daya pembeda. Dilihat dari koefisien
reliabilitas kedua instrumen ini memiliki tingkat keajegan yang cukup tinggi yaitu
0,84 untuk instrumen X dan 0,87 untuk instrumen Y. Dapat disimpulkan bahwa
kedua instrumen ini memiliki koefisien reliabilitas yang tidak terlalu berbeda,
karena sama-sama memiliki nilai reliabilitas yang tinggi.
Persamaan atau formula konversi sekor dari dua perangkat tes Bahasa
Inggris yaitu instrumen X adalah Y*=0,94(X-51,82)+49,08 dan sebaliknya
instrumen Y adalah X*=1,15(Y-49,1)+51. Berdasarkan dari hasil penyetaraan
sekor dengan rumusan persamaan konversi ini didapatkan sekor-sekor tes siswa
yang setara. Dapat disimpulkan bahwa instrumen Y cukup sukar dibandingkan
dengan instrumen X, sebab dari proses perhitungan penyetaraan menggunakan
formula persamaan konversi ini atau menggunakan formula dari X ke Y* tersebut
menunjukkan bahwa sekor yang berasal dari instrumen X setelah sekor tersebut
disetarakan akan mengalami penurunan sekor. Begitu juga sebaliknya dari Y ke
X* sekor yang berasal dari instrumen Y, ketika disetarakan akan mengalami
57
B. Saran
Berdasarkan pembahasan dan kesimpulan yang telah diuraikan
sebelumnya, ada beberapa saran yang perlu disampaikan yang berhubungan
dengan penyetaraan sekor dan juga hasil penelitian.
1. Peneliti mengharapkan hasil penelitian ini dapat memberikan masukan yang
baik bagi semua unsur yang berperan penting dalam bidang pendidikan
dimana masalah penyetaraan sekor merupakan hal yang penting untuk
dilakukan oleh guru-guru disekolah.
2. Usaha untuk melakukan penyetaraan sekor perlu dimulai dan dilakukan oleh
sekolah-sekolah, baik mandiri maupun secara bersama-sama mengingat tren
sekarang banyak sekali para pendidik ketika melakukan evaluasi membuat
lebih dari satu perangkat tes.
3. Bagi peneliti lanjutan yang tertarik meneliti dalam bidang pengukuran
pendidikan, disarankan untuk bisa menindaklanjuti penelitian ini yang
berhubungan dengan penyetaraan sekor, menggali lebih dalam lagi terkait
dengan metode penyetaraan dengan melibatkan variabel-variabel lain yang
DAFTAR PUSTAKA
Ali, Mohammad.2011. Memahami Riset Prilaku dan Sosial. Bandung: Pustaka
Cendikia Utama.
Anastasi, Anne and Susan Urbina.1997. Psychological Testing. New Jersey:
Prentice-Hall, Inc Company.
Azwar, Syaifuddin.1987. Tes Prestasi Fungsi dan Pengembangan Pengukuran
Prestasi Belajar. Yogyakarta: Pustakan Pelajar offset.
Azwar, Syaifuddin.1999. Dasar-Dasar Psikometri. Yogyakarta: Pustakan Pelajar
offset.
Azwar, Syaifuddin.2001. Reliabilitas dan Validitas. Yogyakarta: Pustakan
Pelajar offset.
Borg, Walter R and Meredith Damien Gall.1989. Educational Research: An
Introduction Fifth Edition. New York: Longman.
Brata, Sumadi Surya.2002.Pengembangan dan Alat Ukur Psikologis.
Yogyakarta:Andi.
Crocker, Linda and James Algina.1986. Introduction to Classical and Modern
Test Theory. USA: Rinehartand Winston Inc.
Dorans, Neil J, Tim P Moses and Daniel R Eighnor.2010. Research Report:
Principles and Practices of Test Score Equating.
Princeton,NewJersey:ETS.
Furqon.2004.Statistika Terapan untuk Penelitian.Bandung:ALFABETA
Gronlund, N.E. and Linn R L 1990. Measurement and Evaluation in Teaching.
New York:Macmilan Co. Inc.
Ida, W. 2010. www.undip.ac.id/24056/3. (13 Januari 2014)
Iteman.1988.MicroCAT (tm) Testing System.Assessmet Systems Corporation
Kolen, M. J and R. L Brennan.1995.Test Equating Methods and Practice. New
York:Springer-Verlag New York.Inc.
Mardapi, Djemari.2008. Teknik Penyusunan Instrumen Tes dan Non Tes.
Jogjakarta:Mitra Cendikia
59
Naga, Dali Santun. 2012. Teori Sekor Pada Pengukuran Mental. Jakarta: PT.
Nagarani Citrayasa.
Nunnally, Jum C. 1959. Tes and Measurements: Assessment and Prediction. New
York: MC Graw-Hill Book Company. Inc
Rasyid, Harun dan Mansyur. 2007. Hasil Belajar. Bandung: CV Wacana Prima.
Rijanto, Tri.2011. Pengaruh Metode Penyetaraan Sekor dan Jumlah Sampel Terhadap Variansi Sekor Hasil Penyetaraan Pada Ujian Akhir Sekolah Berstandar Nasional Mata Pelajaran IPA. Disertasi tidak
dipublikasikan. Jakarta: Pascasarjan Universitas Negeri Jakarta
Rustam.2000. Penyetaraan Perangkat Tes Matematika Program D2 PGSD
Universitas Terbuka.Jakarta:Lembaga Penelitian Universitas Terbuka
Sudaryono.2012.Dasar-dasar Evaluasi Pembelajaran. Yogyakarta: Graha Ilmu.
Sugiyono.2009.Metode Penelitian Pendidikan:Pendekatan Kuantitatif, Kualitatif
dan R&D. Bandung:ALFABETA
Supriyati, Yetti. 2003. Pengaruh Proporsi Anchor Items Terhadap Kestabilan
Koefisien Penyetaraan Sekor Pada Evaluasi Belajar. Disertasi tidak
dipublikasikan.Jakarta: Pascasarjana Universitas Negeri Jakarta.
Susetyo, Budi.2011. Menyusun Tes Hasil Belajar. Bandung: CV Cakra.
Tumilisar, A.J.V.2005. Akurasi Relatif Penyetaraan Skor Tes Untuk Sampel
Berukuran 300 Ditinjau Dari Metode Penyetaraan dan Teknik Penghalusan.Disertasi tidak dipublikasikan.Jakarta:Pascasarjana Universitas Negeri Jakarta.
Weiss, David J.1983. New Horizons In Testing; Latent Trait Test Theory and
Computerized Adaptive Testing. London:Academic Press.Inc
Wiersman, William and Stephen G. Jurs. 1990. Educational Measurement and
Testing. Massachusetts: Division of Simon Schuster Inc.
Zainul, Asmawi dan Noehl Nasoetion.1993. Bahan Ajar Program Pengembangan Keterampilan Teknik Instruksional (PEKERTI) Untuk Dosen Muda, Penilaian Hasil Belajar. Jakarta: Departemen Pendidikan
dan Kebudayaan PAU PPAI Universitas Terbuka.
BAB III
METODE PENELITIAN
A.Populasi dan Sampel
Menurut Ali (2011:83) populasi pada dasarnya merupakan sumber data
secara keseluruhan. Populasi dalam penelitian ini terbagi menjadi dua yaitu
populasi responden dan populasi sekor tes responden. Populasi responden yaitu
siswa SMA kelas XI di kabupaten Bangka Tengah yaitu SMA 1 Koba, SMA 1
Lubuk Besar, SMA 1 Namang, SMA 1 Pangkalan Baru. Sebanyak 400 orang
siswa, yang dibagi menjadi dua yaitu 200 siswa yang mengerjakan instrumen X
dan 200 orang siswa yang mengerjakan instrumen Y.
Populasi sekor tes yaitu sekor butir hasil jawaban dari 400 responden
yang mengerjakan dua perangkat tes X dan Y pada mata pelajaran Bahasa Inggris.
Kedua perangkat tes yang berbeda ini berasal dari kisi-kisi yang sama dan
memiliki butir anchor didalamnya.
Sampel dalam penelitian ini adalah sekor yang diambil dari populasi,
sekor ini yang akan digunakan dalam proses penyetaraan. Pengambilan sampel
data dalam penelitian ini menggunakan teknik cluster random sampling dengan
kelompok intack. Menurut Ali (2011:110) teknik ini merupakan teknik
penyampelan peluang, dalam penyampelan kluster dilaksanakan perandoman
meskipun pelaksanaannya bukan terhadap individu subyek, melainkan terhadap
klaster, kumpulan atau kelompok subyek.
B. Metode Penelitian
Penelitian ini termasuk penelitian deskriptif eksploratif. Menurut Sugiono
(2009:56) penelitian deskriptif adalah penelitian untuk mengetahui variabel
mandiri, baik satu variabel atau lebih (independen), tanpa membuat perbandingan
atau menghubungkan variabel yang lain. Eksploratif cenderung untuk belajar
variabel dan hubungan mereka dalam rangka untuk lebih memahami fenomena.
Menurut Borg dan Meredith (1989:32) ekploratif studi ini cenderung tidak
dipandu oleh hipotesis karena peneliti tidak memiliki pemahaman yang memadai
34
Didalam penelitian ini tidak membandingkan variabel, tetapi hanya bersifat
menganalisis kedua perangkat tes dan menyetarakan sekor yang berasal dari
kedua perangkat tes tersebut.
C. Variabel Penelitian
Variabel dapat didefinisikan sebagai segala sesuatu yang ada dan
keberadaannya memiliki lebih dari satu label atau lebih dari satu nilai (Ali,
2011:69). Dalam penelitian ini melibatkan beberapa variabel penelitian yaitu
variabel bebas, variabel moderator dan variabel terikat.
Variabel bebas dalam penelitian ini adalah metode linier. Variabel bebas
(independent variable) adalah variabel yang kemunculannya diasumsikan menjadi
sebab munculnya variabel lain (Ali, 2011:71).
Variabel moderator dalam penyetaraan ini adalah penyetaraan sekor.
Variabel moderator adalah variabel yang menjadi perantara bagi variabel bebas
dalam memberi pengaruh kepada variabel terikat (Ali, 2011:71).
Variabel terikat dalam penelitian ini adalah sekor hasil
penyetaraan.Variabel terikat yang kemunculannya diasumsikan sebagai akibat
dari adanya variabel sebab (Ali , 2011:71).
D. Definisi Operasional
1. Perangkat tes pararel yang dimaksud dalam penelitian ini adalah dua
perangkat tes Bahasa Inggris yang terdiri dari X dan Y.
2. Butir Anchor yang dimaksud dalam penelitian ini adalah butir yang disisipkan
kedalam kedua perangkat tes yang berbeda yang dikategorikan perangkat tes
X dan Y. Butir ini memiliki tempat atau posisi yang sama dan jumlah butir
yang sama.
3. Penyetaraan sekor yang dimaksud adalah penyetaraan dari sekor mentah yang
diperoleh dari perangkat tes yang satu (X) atau (Y) dimana sekor ini akan
dikonversikan pada kedua perangkat tes tersebut dengan menggunakan
penyetaraan linier dengan metode rancangan D yaitu common item non
35
E. Instrumen Penelitian
Instrumen yang digunakan dalam penelitian ini berupa tes hasil belajar
yang mengacu pada Ujian Tengah Semester (UTS) yang terdiri dari dua perangkat
tes X dan Y.
Penyusunan instrumen ini didasarkan pada indikator hasil belajar yang
hendak dicapai. Instrumen ini mencakup ranah kognitif pada kemampuan (C1),
pemahaman (C2), dan penerapan/aplikasi (C3), yang terdiri dari berbagai soal
yang disesuaikan dengan indikator soal.
Adapun langkah-langkah yang telah ditempuh dalam penyusunan kedua
instrumen tes X dan Y pada Ujian Tengah Semester (UTS) adalah sebagai berikut:
a. Menentukan konsep berdasarkan kurikulum yang berlaku untuk mata
pelajaran Bahasa Inggris di sekolah – sekolah tempat penelitian berlangsung.
b. Membuat kisi-kisi soal berdasarkan kurikulum untuk mata pelajaran Bahasa
Inggris kelas XI SMA semester dua dengan materi pokok berupa teks
Narrative, teks Spoof, teks Hortatory Exposition serta kebahasaan dan
ungkapan bahasa yang berhubungan dengan teks tersebut.
c. Membuat soal tes berdasarkan kisi-kisi dan membuat kunci jawaban.
F. Prosedur Penelitian
Prosedur penelitian yang telah dilakukan meliputi beberapa tahap
meliputi:
1. Membuat soal Bahasa Inggris
Penulis menyusun rancangan instrumen pengukuran sementara terlebih dahulu.
Penyusunan instrumen sementara berpedoman kepada kurikulum yang ada dan
berdasarkan kisi – kisi tes yang telah dirancang terlebih dahulu. Penulis
memilih pokok bahasan teks Narrative, teks Spoof dan teks Hortatory
Exposition serta kebahasaan dan ungkapan bahasa yang berhubungan dengan
teks tersebut. Yang pelajari oleh siswa kelas XI SMA. Pada rancangan
36
2. Uji validitas butir soal
Validitas butir soal diuji dengan judment ahli yang bertujuan untuk melihat
kecocokan antara butir tes yang dikembangkan dengan indikator yang telah
ditetapkan sebelumnya. Judment dilakukan oleh 9 orang yang terdiri dari guru
Bahasa Inggris.
3. Melakukan uji coba soal
Butir tes yang telah dinilai oleh ahli dan telah dinyatakan valid dan memiliki
kecocokan antara butir tes yang telah dibuat dengan indikator yang telah
ditetapkan sebelumnya di uji terlebih dahulu untuk melihat daya beda, tingkat
kesukaran dan reliabilitasnya. Pengujian instrumen dilakukan di SMA 1
Pangkalan Baru.
4. Melakukan analisis butir
Pada tahap ini peneliti melakukan analisis terhadap daya beda, tingkat
kesukaran dan reliabilitas tes secara kuantitatif. Hal ini bertujuan untuk
mendapatkan butir tes yang valid dan reliabel.
5. Meletakkan butir anchor kedalam kedua perangkat tes tersebut
Menyisipkan butir anchor pada instrumen yang telah memenuhi persyaratan
tersebut. Butir anchor yang akan digunakan diambil dari soal-soal ujian
nasional, karena dianggap telah standar dan divalidasi oleh tim BNSP. Butir
anchor ini diadaptasikan dengan pokok bahasan kelas XI pada semester genap,
Butir anchor yang dimaksud memiliki SK dan KD yang sama indikator yang
setara dengan butir non anchor. Butir anchor yang digunakan adalah 20% dari
panjang tes keseluruhan. Satu instrumen terdiri 35 butir soal, jadi 28 butir non
anchor 7 butir anchor item.
6. Menguji butir tes yang valid, reliabel dan telah disisipkan butir anchor di
kelas penelitian
Penelitian ini dilakukan di SMA 1 Koba, SMA 1 Lubuk Besar, SMA 1
Namang. Responden yang diambil sebanyak 400 orang siswa kelas XI.
Setelah tes diujikan di kelas penelitian kemudian dilakukan penyekoran
terhadap hasil tes siswa.
37
7. Setelah sekor didapat maka akan dilanjutkan dengan penyetaraan sekor
dengan menggunakan metode penyetaraan linier dengan rancangan D.
ALUR PROSEDUR PENELITIAN
Diujikan
Didapat
Diujikan
Hasil
Disetarakan
---
Gambar 3.1. Alur Penelitian
Membuat soal Bahasa Inggris X dan Y
Uji Validitas Butir Soal
Kelas Uji Coba
Reliabilitas, Tingkat Kesukaran dan Daya Pembeda
Butir Soal Bahasa Inggris yang Valid dan Reliabel
Kelas Penelitian
Sekor
38
G. Teknik Pengumpulan Data
Pengumpulan data dalam penelitian ini adalah dengan cara memberikan
instrumen yang telah di ujicoba kepada responden yaitu siswa SMA kelas XI.
Selanjutnya hasil tes yang berupa skor-skor yang diperoleh dari responden inilah
yang akan dijadikan subjek penelitian. Prosedur pengumpulan data melalui tahap
– tahap sebagai berikut:
Perangkat tes yang dibuat pararel yaitu tes Bahasa Inggris X dan Y dengan
butir anchor yang menyebar pada kedua perangkat tersebut..
1. Untuk masing – masing siswa ada yang mengerjakan tes X dan Y.
2. Responden menjawab pada lembar jawaban yang telah disediakan.
3. Sekor yang diperoleh dari 400 orang siswa (sekor responden) 200 sekor tes X
dan 200 sekor tes Y.
H. Teknik Analisis Data
Pengolahan data pada penelitian ini diawali dengan:
1. Menghitung reliabilitas
Pada tahap ini adalah menghitung reliabilitas dari perangkat tes X dan
perangkat tes Y yang telah disisipkan butir anchor pada kedua perangkat tersebut.
Reliabilitas instrumen adalah ketepatan alat ukur dalam mengukur atau ketepatan
siswa dalam menjawab alat ukur itu. Suatu tes dapat dikatakan memiliki taraf
reliabilitas yang tinggi jika tes tersebut dapat memberikan hasil tetap yang
dihitung dengan koefesien reliabilitas.
Pada penelitian ini sekor berupa dikotomi yaitu sekor tes hasil belajar siswa
yang diperoleh dalam penelitian, karena bobot soal yang diberikan bernilai 1
untuk soal yang dijawab benar dan bernilai 0 untuk soal yang dijawab salah.
Menghitung reliabilitas tes pada penelitian ini dilakukan dengan menggunakan
software ITEMAN MICROCAT Versi 3.0
2. Tingkat Kesukaran
Tingkat kesukaran adalah bilangan yang menunjukkan sukar atau
mudahnya suatu soal. Besarnya indeks kesukaran berkisar antara 0,0 sampai 1,00.
Soal dengan indeks kesukaran 0,0 menunjukkan bahwa soal tersebut terlalu sukar,
39
Indeks kesukaran diberi simbol P (proporsi) yang dihitung dengan rumus
(Susetyo, 2011) :
(3.1)
Keterangan:
P : Tingkat kesukaran
B : Banyaknya siswa yang menjawab soal itu dengan benar
JS : Jumlah seluruh siswa peserta tes
Kriteria indeks kesukaran suatu tes menurut Witherington adalah sebagai berikut:
Tabel 3.1 Kriteria Indeks Kesukaran
Batasan Kategori
0,00 ≤ P < 0,30 Soal sukar
0,30 ≤ P < 0,70 Soal sedang
0,70 ≤ P ≤ 1,00 Soal mudah
Perhitungan tingkat kesukaran kedua perangkat tes tersebut maka akan
dilakukan dengan bantuan software ITEMAN MICROCAT Versi 3.0.
3. Daya Pembeda
Daya beda (D) butir tes adalah kemampuan butir tes untuk mengetahui
seberapa besar suatu butir tes dapat membedakan (diskriminasi) antara peserta tes
yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah.
Pada penelitian ini perhitungan daya beda dilakukan dengan cara
menghitung koefisien biserial titik. Korelasi butir – total merupakan korelasi yang
didasarkan pada sekor butir dan sekor total untuk semua butir yang dijawab benar.
Untuk menguji validitas setiap butir soal, skor tiap butir soal yang
dimaksud dikorelasikan dengan skor total. Sebuah soal akan memiliki validitas
tinggi jika skor soal tersebut memiliki dukungan yang besar terhadap skor total.
Dukungan setiap butir soal dinyatakan dalam bentuk korelasi, sehingga untuk
mendapatkan validitas suatu butir soal digunakan rumus korelasi.
Perhitungan korelasi butir – total untuk data dengan sekor dikotomi
menggunakan koefisien korelasi point biserial. Adapun rumus yang digunakan
40
√ (3.2)
Keterangan:
: Validitas butir total/ daya beda
: Rata – rata sekor total responden yang menjawab benar
: Rata – rata sekor total responden yang menjawab salah
: Proporsi jawaban benar butir tes tertentu : Proporsi jawaban salah butir tes tertentu
: Standar deviasi sekor total semua responden
Ada ketentuan yang dapat digunakan dalam menetapkan daya beda pada suatu
butir tes. Menurut Nunnally koefisien korelasi diatas 0.20 sudah dianggap cukup
baik. Perhitungan daya beda butir pada kedua perangkat tes X dan Y ini akan
dilakukan dengan bantuan software ITEMAN MICROCAT Versi 3.0
4. Penyetaraan Sekor
Selanjutnya menganalisis skor dengan melakukan penyetaraan sekor yang
diperoleh dari perangkat tes X dan Y, yang mana penyetaraan sekor akan
dianalisis menggunakan program Excell. Pertama menghitung jumlah sekor
mentah yang diperolah dari kedua perangkat tes X dan Y, dengan cara
mengelompokkan sekor anchor item dan sekor non anchor item. Dari
pengelompokkan tersebut dilanjutkan dengan perhitungan statistik yaitu mencari
jumlah rata-rata, simpangan baku perangkat tes yang satu dan perangkat tes yang
lain juga beserta anchor. Kemudian disetarakan dengan menggunakan
penyetaraan linier rancangan D untuk memudahkan perhitungan, maka analisis