PENYETARAAN SEKOR ANTARA DUA PERANGKAT TES BAHASA INGGRIS DENGAN DESAIN BUTIR ANCHOR BERSAMA.

(1)

PENYETARAAN SEKOR ANTARA DUA PERANGKAT TES BAHASA INGGRIS DENGAN DESAIN BUTIR ANCHOR BERSAMA

TESIS

Diajukan untuk Memenuhi Sebagian dari Syarat untuk Memperoleh Gelar Magister Pendidikan Program Studi Penelitian dan Pengukuran Pendidikan

Oleh

DESI SUSANTI 1202654

SEKOLAH PASCASARJANA

UNIVERSITAS PENDIDIKAN INDONESIA

(2)

Oleh: Desi Susanti

Sarjana Pendidikan Universitas PGRI Palembang, 2005

Sebuah Tesis yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Magister Pendidikan (M.Pd.) pada Program Studi Penelitian dan Pengukuran

Pendidikan

Juli 2014

Hak Cipta dilindungi undang – undang

Tesis ini tidak boleh diperbanyak seluruhnya atau sebagian

(3)

LEMBAR PENGESAHAN

Disetujui dan disahkan oleh pembimbing:

Pembimbing,

Prof. DR. H. Asmawi Zainul, M.Ed.

Mengetahui,

Ketua Program Studi Penelitian dan Pengukuran Pendidikan

(4)

DESI SUSANTI 1202654

ABSTRAK

Penelitian ini bertujuan untuk (1) menganalisis karakteristik dari dua perangkat tes bahasa inggris (2) menemukan rumusan persamaan konversi yang digunakan untuk menyetarakan sekor-sekor dari dua perangkat tes yang berbeda hingga menghasilkan sekor yang setara. Metode yang di gunakan dalam penelitian ini adalah deskriptif exploratif, variabel bebas adalah metode penyetaraan linier dan variabel terikat sekor hasil penyetaraan. Instrumen yang digunakan adalah dua perangkat tes dengan pilihan ganda sebanyak 35 butir soal pada mata pelajaran Bahasa Inggris untuk siswa SMA kelas XI, di mana dua perangkat tes mengandung butir anchor yang menyebar di antara kedua perangkat tes tersebut. Data penelitian berupa skor siswa kelas XI SMA di kabupaten Bangka Tengah, yang diambil menggunakan teknik penarikan sampel yaitu cluster random

sampling sebanyak 200 orang siswa untuk setiap instrumen penelitian. Desain

yang digunakan dalam penyetaraan ini adalah desain common item nonequivalent

groups. Dari hasil analisis data di dapat rumusan persamaan konversi sekor yaitu

Y*=0,94(X-51,82)+49,08 dan X*=1,15(Y-49,1)+51. Berdasarkan hasil penyetaraan sekor dengan rumusan persamaan konversi ini di dapatkan sekor-sekor tes siswa yang setara.

(5)

THE EQUITING OF SCORES

BETWEEN TWO OF INSTRUMENT ENGLISH TEST BY ANCHOR INTERNAL ITEM DESIGN

DESI SUSANTI 1202654

ABSTRACTS

This research was aimed to analyze the characteristics of two instrument English test (2) to find the conversion formula of equiting were used to equite the scores came from two of different instrument test until produced an equivalent scores. The method of study was descriptive exploratory. The independent variable was a

linear equiting method and the dependent variable was score’s result from

equiting. The instruments of the study were two of instruments with multiple-choice tests as many as 35 items on the subjects of English for the high school students of class XI, in which two of device test contains of anchor items were spread between both the device test. The data of research data was score of the high school students in Central Bangka regency, which was taken using sampling techniques, namely cluster random sampling as many as 200 students for each instrument. The design was used in this equiting was a common item nonequivalent groups design. From the analysis of data obtained the score conversion formula equation is Y * = 0.94 (X-51, 82) +49.08 and X * = 1.15 (Y-49, 1) +51. Based on the results of the equiting using the conversion formula was found that the equivalent of score test.

(6)

DAFTAR ISI

B. Identifikasi Masalah ... 7

C. Pembatasan Masalah ... 8

D. Rumusan Masalah ... 8

E. Tujuan Penelitian ... 9

F. Manfaat Penelitian ... 9

BAB II PENYUSUNAN KERANGKA TEORITIK, KERANGKA BERPIKIR DAN PENGAJUAN HIPOTESIS

8. Rancangan Penyetaraan Sekor ... 22

a. Rancangan A ... 24

b. Rancangan B ... 24

c. Rancangan C ... 25

(7)

9. Metode Penyetaraan Sekor ... 27

a. Penyetaraan Linier Rancangan A ... 28

b. Penyetaraan Linier Rancangan B ... 29

c. Penyetaraan Linier Rancangan C dan D ... 29

10.Butir Anchor ... 30

B. Penelitian Yang Relevan ... 32

BAB III METODE PENELITIAN

F. Rancangan Prosedur Penelitian ... 36

G. Teknik Pengumpulan Data ... 38

H. Teknik Analisis Data ... 38

1. Menghitung Reliabilitas ... 38

2. Tingkat Kesukaran ... 38

3. Daya Pembeda ... 39

4. Penyetaraan Sekor ... 40

BAB IV HASIL PENELITIAN DAN PEMBAHASAN A. Deskripsi Data ... 41

1. Deskripsi Data Responden ... 41

a. Sekor Hasil Tes Siswa pada Instrumen X ... 41

b. Sekor Hasil Tes Siswa pada Instrumen Y ... 42

2. Deskripsi Karakteristik Instrumen Tes ... 44

a. Reliabilitas ... 44

b. Taraf kesukaran Butir Soal... 44

c. Daya Beda ... 48

B. Deskripsi Data Hasil Penyataraan ... 52

C. Pembahasan Hasil Penelitian ... 53

1. Pembahasan Karakteristik perangkat tes ... 53

2. Pembahasan Penyetaraan Sekor ... 54

BAB V KESIMPULAN DAN SARAN A. Kesimpulan ... 56

B. Saran dan Rekomendasi ... 57

(8)

BAB 1 PENDAHULUAN

A. LATAR BELAKANG MASALAH

Pengukuran merupakan suatu proses pemberian angka kepada suatu atribut

atau karakteristik tertentu yang dimiliki oleh orang, hal atau objek tertentu

menurut aturan atau formulasi yang jelas. Berdasarkan pandangan tersebut,

tampak bahwa semua kegiatan didunia ini tidak bisa lepas dari pengukuran.

Keberhasilan suatu program dapat diketahui melalui suatu pengukuran, begitu

juga perkembangan ilmu pengetahuan dan teknologi. Penelitian-penelitian yang

dilakukan dalam semua bidang selalu melibatkan kegiatan pengukuran, baik yang

bersifat kualitatif maupun kuantitatif. Oleh karena itu, pengukuran memegang

peranan penting, baik untuk pengembangan ilmu pengetahuan dan teknologi

maupun untuk penyajian informasi bagi pembuat kebijakan (Mardapi, 2008:2).

Pada dasarnya pengukuran merupakan kegiatan penentuan angka bagi

suatu objek secara sistematik. Penentuan angka ini merupakan usaha untuk

menggambarkan karakteristik suatu objek. Kemampuan seseorang dalam bidang

tertentu dinyatakan dengan angka. Kesalahan yang terjadi pada pengukuran

ilmu-ilmu sosial biasanya disebabkan oleh alat ukur, cara mengukur dan keadaan objek

yang diukur. Masalah evaluasi hasil belajar meliputi alat ukur yang digunakan,

cara menggunakan, cara penilaian dan evaluasinya.

Pengukuran yang tepat dapat memberikan informasi yang akurat mengenai

penguasaan seseorang atau sekelompok orang terhadap materi yang dipelajari, dan

informasi itu berguna untuk mengambil sebuah keputusan. Kesahihan alat ukur

dapat dilihat dari konstruk alat ukur, yaitu mengukur seperti yang direncanakan.

Alat ukur yang baik memberi hasil yang konstan bila digunakan berulang-ulang,

asalkan kemampuan yang diukur tidak berubah. Pengukuran hasil belajar di

sekolah dilakukan dengan menggunakan alat ukur yaitu berupa instrumen yang

(9)

2

Tes sebagai alat bantu mengukur berisikan serangkaian pertanyaan atau

tugas yang harus dijawab, dikerjakan atau dilaksanakan oleh responden yang dites

(Susetyo,2011:2). Kemampuan kognitif seseorang atau sekelompok diketahui

melalui tes prestasi belajar. Tes prestasi belajar memuat butir-butir soal yang

disusun untuk mengukur kemampuan siswa terhadap materi pelajaran yang

diberikan. Hasil tes merupakan informasi tentang karakteristik seseorang atau

sekelompok orang. Tes merupakan salah satu cara untuk menaksir besarnya

tingkat kemampuan siswa secara langsung, yaitu melalui respon siswa terhadap

sejumlah stimulus atau pertanyaan. Oleh karena itu agar diperoleh informasi yang

akurat dibutuhkan tes yang handal (Rasyid dan Mansur, 2007:9).

Supaya hasil dari pengukuran tersebut menggambarkan yang

sesungguhnya, maka dalam pengelolaannya dan termasuk penyelenggaraanya

harus dilakukan secara profesional, akurat, objektif dan adil. Rendahnya mutu

pendidikan berhubungan dengan rendahnya hasil belajar, dan berhubungan pula

dengan kemampuan guru dalam melaksanakan proses pembelajaran serta

membuat evaluasi belajar. Guru merasa kurang terampil dalam menyusun tes hasil

belajar yang benar dan bermakna (Supriyati, 2003:4).

Kenyataan yang dihadapi sekarang tes yang dipergunakan di sekolah saat

ini pada umumnya dibuat oleh guru. Masih banyak guru tidak mengetahui

prosedur pembuatan tes yang baik. Kebanyakan tes disusun dalam jangka waktu

yang sangat singkat bahkan ada juga yang mengadopsi langsung butir-butir tes

yang telah tersedia dibuku panduan belajar, dan perangkat tersebut langsung

diberikan sebagai perangkat tes untuk melakukan evaluasi baik sumatif maupun

formatif, tidak menutup kemungkinan alat tes yang digunakan oleh guru sebagai

evaluasi tidak dapat mengukur apa yang sebenarnya akan diukur.

Kesalahan pengukuran ini mengakibatkan kekeliruan dalam pengambilan

keputusan, maka dalam melaksanakan evalusi pembelajaran guru memerlukan alat

ukur yang dapat mengukur dengan tepat keberhasilan siswa dalam pembelajaran.

Hasil tes yang diperolah dengan cara tidak adil, tidak dapat memberikan informasi

untuk mengetahui prestasi siswa yang sebenarnya, dan hasil tes seperti itu dapat

(10)

3

Oleh karena itu guru harus mempersiapkan perangkat tes yang sahih dan

terandal untuk mengukur keberhasilan belajar siswa. Seorang tenaga pengajar

haruslah mengetahui dasar-dasar penyusunan tes prestasi belajar yang baik agar

dapat memperoleh hasil ukur yang akurat (valid) dan dapat dipercaya (reliabel).

Mereka harus pula mengetahui aspek-aspek penggunaannya yang layak di kelas,

mengetahui cara-cara pemberian angka, dan yang paling penting adalah

mengetahui pula cara interpretasi hasil pengukuran tersebut (Azwar, 1987:9).

Dalam penyelenggaraan evaluasi hasil belajar, guru terkadang mendapat

kesulitan untuk menyelenggarakan tes, diantaranya tes formatif dan sumatif.

Permasalahannya adalah guru memiliki kelas pararel yang cukup banyak.

Contohnya Tes formatif biasanya diselenggarakan sesuai dengan jam pelajaran

masing-masing. Jika hanya menggunakan satu instrumen saja tidak menutup

kemungkinan saling mencontek dan kebocoran soal antar sesama murid tidak

dapat dihindari. Maka untuk menghindari situasi demikian para guru membuat

lebih dari satu perangkat tes yang tujuannya untuk mengatasi permasalahan

tersebut. Perangkat-perangkat tes yang lebih dari satu tersebut dibuat dari kisi-kisi

yang sama dan untuk mengukur tingkat kemampuan yang sama, namun tidak

menutup kemungkinan memiliki karakteristik soal yang berbeda yaitu dari segi

validitas, reliabilitas soal, tingkat kesukaran maupun daya pembedanya.

Menurut Hambleton yang dikutif oleh Rustam (2000) Sebenarnya tidak

pernah dua perangkat atau lebih mempunyai item yang sama tingkat

kesukarannya. Maka dalam hal ini ada siswa yang dirugikan karena mengerjakan

soal yang sulit, ada juga siswa yang beruntung karena mendapatkan soal yang

mudah. Malahan hasil sekor-sekor dari evaluasi tersebut diperbandingkan untuk

menentukan prestasi siswa atau penentuan kenaikan kelas, hal ini merupakan hal

yang tidak adil maka pemberian nilai terhadap hasil belajar siswa tidak

mencerminkan prestasi yang sebenarnya.

Jika permasalahan ini dibiarkan berlarut-larut tanpa ditanggulangi maka

sistem evaluasi yang digunakan oleh para pendidik sebagai pembuat keputusan

atas prestasi siswa memiliki kecacatan. Jadi perlu ada terobosan yang bisa

(11)

4

Sudah saatnya para penerima didikan mendapatkan perlakuan yang adil yang bisa

mencerminkan dan menentukkan prestasi yang telah menjadi hak mereka. Untuk

mendapatkan informasi yang adil bagi setiap siswa selain diperlukan alat ukur

yang baik juga proses perhitungan sekor tes yang baik. Pendapat Setiadi yang

dikutip oleh Supriyati (2003:7) bahwa alat ukur yang baik meliputi perangkat tes

yang dapat mengestimasi kemampuan seseorang dengan kesalahan pengukuran

yang sekecil-kecilnya.

Proses perhitungan sekor tes yang baik adalah suatu proses yang mana

seluruh siswa bisa mendapatkan perlakuan yang adil dari hasil evaluasi tersebut.

Lagi pula proses ini dapat mengukur prestasi yang sebenarnya sesuai dengan

kemampuan siswa dan dapat membedakan yang mana siswa yang pandai atau

yang tidak. Untuk mengatasi permasalahan didalam pemberian sekor tes yang

adil maka dapat dilakukan cara melakukan penyetaraan sekor, yaitu menyetarakan

sekor-sekor tes yang didapat dari kedua perangkat atau lebih yang berbeda

Penyetaraan sekor merupakan proses secara statistik untuk menentukan

hubungan antar skala sekor dari dua atau lebih tes agar sekor-sekor tersebut

diperlakukan secara adil (Weiss, 1983:147). Dengan melalui proses penyetaraan

sekor maka peserta tes tidak merasa dirugikan atau diuntungkan karena

mendapatkan perangkat tes yang sulit atau mudah. Penyetaraan sekor ini

memberlakukan pensekoran yang dapat mengestimasi kesalahan pengukuran

sekecil-kecilnya. Menggunakan penyetaraan sekor dapat memberikan informasi

hasil tes yang objektif, artinya siswa yang pandai hendaknya mendapatkan sekor

lebih tinggi daripada siswa yang berkemampuan sedang dan rendah (Supriyati,

2003:13).

Dalam pengukuran tes klasik penyetaraan sekor terdapat dua arah yaitu

penyetaraan horizontal dan vertikal. Penyetaraan horizontal dilakukan untuk

mengukur responden yang setara dan juga atribut yang setara, sementara

penyetaraan vertikal dilakukan untuk mengukur responden yang tidak setara

(Dali, 2012:350). Sesuai permasalahan yang telah diuraikan diatas maka

(12)

5

Didalam penyetaraan sekor tes horizontal terdapat beberapa rancangan

yang dapat dipakai dalam menyamakan sekor yaitu penyetaraan pada kelompok

tunggal, kelompok bersama dan kelompok butir anchor. Rancangan yang cukup

cermat dalam mengatasi kelas pararel yang banyak yaitu dengan rancangan

kelompok butir anchor. Pada rancangan ini perangkat tes yang lebih dari satu

dikemas secara pararel dengan butir anchor. Butir anchor yang dimaksud adalah

dimana terdapat butir yang sama dibeberapa perangkat tes tersebut dan berbaur

dengan butir yang non anchor. Belum bisa dipastikan dengan jelas berapa jumlah

anchor yang dapat digunakan pada perangkat-perangkat tes tersebut. Namun

sekor-sekor yang berasal dari perangkat tes yang berbeda harus berasal dari

perangkat tes yang memiliki reabilitas yang sama merata, dan juga taraf kesukaran

yang merata (Dali, 1992:347). Jadi sebelum dilakukan penyetaraan sekor pada

penelitian ini perlu peninjauan terhadap karakteristik kedua instrumen tersebut

yang meliputi reliabilitas, tingkat kesukaran dan daya beda.

Dalam penyetaraan sekor secara klasik terdapat dua metode penyetaraan

diantaranya adalah metode penyetaraan linier dan metode penyetaraan

ekipersentil. Metode penyetaraan secara linier hubungan sekor setara dan sekor

asal linier. Pada penyetaraan secara ekipersentil, peringkat secara persentil pada

sekor setara disamakan dengan peringkat persentil pada sekor asal sehingga

hubungan mereka menjadi pada umumnya nonlinier (Dali, 2012:356). Penelitian

ini terfokus hanya pada metode penyetaraan linier. Menurut Weiss (1983,148)

asumsi penyetaraan dengan cara linier adalah sekor tes distribusinya berbeda,

distribusi tersebut terkait dengan rerata dan simpangan bakunya.

Kebutuhan akan betapa pentingnya penyetaraan sekor memang telah lama

disadari dan sangat bermanfaat untuk dikembangkan dalam pengukuran

pendidikan. Namun karena pemikiran dan penelitian terhadap penyetaraan sekor

ini yang masih sangat terbatas. Adapun beberapa penelitian-penelitian yang

telah ada sekarang ini kebanyakan penyetaraan sekor hanya dilakukan dalam

ruang lingkup pengukuran dalam pembelajaran sain saja, jarang sekali atau

bahkan belum ditemukan penelitian penyetaraan sekor dalam pengukuran

(13)

6

Seharusnya penyetaraan sekor ini harus bisa diterapkan dalam pengukuran

pendidikan semua bidang ilmu. Diantara beberapa penelitian tersebut melakukan

penyetaraan sekor terhadap perangkat-perangkat tes untuk menemukan persamaan

konversinya.

Diantaranya seperti Rustam (2000) meneliti penyetaraan terhadap

perangkat tes Matematika, dari hasil penelitiannya ditemukan suatu formula

penyetaraan terhadap dua perangkat tes program D2 UT untuk wilayah kota

Bogor dan Bandar Lampung. Selanjutnya Syahril (1998) yang mana dari hasil

penelitiannya menunjukkan dari beberapa perangkat tes Kimia SMU untuk

kotamadya Banjarmasin sebelum dilakukan penyetaraan memiliki tingkat

kesukaran yang berbeda maka harus beberapa perangkat tersebut harus dilakukan

kesetaraan sekor untuk menentukan prestasi siswa.

Berpijak dari beberapa penelitian-penelitian yang telah ada ini lah maka

peneliti tertarik untuk melakukan pengukuran terhadap kedua perangkat tes

Bahasa Inggris yang berbeda dalam bentuk penyetaraan sekor. Mengingat

penelitian-penelitian mengenai penyetaraan sekor sebelumnya diteliti banyak

dalam pengukuran pelajaran sain dan sangat jarang ditemukan dalam pengukuran

pada bidang ilmu bahasa. Maka sesuai dengan latar belakang peneliti seorang

guru Bahasa Inggris maka dalam penelitian ini pelajaran Bahasa Inggris yang

(14)

7

B. IDENTIFIKASI MASALAH

Berdasarkan paparan yang telah dikemukakan didalam latar belakang

masalah diatas dapat diidentifikasikan diantaranya adalah:

1. Bahwa tes yang digunakan di sekolah-sekolah pada umumnya dibuat oleh

guru. Namun, masih banyak para guru kurang mengetahui prosedur

pembuatan tes yang baik.

2. Bahwa kebanyakan alat evaluasi yang digunakan oleh guru disusun dalam

waktu yang sangat singkat bahkan mengadopsi dari buku panduan belajar

tanpa dianalisis terlebih dahulu, dan langsung diberikan kepada siswa sebagai

tes sumatif dan formatif untuk menentukkan keberhasilan peserta didiknya.

3. Bahwa guru sering mendapatkan kesulitan dalam menyelenggarakan tes

formatif atau tes sumatif karena memiliki kelas pararel yang begitu banyak.

Kalau hanya memiliki satu instrumen saja maka saling mencontek dan

kebocoran soal antar murid tidak dapat dihindari. Untuk mengatasi hal

tersebut guru membuat tes lebih dari satu perangkat tes.

4. Bahwa perangkat-perangkat tes yang dibuat lebih dari satu tidak menutup

kemungkinan memiliki karakterisitik yang berbeda dari segi reliabilitas,

validitas, tingkat kesukaran dan juga daya pembedanya.

5. Bahwa sekor-sekor dari perangkat tes yang berbeda jika diperbandingkan

sebagai penentuan prestasi peserta didik maka akan memberikan perlakuan

yang tidak adil.

6. Bahwa penyetaraan sekor pada saat ini banyak dilakukan dalam pengukuran

pembelajaran sains, sangat sulit ditemukan penyetaraan sekor dalam

(15)

8

C. PEMBATASAN MASALAH

Dari yang telah dikemukakan didalam indentifikasi masalah penelitian

mengingat begitu banyak permasalahan yang muncul terhadap evaluasi

pembelajaran. Maka penelitian ini dibatasi pada pengukuran hasil belajar siswa

terhadap sekor yang berasal dari kedua perangkat tes yang berbeda dikategorikan

dengan perangkat tes (X) dan perangkat tes (Y). Dimana kedua perangkat tes ini

disusun secara pararel dan memiliki butir anchor (internal).

Butir anchor yang dimaksud adalah butir yang sama yang mana menyebar

diantara kedua perangkat tes tersebut. Perangkat tes yang dimaksud adalah

perangkat tes Bahasa Inggris yang dibuat dalam bentuk pilihan ganda dengan lima

pilihan jawaban. Sebelum dilakukan proses penyetaraan perlu peninjauan

terhadap karakteristik kedua instrumen tersebut atau dianalisis untuk menentukan

bagaimana reliabilitas, tingkat kesukaran dan daya pembeda dari perangkat tes.

Dan juga akan dianalisis tingkat kesukaran dan daya pembeda dari butir anchor

tersebut.

Skor-skor mentah yang dihasilkan dari kedua perangkat tes yang berbeda

itu dikonversikan dengan penyetaraan sekor dengan arah penyetaraan horizontal

dalam metode penyetaraan linier dan menggunakan rancangan common item

nonequivalent groups design.

D. PERUMUSAN MASALAH

Berdasarkan pembatasan masalah diatas maka dapat dirumuskan sebagai

berikut:

1. Bagaimanakah karakteristik kedua perangkat tes Bahasa Inggris X dan Y

tersebut ?

2. Bagaimanakah persamaan atau rumusan konversi penyetaraan sekor dari

(16)

9

E. TUJUAN PENELITIAN

Adapun tujuan dari penelitian ini adalah untuk:

1. Menganalisikan karakteristik dari kedua perangkat tes Bahasa Inggris X dan

Y.

2. Menemukan persamaan konversi penyetaraan sekor dari dua perangkat tes

Bahasa Inggris X dan Y.

F. MANFAAT PENELITIAN

Secara teoritis, hasil penelitian ini diharapkan dapat memberikan

kontribusi yang menyangkut pengukuran dan evaluasi pendidikan. Hasil

penelitian ini juga dapat digunakan sebagai masukan awal bagi peneliti-peneliti

lanjutan sebagai bahan kajian untuk mengelaborasi lebih mendalam terhadap

variabel yang diteliti, meskipun sedikit hasil penelitian ini dapat memberikan

sumbangan. Secara praktis, hasil penelitian ini dapat menjadi masukan bagi para

guru-guru bidang studi yang memiliki kelas pararel dalam menyelenggarakan tes,

agar dapat membuat tes yang benar-benar mengukur kemampuan siswa yang bisa

membedakan antara siswa yang pandai dan tidak pandai. Selain itu dengan

penyetaraan sekor dapat memberikan penilaian yang akurat dan memberikan

(17)

BAB V

KESIMPULAN DAN SARAN

A. Kesimpulan

Berdasarkan hasil penelitian dan pembahasan yang telah dikemukakan

bahwa kedua instrumen X dan Y memiliki karakteristik soal yang tidak sama,

baik dari tingkat kesukaran dan juga daya pembeda. Kedua instrumen ini

mempunyai data empiris yang cukup baik karena mempunyai tingkat kesukaran

rata-rata sedang, dan memiliki kemampuan sedang untuk membedakan antara

siswa yang pandai dan tidak pandai. Sementara butir anchor yang tersebar dari

kedua perangkat tes X dan Y, berfungsi dengan cukup baik dan berkategori

sedang, baik dari tingkat kesukaran dan daya pembeda. Dilihat dari koefisien

reliabilitas kedua instrumen ini memiliki tingkat keajegan yang cukup tinggi yaitu

0,84 untuk instrumen X dan 0,87 untuk instrumen Y. Dapat disimpulkan bahwa

kedua instrumen ini memiliki koefisien reliabilitas yang tidak terlalu berbeda,

karena sama-sama memiliki nilai reliabilitas yang tinggi.

Persamaan atau formula konversi sekor dari dua perangkat tes Bahasa

Inggris yaitu instrumen X adalah Y*=0,94(X-51,82)+49,08 dan sebaliknya

instrumen Y adalah X*=1,15(Y-49,1)+51. Berdasarkan dari hasil penyetaraan

sekor dengan rumusan persamaan konversi ini didapatkan sekor-sekor tes siswa

yang setara. Dapat disimpulkan bahwa instrumen Y cukup sukar dibandingkan

dengan instrumen X, sebab dari proses perhitungan penyetaraan menggunakan

formula persamaan konversi ini atau menggunakan formula dari X ke Y* tersebut

menunjukkan bahwa sekor yang berasal dari instrumen X setelah sekor tersebut

disetarakan akan mengalami penurunan sekor. Begitu juga sebaliknya dari Y ke

X* sekor yang berasal dari instrumen Y, ketika disetarakan akan mengalami

(18)

57

B. Saran

Berdasarkan pembahasan dan kesimpulan yang telah diuraikan

sebelumnya, ada beberapa saran yang perlu disampaikan yang berhubungan

dengan penyetaraan sekor dan juga hasil penelitian.

1. Peneliti mengharapkan hasil penelitian ini dapat memberikan masukan yang

baik bagi semua unsur yang berperan penting dalam bidang pendidikan

dimana masalah penyetaraan sekor merupakan hal yang penting untuk

dilakukan oleh guru-guru disekolah.

2. Usaha untuk melakukan penyetaraan sekor perlu dimulai dan dilakukan oleh

sekolah-sekolah, baik mandiri maupun secara bersama-sama mengingat tren

sekarang banyak sekali para pendidik ketika melakukan evaluasi membuat

lebih dari satu perangkat tes.

3. Bagi peneliti lanjutan yang tertarik meneliti dalam bidang pengukuran

pendidikan, disarankan untuk bisa menindaklanjuti penelitian ini yang

berhubungan dengan penyetaraan sekor, menggali lebih dalam lagi terkait

dengan metode penyetaraan dengan melibatkan variabel-variabel lain yang

(19)

DAFTAR PUSTAKA

Ali, Mohammad.2011. Memahami Riset Prilaku dan Sosial. Bandung: Pustaka

Cendikia Utama.

Anastasi, Anne and Susan Urbina.1997. Psychological Testing. New Jersey:

Prentice-Hall, Inc Company.

Azwar, Syaifuddin.1987. Tes Prestasi Fungsi dan Pengembangan Pengukuran

Prestasi Belajar. Yogyakarta: Pustakan Pelajar offset.

Azwar, Syaifuddin.1999. Dasar-Dasar Psikometri. Yogyakarta: Pustakan Pelajar

offset.

Azwar, Syaifuddin.2001. Reliabilitas dan Validitas. Yogyakarta: Pustakan

Pelajar offset.

Borg, Walter R and Meredith Damien Gall.1989. Educational Research: An

Introduction Fifth Edition. New York: Longman.

Brata, Sumadi Surya.2002.Pengembangan dan Alat Ukur Psikologis.

Yogyakarta:Andi.

Crocker, Linda and James Algina.1986. Introduction to Classical and Modern

Test Theory. USA: Rinehartand Winston Inc.

Dorans, Neil J, Tim P Moses and Daniel R Eighnor.2010. Research Report:

Principles and Practices of Test Score Equating.

Princeton,NewJersey:ETS.

Furqon.2004.Statistika Terapan untuk Penelitian.Bandung:ALFABETA

Gronlund, N.E. and Linn R L 1990. Measurement and Evaluation in Teaching.

New York:Macmilan Co. Inc.

Ida, W. 2010. www.undip.ac.id/24056/3. (13 Januari 2014)

Iteman.1988.MicroCAT (tm) Testing System.Assessmet Systems Corporation

Kolen, M. J and R. L Brennan.1995.Test Equating Methods and Practice. New

York:Springer-Verlag New York.Inc.

Mardapi, Djemari.2008. Teknik Penyusunan Instrumen Tes dan Non Tes.

Jogjakarta:Mitra Cendikia

(20)

59

Naga, Dali Santun. 2012. Teori Sekor Pada Pengukuran Mental. Jakarta: PT.

Nagarani Citrayasa.

Nunnally, Jum C. 1959. Tes and Measurements: Assessment and Prediction. New

York: MC Graw-Hill Book Company. Inc

Rasyid, Harun dan Mansyur. 2007. Hasil Belajar. Bandung: CV Wacana Prima.

Rijanto, Tri.2011. Pengaruh Metode Penyetaraan Sekor dan Jumlah Sampel Terhadap Variansi Sekor Hasil Penyetaraan Pada Ujian Akhir Sekolah Berstandar Nasional Mata Pelajaran IPA. Disertasi tidak

dipublikasikan. Jakarta: Pascasarjan Universitas Negeri Jakarta

Rustam.2000. Penyetaraan Perangkat Tes Matematika Program D2 PGSD

Universitas Terbuka.Jakarta:Lembaga Penelitian Universitas Terbuka

Sudaryono.2012.Dasar-dasar Evaluasi Pembelajaran. Yogyakarta: Graha Ilmu.

Sugiyono.2009.Metode Penelitian Pendidikan:Pendekatan Kuantitatif, Kualitatif

dan R&D. Bandung:ALFABETA

Supriyati, Yetti. 2003. Pengaruh Proporsi Anchor Items Terhadap Kestabilan

Koefisien Penyetaraan Sekor Pada Evaluasi Belajar. Disertasi tidak

dipublikasikan.Jakarta: Pascasarjana Universitas Negeri Jakarta.

Susetyo, Budi.2011. Menyusun Tes Hasil Belajar. Bandung: CV Cakra.

Tumilisar, A.J.V.2005. Akurasi Relatif Penyetaraan Skor Tes Untuk Sampel

Berukuran 300 Ditinjau Dari Metode Penyetaraan dan Teknik Penghalusan.Disertasi tidak dipublikasikan.Jakarta:Pascasarjana Universitas Negeri Jakarta.

Weiss, David J.1983. New Horizons In Testing; Latent Trait Test Theory and

Computerized Adaptive Testing. London:Academic Press.Inc

Wiersman, William and Stephen G. Jurs. 1990. Educational Measurement and

Testing. Massachusetts: Division of Simon Schuster Inc.

Zainul, Asmawi dan Noehl Nasoetion.1993. Bahan Ajar Program Pengembangan Keterampilan Teknik Instruksional (PEKERTI) Untuk Dosen Muda, Penilaian Hasil Belajar. Jakarta: Departemen Pendidikan

dan Kebudayaan PAU PPAI Universitas Terbuka.

(21)

BAB III

METODE PENELITIAN

A.Populasi dan Sampel

Menurut Ali (2011:83) populasi pada dasarnya merupakan sumber data

secara keseluruhan. Populasi dalam penelitian ini terbagi menjadi dua yaitu

populasi responden dan populasi sekor tes responden. Populasi responden yaitu

siswa SMA kelas XI di kabupaten Bangka Tengah yaitu SMA 1 Koba, SMA 1

Lubuk Besar, SMA 1 Namang, SMA 1 Pangkalan Baru. Sebanyak 400 orang

siswa, yang dibagi menjadi dua yaitu 200 siswa yang mengerjakan instrumen X

dan 200 orang siswa yang mengerjakan instrumen Y.

Populasi sekor tes yaitu sekor butir hasil jawaban dari 400 responden

yang mengerjakan dua perangkat tes X dan Y pada mata pelajaran Bahasa Inggris.

Kedua perangkat tes yang berbeda ini berasal dari kisi-kisi yang sama dan

memiliki butir anchor didalamnya.

Sampel dalam penelitian ini adalah sekor yang diambil dari populasi,

sekor ini yang akan digunakan dalam proses penyetaraan. Pengambilan sampel

data dalam penelitian ini menggunakan teknik cluster random sampling dengan

kelompok intack. Menurut Ali (2011:110) teknik ini merupakan teknik

penyampelan peluang, dalam penyampelan kluster dilaksanakan perandoman

meskipun pelaksanaannya bukan terhadap individu subyek, melainkan terhadap

klaster, kumpulan atau kelompok subyek.

B. Metode Penelitian

Penelitian ini termasuk penelitian deskriptif eksploratif. Menurut Sugiono

(2009:56) penelitian deskriptif adalah penelitian untuk mengetahui variabel

mandiri, baik satu variabel atau lebih (independen), tanpa membuat perbandingan

atau menghubungkan variabel yang lain. Eksploratif cenderung untuk belajar

variabel dan hubungan mereka dalam rangka untuk lebih memahami fenomena.

Menurut Borg dan Meredith (1989:32) ekploratif studi ini cenderung tidak

dipandu oleh hipotesis karena peneliti tidak memiliki pemahaman yang memadai

(22)

34

Didalam penelitian ini tidak membandingkan variabel, tetapi hanya bersifat

menganalisis kedua perangkat tes dan menyetarakan sekor yang berasal dari

kedua perangkat tes tersebut.

C. Variabel Penelitian

Variabel dapat didefinisikan sebagai segala sesuatu yang ada dan

keberadaannya memiliki lebih dari satu label atau lebih dari satu nilai (Ali,

2011:69). Dalam penelitian ini melibatkan beberapa variabel penelitian yaitu

variabel bebas, variabel moderator dan variabel terikat.

Variabel bebas dalam penelitian ini adalah metode linier. Variabel bebas

(independent variable) adalah variabel yang kemunculannya diasumsikan menjadi

sebab munculnya variabel lain (Ali, 2011:71).

Variabel moderator dalam penyetaraan ini adalah penyetaraan sekor.

Variabel moderator adalah variabel yang menjadi perantara bagi variabel bebas

dalam memberi pengaruh kepada variabel terikat (Ali, 2011:71).

Variabel terikat dalam penelitian ini adalah sekor hasil

penyetaraan.Variabel terikat yang kemunculannya diasumsikan sebagai akibat

dari adanya variabel sebab (Ali , 2011:71).

D. Definisi Operasional

1. Perangkat tes pararel yang dimaksud dalam penelitian ini adalah dua

perangkat tes Bahasa Inggris yang terdiri dari X dan Y.

2. Butir Anchor yang dimaksud dalam penelitian ini adalah butir yang disisipkan

kedalam kedua perangkat tes yang berbeda yang dikategorikan perangkat tes

X dan Y. Butir ini memiliki tempat atau posisi yang sama dan jumlah butir

yang sama.

3. Penyetaraan sekor yang dimaksud adalah penyetaraan dari sekor mentah yang

diperoleh dari perangkat tes yang satu (X) atau (Y) dimana sekor ini akan

dikonversikan pada kedua perangkat tes tersebut dengan menggunakan

penyetaraan linier dengan metode rancangan D yaitu common item non

(23)

35

E. Instrumen Penelitian

Instrumen yang digunakan dalam penelitian ini berupa tes hasil belajar

yang mengacu pada Ujian Tengah Semester (UTS) yang terdiri dari dua perangkat

tes X dan Y.

Penyusunan instrumen ini didasarkan pada indikator hasil belajar yang

hendak dicapai. Instrumen ini mencakup ranah kognitif pada kemampuan (C1),

pemahaman (C2), dan penerapan/aplikasi (C3), yang terdiri dari berbagai soal

yang disesuaikan dengan indikator soal.

Adapun langkah-langkah yang telah ditempuh dalam penyusunan kedua

instrumen tes X dan Y pada Ujian Tengah Semester (UTS) adalah sebagai berikut:

a. Menentukan konsep berdasarkan kurikulum yang berlaku untuk mata

pelajaran Bahasa Inggris di sekolah – sekolah tempat penelitian berlangsung.

b. Membuat kisi-kisi soal berdasarkan kurikulum untuk mata pelajaran Bahasa

Inggris kelas XI SMA semester dua dengan materi pokok berupa teks

Narrative, teks Spoof, teks Hortatory Exposition serta kebahasaan dan

ungkapan bahasa yang berhubungan dengan teks tersebut.

c. Membuat soal tes berdasarkan kisi-kisi dan membuat kunci jawaban.

F. Prosedur Penelitian

Prosedur penelitian yang telah dilakukan meliputi beberapa tahap

meliputi:

1. Membuat soal Bahasa Inggris

Penulis menyusun rancangan instrumen pengukuran sementara terlebih dahulu.

Penyusunan instrumen sementara berpedoman kepada kurikulum yang ada dan

berdasarkan kisi – kisi tes yang telah dirancang terlebih dahulu. Penulis

memilih pokok bahasan teks Narrative, teks Spoof dan teks Hortatory

Exposition serta kebahasaan dan ungkapan bahasa yang berhubungan dengan

teks tersebut. Yang pelajari oleh siswa kelas XI SMA. Pada rancangan

(24)

36

2. Uji validitas butir soal

Validitas butir soal diuji dengan judment ahli yang bertujuan untuk melihat

kecocokan antara butir tes yang dikembangkan dengan indikator yang telah

ditetapkan sebelumnya. Judment dilakukan oleh 9 orang yang terdiri dari guru

Bahasa Inggris.

3. Melakukan uji coba soal

Butir tes yang telah dinilai oleh ahli dan telah dinyatakan valid dan memiliki

kecocokan antara butir tes yang telah dibuat dengan indikator yang telah

ditetapkan sebelumnya di uji terlebih dahulu untuk melihat daya beda, tingkat

kesukaran dan reliabilitasnya. Pengujian instrumen dilakukan di SMA 1

Pangkalan Baru.

4. Melakukan analisis butir

Pada tahap ini peneliti melakukan analisis terhadap daya beda, tingkat

kesukaran dan reliabilitas tes secara kuantitatif. Hal ini bertujuan untuk

mendapatkan butir tes yang valid dan reliabel.

5. Meletakkan butir anchor kedalam kedua perangkat tes tersebut

Menyisipkan butir anchor pada instrumen yang telah memenuhi persyaratan

tersebut. Butir anchor yang akan digunakan diambil dari soal-soal ujian

nasional, karena dianggap telah standar dan divalidasi oleh tim BNSP. Butir

anchor ini diadaptasikan dengan pokok bahasan kelas XI pada semester genap,

Butir anchor yang dimaksud memiliki SK dan KD yang sama indikator yang

setara dengan butir non anchor. Butir anchor yang digunakan adalah 20% dari

panjang tes keseluruhan. Satu instrumen terdiri 35 butir soal, jadi 28 butir non

anchor 7 butir anchor item.

6. Menguji butir tes yang valid, reliabel dan telah disisipkan butir anchor di

kelas penelitian

Penelitian ini dilakukan di SMA 1 Koba, SMA 1 Lubuk Besar, SMA 1

Namang. Responden yang diambil sebanyak 400 orang siswa kelas XI.

Setelah tes diujikan di kelas penelitian kemudian dilakukan penyekoran

terhadap hasil tes siswa.

(25)

37

7. Setelah sekor didapat maka akan dilanjutkan dengan penyetaraan sekor

dengan menggunakan metode penyetaraan linier dengan rancangan D.

ALUR PROSEDUR PENELITIAN

Diujikan

Didapat

Diujikan

Hasil

Disetarakan

---

Gambar 3.1. Alur Penelitian

Membuat soal Bahasa Inggris X dan Y

Uji Validitas Butir Soal

Kelas Uji Coba

Reliabilitas, Tingkat Kesukaran dan Daya Pembeda

Butir Soal Bahasa Inggris yang Valid dan Reliabel

Kelas Penelitian

Sekor

(26)

38

G. Teknik Pengumpulan Data

Pengumpulan data dalam penelitian ini adalah dengan cara memberikan

instrumen yang telah di ujicoba kepada responden yaitu siswa SMA kelas XI.

Selanjutnya hasil tes yang berupa skor-skor yang diperoleh dari responden inilah

yang akan dijadikan subjek penelitian. Prosedur pengumpulan data melalui tahap

– tahap sebagai berikut:

Perangkat tes yang dibuat pararel yaitu tes Bahasa Inggris X dan Y dengan

butir anchor yang menyebar pada kedua perangkat tersebut..

1. Untuk masing – masing siswa ada yang mengerjakan tes X dan Y.

2. Responden menjawab pada lembar jawaban yang telah disediakan.

3. Sekor yang diperoleh dari 400 orang siswa (sekor responden) 200 sekor tes X

dan 200 sekor tes Y.

H. Teknik Analisis Data

Pengolahan data pada penelitian ini diawali dengan:

1. Menghitung reliabilitas

Pada tahap ini adalah menghitung reliabilitas dari perangkat tes X dan

perangkat tes Y yang telah disisipkan butir anchor pada kedua perangkat tersebut.

Reliabilitas instrumen adalah ketepatan alat ukur dalam mengukur atau ketepatan

siswa dalam menjawab alat ukur itu. Suatu tes dapat dikatakan memiliki taraf

reliabilitas yang tinggi jika tes tersebut dapat memberikan hasil tetap yang

dihitung dengan koefesien reliabilitas.

Pada penelitian ini sekor berupa dikotomi yaitu sekor tes hasil belajar siswa

yang diperoleh dalam penelitian, karena bobot soal yang diberikan bernilai 1

untuk soal yang dijawab benar dan bernilai 0 untuk soal yang dijawab salah.

Menghitung reliabilitas tes pada penelitian ini dilakukan dengan menggunakan

software ITEMAN MICROCAT Versi 3.0

2. Tingkat Kesukaran

Tingkat kesukaran adalah bilangan yang menunjukkan sukar atau

mudahnya suatu soal. Besarnya indeks kesukaran berkisar antara 0,0 sampai 1,00.

Soal dengan indeks kesukaran 0,0 menunjukkan bahwa soal tersebut terlalu sukar,

(27)

39

Indeks kesukaran diberi simbol P (proporsi) yang dihitung dengan rumus

(Susetyo, 2011) :

(3.1)

Keterangan:

P : Tingkat kesukaran

B : Banyaknya siswa yang menjawab soal itu dengan benar

JS : Jumlah seluruh siswa peserta tes

Kriteria indeks kesukaran suatu tes menurut Witherington adalah sebagai berikut:

Tabel 3.1 Kriteria Indeks Kesukaran

Batasan Kategori

0,00 ≤ P < 0,30 Soal sukar

0,30 ≤ P < 0,70 Soal sedang

0,70 ≤ P ≤ 1,00 Soal mudah

Perhitungan tingkat kesukaran kedua perangkat tes tersebut maka akan

dilakukan dengan bantuan software ITEMAN MICROCAT Versi 3.0.

3. Daya Pembeda

Daya beda (D) butir tes adalah kemampuan butir tes untuk mengetahui

seberapa besar suatu butir tes dapat membedakan (diskriminasi) antara peserta tes

yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah.

Pada penelitian ini perhitungan daya beda dilakukan dengan cara

menghitung koefisien biserial titik. Korelasi butir – total merupakan korelasi yang

didasarkan pada sekor butir dan sekor total untuk semua butir yang dijawab benar.

Untuk menguji validitas setiap butir soal, skor tiap butir soal yang

dimaksud dikorelasikan dengan skor total. Sebuah soal akan memiliki validitas

tinggi jika skor soal tersebut memiliki dukungan yang besar terhadap skor total.

Dukungan setiap butir soal dinyatakan dalam bentuk korelasi, sehingga untuk

mendapatkan validitas suatu butir soal digunakan rumus korelasi.

Perhitungan korelasi butir – total untuk data dengan sekor dikotomi

menggunakan koefisien korelasi point biserial. Adapun rumus yang digunakan

(28)

40

√ (3.2)

Keterangan:

: Validitas butir total/ daya beda

: Rata – rata sekor total responden yang menjawab benar

: Rata – rata sekor total responden yang menjawab salah

: Proporsi jawaban benar butir tes tertentu : Proporsi jawaban salah butir tes tertentu

: Standar deviasi sekor total semua responden

Ada ketentuan yang dapat digunakan dalam menetapkan daya beda pada suatu

butir tes. Menurut Nunnally koefisien korelasi diatas 0.20 sudah dianggap cukup

baik. Perhitungan daya beda butir pada kedua perangkat tes X dan Y ini akan

dilakukan dengan bantuan software ITEMAN MICROCAT Versi 3.0

4. Penyetaraan Sekor

Selanjutnya menganalisis skor dengan melakukan penyetaraan sekor yang

diperoleh dari perangkat tes X dan Y, yang mana penyetaraan sekor akan

dianalisis menggunakan program Excell. Pertama menghitung jumlah sekor

mentah yang diperolah dari kedua perangkat tes X dan Y, dengan cara

mengelompokkan sekor anchor item dan sekor non anchor item. Dari

pengelompokkan tersebut dilanjutkan dengan perhitungan statistik yaitu mencari

jumlah rata-rata, simpangan baku perangkat tes yang satu dan perangkat tes yang

lain juga beserta anchor. Kemudian disetarakan dengan menggunakan

penyetaraan linier rancangan D untuk memudahkan perhitungan, maka analisis