KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING.

(1)

Maria Agustina Amelia, 2014

KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING

Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu

KETERBANDINGAN RELIABILITAS TES HASIL

BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN

NUMBER-RIGHT SCORE DAN METODE PENSKORAN

CORRECTION FOR GUESSING

TESIS

Diajukan untuk Memenuhi Sebagian dari

Syarat untuk Memperoleh Gelar Magister Pendidikan

Program Studi Penelitian dan Pengukuran Pendidikan

Oleh :

Maria Agustina Amelia

1201086

PROGRAM STUDI PENELITIAN DAN PENGUKURAN

PENDIDIKAN

SEKOLAH PASCASARJANA

UNIVERSITAS PENDIDIKAN INDONESIA

(2)

KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT

SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING

Oleh

MARIA AGUSTINA AMELIA

S.Si. Universitas Sanata Dharma Yogyakarta, 2002

Sebuah Tesis yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Magister Pendidikan (M.Pd.) pada Penelitian dan Pengukuran Pendidikan

Juli 2014

Hak Cipta dilindungi undang-undang.

Tesis ini tidak boleh diperbanyak seluruhya atau sebagian,

(3)

(4)

(5)

Keterbandingan Reliabilitas Tes Hasil Belajar Matematika Berdasar Metode

Penskoran Number-Right Score dan Metode Penskoran Correction for Guessing

Oleh:

ABSTRAK

Penelitian ini bertujuan untuk mengetahui keterbandingan reliabilitas tes hasil belajar matematika berdasar metode penskoran number-right score dan metode penskoran correction for guessing. Penelitian menggunakan metode penelitian kuasi-eksperimental dengan desain perbandingan kelompok statis (the static group comparison design). Instrumen yang digunakan adalah tes hasil belajar matematika berbentuk pilihan ganda yang diberikan pada siswa Sekolah Dasar kelas V. Penelitian dilaksanakan di dua SD yang terletak di kota Bandung pada 357 peserta didik. Populasi penelitian berupa skor tes hasil belajar dengan metode penskoran number-right score, punishment score dan reward score. Hipotesis penelitian diuji menggunakan uji Friedman (Friedman test). Hasil analisis pada taraf signifikansi 0,05 diperoleh hasil: ada perbedaan reliabilitas hasil belajar antara yang dinilai menggunakan metode penskoran number-right score dengan metode penskoran correction for guessing yaitu metode penskoran punishment score dan reward score. Hasil dari uji pasca hipotesis adalah (1) Ada perbedaan reliabilitas hasil belajar antara yang dinilai menggunakan metode penskoran number-right score dengan metode penskoran punishment score; (2) Ada perbedaan reliabilitas hasil belajar antara yang dinilai menggunakan metode penskoran number-right score dengan metode penskoran reward score; (3) Ada perbedaan reliabilitas hasil belajar antara yang dinilai menggunakan metode penskoran punishment score dengan metode penskoran reward score.

(6)

Comparability of Reliability on Mathematics Achievement Test Based on the

method of Scoring Number-Right Score and Correction for Guessing

By:

ABSTRACT

This study aims to percieve comparison of the reliability on multiple choice mathematics achievement test based on number-right scoring method and correction for guessing scoring method. The study was conducted using an quasi-experimental method and the static group comparison design. The instrument used is a mathematics achievement test given at the fifth grade of elementary school students. The research was held in two elementary school in Bandung with 357 students. Population of the research is achievement test scores with number-right, punishment, and reward scoring method. The hypotheses research were tested using Friedman test. Analysis result at 0,05 significance level shown that there is a difference between reliability that scored with number-right, punishment, and reward scoring methods. Posthoc analysis result at 5% significance level shown that (1) There is a difference between reliability that scored with number-right and punishment scoring methods; (2) There is a difference between reliability that scored with number-right and reward scoring methods; (3) There is no difference between reliability that scored with punishment, and reward scoring methods.

(7)

DAFTAR ISI

COVER ... i

LEMBAR PENGESAHAN ... ii

PERNYATAAN ... iv

KATA PENGANTAR ... v

UCAPAN TERIMAKASIH ... vi

ABSTRAK ... viii

ABSTRCT ... ix

DAFTAR ISI ... x

DAFTAR TABEL ... xii

DAFTAR GAMBAR ... xiv

DAFTAR LAMPIRAN ... xv

BAB I PENDAHULUAN A. Latar Belakang Masalah ... 1

B. Identifikasi Masalah ... 6

C. Pembatasan Masalah ... 8

D. Perumusan Masalah ... 9

E. Tujuan Penelitian ... 9

F. Manfaat Penelitian ... 10

BAB II KAJIAN TEORITIS A. Deskripsi Konsep ... 11

1. Reliabilitas Tes ... 11

2. Tes Hasil Belajar ... 20

3. Teknik Penskoran Tes ... 22

B. Hasil Penelitian Terdahulu yang Relevan ... 27

C. Kerangka Berpikir ... 27

(8)

BAB III METODOLOGI PENELITIAN

A. Variabel Penelitian ... 31

B. Metode dan Desain Penelitian ... 31

C. Populasi dan Sampel ... 32

D. Instrumen dan Teknik Pengumpulan Data ... 33

1. Instrumen ... 33

2. Teknik Pengumpulan Data ... 38

E. Teknik Pengolahan Data ... 39

BAB IV HASIL DAN PEMBAHASAN PENELITIAN A. Data Uji Coba ... 45

1. Uji Validitas Isi ... 45

2. Uji Kesetaraan (konkordansi) ... 46

3. Uji Reliabilitas ... 47

4. Analisis Tingkat Kesukaran ... 52

5. Analisis Daya Beda ... 53

6. Analisis Distraktor ... 54

B. Data Penelitian ... 56

1. Uji Asumsi ... .56

2. Uji Hipotesis ... .66

C. Pembahasan Hasil Penelitian... 71

D. Keterbatasan Penelitian ... 74

BAB V KESIMPULAN DAN SARAN A. Kesimpulan ... 75

B. Saran ... 76

DAFTAR PUSTAKA ... 77

(9)

BAB I PENDAHULUAN

A. Latar Belakang Masalah

Pendidikan merupakan komponen penting dalam pengembangan sumber

daya manusia. Menurut Undang-Undang Nomor 20 Tahun 2003 Tentang Sistem

Pendidikan Nasional, didefinisikan :

pendidikan sebagai suatu usaha sadar dan terencana untuk mewujudkan suasana belajar dan proses pembelajaran agar peserta didik secara aktif mengembangkan potensi dirinya untuk memiliki kekuatan spiritual keagamaan, pengendalian diri, kepribadian, kecerdasan, akhlak mulia, serta keterampilan yang diperlukan dirinya, masyarakat, bangsa dan negara.

Indonesia memiliki 237.641.000 penduduk, dengan 19, 33% berada dalam

usia pendidikan dasar (Badan Pusat Statistik, 2013). Penduduk yang masih berada

dalam level pendidikan dasar tersebut, jika mendapatkan pendidikan yang baik,

akan menjadi sumber daya manusia berkualitas sesuai dengan yang dicanangkan

dalam Undang-Undang tersebut. “Lembaga pendidikan selalu berusaha untuk

meningkatkan kemampuan dan kualitas lulusannya” (Mardapi, 2012: 1). Tujuan

sekolah sebagai lembaga pendidikan adalah mengembangkan potensi peserta

didik secara optimal menjadi kemampuan untuk hidup dalam masyarakat.

Pengembangan potensi peserta didik dilakukan melalui proses pembelajaran.

Pencapaian belajar atau sering disebut dengan hasil belajar merupakan tingkat

kompetensi yang dicapai peserta didik yang mencakup tiga ranah, yaitu ranah

kognitif, ranah afektif, dan ranah psikomotor. Kualitas pendidikan dilihat dari

kemampuan lulusan suatu jenjang pendidikan. Menurut Mardapi (2012: 3) “kemampuan lulusan adalah kemampuan melakukan suatu tugas atau pekerjaan. Proses pendidikan dikatakan berhasil jika peserta didik berhasil menguasai

(10)

peserta didik dicantumkan dalam Kisi-kisi soal atau dalam Standar Kompetensi

Lulusan (SKL).

Untuk dapat mengukur kemampuan, keberhasilan belajar, sikap, minat,

atau ciri terpendam yang terdapat pada para peserta didik dilakukan pengukuran di

bidang pendidikan. Pengukuran pada dasarnya merupakan kegiatan penentuan

angka bagi suatu objek secara sistematik. Penentuan angka ini merupakan usaha

untuk menggambarkan karakteristik suatu objek. Pengukuran terhadap objek non

fisik seperti prestasi belajar dilakukan secara tidak langsung, yaitu melalui

pemberian stimulus. Stimulus bisa berupa pertanyaan atau pernyataan, sedangkan

respon peserta didik berupa jawaban pertanyaan, pendapat atau persepsi terhadap suatu pertanyaan. “Kalau stimulus yang diberikan tepat, maka respon yang diberikan akan menunjukkan kemampuan, keberhasilan belajar, sikap, minat, atau

atribut lain yang ingin diukur. Respon tersebut dapat ditafsirkan dengan memberikan skor yang sesuai” (Naga, 1992: 2).

“Tujuan utama suatu tes adalah mengukur dan menemukan kemampuan peserta ujites” (Naga, 1992: 114). Pada jangka waktu tertentu, kemampuan sesungguhnya dari peserta didik tetap (konstan). Konsistensi dan keajegan skor berkaitan dengan reliabilitas. “Reliabilitas atau keandalan merupakan koefisien yang menunjukkan tingkat keajegan atau konsistensi hasil pengukuran suatu tes”

(Mardapi, 2012: 51). Konsistensi yang dimaksudkan adalah konsistensi hasil

pengukuran dengan menggunakan alat ukur yang sama untuk orang yang berbeda

atau pada waktu yang berbeda tetapi dengan kondisi yang sama. Tujuan mengukur

reliabilitas tes adalah untuk mengetahui tingkat ketepatan (precision) dan

keajegan (consistency) skor tes. Keadaan subjek sebenarnya sama, namun jika

dilakukan pengukuran ulang terhadap subjek yang sama sangat mungkin diperoleh hasil yang berbeda. “Menurut teori pengukuran klasik, koefisien reliabilitas dinyatakan oleh rasio varians skor sebenarnya dengan varians skor tampak” (Mardapi, 2011: 54).

Bentuk tes objektif yang umum digunakan dalam berbagai jenjang

(11)

pilihan ganda adalah luas cakupan materi yang dapat diujikan dan objektifitas

penilaiannya. Selain itu proses menjawab soal relatif mudah dilakukan oleh

peserta didik. Bentuk tes pilihan ganda juga memiliki kelemahan yaitu proses

pembuatan membutuhkan waktu dan tenaga yang banyak selain itu terdapat

kemungkinan peserta didik menjawab dengan menebak. Dalam suatu tes

berbentuk pilihan ganda sangat dimungkinkan diperoleh hasil yang tidak sesuai

dengan kemampuan peserta didik. Ketidaksesuaian antara hasil tes dengan

kemampuan peserta didik tersebut dapat terjadi jika dalam pengerjaan tes, peserta

didik menjawab dengan menebak. Faktor menebak dari peserta didik akan

berpengaruh pada konsistensi hasil tes dari waktu ke waktu. Faktor menebak

terjadi jika peserta didik dengan pengetahuan dan kemampuan yang kurang secara

random memilih jawaban dan jawaban tersebut benar.

Menurut teori klasik, jika peserta didik mengerjakan suatu bentuk tes yang

sama dengan waktu berbeda dapat terjadi bahwa skor yang dihasilkan tidak sama.

Perbedaan skor antara tes pertama dengan tes kedua dipengaruhi oleh error.

Terkadang error tersebut dapat membuat peserta didik mendapat nilai melebihi

kemampuan peserta didik yang sebenarnya. Hal tersebut terjadi jika peserta didik

mengerjakan soal dengan menebak. Jika dilakukan tes berulang-ulang, hasil tes

peserta didik yang melakukan faktor menebak tidak akan sama (berubah-ubah),

maka hasil pengukuran menjadi tidak reliabel. Semua hal yang tidak relevan dan

ikut mempengaruhi hasil pengukuran merupakan sumber ketidakreliabelan, atau

kesalahan pengukuran. Jika skor peserta didik berubah-ubah secara signifikan,

maka hasil tes tersebut tidak dapat mengungkapkan kemampuan peserta didik

yang sebenarnya. Berarti dengan perilaku menebak hasil tes tidak mencerminkan

kemampuan peserta didik.

Salah satu tes yang menggunakan bentuk pilihan ganda adalah Ujian

Nasional yang diselenggarakan oleh dinas pendidikan mulai dari jenjang

Pendidikan dasar hingga Sekolah Menengah. “Harapan terhadap Ujian Nasional

(12)

(Greany dan Kellaghan dalam Mardapi, 2012: 224). Menurut data Dinas

Pendidikan Provinsi Jawa Barat, pada tahun 2013 hasil UN SD mata pelajaran

matematika mendapat rata-rata nilai 7,30 dengan variansi 1,72. Dari hasil UN

tersebut dapat dikatakan bahwa kemampuan atau kompetensi matematis peserta

didik di kota Bandung sebesar 73% dari seluruh standar kompetensi minimal yang

diberikan. Dari hasil UN tersebut, dapat dilihat bahwa nilai matematika peserta

didik tersebut berada di atas persentil ketujuh puluh.

Penilaian yang biasa dilakukan dalam tes bentuk pilihan ganda adalah

bentuk number-right score atau disebut juga jumlah skor benar. Dasar metode

penskoran number-right score ini adalah peserta didik dengan pengetahuan atau

kemampuan yang cukup akan menjawab soal dengan benar. Peserta didik yang

pengetahuan dan kemampuannya kurang akan menjawab soal dengan salah.

Menurut pendapat Crocker dan Algina (1986: 399) mengenai metode penskoran

konvensional (number-right score) :

butir soal dinilai secara dikotomus jika nilai yang diberikan adalah 0 dan 1 dan tidak ada penilaian terhadap jawaban yang diabaikan atau tidak dijawab. Dengan metode penilaian ini setiap butir soal memiliki bobot yang sama meskipun metode penskoran konvensional ini sederhana dan mudah diaplikasikan, namun dapat menimbulkan masalah jika digunakan dalam soal pilihan ganda ataupun soal benar-salah. Telah lama diketahui bahwa keinginan peserta didik untuk mengosongkan jawaban saat mereka tidak memiliki kemampuan yang cukup untuk menjawab suatu soal bervariasi.

Metode penskoran tes secara number-right score adalah peserta didik

akan diberi nilai satu jika menjawab dengan benar dan mendapat nilai nol jika

menjawab salah. Kelemahan dari metode penilaian tersebut adalah tidak

memperhitungkan adanya faktor tebakan dari peserta didik karena peserta didik

memiliki variasi dalam hal mengosongkan jawaban soal tes jika mereka tidak

memiliki kemampuan yang cukup untuk menjawab soal tes tersebut. Ada peserta

didik yang akan memilih untuk mengosongkan jawaban untuk soal-soal yang

tidak dapat mereka jawab. Ada pula peserta didik yang tidak ingin mengosongkan

jawaban dan memilih untuk memilih jawaban secara random dari alternatif

(13)

Dengan metode penilaian number-right score, antara peserta didik yang

tidak menjawab dan peserta didik yang menjawab salah akan sama-sama

mendapat nilai nol. Dengan metode penskoran number-right score, faktor

menebak pada jawaban peserta tidak terlalu diperhatikan. Karena adanya faktor

menebak saat menjawab soal tes, hasil tes tidak mencerminkan kemampuan

peserta didik dan dimungkinkan terjadinya inkonsistensi hasil tes. Jika peserta

didik dapat mengerjakan tes tanpa melakukan tebakan, maka skor hasil tes

tersebut akan konsisten dan mencerminkan kemampuan siswa yang sebenarnya.

Agar didapatkan hasil tes yang konsisten dan mencerminkan kemampuan siswa

yang sebenarnya, perlu digunakan suatu cara untuk meminimalisir faktor menebak

dari peserta didik. Salah satu cara yang dapat dilakukan untuk meminimalisir

kemungkinan menebak adalah menerapkan metode penskoran koreksi terhadap

tebakan (correction for guessing). Metode penskoran correction for guessing

digunakan sebagai cara untuk mengurangi unsur tebakan dari peserta didik.

Metode penskoran correction for guessing terdiri dari dua metode penskoran

yaitu: 1) Penskoran dengan punishment score dan 2) Penskoran dengan reward

score. Dengan teknik penskoran correction for guessing tambahan nilai karena

unsur tebakan akan dikoreksi sehingga didapatkan skor akhir yang lebih konsisten

dan lebih mencerminkan kemampuan peserta didik yang sebenarnya. Skor yang

lebih konsisten tersebut akan berpengaruh pada koefisien reliabilitas skor tes hasil

belajar.

Teknik penilaian dengan pinalti dilakukan jika peserta didik menjawab

benar maka akan mendapat nilai satu. Jika responden menjawab salah, skor

responden akan dikurangi sebesar nilai tertentu. Sedangkan jika responden tidak

menjawab akan mendapat nilai nol. Teknik penilaian dengan reward score

dilakukan jika peserta didik menjawab benar akan mendapat nilai satu. Jika

responden menjawab salah akan mendapat nilai nol dan jika responden tidak

menjawab akan mendapat sejumlah tertentu tambahan skor.

Metode penskoran yang selama ini digunakan untuk menilai bentuk tes

(14)

number-right score tidak diperhitungkan adanya tebakan pada jawaban tes. Faktor

tebakan merupakan salah satu sumber munculnya kesalahan pengukuran karena

mengakibatkan inkonsistensi hasil pengukuran. Kesalahan pengukuran berakibat

pada tingkat reliabilitas tes. Padahal ada metode penskoran correction for

guessing yaitu punishment score dan reward score dipercaya dapat meningkatkan

reliabilitas tes. Peningkatan reliabilitas itu disebabkan karena ada koreksi terhadap

faktor tebakan sehingga diperoleh hasil tes yang lebih konsisten dengan variansi

skor hasil tes relatif kecil. “Variansi skor yang kecil ini dipercaya menjadi penduga yang baik untuk dapat mengetahui kemampuan seseorang” (Crocker dan Algina, 1986: 402). Berarti reliabilitas suatu tes dapat dipengaruhi oleh metode

penskoran, semakin berkurang faktor tebakan maka hasil tes akan semakin

konsisten. Namun metode penskoran correction for guessing ini masih jarang

digunakan dalam melakukan penilaian hasil belajar di berbagai tingkat pendidikan

di Indonesia.

Penelitian mengenai reliabilitas tes yang berkaitan dengan metode

penskoran correction for guessing sebenarnya sudah banyak dilakukan, terutama

mengenai correction for guessing dengan metode penskoran punishment score

yang dilakukan di Sekolah Menengah Pertama maupun di Sekolah Menengah

Atas. Metode penskoran pinalti juga digunakan dalam tes saringan masuk

perguruan tinggi negeri (SNMPTN). Hasil dari berbagai penelitian tersebut

menyatakan bahwa metode penskoran correction for guessing dapat

meningkatkan reliabilitas tes. Penelitian reliabilitas yang berkaitan dengan teknik

penilaian correction for guessing yang dilakukan di Sekolah Dasar masih jarang

dilakukan. Peneliti ingin melakukan penelitian mengenai perbedaan reliabilitas tes

hasil belajar jika dilakukan metode penskoran number-right score dengan

reliabilitas tes hasil belajar jika dilakukan metode penskoran correction for

guessing dengan menggunakan punishment score dan reward score.

(15)

Tes berbentuk pilihan ganda sampai saat ini merupakan bentuk tes yang

banyak digunakan pada berbagai jenjang pendidikan. Tes pilihan ganda digunakan

karena cakupannya yang luas, waktu pengerjaan perbutir relatif singkat dan

mudah proses penskorannya. Bentuk tes pilihan ganda dapat digunakan di segala

tingkat pendidikan dari tingkat Sekolah Dasar hingga Perguruan Tinggi. Namun

dengan bentuk tes pilihan ganda, dimungkinkan adanya faktor tebakan yang

dilakukan oleh siswa. Faktor menebak ini tentu saja berpengaruh pada reliabilitas

tes. Padahal hasil tes biasanya dijadikan dasar pengambilan keputusan dalam

bidang pendidikan. Jika hasil tes tidak reliabel maka keputusan yang diambil tidak

tepat.

Reliabilias suatu tes hasil belajar dianggap penting karena menurut (Azwar, 2012: 7) “gagasan pokok yang terkandung dalam konsep reliabilias adalah sejauhmana hasil suatu proses pengukuran dapat dipercaya”. Informasi yang didapat dari skor atau nilai dari suatu tes hasil belajar digunakan untuk

menilai kualitas lulusan di berbagai jenjang pendidikan. Informasi tersebut

selanjutnya digunakan sebagai dasar pengambilan kebijakan bagi perbaikan

kualitas pendidikan. Beberapa faktor yang menyebabkan error dalam pengukuran

terutama pada bidang pendidikan diantaranya : adanya tebakan, gangguan saat

pengerjaan tes hasil belajar, kekeliruan saat pelaksanaan tes, pengambilan sampel

soal, kesalahan penilaian , keadaan peserta didik yang berubah-ubah. Error dalam

pegukuran akan mempengaruhi reliabilitas tes hasil belajar. Beberapa hal yang

mempengaruhi tingkat reliabilitas tes diantaranya : penampilan peserta tes kurang

prima, penilaian tidak objektif, tes terlalu pendek, soal tes terlalu mudah atau

terlalu sulit, mencontek saat tes atau waktu dan tepat tes yang tidak

menyenangkan.

Tebakan saat menjawab soal tes merupakan salah satu sumber error dalam

pengukuran yang akan mempengaruhi reliabilitas skor tes hasil belajar. Faktor

tebakan seringkali terjadi jika peserta didik mengerjakan tes dengan bentuk

objektif dengan alternatif jawaban misalnya soal pilihan ganda. Sistem penilaian

(16)

pilihan ganda, unsur tebakan tidak diperhitungkan. Padahal ada metode penskoran

lain yang dapat digunakan yaitu metode penskoran correction for guessing yang

terdiri dari punishment score dan reward score. Metode penskoran correction for

guessing ini memperhitungkan adanya tebakan dan bertujuan melakukan koreksi

terhadap tebakan tersebut sehingga error dalam pengukuran dapat berkurang dan

dapat meningkatkan reliabilitas.

Penelitian mengenai keterbandingan reliabilitas tes hasil belajar jika

dilakukan metode penskoran number-right score dengan reliabilitas tes hasil

belajar jika dilakukan metode penskoran correction for guessing ini ingin

mengetahui dan mencari bukti secara empiris adanya pengaruh metode penskoran

yang dapat mengurangi adanya faktor menebak pada tes berbentuk pilihan ganda

terhadap reliabilitas tes. Metode penskoran yang selama ini digunakan adalah

metode penskoran number-right score. Metode penilaian tersebut dirasa tidak

mempertimbangkan adanya faktor tebakan oleh peserta didik. Metode penskoran

yang mempertimbangkan adanya faktor tebakan disebut metode penskoran

correction for guessing yaitu metode penskoran punishment score dan reward

score.

Masalah yang dapat diidentifikasi dalam penelitian ini adalah mengenai

perbedaan reliabilitas tes hasil belajar jika dilakukan metode penskoran yang

berbeda yaitu metode penskoran number-right score dan metode penskoran

correction for guessing. Masalah lain yang dapat diidentifikasi adalah mengenai

perbedaan reliabilitas tes hasil belajar antara metode penskoran correction for

guessing yaitu metode penskoran punishment score dan metode penskoran

reward score.

C. Pembatasan Masalah

Reliabilitas skor hasil belajar merupakan hal penting dalam dunia

pendidikan karena berpengaruh pada informasi mengenai kualitas lulusan dan

peningkatan kualitas pendidikan. Berbagai kekeliruan dapat mempengaruhi

(17)

pada reliabilitas skor hasil belajar adalah tebakan saat menjawab soal pilihan

ganda, Padahal sudah ada teknik penskoran yang dapat melakukan koreksi

terhadap tebakan yaitu metode penskoran correction for guessing.

Pada penelitian yang dilakukan ini, peneliti akan fokus pada metode

penskoran yang berpengaruh pada reliabilitas tes hasil belajar matematika di

Sekolah Dasar. Metode penskoran yang dimaksud adalah metode penskoran

number-right score dan metode penskoran correction for guessing yaitu metode

penskoran punishment score dan metode penskoran reward score. Berbagai

sumber yang mempengaruhi reliabilitas skor hasil belajar tidak akan dibahas pada

penelitian ini.

Penelitian akan membahas mengenai keterbandingan reliabilitas jika

diberikan metode penskoran yang berbeda yaitu metode penskoran number-right

score dan metode penskoran correction for guessing yaitu metode penskoran

punishment score dan metode penskoran reward score.

D. Perumusan Masalah

Masalah yang akan diteliti adalah :

1. Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai

menggunakan metode penskoran number-right score dengan metode

penskoran correction for guessing yaitu metode penskoran punishment score,

dan reliabilitas dari metode penskoran reward score?

penskoran punishment score?

penskoran reward score?

menggunakan metode penskoran punishment score dengan metode penskoran

(18)

E. Tujuan Penelitian

Secara umum penelitian ini bertujuan untuk memperoleh gambaran

mengenai perbedaan reliabilitas jika dilakukan metode penskoran yang berbeda

untuk menilai tes hasil belajar siswa Sekolah Dasar. Hasil penelitian akan menjadi

tambahan bukti bahwa metode penskoran yang tepat akan berpengaruh pada

reliabilitas tes hasil belajar. Tes hasil belajar yang reliabel selanjutnya juga

berpengaruh pada pengambilan keputusan yang tepat pula.

Secara khusus tujuan dari penelitian adalah :

1. Memperoleh gambaran mengenai perbedaan reliabilitas hasil belajar antara

yang dinilai menggunakan metode penskoran number-right score dengan

metode penskoran correction for guessing.

metode penskoran punishment score.

metode penskoran reward score.

yang dinilai menggunakan metode penskoran punishment score dengan

F. Manfaat Penelitian

Informasi yang didapat dari penelitian ini memiliki beberapa manfaat, diantaranya

1. Bagi para pendidik akan didapatkan metode penskoran yang dapat

mengurangi efek tebakan pada tes hasil belajar dengan meningkatkan

reliabilitas tes hasil belajar.

2. Secara teoritis didapatkan bukti empiris bahwa metode penskoran akan

mempunyai pengaruh yang berbeda terhadap reliabilitas tes hasil belajar dan

dapat menambah informasi untuk memilih metode penskoran yang lebih

(19)

BAB III

METODOLOGI PENELITIAN

A. Variabel Penelitian

Secara garis besar variabel penelitian mengenai keterbandingan reliabilitas

berdasar metode penskoran number-right score dengan metode penskoran

correction for guessing dibagi menjadi dua yaitu:

1. Variabel bebas pada penelitian ini adalah metode penskoran dengan

menggunakan tiga metode penskoran yaitu metode penskoran number-right

score dan metode penskoran correction for guessing yaitu metode penskoran

punishment score dan metode penskoran reward score.

2. Variabel terikat pada penelitian ini adalah reliabilitas tes.

B. Metode Penelitian

Penelitian mengenai keterbandingan reliabilitas tes hasil belajar

matematika berdasar metode penskoran number-right score dan metode

penskoran correction for guessing ini merupakan penelitian kuantitatif. Metode

yang digunakan dalam penelitian ini adalah metode penelitian

kuasi-eksperimental (eksperimen semu). Menurut Ali (2011: 284) “Perbedaan utama

studi eksperimental dan studi kuasi-eksperimental terletak pada pemilihan subyek

sampel secara random dan penugasan subyek secara random ... pada hakekatnya

studi kuasi-eksperimental adalah studi eksperimental”. Jadi metode Penelitian

kuasi-eksperimental adalah metode penelitian yang dilakukan melalui kegiatan

ekperimentasi atau percobaan yang sengaja dilakukan dan terkontrol. Peneliti

tidak melakukan penugasan random saat melakukan penelitian yaitu saat

melakukan penskoran menggunakan tiga metode penskoran yaitu metode

penskoran number-right score dan metode penskoran correction for guessing

(20)

Desain penelitian

Desain penelitian yang digunakan adalah desain perbandingan kelompok

statis (the static group comparison design) yaitu penelitian membandingkan tiga

kelompok penelitian. Satu kelompok kontrol reliabilitas skor hasil tesnya

menggunakan metode penskoran number-right score. Sedangkan dua kelompok

eksperimen lain reliabilitas skor hasil tesnya menggunakan metode penskoran

correction for guessing yaitu punishment score dan reward score.

Tabel 3.1 Desain perbandingan kelompok berdasar metode penskoran Model Penskoran

Number-right score Correction for guessing

Punishment score reward score

Populasi penelitian dibedakan menjadi dua bagian yaitu populasi subyek

penelitian dan populasi skor. Populasi subjek adalah seluruh siswa Sekolah Dasar

di kota Bandung. Populasi skor adalah skor siswa dan skor butir yang datanya

diambil dari hasil tes sampel siswa Sekolah Dasar di Bandung.

Sampel subjek dipilih dari seluruh siswa Sekolah Dasar Negeri di kota

Bandung yang berjumlah 575 sekolah. Pengambilan sampel menggunakan teknik

random sampling. Menurut Taniredja dan Mustafidah (2012: 35) “Teknik random

sampling disebut juga acak, serampangan, tidak pandang bulu/ tidak pilih kasih,

objektif, sehingga seluruh elemen populasi mempunyai kesempatan untuk jadi

(21)

subjek memiliki peluang yang sama untuk dipilih menjadi sampel subjek. Alasan

dipilih teknik pengambilan sampel random sampling karena pada tingkat sekolah

dasar, penerimaan peserta didik tidak didasarkan pada nilai tertentu atau

berdasarkan tes masuk jadi diasumsikan bahwa peserta didik ditingkat sekolah

dasar memiliki kemampuan yang merata. Selain hal tersebut sampel subjek dipilih

karena sudah selesai mengajarkan materi pecahan yang merupakan materi yang

akan diujikan dalam instrumen penelitian. Dari 575 Sekolah Dasar Negeri di kota

Bandung dipilih secara random lima Sekolah Dasar Negeri sebagai tempat

pelaksanaan penelitian.

Sampel siswa kemudian diberikan tes hasil belajar yang sama yaitu

mengenai materi pecahan. Dari tes belajar tersebut, jawaban masing-masing

peserta didik akan dinilai menggunakan tiga kelompok berdasar tiga metode

penskoran yaitu metode number-right score, punishment score dan reward score.

Berdasarkan data kelompok populasi skor tersebut, masing-masing kelompok

akan diambil data dengan metode pengambilan Sampel Acak Dengan

Pengembalian (SADP) sebanyak sepuluh kali jumlah faktor atau variabel yang

memberi pengaruh pada hasil tes. Setelah didapatkan data skor yang diinginkan,

hitung reliabilitas dari data skor tersebut. Ulangi pengambilan data secara acak

dengan pengembalian sehingga didapat data tiga puluh koefisien reliabilitas.

Ketiga puluh data koefisien reliabilitas dari masing-masing kelompok skor yang

dijadikan data sampel penelitian.

Sampel skor berupa data koefisien reliabilitas dari kelompok skor siswa

yang dinilai menggunakan metode penskoran number-right score, metode

penskoran punishment score dan metode penskoran reward score.

D. Instrumen dan Teknik Pengumpulan Data

1. Instrumen

Instrumen yang digunakan dalam penelitian adalah tes berbentuk pilihan

ganda dengan empat pilihan jawaban. Ruang lingkup materi yang akan diujikan

(22)

Sebelum digunakan, instrumen diujicobakan dahulu kepada siswa untuk

mengetahui validitas dan reliabilitas instrumen. Sesuai dengan pendapat

Arikunto (dalam Taniredja, 2012: 41) “instrumen yang baik harus memenuhi dua persyaratan penting yaitu valid dan reliabel”. Soal uji coba tes dibagi menjadi dua tipe dengan masing-masing tipe berisi 20 butir soal. Uji coba diberikan di tiga kelas (100 peserta didik) dengan masing-masing kelas diminta mengerjakan dua

jenis soal. Selain itu agar didapat instrumen yang baik, masing-masing butir akan

diuji tingkat kesukaran, daya beda dan analisis distraktor.

1. Uji Validitas

Pengujian validitas dilakukan dengan menguji validitas isi dari instrumen.

Pengujian validitas isi dilakukan dengan meminta lima orang ahli atau praktisi

pendidikan di bidang matematika. Format yang digunakan untuk validasi adalah

format skala penilaian (judgement ahli) bentuk dikotomi dengan skala satu-nol.

Nilai 1 = sesuai dan nilai 0 = tidak sesuai

Tabel 3.2 Format skala penilaian judgement ahli

Butir Penilai Jumlah

sesuai persentase

1 2 . . n

1

x11 x12 . . x1n ∑ ∑

2

x21 x22 . . x2n ∑ ∑

. x31 x32 . . x3n . .

. x41 x42 . . x4n . .

m xm1 xm2 . . xmn ∑ ∑

Perhitungan validitas isi menggunakan persentase butir yang cocok dengan

(23)

∑ _(3.1)

dengan

m = jumlah penilai = 5

∑

Menurut Susetyo (2011: 92) “Butir soal dikatakan valid jika diperoleh persentase lebih besar dari 50% ”.

2. Uji Keselarasan (Konkordansi)

Selain uji validitas, dilakukan uji keselarasan (konkordansi) antar penilai

menggunakan uji Cochran. Uji Cochran dilakukan untuk melihat apakah ada

kesepakatan antar penilai saat melakukan validitas isi terhadap instrumen tes.

Hipotesis uji

H0 : Terdapat kesamaan penilaian yang diberikan saat melakukan validitas isi

instrumen tes

H1 : Tidak terdapat kesamaan penilaian yang diberikan saat melakukan

validitas isi instrumen tes

Signifikansi uji

∑ ( ̅)

∑ ∑ (3.2)

dengan

m = jumlah penilai

= jumlah nilai “cocok” pada kolom ke-i

̅= rata- rata nilai Gi

= jumlah nilai “cocok” pada baris ke-i

Kriteria uji

H0 ditolak jika Q < 2tabel atau jika p <  = 0,05

(24)

Uji Cochran dilakukan dengan menggunakan software Statistical Package for

Social Sciences (SPSS).

3. Uji Reliabilitas

Setelah diperoleh hasil validitas isi instrumen diujicobakan di lapangan.

Hasil uji coba digunakan untuk mengukur reliabilitas tes. Koefisien reliabilitas

dihitung mengunakan teknik perhitungan Alpha Cronbach yaitu :

∑

(3.4) dengan

 = koefisien korelasi Alpha Cronbach

k = banyaknya butir soal

s2X = varians skor pada keseluruhan tes X

s2i = varians skor pada belahan tes ke-i

Pendapat Naga (2012: 241) mengenai kriteria koefisien reliabilitas Alpha

Cronbach :

Tabel 3.3 Kriteria umum koefisien reliabilitas Alpha Cronbach Reliabilitas Alpha Cronbach Kriteria

 < 0,50 Tidak dapat diterima

0,50 ≤  < 0,60 Kurang

0,60 ≤  < 0,70 Bermasalah

0,70 ≤  < 0,80 Dapat diterima

0,80 ≤  < 0,90 Baik

(25)

Butir soal dikatakan reliabel jika memiliki koefisien reliabilitas lebih besar dari 0,7 ( ≥ 0,7).

4. Analisis Tingkat Kesukaran

Tingkat kesukaran merupakan perbandingan jumlah siswa yang menjawab

benar suatu butir soal dengan jumlah seluruh peserta tes. Tingkat kesukaran biasa

dinyatakan dalam bentuk proporsi dan berkisar dari nilai 0,00 hingga 1,00. Jika

nilai tingkat kesukaran makin mendekati nol, maka butir soal semakin sukar.

Sebaliknya jika nilai tingkat kesukaran makin mendekati satu, maka butir soal

semakin mudah. Berikut ini klasifikasi tingkat kesukaran menurut Witherington

(dalam Susetyo, 2011: 154) :

Tabel 3.4 Klasifikasi tingkat kesukaran Rentang Klasifikasi

0,00 ≤ P ≤ 0,24 Sukar

0,25 ≤ P ≤ 0,74 Sedang

0,75 ≤ P ≤ 1,00 Mudah

Butir soal pada konstruksi tes Sumatif seperti Ujian Akhir bab dengan

materi pecahan diharapkan memiliki tingkat kesukaran tiap butir dapat bervariasi

dari butir dengan tingkat kesukaran mudah hingga sukar. Penyebaran tingkat

kesukaran yang berdistribusi normal dengan sebaran soal sukar 20%, soal sedang

50% dan soal mudah 30% dari keseluruhan jumlah soal.

5. Analisis Daya Beda

Daya beda digunakan untuk membedakan siswa yang berkemampuan

tinggi dan berkemampuan rendah. Analisis daya beda menggunakan korelasi point

biserial yang perhitungannya dilakukan menggunakan program ITEMAN.

Pembagian daya beda menurut Ebel (Susetyo, 2011: 161)

(26)

Indeks daya beda Klasifikasi

0,70 ≤ D ≤ 1,00 Daya beda baik

0,40 ≤ D ≤ 0,69 Daya beda cukup baik 0,30 ≤ D ≤ 0,39 Perlu sedikit revisi

0,20 ≤ D ≤ 0,29 Perlu revisi atau disisihkan

0,00 ≤ D ≤ 0,19 Revisi total atau disisihkan

Jika indeks daya beda semakin mendekati nilai satu maka butir soal

semakin baik dalam membedakan siswa dengan kemampuan tinggi dengan siswa

dengan kemampuan rendah. Menurut Nunnally (Dali, 1992: 7) “butir soal dengan

daya beda di atas 0,2 sudah cukup baik. Butir soal dengan indeks daya beda

kurang dari 0,2 perlu dibuang karena kurang baik dalam membedakan

kemampuan siswa”.

6. Analisis Distraktor

Analisis distraktor dilakukan untuk mengetahui apakah distraktor berjalan

dengan baik sebagai pengecoh. Distraktor yang baik juga mencegah siswa untuk

melakukan tebakan saat menjawab soal tes pilihan ganda (Susetyo, 2011 : 172).

Analisis distraktor dilakukan dengan menggunakan proporsi sebagai berikut:

(3.5)

dengan

P = proporsi distraktor

f = frekuensi jawaban siswa

N = Jumlah seluruh siswa

Distraktor dikatakan berfungsi dengan baik jika proporsi masing-masing

distraktor adalah 5%.

(27)

Teknik pengumpulan data dilakukan dengan menggunakan tes hasil

belajar matematika dengan materi pecahan untuk siswa Sekolah Dasar kelas V.

Butir soal didapatkan dari butir-butir soal yang telah diujicoba dan direvisi.

Langkah-langkah pengumpulan data yang dilakukan adalah :

1. Instrumen tes yang sama diberikan kepada sampel siswa. Kemudian hitung

nilai akhir tes menggunakan tiga metode penskoran yaitu metode penskoran

number-right score, metode penskoran punishment score dan metode

penskoran reward score.

2. Dari sampel siswa didapatkan tiga kelompok data skor dengan metode

penskoran yang berbeda yaitu data skor menggunakan metode penskoran

number-right score, data skor menggunakan metode penskoran punishment

score dan data skor menggunakan metode penskoran reward score.

3. Kelompok data skor tersebut menjadi populasi data skor penelitian

4. Lakukan analisis faktor untuk mendapatkan jumlah data skor minimum yang

memadai untuk melakukan penelitian.

5. Setelah jumlah sampel minimum ditentukan, lakukan pengambilan data skor

secara acak dengan pengembalian.

6. Pengambilan sampel acak skor responden dengan pengembalian sebanyak 10

kali jumlah variabel pada analisis faktor yang telah dilakukan sebelumnya.

7. Dari pengambilan acak tersebut hitung nilai reliabilitas dari masing-masing

metode penskoran.

8. Didapat nilai reliabilitas dari tiga metode penskoran yang berbeda dari

pengambilan sampel acak dengan pengembalian.

9. Lakukan langkah (6.) dan (7.) hingga didapat 30 nilai reliabilitas dari tiga

metode penskoran yang berbeda

10.Data 30 buah koefisien reliabilitas dari masing-masing kelompok merupakan

data sampel untuk pengujian hipotesis.

E. Teknik Pengolahan Data

(28)

Sebelum dilakukan uji asumsi, dilakukan analisis tentang jumlah sampel

responden minimum yang memadai untuk melakukan penelitian dan mengetahui

berapa jumlah variabel yang terdeteksi menggunakan analisis faktor. Banyaknya

variabel digunakan untuk menentukan berapa banyak pengambilan sampel acak

dengan pengembalian.

Analisis faktor dilakukan dengan Keiser-Meyer-Olkin (KMO) terlebih

dahulu. Jika nilai KMO > 0,5 maka analisis lanjutan dapat dilakukan. Analisis tiap

butir dilakukan dengan melihat matriks korelasi anti image. Butir-butir dengan

korelasi anti image yang bernilai di atas 0,5 dianggap baik dan dapat digunakan

dalam pengujian hipotesis.

“Dalam analisis faktor dikenal dua macam prosedur yang dilandasi oleh

dasar pikiran yang agak berbeda yaitu eksplanatory factor analysis dan

confirmatory factor analysis” (Azwar, 2013: 122). Analisis faktor yang dilakukan

pada penelitian ini merupakan prosedur eksplanatory factor analysis karena

“membantu peneliti untuk mengenali dan mengidentifikasi berbagai faktor yang

membentuk suatu konstrak dengan cara menemukan varians skor terbesar dengan

jumlah faktor paling sedikit” (Azwar, 2013: 122). Selain itu dikatakan prosedur

eksplanatory factor analysis karena tidak bermaksud menguji hipotesis mengenai

banyaknya variabel yang terbentuk dari data skor tes hasil belajar. Menurut

Crocker dan Algina (1986: 304) “suatu analisis faktor dikatakan eksplanatori jika

peneliti tidak memiliki hipotesis mengenai jumlah faktor yang terukur pada suatu

tes”.

Tujuan dilakukan analisis faktor adalah mendapatkan jumlah sampel

minimum yang memenuhi syarat KMO dan dengan butir-butir yang telah

mencakup seluruh variabel yang ingin diteliti. Analisis faktor juga dilakukan

untuk mendapatkan banyaknya pengambilan sampel acak dengan pengembalian

yang digunakan untuk mendapatkan nilai reliabilitas skor hasil belajar sebagai

data sampel. Sejalan dengan pendapat Roscoe (dalamTaniredja, 2012: 38) “Bila dalam penelitian akan melakukan analisis dengan multivariate, maka jumlah

(29)

2. Uji persyaratan

Uji normalitas

Uji normalitas data digunakan untuk melihat apakah distribusi data

sampel penelitian berasal dari populasi berdistribusi normal. Data yang

berdistribusi normal merupakan salah satu syarat sebelum menggunakan uji

parametrik. Uji normalitas dilakukan menggunakan uji Saphiro-Wilk. Uji

Saphiro-Wilk dipilih karena “Uji Saphiro-Wilk merupakan uji yang paling kuat

meskipun tidak cukup efektif untuk ukuran sampel kecil” (Razali dan Bee, 2011).

Langkah-langkah uji Saphiro-Wilk adalah

Hipotesis uji

H0 : data sampel berdistribusi normal

H1 : data sampel berdistribusi tidak normal

Kriteria uji

H0 ditolak jika p <  = 0,05

H0 diterima jika p >  = 0,05

3. Uji hipotesis

Uji hipotesis dilakukan dengan menggunakan uji perbedaan rata-rata untuk

sampel berpasangan untuk tiga sampel jika data telah teruji normalitasnya.

Karena uji perbedaan rata-rata untuk tiga sampel berpasangan tidak ada untuk uji

parametrik maka digunakan uji non parametrik Friedman test untuk menguji

perbedaan rata-rata untuk tiga sampel berpasangan.

Hipotesis uji

H0 : (Tidak ada perbedaan rata-rata nilai reliabilitas skor hasil

belajar dengan metode penskoran number-right score, punishment score dan

reward score)

H1 : minimal ada satu pasang nilai reliabilitas skor hasil belajar dengan metode

penskoran number-right score, punishment score dan reward score yang

(30)

Kriteria uji

Jika pada uji hipotesis disimpulkan ada perbedaan rata-rata antara

reliabilitas dengan metode penskoran yang berbeda, maka perlu ada uji Posthoc

untuk mencari tahu pasangan yang memiliki perbedaan yang signifikan.

Uji Posthoc

Uji Posthoc digunakan untuk melakukan pengujian pasca uji hipotesis. Uji

hipotesis dilakukan untuk menguji perbedaan rata-rata untuk tiga sampel

berpasangan. Karenanya belum diketahui seberapa besar perbedaan yang terjadi

dan sampel mana yang dikatakan berbeda atau sampel mana yang dikatakan tidak

berbeda. Uji posthoc dilakukan dengan melakukan uji perbedaan rata-rata untuk

dua sampel berpasangan secara berulang. Uji posthoc yang sesuai ada dua jenis

tergantung pada dipenuhinya asumsi data sebagai berikut:

a. Data berasal dari populasi berdistribusi normal

Jika kedua data berdistribusi normal maka uji Posthoc menggunakan uji

parametrik yaitu uji-t untuk perbedaan rata-rata dua sampel berpasangan. Uji-t

tersebut dilakukan secara berulang sebanyak tiga kali. Uji perbedaan yang

dilakukan untuk menguji antara :

1) Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai

menggunakan metode penskoran punishment score dengan metode

(31)

Karena uji Posthoc dilakukan menggunakan uji-t untuk perbedaan

rata-rata dua sampel berpasangan yang diulang sebanyak tiga kali akan terjadi

kenaikan kesalahan tipe I. Untuk mengatasi kenaikan kesalahan tipe I karena

perulangan yang dilakukan, maka digunakan prosedur Bonnferoni yang akan mengubah nilai  yang digunakan.

Perulangan dilakukan sebanyak tiga kali. K= 3, dengan  = 0,05.

Hipotesis uji

H0 :

H1 :

Kriteria uji

b. Data berasal dari populasi berdistribusi tidak normal

Jika salah satu dari kedua data yang dibandingkan berdistribusi tidak

normal maka uji Posthoc menggunakan uji non-parametrik yaitu uji Wilcoxon

untuk perbedaan rata-rata dua sampel berpasangan. Uji Wilcoxon tersebut

dilakukan secara berulang sebanyak tiga kali. Uji perbedaan yang dilakukan

untuk menguji antara :

(32)

menggunakan metode penskoran punishment score dengan metode

Uji Posthoc dilakukan untuk mengetahui pasangan reliabilitas yang

memiliki perbedaan yang signifikan. Karena uji Posthoc dilakukan menggunakan

uji wilcoxon untuk perbedaan rata-rata dua sampel berpasangan yang diulang

sebanyak tiga kali akan terjadi kenaikan kesalahan tipe I. Untuk mengatasi

kenaikan kesalahan tipe I karena perulangan yang dilakukan, maka digunakan

prosedur Bonnferoni yang akan mengubah nilai  yang digunakan.

Perulangan dilakukan sebanyak tiga kali. K= 3, dengan  = 0,05.

Hipotesis uji

H0 :

H1 :

Kriteria uji

(33)

BAB V

KESIMPULAN DAN SARAN

A. Kesimpulan

Berdasar hasil analisis data, dapat disimpulkan bahwa:

1. Dari uji hipotesis disimpulkan bahwa ada perbedaan rata-rata nilai reliabilitas

dari metode penskoran number-right score, reliabilitas dari metode penskoran

punishment score, dan reliabilitas dari metode penskoran reward score.

2. Dari uji poshoc disimpulkan pula bahwa ada perbedaan yang signifikan antara

reliabilitas menggunakan metode penskoran number-right score dengan

reliabilitas menggunakan metode penskoran punishment score.

3. Dari uji poshoc disimpulkan ada perbedaan yang signifikan antara reliabilitas

menggunakan metode penskoran number-right score dengan reliabilitas

menggunakan metode penskoran reward score.

4. Tidak terdapat perbedaan yang signifikan antara reliabilitas menggunakan

metode penskoran punishment score dengan reliabilitas menggunakan metode

penskoran reward score.

Berdasar hasil uji poshoc ternyata didapatkan rata-rata reliabilitas

menggunakan metode penskoran number-right score lebih tinggi jika

dibandingkan dengan rata-rata reliabilitas menggunakan menggunakan metode

penskoran punishment score. Rata-rata reliabilitas menggunakan metode

penskoran number-right score lebih tinggi jika dibandingkan dengan rata-rata

reliabilitas menggunakan menggunakan metode penskoran reward score.

Rata-rata reliabilitas menggunakan metode penskoran punishment score lebih tinggi

jika dibandingkan dengan rata-rata reliabilitas menggunakan menggunakan

Hasil analisis data tersebut berbeda dengan teori yang menyatakan bahwa

reliabilitas dengan metode penskoran correction for guessing akan lebih tinggi

jika dibandingkan reliabilitas dengan metode penskoran number-right score. Hal

(34)

dalam pelaksanaan tes hasil belajar. Instruksi mengenai metode penilaian akan

menyebabkan peserta didik lebih hati-hati dalam pengerjaan tes hasil belajar

dengan materi pecahan.

Namun ternyata metode penskoran correction for guessing perlu

dilengkapi dengan instruksi mengenai penskoran yang akan dilakukan. Metode

penskoran correction for guessing tidak menghasilkan perbedaan yang signifikan

jika tidak dilengkapi dengan instruksi yang tepat. Berarti reliabilitas akan

meningkat jika peserta didik tahu dengan pasti metode penilaian yang dilakukan

dan dapat memilih untuk melakukan tebakan atau tidak melakukan tebakan dalam

menjawab soal.

B. Saran

Berdasar pembahasan dan kesimpulan yang telah dilakukan maka ada

beberapa saran mengenai penelitian selanjutnya yaitu :

1. Dalam melakukan metode penskoran correction for guessing diperlukan

instruksi tes yang sesuai. Karena tanpa instruksi yang sesuai maka metode

penilaian tersebut tidak akan efektif untuk melakukan koreksi terhadap

faktor tebakan.

2. Diperlukan penelitian lanjutan mengenai risk-taking behavior pada peserta

didik di tingkat Sekolah Dasar untuk mengetahui metode penskoran

correction for guessing mana yang lebih efektif untuk diterapkan di Sekolah

Dasar.

3. Disarankan bagi guru untuk melakukan dan mensosialisasikan metode

penskoran correction for guessing bagi peserta didik untuk mengurangi

(35)

DAFTAR PUSTAKA

Ali, Mohammad. (2011). Memahami Riset Perilaku dan Sosial. Bandung. Pustaka

Cendekia Utama

Aries S., Erna Febru. (2011). Asesmen dan evaluasi. Yogyakarta. Aditya Media

Publishing.

Azwar, Saifuddin. (2012). Reliabilitas dan Validitas. Yogyakarta. Pustaka Pelajar.

Busnawir. (2006). Pengaruh Metode Penskoran terhadap Kestabilan Reliabilitas

Hasil Pengukuran Skala Sikap dengan Mempertimbangkan Varians Usia.

Disertasi UNJ : Tidak Diterbitkan.

Corder, Gregory W. & Foreman, Dale I. (2009). Nonparametric Statistics for

Non-Statisticians. New Jersey. John Wiley & Sons.

Crocker, Linda & Algina, James. (1986). Introduction to Classical and Modern

Test Theory. Florida. Hold, Rinehart and Winston, Inc.

Ebel, Robert L. (1979). Essentials of Educational Measurement. New Jersey.

Prentice-Hall, Inc.

Espinosa, Maria Paz. (2013). Do Students Behave Rationally in Multiple Choice

Tests? Evidence from a Field Experiment. Journal of Economics and

Management, 9(2), pp 107-135. Retrieved from

http://www.jem.org.tw/content/pdf/Vol.9No.2/02.pdf

Guilford, J. P. (1954). Psychometric Methods. Japan. Kogakusha Company, Ltd.

Khafid, M & Suyati. (2006). Pelajaran Matematika Penekanan pada Berhitung

Jilid 5B. Jakarta. Penerbit Erlangga.

Mardapi, Djemari. (2008). Teknik Penyusunan Instrumen Tes dan Nontes.

Yogyakarta. Mitra Cendikia Press.

Mardapi, Djemari. (2012). Pengukuran, Penilaian, dan Evaluasi Pendidikan.

Yogyakarta. Nuha Medika.

Musmuliadi. (2009). Hubungan model penskoran terhadap estimasi skor

(36)

Evaluasi Pendidikan, 13(2), hal 246-267. Diunduh dari

http://journal.uny.ac.id/index.php/jpep/article/download/1412/1199.

Naga, Dali Santun. (2012). Teori Sekor pada Pengukuran Mental edisi kedua.

Jakarta. PT Nagarani Citrayasa.

Naga, Dali Santun. (2008). Probabillitas dan Sekor pada Hipotesis Statistika.

Jakarta. UPT Penerbitan Universitas Tarumanagara.

Naga, Dali Santun. (1992). Pengantar Teori Sekor pada Pengukuran Pendidikan.

Jakarta. Gunadarma.

Nunnally, Jum C. (1959). Tests and measurements assessment and prediction.

New York. McGraw-Hill Book Company, Inc.

Razali, Nornadiah Mohd & Wah, Yap Bee. (2011). Comparisons of Shapiro-Wilk,

Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of

Statistical Modeling and Analytics [Online], Vol 2 (1), 21-33. Tersedia

http://instatmy.org.my/downloads/e-jurnal%202/3.pdf [11 Juni 2014].

Rasyid, Harun & Mansur. (2007). Penilaian Hasil Belajar. Bandung. CV Wacana

Prima.

Siegel, Sidney & Castellan Jr., N John. (1988). Nonparametric Statistics for the

Behavioral Sciences. New York. McGraw-Hill.

Soekadji, Sutarlinah. (1999). Guessing : Instructed or Discouraged Penalized or

Unpenalized. Jurnal Psikologi, 2, hal. 93-105. Diunduh dari

http://jurnal.psikologi.ugm.ac.id/index.php/fpsi/article/view/148/139

Sumarmo, Utari. (2013). Berpikir dan Disposisi Matematik Serta

Pembelajarannya. Kumpulan Makalah pada Universitas Pendidikan

Indonesia. Bandung.

Susetyo, Budi. (2011). Menyusun Tes Hasil Belajar dengan Teori Ujian Klasik

dan Teori Respon Butir. Bandung. CV Cakra.

Susetyo, Budi. (2010). Statistika untuk Analisis Data Penelitian : Dilengkapi

Cara Perhitungn dengan SPSS dan MS Office Exel. Bandung. Refika

(37)

Suwarto. (2011). Teori Tes Klasik dan Teori Tes Modern. Widyatama, 20(1), hal

69-78. Diunduh dari

http://ejurnal.veteranbantara.ac.id/index.php/widyatama/article/download/99/90

Taniredja, Tukiran & Mustafidah, Hidayati. (2012). Penelitian Kuantitatif : Suatu

Pengantar. Bandung. Alfabeta.

Tim Karya Media Guru. (2012). Mandiri dan Sukses Ulangan Matematika Kelas

V SD/MI : Dilengkapi Latihan Soal dan Pembahasan. Yogyakarta. C. V