Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
KETERBANDINGAN RELIABILITAS TES HASIL
BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN
NUMBER-RIGHT SCORE DAN METODE PENSKORAN
CORRECTION FOR GUESSING
TESIS
Diajukan untuk Memenuhi Sebagian dari
Syarat untuk Memperoleh Gelar Magister Pendidikan
Program Studi Penelitian dan Pengukuran Pendidikan
Oleh :
Maria Agustina Amelia
1201086
PROGRAM STUDI PENELITIAN DAN PENGUKURAN
PENDIDIKAN
SEKOLAH PASCASARJANA
UNIVERSITAS PENDIDIKAN INDONESIA
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT
SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Oleh
MARIA AGUSTINA AMELIA
S.Si. Universitas Sanata Dharma Yogyakarta, 2002
Sebuah Tesis yang diajukan untuk memenuhi salah satu syarat memperoleh gelar Magister Pendidikan (M.Pd.) pada Penelitian dan Pengukuran Pendidikan
© Maria Agustina Amelia 2014 Universitas Pendidikan Indonesia
Juli 2014
Hak Cipta dilindungi undang-undang.
Tesis ini tidak boleh diperbanyak seluruhya atau sebagian,
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Maria Agustina Amelia, 2014
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Keterbandingan Reliabilitas Tes Hasil Belajar Matematika Berdasar Metode
Penskoran Number-Right Score dan Metode Penskoran Correction for Guessing
Oleh:
Maria Agustina Amelia
ABSTRAK
Penelitian ini bertujuan untuk mengetahui keterbandingan reliabilitas tes hasil belajar matematika berdasar metode penskoran number-right score dan metode penskoran correction for guessing. Penelitian menggunakan metode penelitian kuasi-eksperimental dengan desain perbandingan kelompok statis (the static group comparison design). Instrumen yang digunakan adalah tes hasil belajar matematika berbentuk pilihan ganda yang diberikan pada siswa Sekolah Dasar kelas V. Penelitian dilaksanakan di dua SD yang terletak di kota Bandung pada 357 peserta didik. Populasi penelitian berupa skor tes hasil belajar dengan metode penskoran number-right score, punishment score dan reward score. Hipotesis penelitian diuji menggunakan uji Friedman (Friedman test). Hasil analisis pada taraf signifikansi 0,05 diperoleh hasil: ada perbedaan reliabilitas hasil belajar antara yang dinilai menggunakan metode penskoran number-right score dengan metode penskoran correction for guessing yaitu metode penskoran punishment score dan reward score. Hasil dari uji pasca hipotesis adalah (1) Ada perbedaan reliabilitas hasil belajar antara yang dinilai menggunakan metode penskoran number-right score dengan metode penskoran punishment score; (2) Ada perbedaan reliabilitas hasil belajar antara yang dinilai menggunakan metode penskoran number-right score dengan metode penskoran reward score; (3) Ada perbedaan reliabilitas hasil belajar antara yang dinilai menggunakan metode penskoran punishment score dengan metode penskoran reward score.
Maria Agustina Amelia, 2014
Comparability of Reliability on Mathematics Achievement Test Based on the
method of Scoring Number-Right Score and Correction for Guessing
By:
Maria Agustina Amelia
ABSTRACT
This study aims to percieve comparison of the reliability on multiple choice mathematics achievement test based on number-right scoring method and correction for guessing scoring method. The study was conducted using an quasi-experimental method and the static group comparison design. The instrument used is a mathematics achievement test given at the fifth grade of elementary school students. The research was held in two elementary school in Bandung with 357 students. Population of the research is achievement test scores with number-right, punishment, and reward scoring method. The hypotheses research were tested using Friedman test. Analysis result at 0,05 significance level shown that there is a difference between reliability that scored with number-right, punishment, and reward scoring methods. Posthoc analysis result at 5% significance level shown that (1) There is a difference between reliability that scored with number-right and punishment scoring methods; (2) There is a difference between reliability that scored with number-right and reward scoring methods; (3) There is no difference between reliability that scored with punishment, and reward scoring methods.
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
DAFTAR ISI
COVER ... i
LEMBAR PENGESAHAN ... ii
PERNYATAAN ... iv
KATA PENGANTAR ... v
UCAPAN TERIMAKASIH ... vi
ABSTRAK ... viii
ABSTRCT ... ix
DAFTAR ISI ... x
DAFTAR TABEL ... xii
DAFTAR GAMBAR ... xiv
DAFTAR LAMPIRAN ... xv
BAB I PENDAHULUAN A. Latar Belakang Masalah ... 1
B. Identifikasi Masalah ... 6
C. Pembatasan Masalah ... 8
D. Perumusan Masalah ... 9
E. Tujuan Penelitian ... 9
F. Manfaat Penelitian ... 10
BAB II KAJIAN TEORITIS A. Deskripsi Konsep ... 11
1. Reliabilitas Tes ... 11
2. Tes Hasil Belajar ... 20
3. Teknik Penskoran Tes ... 22
B. Hasil Penelitian Terdahulu yang Relevan ... 27
C. Kerangka Berpikir ... 27
Maria Agustina Amelia, 2014
BAB III METODOLOGI PENELITIAN
A. Variabel Penelitian ... 31
B. Metode dan Desain Penelitian ... 31
C. Populasi dan Sampel ... 32
D. Instrumen dan Teknik Pengumpulan Data ... 33
1. Instrumen ... 33
2. Teknik Pengumpulan Data ... 38
E. Teknik Pengolahan Data ... 39
BAB IV HASIL DAN PEMBAHASAN PENELITIAN A. Data Uji Coba ... 45
1. Uji Validitas Isi ... 45
2. Uji Kesetaraan (konkordansi) ... 46
3. Uji Reliabilitas ... 47
4. Analisis Tingkat Kesukaran ... 52
5. Analisis Daya Beda ... 53
6. Analisis Distraktor ... 54
B. Data Penelitian ... 56
1. Uji Asumsi ... .56
2. Uji Hipotesis ... .66
C. Pembahasan Hasil Penelitian... 71
D. Keterbatasan Penelitian ... 74
BAB V KESIMPULAN DAN SARAN A. Kesimpulan ... 75
B. Saran ... 76
DAFTAR PUSTAKA ... 77
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
BAB I PENDAHULUAN
A. Latar Belakang Masalah
Pendidikan merupakan komponen penting dalam pengembangan sumber
daya manusia. Menurut Undang-Undang Nomor 20 Tahun 2003 Tentang Sistem
Pendidikan Nasional, didefinisikan :
pendidikan sebagai suatu usaha sadar dan terencana untuk mewujudkan suasana belajar dan proses pembelajaran agar peserta didik secara aktif mengembangkan potensi dirinya untuk memiliki kekuatan spiritual keagamaan, pengendalian diri, kepribadian, kecerdasan, akhlak mulia, serta keterampilan yang diperlukan dirinya, masyarakat, bangsa dan negara.
Indonesia memiliki 237.641.000 penduduk, dengan 19, 33% berada dalam
usia pendidikan dasar (Badan Pusat Statistik, 2013). Penduduk yang masih berada
dalam level pendidikan dasar tersebut, jika mendapatkan pendidikan yang baik,
akan menjadi sumber daya manusia berkualitas sesuai dengan yang dicanangkan
dalam Undang-Undang tersebut. “Lembaga pendidikan selalu berusaha untuk
meningkatkan kemampuan dan kualitas lulusannya” (Mardapi, 2012: 1). Tujuan
sekolah sebagai lembaga pendidikan adalah mengembangkan potensi peserta
didik secara optimal menjadi kemampuan untuk hidup dalam masyarakat.
Pengembangan potensi peserta didik dilakukan melalui proses pembelajaran.
Pencapaian belajar atau sering disebut dengan hasil belajar merupakan tingkat
kompetensi yang dicapai peserta didik yang mencakup tiga ranah, yaitu ranah
kognitif, ranah afektif, dan ranah psikomotor. Kualitas pendidikan dilihat dari
kemampuan lulusan suatu jenjang pendidikan. Menurut Mardapi (2012: 3) “kemampuan lulusan adalah kemampuan melakukan suatu tugas atau pekerjaan. Proses pendidikan dikatakan berhasil jika peserta didik berhasil menguasai
peserta didik dicantumkan dalam Kisi-kisi soal atau dalam Standar Kompetensi
Lulusan (SKL).
Untuk dapat mengukur kemampuan, keberhasilan belajar, sikap, minat,
atau ciri terpendam yang terdapat pada para peserta didik dilakukan pengukuran di
bidang pendidikan. Pengukuran pada dasarnya merupakan kegiatan penentuan
angka bagi suatu objek secara sistematik. Penentuan angka ini merupakan usaha
untuk menggambarkan karakteristik suatu objek. Pengukuran terhadap objek non
fisik seperti prestasi belajar dilakukan secara tidak langsung, yaitu melalui
pemberian stimulus. Stimulus bisa berupa pertanyaan atau pernyataan, sedangkan
respon peserta didik berupa jawaban pertanyaan, pendapat atau persepsi terhadap suatu pertanyaan. “Kalau stimulus yang diberikan tepat, maka respon yang diberikan akan menunjukkan kemampuan, keberhasilan belajar, sikap, minat, atau
atribut lain yang ingin diukur. Respon tersebut dapat ditafsirkan dengan memberikan skor yang sesuai” (Naga, 1992: 2).
“Tujuan utama suatu tes adalah mengukur dan menemukan kemampuan peserta ujites” (Naga, 1992: 114). Pada jangka waktu tertentu, kemampuan sesungguhnya dari peserta didik tetap (konstan). Konsistensi dan keajegan skor berkaitan dengan reliabilitas. “Reliabilitas atau keandalan merupakan koefisien yang menunjukkan tingkat keajegan atau konsistensi hasil pengukuran suatu tes”
(Mardapi, 2012: 51). Konsistensi yang dimaksudkan adalah konsistensi hasil
pengukuran dengan menggunakan alat ukur yang sama untuk orang yang berbeda
atau pada waktu yang berbeda tetapi dengan kondisi yang sama. Tujuan mengukur
reliabilitas tes adalah untuk mengetahui tingkat ketepatan (precision) dan
keajegan (consistency) skor tes. Keadaan subjek sebenarnya sama, namun jika
dilakukan pengukuran ulang terhadap subjek yang sama sangat mungkin diperoleh hasil yang berbeda. “Menurut teori pengukuran klasik, koefisien reliabilitas dinyatakan oleh rasio varians skor sebenarnya dengan varians skor tampak” (Mardapi, 2011: 54).
Bentuk tes objektif yang umum digunakan dalam berbagai jenjang
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
pilihan ganda adalah luas cakupan materi yang dapat diujikan dan objektifitas
penilaiannya. Selain itu proses menjawab soal relatif mudah dilakukan oleh
peserta didik. Bentuk tes pilihan ganda juga memiliki kelemahan yaitu proses
pembuatan membutuhkan waktu dan tenaga yang banyak selain itu terdapat
kemungkinan peserta didik menjawab dengan menebak. Dalam suatu tes
berbentuk pilihan ganda sangat dimungkinkan diperoleh hasil yang tidak sesuai
dengan kemampuan peserta didik. Ketidaksesuaian antara hasil tes dengan
kemampuan peserta didik tersebut dapat terjadi jika dalam pengerjaan tes, peserta
didik menjawab dengan menebak. Faktor menebak dari peserta didik akan
berpengaruh pada konsistensi hasil tes dari waktu ke waktu. Faktor menebak
terjadi jika peserta didik dengan pengetahuan dan kemampuan yang kurang secara
random memilih jawaban dan jawaban tersebut benar.
Menurut teori klasik, jika peserta didik mengerjakan suatu bentuk tes yang
sama dengan waktu berbeda dapat terjadi bahwa skor yang dihasilkan tidak sama.
Perbedaan skor antara tes pertama dengan tes kedua dipengaruhi oleh error.
Terkadang error tersebut dapat membuat peserta didik mendapat nilai melebihi
kemampuan peserta didik yang sebenarnya. Hal tersebut terjadi jika peserta didik
mengerjakan soal dengan menebak. Jika dilakukan tes berulang-ulang, hasil tes
peserta didik yang melakukan faktor menebak tidak akan sama (berubah-ubah),
maka hasil pengukuran menjadi tidak reliabel. Semua hal yang tidak relevan dan
ikut mempengaruhi hasil pengukuran merupakan sumber ketidakreliabelan, atau
kesalahan pengukuran. Jika skor peserta didik berubah-ubah secara signifikan,
maka hasil tes tersebut tidak dapat mengungkapkan kemampuan peserta didik
yang sebenarnya. Berarti dengan perilaku menebak hasil tes tidak mencerminkan
kemampuan peserta didik.
Salah satu tes yang menggunakan bentuk pilihan ganda adalah Ujian
Nasional yang diselenggarakan oleh dinas pendidikan mulai dari jenjang
Pendidikan dasar hingga Sekolah Menengah. “Harapan terhadap Ujian Nasional
(Greany dan Kellaghan dalam Mardapi, 2012: 224). Menurut data Dinas
Pendidikan Provinsi Jawa Barat, pada tahun 2013 hasil UN SD mata pelajaran
matematika mendapat rata-rata nilai 7,30 dengan variansi 1,72. Dari hasil UN
tersebut dapat dikatakan bahwa kemampuan atau kompetensi matematis peserta
didik di kota Bandung sebesar 73% dari seluruh standar kompetensi minimal yang
diberikan. Dari hasil UN tersebut, dapat dilihat bahwa nilai matematika peserta
didik tersebut berada di atas persentil ketujuh puluh.
Penilaian yang biasa dilakukan dalam tes bentuk pilihan ganda adalah
bentuk number-right score atau disebut juga jumlah skor benar. Dasar metode
penskoran number-right score ini adalah peserta didik dengan pengetahuan atau
kemampuan yang cukup akan menjawab soal dengan benar. Peserta didik yang
pengetahuan dan kemampuannya kurang akan menjawab soal dengan salah.
Menurut pendapat Crocker dan Algina (1986: 399) mengenai metode penskoran
konvensional (number-right score) :
butir soal dinilai secara dikotomus jika nilai yang diberikan adalah 0 dan 1 dan tidak ada penilaian terhadap jawaban yang diabaikan atau tidak dijawab. Dengan metode penilaian ini setiap butir soal memiliki bobot yang sama meskipun metode penskoran konvensional ini sederhana dan mudah diaplikasikan, namun dapat menimbulkan masalah jika digunakan dalam soal pilihan ganda ataupun soal benar-salah. Telah lama diketahui bahwa keinginan peserta didik untuk mengosongkan jawaban saat mereka tidak memiliki kemampuan yang cukup untuk menjawab suatu soal bervariasi.
Metode penskoran tes secara number-right score adalah peserta didik
akan diberi nilai satu jika menjawab dengan benar dan mendapat nilai nol jika
menjawab salah. Kelemahan dari metode penilaian tersebut adalah tidak
memperhitungkan adanya faktor tebakan dari peserta didik karena peserta didik
memiliki variasi dalam hal mengosongkan jawaban soal tes jika mereka tidak
memiliki kemampuan yang cukup untuk menjawab soal tes tersebut. Ada peserta
didik yang akan memilih untuk mengosongkan jawaban untuk soal-soal yang
tidak dapat mereka jawab. Ada pula peserta didik yang tidak ingin mengosongkan
jawaban dan memilih untuk memilih jawaban secara random dari alternatif
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Dengan metode penilaian number-right score, antara peserta didik yang
tidak menjawab dan peserta didik yang menjawab salah akan sama-sama
mendapat nilai nol. Dengan metode penskoran number-right score, faktor
menebak pada jawaban peserta tidak terlalu diperhatikan. Karena adanya faktor
menebak saat menjawab soal tes, hasil tes tidak mencerminkan kemampuan
peserta didik dan dimungkinkan terjadinya inkonsistensi hasil tes. Jika peserta
didik dapat mengerjakan tes tanpa melakukan tebakan, maka skor hasil tes
tersebut akan konsisten dan mencerminkan kemampuan siswa yang sebenarnya.
Agar didapatkan hasil tes yang konsisten dan mencerminkan kemampuan siswa
yang sebenarnya, perlu digunakan suatu cara untuk meminimalisir faktor menebak
dari peserta didik. Salah satu cara yang dapat dilakukan untuk meminimalisir
kemungkinan menebak adalah menerapkan metode penskoran koreksi terhadap
tebakan (correction for guessing). Metode penskoran correction for guessing
digunakan sebagai cara untuk mengurangi unsur tebakan dari peserta didik.
Metode penskoran correction for guessing terdiri dari dua metode penskoran
yaitu: 1) Penskoran dengan punishment score dan 2) Penskoran dengan reward
score. Dengan teknik penskoran correction for guessing tambahan nilai karena
unsur tebakan akan dikoreksi sehingga didapatkan skor akhir yang lebih konsisten
dan lebih mencerminkan kemampuan peserta didik yang sebenarnya. Skor yang
lebih konsisten tersebut akan berpengaruh pada koefisien reliabilitas skor tes hasil
belajar.
Teknik penilaian dengan pinalti dilakukan jika peserta didik menjawab
benar maka akan mendapat nilai satu. Jika responden menjawab salah, skor
responden akan dikurangi sebesar nilai tertentu. Sedangkan jika responden tidak
menjawab akan mendapat nilai nol. Teknik penilaian dengan reward score
dilakukan jika peserta didik menjawab benar akan mendapat nilai satu. Jika
responden menjawab salah akan mendapat nilai nol dan jika responden tidak
menjawab akan mendapat sejumlah tertentu tambahan skor.
Metode penskoran yang selama ini digunakan untuk menilai bentuk tes
number-right score tidak diperhitungkan adanya tebakan pada jawaban tes. Faktor
tebakan merupakan salah satu sumber munculnya kesalahan pengukuran karena
mengakibatkan inkonsistensi hasil pengukuran. Kesalahan pengukuran berakibat
pada tingkat reliabilitas tes. Padahal ada metode penskoran correction for
guessing yaitu punishment score dan reward score dipercaya dapat meningkatkan
reliabilitas tes. Peningkatan reliabilitas itu disebabkan karena ada koreksi terhadap
faktor tebakan sehingga diperoleh hasil tes yang lebih konsisten dengan variansi
skor hasil tes relatif kecil. “Variansi skor yang kecil ini dipercaya menjadi penduga yang baik untuk dapat mengetahui kemampuan seseorang” (Crocker dan Algina, 1986: 402). Berarti reliabilitas suatu tes dapat dipengaruhi oleh metode
penskoran, semakin berkurang faktor tebakan maka hasil tes akan semakin
konsisten. Namun metode penskoran correction for guessing ini masih jarang
digunakan dalam melakukan penilaian hasil belajar di berbagai tingkat pendidikan
di Indonesia.
Penelitian mengenai reliabilitas tes yang berkaitan dengan metode
penskoran correction for guessing sebenarnya sudah banyak dilakukan, terutama
mengenai correction for guessing dengan metode penskoran punishment score
yang dilakukan di Sekolah Menengah Pertama maupun di Sekolah Menengah
Atas. Metode penskoran pinalti juga digunakan dalam tes saringan masuk
perguruan tinggi negeri (SNMPTN). Hasil dari berbagai penelitian tersebut
menyatakan bahwa metode penskoran correction for guessing dapat
meningkatkan reliabilitas tes. Penelitian reliabilitas yang berkaitan dengan teknik
penilaian correction for guessing yang dilakukan di Sekolah Dasar masih jarang
dilakukan. Peneliti ingin melakukan penelitian mengenai perbedaan reliabilitas tes
hasil belajar jika dilakukan metode penskoran number-right score dengan
reliabilitas tes hasil belajar jika dilakukan metode penskoran correction for
guessing dengan menggunakan punishment score dan reward score.
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Tes berbentuk pilihan ganda sampai saat ini merupakan bentuk tes yang
banyak digunakan pada berbagai jenjang pendidikan. Tes pilihan ganda digunakan
karena cakupannya yang luas, waktu pengerjaan perbutir relatif singkat dan
mudah proses penskorannya. Bentuk tes pilihan ganda dapat digunakan di segala
tingkat pendidikan dari tingkat Sekolah Dasar hingga Perguruan Tinggi. Namun
dengan bentuk tes pilihan ganda, dimungkinkan adanya faktor tebakan yang
dilakukan oleh siswa. Faktor menebak ini tentu saja berpengaruh pada reliabilitas
tes. Padahal hasil tes biasanya dijadikan dasar pengambilan keputusan dalam
bidang pendidikan. Jika hasil tes tidak reliabel maka keputusan yang diambil tidak
tepat.
Reliabilias suatu tes hasil belajar dianggap penting karena menurut (Azwar, 2012: 7) “gagasan pokok yang terkandung dalam konsep reliabilias adalah sejauhmana hasil suatu proses pengukuran dapat dipercaya”. Informasi yang didapat dari skor atau nilai dari suatu tes hasil belajar digunakan untuk
menilai kualitas lulusan di berbagai jenjang pendidikan. Informasi tersebut
selanjutnya digunakan sebagai dasar pengambilan kebijakan bagi perbaikan
kualitas pendidikan. Beberapa faktor yang menyebabkan error dalam pengukuran
terutama pada bidang pendidikan diantaranya : adanya tebakan, gangguan saat
pengerjaan tes hasil belajar, kekeliruan saat pelaksanaan tes, pengambilan sampel
soal, kesalahan penilaian , keadaan peserta didik yang berubah-ubah. Error dalam
pegukuran akan mempengaruhi reliabilitas tes hasil belajar. Beberapa hal yang
mempengaruhi tingkat reliabilitas tes diantaranya : penampilan peserta tes kurang
prima, penilaian tidak objektif, tes terlalu pendek, soal tes terlalu mudah atau
terlalu sulit, mencontek saat tes atau waktu dan tepat tes yang tidak
menyenangkan.
Tebakan saat menjawab soal tes merupakan salah satu sumber error dalam
pengukuran yang akan mempengaruhi reliabilitas skor tes hasil belajar. Faktor
tebakan seringkali terjadi jika peserta didik mengerjakan tes dengan bentuk
objektif dengan alternatif jawaban misalnya soal pilihan ganda. Sistem penilaian
pilihan ganda, unsur tebakan tidak diperhitungkan. Padahal ada metode penskoran
lain yang dapat digunakan yaitu metode penskoran correction for guessing yang
terdiri dari punishment score dan reward score. Metode penskoran correction for
guessing ini memperhitungkan adanya tebakan dan bertujuan melakukan koreksi
terhadap tebakan tersebut sehingga error dalam pengukuran dapat berkurang dan
dapat meningkatkan reliabilitas.
Penelitian mengenai keterbandingan reliabilitas tes hasil belajar jika
dilakukan metode penskoran number-right score dengan reliabilitas tes hasil
belajar jika dilakukan metode penskoran correction for guessing ini ingin
mengetahui dan mencari bukti secara empiris adanya pengaruh metode penskoran
yang dapat mengurangi adanya faktor menebak pada tes berbentuk pilihan ganda
terhadap reliabilitas tes. Metode penskoran yang selama ini digunakan adalah
metode penskoran number-right score. Metode penilaian tersebut dirasa tidak
mempertimbangkan adanya faktor tebakan oleh peserta didik. Metode penskoran
yang mempertimbangkan adanya faktor tebakan disebut metode penskoran
correction for guessing yaitu metode penskoran punishment score dan reward
score.
Masalah yang dapat diidentifikasi dalam penelitian ini adalah mengenai
perbedaan reliabilitas tes hasil belajar jika dilakukan metode penskoran yang
berbeda yaitu metode penskoran number-right score dan metode penskoran
correction for guessing. Masalah lain yang dapat diidentifikasi adalah mengenai
perbedaan reliabilitas tes hasil belajar antara metode penskoran correction for
guessing yaitu metode penskoran punishment score dan metode penskoran
reward score.
C. Pembatasan Masalah
Reliabilitas skor hasil belajar merupakan hal penting dalam dunia
pendidikan karena berpengaruh pada informasi mengenai kualitas lulusan dan
peningkatan kualitas pendidikan. Berbagai kekeliruan dapat mempengaruhi
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
pada reliabilitas skor hasil belajar adalah tebakan saat menjawab soal pilihan
ganda, Padahal sudah ada teknik penskoran yang dapat melakukan koreksi
terhadap tebakan yaitu metode penskoran correction for guessing.
Pada penelitian yang dilakukan ini, peneliti akan fokus pada metode
penskoran yang berpengaruh pada reliabilitas tes hasil belajar matematika di
Sekolah Dasar. Metode penskoran yang dimaksud adalah metode penskoran
number-right score dan metode penskoran correction for guessing yaitu metode
penskoran punishment score dan metode penskoran reward score. Berbagai
sumber yang mempengaruhi reliabilitas skor hasil belajar tidak akan dibahas pada
penelitian ini.
Penelitian akan membahas mengenai keterbandingan reliabilitas jika
diberikan metode penskoran yang berbeda yaitu metode penskoran number-right
score dan metode penskoran correction for guessing yaitu metode penskoran
punishment score dan metode penskoran reward score.
D. Perumusan Masalah
Masalah yang akan diteliti adalah :
1. Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai
menggunakan metode penskoran number-right score dengan metode
penskoran correction for guessing yaitu metode penskoran punishment score,
dan reliabilitas dari metode penskoran reward score?
2. Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai
menggunakan metode penskoran number-right score dengan metode
penskoran punishment score?
3. Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai
menggunakan metode penskoran number-right score dengan metode
penskoran reward score?
4. Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai
menggunakan metode penskoran punishment score dengan metode penskoran
E. Tujuan Penelitian
Secara umum penelitian ini bertujuan untuk memperoleh gambaran
mengenai perbedaan reliabilitas jika dilakukan metode penskoran yang berbeda
untuk menilai tes hasil belajar siswa Sekolah Dasar. Hasil penelitian akan menjadi
tambahan bukti bahwa metode penskoran yang tepat akan berpengaruh pada
reliabilitas tes hasil belajar. Tes hasil belajar yang reliabel selanjutnya juga
berpengaruh pada pengambilan keputusan yang tepat pula.
Secara khusus tujuan dari penelitian adalah :
1. Memperoleh gambaran mengenai perbedaan reliabilitas hasil belajar antara
yang dinilai menggunakan metode penskoran number-right score dengan
metode penskoran correction for guessing.
2. Memperoleh gambaran mengenai perbedaan reliabilitas hasil belajar antara
yang dinilai menggunakan metode penskoran number-right score dengan
metode penskoran punishment score.
3. Memperoleh gambaran mengenai perbedaan reliabilitas hasil belajar antara
yang dinilai menggunakan metode penskoran number-right score dengan
metode penskoran reward score.
4. Memperoleh gambaran mengenai perbedaan reliabilitas hasil belajar antara
yang dinilai menggunakan metode penskoran punishment score dengan
metode penskoran reward score.
F. Manfaat Penelitian
Informasi yang didapat dari penelitian ini memiliki beberapa manfaat, diantaranya
1. Bagi para pendidik akan didapatkan metode penskoran yang dapat
mengurangi efek tebakan pada tes hasil belajar dengan meningkatkan
reliabilitas tes hasil belajar.
2. Secara teoritis didapatkan bukti empiris bahwa metode penskoran akan
mempunyai pengaruh yang berbeda terhadap reliabilitas tes hasil belajar dan
dapat menambah informasi untuk memilih metode penskoran yang lebih
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
BAB III
METODOLOGI PENELITIAN
A. Variabel Penelitian
Secara garis besar variabel penelitian mengenai keterbandingan reliabilitas
berdasar metode penskoran number-right score dengan metode penskoran
correction for guessing dibagi menjadi dua yaitu:
1. Variabel bebas pada penelitian ini adalah metode penskoran dengan
menggunakan tiga metode penskoran yaitu metode penskoran number-right
score dan metode penskoran correction for guessing yaitu metode penskoran
punishment score dan metode penskoran reward score.
2. Variabel terikat pada penelitian ini adalah reliabilitas tes.
B. Metode Penelitian
Penelitian mengenai keterbandingan reliabilitas tes hasil belajar
matematika berdasar metode penskoran number-right score dan metode
penskoran correction for guessing ini merupakan penelitian kuantitatif. Metode
yang digunakan dalam penelitian ini adalah metode penelitian
kuasi-eksperimental (eksperimen semu). Menurut Ali (2011: 284) “Perbedaan utama
studi eksperimental dan studi kuasi-eksperimental terletak pada pemilihan subyek
sampel secara random dan penugasan subyek secara random ... pada hakekatnya
studi kuasi-eksperimental adalah studi eksperimental”. Jadi metode Penelitian
kuasi-eksperimental adalah metode penelitian yang dilakukan melalui kegiatan
ekperimentasi atau percobaan yang sengaja dilakukan dan terkontrol. Peneliti
tidak melakukan penugasan random saat melakukan penelitian yaitu saat
melakukan penskoran menggunakan tiga metode penskoran yaitu metode
penskoran number-right score dan metode penskoran correction for guessing
Desain penelitian
Desain penelitian yang digunakan adalah desain perbandingan kelompok
statis (the static group comparison design) yaitu penelitian membandingkan tiga
kelompok penelitian. Satu kelompok kontrol reliabilitas skor hasil tesnya
menggunakan metode penskoran number-right score. Sedangkan dua kelompok
eksperimen lain reliabilitas skor hasil tesnya menggunakan metode penskoran
correction for guessing yaitu punishment score dan reward score.
Tabel 3.1 Desain perbandingan kelompok berdasar metode penskoran Model Penskoran
Number-right score Correction for guessing
Punishment score reward score
Populasi penelitian dibedakan menjadi dua bagian yaitu populasi subyek
penelitian dan populasi skor. Populasi subjek adalah seluruh siswa Sekolah Dasar
di kota Bandung. Populasi skor adalah skor siswa dan skor butir yang datanya
diambil dari hasil tes sampel siswa Sekolah Dasar di Bandung.
Sampel subjek dipilih dari seluruh siswa Sekolah Dasar Negeri di kota
Bandung yang berjumlah 575 sekolah. Pengambilan sampel menggunakan teknik
random sampling. Menurut Taniredja dan Mustafidah (2012: 35) “Teknik random
sampling disebut juga acak, serampangan, tidak pandang bulu/ tidak pilih kasih,
objektif, sehingga seluruh elemen populasi mempunyai kesempatan untuk jadi
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
subjek memiliki peluang yang sama untuk dipilih menjadi sampel subjek. Alasan
dipilih teknik pengambilan sampel random sampling karena pada tingkat sekolah
dasar, penerimaan peserta didik tidak didasarkan pada nilai tertentu atau
berdasarkan tes masuk jadi diasumsikan bahwa peserta didik ditingkat sekolah
dasar memiliki kemampuan yang merata. Selain hal tersebut sampel subjek dipilih
karena sudah selesai mengajarkan materi pecahan yang merupakan materi yang
akan diujikan dalam instrumen penelitian. Dari 575 Sekolah Dasar Negeri di kota
Bandung dipilih secara random lima Sekolah Dasar Negeri sebagai tempat
pelaksanaan penelitian.
Sampel siswa kemudian diberikan tes hasil belajar yang sama yaitu
mengenai materi pecahan. Dari tes belajar tersebut, jawaban masing-masing
peserta didik akan dinilai menggunakan tiga kelompok berdasar tiga metode
penskoran yaitu metode number-right score, punishment score dan reward score.
Berdasarkan data kelompok populasi skor tersebut, masing-masing kelompok
akan diambil data dengan metode pengambilan Sampel Acak Dengan
Pengembalian (SADP) sebanyak sepuluh kali jumlah faktor atau variabel yang
memberi pengaruh pada hasil tes. Setelah didapatkan data skor yang diinginkan,
hitung reliabilitas dari data skor tersebut. Ulangi pengambilan data secara acak
dengan pengembalian sehingga didapat data tiga puluh koefisien reliabilitas.
Ketiga puluh data koefisien reliabilitas dari masing-masing kelompok skor yang
dijadikan data sampel penelitian.
Sampel skor berupa data koefisien reliabilitas dari kelompok skor siswa
yang dinilai menggunakan metode penskoran number-right score, metode
penskoran punishment score dan metode penskoran reward score.
D. Instrumen dan Teknik Pengumpulan Data
1. Instrumen
Instrumen yang digunakan dalam penelitian adalah tes berbentuk pilihan
ganda dengan empat pilihan jawaban. Ruang lingkup materi yang akan diujikan
Sebelum digunakan, instrumen diujicobakan dahulu kepada siswa untuk
mengetahui validitas dan reliabilitas instrumen. Sesuai dengan pendapat
Arikunto (dalam Taniredja, 2012: 41) “instrumen yang baik harus memenuhi dua persyaratan penting yaitu valid dan reliabel”. Soal uji coba tes dibagi menjadi dua tipe dengan masing-masing tipe berisi 20 butir soal. Uji coba diberikan di tiga kelas (100 peserta didik) dengan masing-masing kelas diminta mengerjakan dua
jenis soal. Selain itu agar didapat instrumen yang baik, masing-masing butir akan
diuji tingkat kesukaran, daya beda dan analisis distraktor.
1. Uji Validitas
Pengujian validitas dilakukan dengan menguji validitas isi dari instrumen.
Pengujian validitas isi dilakukan dengan meminta lima orang ahli atau praktisi
pendidikan di bidang matematika. Format yang digunakan untuk validasi adalah
format skala penilaian (judgement ahli) bentuk dikotomi dengan skala satu-nol.
Nilai 1 = sesuai dan nilai 0 = tidak sesuai
Tabel 3.2 Format skala penilaian judgement ahli
Butir Penilai Jumlah
sesuai persentase
1 2 . . n
1
x11 x12 . . x1n ∑ ∑
2
x21 x22 . . x2n ∑ ∑
. x31 x32 . . x3n . .
. x41 x42 . . x4n . .
m xm1 xm2 . . xmn ∑ ∑
Perhitungan validitas isi menggunakan persentase butir yang cocok dengan
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
∑ (3.1)
dengan
m = jumlah penilai = 5
∑
Menurut Susetyo (2011: 92) “Butir soal dikatakan valid jika diperoleh persentase lebih besar dari 50% ”.
2. Uji Keselarasan (Konkordansi)
Selain uji validitas, dilakukan uji keselarasan (konkordansi) antar penilai
menggunakan uji Cochran. Uji Cochran dilakukan untuk melihat apakah ada
kesepakatan antar penilai saat melakukan validitas isi terhadap instrumen tes.
Hipotesis uji
H0 : Terdapat kesamaan penilaian yang diberikan saat melakukan validitas isi
instrumen tes
H1 : Tidak terdapat kesamaan penilaian yang diberikan saat melakukan
validitas isi instrumen tes
Signifikansi uji
∑ ( ̅)
∑ ∑ (3.2)
dengan
m = jumlah penilai
= jumlah nilai “cocok” pada kolom ke-i
̅= rata- rata nilai Gi
= jumlah nilai “cocok” pada baris ke-i
Kriteria uji
H0 ditolak jika Q < 2tabel atau jika p < = 0,05
Uji Cochran dilakukan dengan menggunakan software Statistical Package for
Social Sciences (SPSS).
3. Uji Reliabilitas
Setelah diperoleh hasil validitas isi instrumen diujicobakan di lapangan.
Hasil uji coba digunakan untuk mengukur reliabilitas tes. Koefisien reliabilitas
dihitung mengunakan teknik perhitungan Alpha Cronbach yaitu :
∑
(3.4) dengan
= koefisien korelasi Alpha Cronbach
k = banyaknya butir soal
s2X = varians skor pada keseluruhan tes X
s2i = varians skor pada belahan tes ke-i
Pendapat Naga (2012: 241) mengenai kriteria koefisien reliabilitas Alpha
Cronbach :
Tabel 3.3 Kriteria umum koefisien reliabilitas Alpha Cronbach Reliabilitas Alpha Cronbach Kriteria
< 0,50 Tidak dapat diterima
0,50 ≤ < 0,60 Kurang
0,60 ≤ < 0,70 Bermasalah
0,70 ≤ < 0,80 Dapat diterima
0,80 ≤ < 0,90 Baik
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Butir soal dikatakan reliabel jika memiliki koefisien reliabilitas lebih besar dari 0,7 ( ≥ 0,7).
4. Analisis Tingkat Kesukaran
Tingkat kesukaran merupakan perbandingan jumlah siswa yang menjawab
benar suatu butir soal dengan jumlah seluruh peserta tes. Tingkat kesukaran biasa
dinyatakan dalam bentuk proporsi dan berkisar dari nilai 0,00 hingga 1,00. Jika
nilai tingkat kesukaran makin mendekati nol, maka butir soal semakin sukar.
Sebaliknya jika nilai tingkat kesukaran makin mendekati satu, maka butir soal
semakin mudah. Berikut ini klasifikasi tingkat kesukaran menurut Witherington
(dalam Susetyo, 2011: 154) :
Tabel 3.4 Klasifikasi tingkat kesukaran Rentang Klasifikasi
0,00 ≤ P ≤ 0,24 Sukar
0,25 ≤ P ≤ 0,74 Sedang
0,75 ≤ P ≤ 1,00 Mudah
Butir soal pada konstruksi tes Sumatif seperti Ujian Akhir bab dengan
materi pecahan diharapkan memiliki tingkat kesukaran tiap butir dapat bervariasi
dari butir dengan tingkat kesukaran mudah hingga sukar. Penyebaran tingkat
kesukaran yang berdistribusi normal dengan sebaran soal sukar 20%, soal sedang
50% dan soal mudah 30% dari keseluruhan jumlah soal.
5. Analisis Daya Beda
Daya beda digunakan untuk membedakan siswa yang berkemampuan
tinggi dan berkemampuan rendah. Analisis daya beda menggunakan korelasi point
biserial yang perhitungannya dilakukan menggunakan program ITEMAN.
Pembagian daya beda menurut Ebel (Susetyo, 2011: 161)
Indeks daya beda Klasifikasi
0,70 ≤ D ≤ 1,00 Daya beda baik
0,40 ≤ D ≤ 0,69 Daya beda cukup baik 0,30 ≤ D ≤ 0,39 Perlu sedikit revisi
0,20 ≤ D ≤ 0,29 Perlu revisi atau disisihkan
0,00 ≤ D ≤ 0,19 Revisi total atau disisihkan
Jika indeks daya beda semakin mendekati nilai satu maka butir soal
semakin baik dalam membedakan siswa dengan kemampuan tinggi dengan siswa
dengan kemampuan rendah. Menurut Nunnally (Dali, 1992: 7) “butir soal dengan
daya beda di atas 0,2 sudah cukup baik. Butir soal dengan indeks daya beda
kurang dari 0,2 perlu dibuang karena kurang baik dalam membedakan
kemampuan siswa”.
6. Analisis Distraktor
Analisis distraktor dilakukan untuk mengetahui apakah distraktor berjalan
dengan baik sebagai pengecoh. Distraktor yang baik juga mencegah siswa untuk
melakukan tebakan saat menjawab soal tes pilihan ganda (Susetyo, 2011 : 172).
Analisis distraktor dilakukan dengan menggunakan proporsi sebagai berikut:
(3.5)
dengan
P = proporsi distraktor
f = frekuensi jawaban siswa
N = Jumlah seluruh siswa
Distraktor dikatakan berfungsi dengan baik jika proporsi masing-masing
distraktor adalah 5%.
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Teknik pengumpulan data dilakukan dengan menggunakan tes hasil
belajar matematika dengan materi pecahan untuk siswa Sekolah Dasar kelas V.
Butir soal didapatkan dari butir-butir soal yang telah diujicoba dan direvisi.
Langkah-langkah pengumpulan data yang dilakukan adalah :
1. Instrumen tes yang sama diberikan kepada sampel siswa. Kemudian hitung
nilai akhir tes menggunakan tiga metode penskoran yaitu metode penskoran
number-right score, metode penskoran punishment score dan metode
penskoran reward score.
2. Dari sampel siswa didapatkan tiga kelompok data skor dengan metode
penskoran yang berbeda yaitu data skor menggunakan metode penskoran
number-right score, data skor menggunakan metode penskoran punishment
score dan data skor menggunakan metode penskoran reward score.
3. Kelompok data skor tersebut menjadi populasi data skor penelitian
4. Lakukan analisis faktor untuk mendapatkan jumlah data skor minimum yang
memadai untuk melakukan penelitian.
5. Setelah jumlah sampel minimum ditentukan, lakukan pengambilan data skor
secara acak dengan pengembalian.
6. Pengambilan sampel acak skor responden dengan pengembalian sebanyak 10
kali jumlah variabel pada analisis faktor yang telah dilakukan sebelumnya.
7. Dari pengambilan acak tersebut hitung nilai reliabilitas dari masing-masing
metode penskoran.
8. Didapat nilai reliabilitas dari tiga metode penskoran yang berbeda dari
pengambilan sampel acak dengan pengembalian.
9. Lakukan langkah (6.) dan (7.) hingga didapat 30 nilai reliabilitas dari tiga
metode penskoran yang berbeda
10.Data 30 buah koefisien reliabilitas dari masing-masing kelompok merupakan
data sampel untuk pengujian hipotesis.
E. Teknik Pengolahan Data
Sebelum dilakukan uji asumsi, dilakukan analisis tentang jumlah sampel
responden minimum yang memadai untuk melakukan penelitian dan mengetahui
berapa jumlah variabel yang terdeteksi menggunakan analisis faktor. Banyaknya
variabel digunakan untuk menentukan berapa banyak pengambilan sampel acak
dengan pengembalian.
Analisis faktor dilakukan dengan Keiser-Meyer-Olkin (KMO) terlebih
dahulu. Jika nilai KMO > 0,5 maka analisis lanjutan dapat dilakukan. Analisis tiap
butir dilakukan dengan melihat matriks korelasi anti image. Butir-butir dengan
korelasi anti image yang bernilai di atas 0,5 dianggap baik dan dapat digunakan
dalam pengujian hipotesis.
“Dalam analisis faktor dikenal dua macam prosedur yang dilandasi oleh
dasar pikiran yang agak berbeda yaitu eksplanatory factor analysis dan
confirmatory factor analysis” (Azwar, 2013: 122). Analisis faktor yang dilakukan
pada penelitian ini merupakan prosedur eksplanatory factor analysis karena
“membantu peneliti untuk mengenali dan mengidentifikasi berbagai faktor yang
membentuk suatu konstrak dengan cara menemukan varians skor terbesar dengan
jumlah faktor paling sedikit” (Azwar, 2013: 122). Selain itu dikatakan prosedur
eksplanatory factor analysis karena tidak bermaksud menguji hipotesis mengenai
banyaknya variabel yang terbentuk dari data skor tes hasil belajar. Menurut
Crocker dan Algina (1986: 304) “suatu analisis faktor dikatakan eksplanatori jika
peneliti tidak memiliki hipotesis mengenai jumlah faktor yang terukur pada suatu
tes”.
Tujuan dilakukan analisis faktor adalah mendapatkan jumlah sampel
minimum yang memenuhi syarat KMO dan dengan butir-butir yang telah
mencakup seluruh variabel yang ingin diteliti. Analisis faktor juga dilakukan
untuk mendapatkan banyaknya pengambilan sampel acak dengan pengembalian
yang digunakan untuk mendapatkan nilai reliabilitas skor hasil belajar sebagai
data sampel. Sejalan dengan pendapat Roscoe (dalamTaniredja, 2012: 38) “Bila dalam penelitian akan melakukan analisis dengan multivariate, maka jumlah
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
2. Uji persyaratan
Uji normalitas
Uji normalitas data digunakan untuk melihat apakah distribusi data
sampel penelitian berasal dari populasi berdistribusi normal. Data yang
berdistribusi normal merupakan salah satu syarat sebelum menggunakan uji
parametrik. Uji normalitas dilakukan menggunakan uji Saphiro-Wilk. Uji
Saphiro-Wilk dipilih karena “Uji Saphiro-Wilk merupakan uji yang paling kuat
meskipun tidak cukup efektif untuk ukuran sampel kecil” (Razali dan Bee, 2011).
Langkah-langkah uji Saphiro-Wilk adalah
Hipotesis uji
H0 : data sampel berdistribusi normal
H1 : data sampel berdistribusi tidak normal
Kriteria uji
H0 ditolak jika p < = 0,05
H0 diterima jika p > = 0,05
3. Uji hipotesis
Uji hipotesis dilakukan dengan menggunakan uji perbedaan rata-rata untuk
sampel berpasangan untuk tiga sampel jika data telah teruji normalitasnya.
Karena uji perbedaan rata-rata untuk tiga sampel berpasangan tidak ada untuk uji
parametrik maka digunakan uji non parametrik Friedman test untuk menguji
perbedaan rata-rata untuk tiga sampel berpasangan.
Hipotesis uji
H0 : (Tidak ada perbedaan rata-rata nilai reliabilitas skor hasil
belajar dengan metode penskoran number-right score, punishment score dan
reward score)
H1 : minimal ada satu pasang nilai reliabilitas skor hasil belajar dengan metode
penskoran number-right score, punishment score dan reward score yang
Kriteria uji
H0 ditolak jika p < = 0,05
H0 diterima jika p > = 0,05
Jika pada uji hipotesis disimpulkan ada perbedaan rata-rata antara
reliabilitas dengan metode penskoran yang berbeda, maka perlu ada uji Posthoc
untuk mencari tahu pasangan yang memiliki perbedaan yang signifikan.
Uji Posthoc
Uji Posthoc digunakan untuk melakukan pengujian pasca uji hipotesis. Uji
hipotesis dilakukan untuk menguji perbedaan rata-rata untuk tiga sampel
berpasangan. Karenanya belum diketahui seberapa besar perbedaan yang terjadi
dan sampel mana yang dikatakan berbeda atau sampel mana yang dikatakan tidak
berbeda. Uji posthoc dilakukan dengan melakukan uji perbedaan rata-rata untuk
dua sampel berpasangan secara berulang. Uji posthoc yang sesuai ada dua jenis
tergantung pada dipenuhinya asumsi data sebagai berikut:
a. Data berasal dari populasi berdistribusi normal
Jika kedua data berdistribusi normal maka uji Posthoc menggunakan uji
parametrik yaitu uji-t untuk perbedaan rata-rata dua sampel berpasangan. Uji-t
tersebut dilakukan secara berulang sebanyak tiga kali. Uji perbedaan yang
dilakukan untuk menguji antara :
1) Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai
menggunakan metode penskoran number-right score dengan metode
penskoran punishment score?
2) Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai
menggunakan metode penskoran number-right score dengan metode
penskoran reward score?
3) Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai
menggunakan metode penskoran punishment score dengan metode
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Karena uji Posthoc dilakukan menggunakan uji-t untuk perbedaan
rata-rata dua sampel berpasangan yang diulang sebanyak tiga kali akan terjadi
kenaikan kesalahan tipe I. Untuk mengatasi kenaikan kesalahan tipe I karena
perulangan yang dilakukan, maka digunakan prosedur Bonnferoni yang akan mengubah nilai yang digunakan.
Perulangan dilakukan sebanyak tiga kali. K= 3, dengan = 0,05.
Hipotesis uji
H0 :
H1 :
Kriteria uji
H0 ditolak jika p < = 0,05
H0 diterima jika p > = 0,05
b. Data berasal dari populasi berdistribusi tidak normal
Jika salah satu dari kedua data yang dibandingkan berdistribusi tidak
normal maka uji Posthoc menggunakan uji non-parametrik yaitu uji Wilcoxon
untuk perbedaan rata-rata dua sampel berpasangan. Uji Wilcoxon tersebut
dilakukan secara berulang sebanyak tiga kali. Uji perbedaan yang dilakukan
untuk menguji antara :
1) Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai
menggunakan metode penskoran number-right score dengan metode
penskoran punishment score?
2) Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai
menggunakan metode penskoran number-right score dengan metode
3) Apakah ada perbedaan reliabilitas hasil belajar antara yang dinilai
menggunakan metode penskoran punishment score dengan metode
penskoran reward score?
Uji Posthoc dilakukan untuk mengetahui pasangan reliabilitas yang
memiliki perbedaan yang signifikan. Karena uji Posthoc dilakukan menggunakan
uji wilcoxon untuk perbedaan rata-rata dua sampel berpasangan yang diulang
sebanyak tiga kali akan terjadi kenaikan kesalahan tipe I. Untuk mengatasi
kenaikan kesalahan tipe I karena perulangan yang dilakukan, maka digunakan
prosedur Bonnferoni yang akan mengubah nilai yang digunakan.
Perulangan dilakukan sebanyak tiga kali. K= 3, dengan = 0,05.
Hipotesis uji
H0 :
H1 :
Kriteria uji
H0 ditolak jika p < = 0,05
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
BAB V
KESIMPULAN DAN SARAN
A. Kesimpulan
Berdasar hasil analisis data, dapat disimpulkan bahwa:
1. Dari uji hipotesis disimpulkan bahwa ada perbedaan rata-rata nilai reliabilitas
dari metode penskoran number-right score, reliabilitas dari metode penskoran
punishment score, dan reliabilitas dari metode penskoran reward score.
2. Dari uji poshoc disimpulkan pula bahwa ada perbedaan yang signifikan antara
reliabilitas menggunakan metode penskoran number-right score dengan
reliabilitas menggunakan metode penskoran punishment score.
3. Dari uji poshoc disimpulkan ada perbedaan yang signifikan antara reliabilitas
menggunakan metode penskoran number-right score dengan reliabilitas
menggunakan metode penskoran reward score.
4. Tidak terdapat perbedaan yang signifikan antara reliabilitas menggunakan
metode penskoran punishment score dengan reliabilitas menggunakan metode
penskoran reward score.
Berdasar hasil uji poshoc ternyata didapatkan rata-rata reliabilitas
menggunakan metode penskoran number-right score lebih tinggi jika
dibandingkan dengan rata-rata reliabilitas menggunakan menggunakan metode
penskoran punishment score. Rata-rata reliabilitas menggunakan metode
penskoran number-right score lebih tinggi jika dibandingkan dengan rata-rata
reliabilitas menggunakan menggunakan metode penskoran reward score.
Rata-rata reliabilitas menggunakan metode penskoran punishment score lebih tinggi
jika dibandingkan dengan rata-rata reliabilitas menggunakan menggunakan
metode penskoran reward score.
Hasil analisis data tersebut berbeda dengan teori yang menyatakan bahwa
reliabilitas dengan metode penskoran correction for guessing akan lebih tinggi
jika dibandingkan reliabilitas dengan metode penskoran number-right score. Hal
dalam pelaksanaan tes hasil belajar. Instruksi mengenai metode penilaian akan
menyebabkan peserta didik lebih hati-hati dalam pengerjaan tes hasil belajar
dengan materi pecahan.
Namun ternyata metode penskoran correction for guessing perlu
dilengkapi dengan instruksi mengenai penskoran yang akan dilakukan. Metode
penskoran correction for guessing tidak menghasilkan perbedaan yang signifikan
jika tidak dilengkapi dengan instruksi yang tepat. Berarti reliabilitas akan
meningkat jika peserta didik tahu dengan pasti metode penilaian yang dilakukan
dan dapat memilih untuk melakukan tebakan atau tidak melakukan tebakan dalam
menjawab soal.
B. Saran
Berdasar pembahasan dan kesimpulan yang telah dilakukan maka ada
beberapa saran mengenai penelitian selanjutnya yaitu :
1. Dalam melakukan metode penskoran correction for guessing diperlukan
instruksi tes yang sesuai. Karena tanpa instruksi yang sesuai maka metode
penilaian tersebut tidak akan efektif untuk melakukan koreksi terhadap
faktor tebakan.
2. Diperlukan penelitian lanjutan mengenai risk-taking behavior pada peserta
didik di tingkat Sekolah Dasar untuk mengetahui metode penskoran
correction for guessing mana yang lebih efektif untuk diterapkan di Sekolah
Dasar.
3. Disarankan bagi guru untuk melakukan dan mensosialisasikan metode
penskoran correction for guessing bagi peserta didik untuk mengurangi
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
DAFTAR PUSTAKA
Ali, Mohammad. (2011). Memahami Riset Perilaku dan Sosial. Bandung. Pustaka
Cendekia Utama
Aries S., Erna Febru. (2011). Asesmen dan evaluasi. Yogyakarta. Aditya Media
Publishing.
Azwar, Saifuddin. (2012). Reliabilitas dan Validitas. Yogyakarta. Pustaka Pelajar.
Busnawir. (2006). Pengaruh Metode Penskoran terhadap Kestabilan Reliabilitas
Hasil Pengukuran Skala Sikap dengan Mempertimbangkan Varians Usia.
Disertasi UNJ : Tidak Diterbitkan.
Corder, Gregory W. & Foreman, Dale I. (2009). Nonparametric Statistics for
Non-Statisticians. New Jersey. John Wiley & Sons.
Crocker, Linda & Algina, James. (1986). Introduction to Classical and Modern
Test Theory. Florida. Hold, Rinehart and Winston, Inc.
Ebel, Robert L. (1979). Essentials of Educational Measurement. New Jersey.
Prentice-Hall, Inc.
Espinosa, Maria Paz. (2013). Do Students Behave Rationally in Multiple Choice
Tests? Evidence from a Field Experiment. Journal of Economics and
Management, 9(2), pp 107-135. Retrieved from
http://www.jem.org.tw/content/pdf/Vol.9No.2/02.pdf
Guilford, J. P. (1954). Psychometric Methods. Japan. Kogakusha Company, Ltd.
Khafid, M & Suyati. (2006). Pelajaran Matematika Penekanan pada Berhitung
Jilid 5B. Jakarta. Penerbit Erlangga.
Mardapi, Djemari. (2008). Teknik Penyusunan Instrumen Tes dan Nontes.
Yogyakarta. Mitra Cendikia Press.
Mardapi, Djemari. (2012). Pengukuran, Penilaian, dan Evaluasi Pendidikan.
Yogyakarta. Nuha Medika.
Musmuliadi. (2009). Hubungan model penskoran terhadap estimasi skor
Evaluasi Pendidikan, 13(2), hal 246-267. Diunduh dari
http://journal.uny.ac.id/index.php/jpep/article/download/1412/1199.
Naga, Dali Santun. (2012). Teori Sekor pada Pengukuran Mental edisi kedua.
Jakarta. PT Nagarani Citrayasa.
Naga, Dali Santun. (2008). Probabillitas dan Sekor pada Hipotesis Statistika.
Jakarta. UPT Penerbitan Universitas Tarumanagara.
Naga, Dali Santun. (1992). Pengantar Teori Sekor pada Pengukuran Pendidikan.
Jakarta. Gunadarma.
Nunnally, Jum C. (1959). Tests and measurements assessment and prediction.
New York. McGraw-Hill Book Company, Inc.
Razali, Nornadiah Mohd & Wah, Yap Bee. (2011). Comparisons of Shapiro-Wilk,
Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of
Statistical Modeling and Analytics [Online], Vol 2 (1), 21-33. Tersedia
http://instatmy.org.my/downloads/e-jurnal%202/3.pdf [11 Juni 2014].
Rasyid, Harun & Mansur. (2007). Penilaian Hasil Belajar. Bandung. CV Wacana
Prima.
Siegel, Sidney & Castellan Jr., N John. (1988). Nonparametric Statistics for the
Behavioral Sciences. New York. McGraw-Hill.
Soekadji, Sutarlinah. (1999). Guessing : Instructed or Discouraged Penalized or
Unpenalized. Jurnal Psikologi, 2, hal. 93-105. Diunduh dari
http://jurnal.psikologi.ugm.ac.id/index.php/fpsi/article/view/148/139
Sumarmo, Utari. (2013). Berpikir dan Disposisi Matematik Serta
Pembelajarannya. Kumpulan Makalah pada Universitas Pendidikan
Indonesia. Bandung.
Susetyo, Budi. (2011). Menyusun Tes Hasil Belajar dengan Teori Ujian Klasik
dan Teori Respon Butir. Bandung. CV Cakra.
Susetyo, Budi. (2010). Statistika untuk Analisis Data Penelitian : Dilengkapi
Cara Perhitungn dengan SPSS dan MS Office Exel. Bandung. Refika
Maria Agustina Amelia, 2014
KETERBANDINGAN RELIABILITAS TES HASIL BELAJAR MATEMATIKA BERDASAR METODE PENSKORAN NUMBER-RIGHT SCORE DAN METODE PENSKORAN CORRECTION FOR GUESSING
Universitas Pendidikan Indonesia | repository.upi.edu | perpustakaan.upi.edu
Suwarto. (2011). Teori Tes Klasik dan Teori Tes Modern. Widyatama, 20(1), hal
69-78. Diunduh dari
http://ejurnal.veteranbantara.ac.id/index.php/widyatama/article/download/99/90
Taniredja, Tukiran & Mustafidah, Hidayati. (2012). Penelitian Kuantitatif : Suatu
Pengantar. Bandung. Alfabeta.
Tim Karya Media Guru. (2012). Mandiri dan Sukses Ulangan Matematika Kelas
V SD/MI : Dilengkapi Latihan Soal dan Pembahasan. Yogyakarta. C. V