Soal tes digunakan untuk mengukur hasil belajar matematika peserta didik dengan materi bangun datar pada peserta didik kelas III sekolah dasar yang menjadi subjek penelitian. Bentuk instrumen soal pada penelitian ini adalah soal objektif. Penyusunan soal tes mengacu pada kompetensi dasar, dan indikator mata pelajaran matematika sekolah dasar kelas III. Kompetensi dasar pembelajaran matematika pada penelitian ini adalah memahami berbagai bentuk bangun datar dan dapat mengenal simetri pada bangun datar.
Adapun skor maksimal per soal pada penilaian tes bentuk uraian adalah 1, sedangkan skor minimalnya 0. Sebelum instrumen tes digunakan untuk mengukur hasil belajar matematika peserta didik, dilakukan validasi isi dan uji coba soal. Subjek uji coba instrumen tes adalah 72 peserta didik kelas III SDN Wonosaren Kecamatan Jebres, Surakarta. Hasil uji coba selanjutnya dianalisis untuk mengetahui validitas, reliabilitas, tingkat kesukaran soal, dan daya pembeda.
a. Validitas Isi
Budiyono (2003) menyatakan bahwa untuk menilai apakah instrumen validasi tinngi, dilakukan melalui expert judgment. Penilaian para pakar dilakukan untuk mengetahui suatu angket dikatakan valid atau tidak. Uji validitas isi ini digunakan untuk mengukur seberapa jauh tes dapat mengukur hasil belajar matematika matematika peserta didik. Saran yang diberikan oleh validator Priskila Dwinando, S.Pd yakni, pemilihan kata pada beberapa butir soal masih belum tepat dan perlu ada sedikit perbaikan agar peserta didik tidak salah memahami soal tersebut. Saran yang diberikan Iin, S.Pd yakni butir-butir soal sudah cukup baik dan sesuai dengan kisi-kisi yang disusun sehingga layak digunakan untuk tahap pengukuran hasil belajar matematika peserta didik. Saran yang diberikan oleh Muhammad Waluyo, M.Sc, Ph.D yakni, redaksi butir soal perlu diperbaiki karena ada beberapa butir soal yang bisa menimbulkan tafsiran ganda untuk peserta didik. Selain itu, penempatan aspek kognitif ada yang belum tepat, sehingga perlu adanya sedikit perbaikan. Hasil selengkapnya mengenai validasi isi
instrumen soal evaluasi dapat dilihat pada lampiran. Setelah dilakukan uji validitas oleh para validator serta mempertimbangkan saran dari pakar/validator, dilakukan revisi terhadap butir soal. Hasil revisi tersebut dikonsultasikan kepada validator lagi, dan hasilnya instrumen soal sudah layak dan baik.
b. Tingkat Kesukaran
Tingkat kesukaran soal atau proporsi jawaban benar adalah jumlah peserta tes yang menjawab dengan benar pada butir soal yang dianalisis dibandingkan dengan jumlah peserta tes seluruhnya (Surapranata, 2004: 12).
Instrumen soal tes dikatakan baik atau tidak dapat diketahui dari tingkat kesukaran atau derajat kesukaran yang dimiliki masing-masing butir item tersebut. Butir item tes dinyatakan baik apabila butir soal tersebut tidak terlalu sulit dan tidak terlalu mudah, dengan kata lain derajat kesukaran item adalah sedang atau cukup. Rumus menghitung tingkat kesukaran menurut Sudijono (2008: 371) ditunjukkan sebagai berikut.
Keterangan:
P = Proporsi angka indeks kesukaran item
Np = Banyaknya peserta didik yang dapat menjawab dengan benar Pada butir soal yang bersangkutan
N = Banyaknya peserta didik yang mengikuti tes
Tabel 3.3 Kriteria Tingkat Kesukaran Soal
Interval Kriteria
0,00 - 0,30 Sukar
0,31 - 0,70 Sedang
0,71 - 1,00 Mudah
(Arikunto, 2006: 207)
Adapun peniliaian butir soal memiliki skala 0 sampai dengan 1.
Semakin mendekati 1 soal tergolong jawaban yang benar dan 0 soal
jawaban salah. Indeks kesukaran yang berada sekitar 0,5 dianggap yang terbaik. Butir soal dengan indeks bawah 0,3 dikategorikan sebagai butir soal yang sukar sedangkan jika indeksnya di atas 0,7 butir soal tersebut memiliki kategori mudah.
c. Daya Pembeda
Daya pembeda soal merupakan kemampuan sebuah soal untuk membedakan antara peserta didik yang berkemampuan tinggi dan berkemampuan rendah. Angka yang menunjukkan besarnya daya pembeda adalah indeks diskriminasi. Semakin tinggi indeks daya pembeda soal maka semakin mampu soal untuk membedakan peserta didik yang sudah memahami dan belum memahami materi. Jika daya pembeda soal bernilai negatif berarti lebih banyak kelompok peserta didik yang belum memahami materi tersebut. Daya pembeda butir tes dihitung dengan rumus di bawah ini.
DP = Keterangan:
DP = Indeks daya pembeda
= Banyaknya peserta didik kelompok atas yang menjawab benar
= Banyaknya peserta didik kelompok bawah yang menjawab benar
= Banyaknya peserta didik kelompok atas median
= Banyaknya peserta didik kelompok bawah median
(Ratumanan & Laurens, 2003: 70)
Tabel 3.4 Kriteria Daya Beda
Indeks Daya Beda Kriteria 0,41 ≤ D < 1,00 Butir soal sangat baik
0,31 ≤ D < 0,40 Butir soal baik 0,21 ≤ D < 0,30 Butir soal cukup baik
D < 0,20 Butir soal jelek
(Arikunto, 2006: 218)
Hasil perhitungan uji daya beda soal dapat dilihat dari tabel berikut.
Berdasarkan tabel diatas dapat dilihat bahwa dari 35 soal yang diujikan pada uji instrumen, ada 3 soal yang berada pada kategori jelek, yaitu berada pada rentang 0,00-0,20. Oleh sebab itu, perlu adanya perbaikan terhadap kedua soal tersebut. Bertolak dari hasil perhitungan yang telah dilakukan, selanjutnya untuk mendapatkan pengukuran hasil belajar matematika matematika peserta didik yang valid, dipilih 25 dari 30 soal terbaik. Soal tes tersebut digunakan dalam penelitian ujicoba luas dan uji efektifitas untuk mengukur hasil belajar matematika peserta didik.
d. Uji Reliabilitas
Reliabilitas merupakan tolok ukur sejauh mana hasil suatu proses pengukuran dapat dipercaya. Istilah reliabilitas juga memiliki kesamaan makna dengan konsistensi, keterandalan, keterpercayaan, kestabilan, keajegan, dan sebagainya. Menurut Sugiyono (2015: 172) instrumen yang reliabel adalah instrumen yang bila digunakan beberapa kali untuk mengukur objek yang sama, akan menghasilkan data yang sama.
Berkenaan dengan uji reliabilitas instrumen soal tes pada penelitian ini, peneliti melakukan perhitungan reliabilitas menggunakan rumus Kader-Richardson (K.R 20) sebagai berikut:
=
dengan:
= Koefisien reliabilitas tes
n = Banyaknya butir item 1 = Bilangan konstan
= Variansi total
= Proporsi banyaknya subjek yang menjawab benar pada butir item yang bersangkutan
= Proporsi banyaknya subjek yang menjawab salah atau = 1
-= Jumlah dari hasil perkalian antara dan
(Sudijono, 2008: 252)
Klasifikasi uji reliabilitas menurut Sudijono (2008: 32) ditunjukkan pada Tabel 3.5 di bawah ini.
Tabel 3.5 Klasifikasi Uji Reliabilitas
Reliabilitas Kategori
0,00 ≤ r11< 0,20 Sangat rendah 0,21 ≤ r11< 0,40 Rendah
0,41≤ r11< 0,70 Sedang 0,71 ≤ r11< 0,90 Tinggi
0,91≤ r11< 1,00 Sangat tinggi
Hasil uji reliabilitas selengkapnya terdapat pada lampiran. Dari perhitungan tersebut, diperoleh nilai reliabilitas sebesar 0,894. Nilai tersebut termasuk dalam kategori reliabel karena masuk dalam interval lebih dari 0,70.