• Tidak ada hasil yang ditemukan

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

C. Pembahasan

Pada bagian pembahasan akan dibahas mengenai keterkaitan antara kajian teori yang terdapat pada bab II; hasil analisis data yang meliputi validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh butir soal UAS semester genap mata pelajaran matematika kelas IV SD di Kecamatan Depok; dan hasil penelitian terdahulu yang juga telah dijelaskan pada bab II. Pembahasan juga menggunakan syarat tes tertulis pilihan ganda yang telah dikemukakan Kunandar (2014: 201), sebagai berikut:

54% 46%

Persentase Efektivitas Pengecoh Berdasarkan Keberfungsiannya

Efektivitas pengecoh yang berfungsi efektivitas pengecoh yang tidak berfungsi

89

Syarat tes tertulis pilihan ganda yang baik adalah:

1. Memiliki validitas yang tinggi, artinya mampu mengungkapkan hasil belajar secara tepat.

2. Memiliki reliabilitas yang tinggi, artinya mampu memberikan ketetapan pengukuran tentang kompetensi yang miliki siswa.

3. Tiap butir soal memiliki daya beda yang memadai, artinya tiap butir soal mampu membeda siswa prestasi ata dan siswa prestasi bawah.

4. Tingkat kesukaran tes kira-kira 30% soal mudah, 50% soal sedang, dan 20% soal sulit dari keseluruhan soal tes.

5. Mudah diadministrasi, artinya tes tersebut memiliki petunjuk bagaimana cara pelaksanaanya, pengerjaannya, dan pemeriksaannya.

a. Validitas

Validitas berasal dari kata validity yang memiliki arti sejauhmana akurasi suatu tes dalam menjalankan fungsi pengukurannya (Azwar, 2015 b: 8). Validitas adalah relevansi, kecocokan, atau kesesuaian antara suatu tes dengan jenis kemampuan yang merupakan tujuan dari pengukuran (Djiwandono, 2008: 164). Validitas digunakan untuk menunjukkan sejauh mana alat ukur mampu memenuhi tujuan alat ukur tersebut (Siregar, 2013: 46). Suatu tes dikatakan valid apabila dapat memberikan informasi yang sesuai dan dapat digunakan untuk mencapai tujuan tertentu (Arifin, 2009: 247). Berdasarkan

90

definisi yang telah diuraiakn dapat disimpulkan bahwa validitas adalah suatu kecocokan, ketepatan suatu tes dengan tujuan yang ingin diukur.

Penelitian ini menggunakan jenis analisis validitas isi berdasarkan pada KTSP. Validitas isi digunakan untuk mengukur kesesuaian antara soal dengan materi ajar dan tujuan yang ingin diukur (Jihad & Haris, 2012:179). Validtas ini mengukur kemampuan tes dengan ranah yang ingin diukur (Basuki & Hariyanto, 2014: 124). Validitas isi adalah bertujuan melihat tes evaluasi mengukur cakupan yang ingin diukur (Sukardi, 2008: 32). Validitas isi menunjukkan sejauhmana sebuah aitem dalam tes mencakup keseluruhan isi yang ingin diukur melalui tes tersebut (Azwar, 2015 a: 175). Berdasarkan beberapa pendapat tersebut dapat disimpulkan bahwa validitas isi digunakan untuk melihat sejauhmana sebuah tes mencakup keseluruhan materi yang ingin diukur.

Penentuan validitas isi, biasanya menggunakan penilaian dari para ahli yang sesuai dengan bidangnya (Azwar, 2015 b: 113). Akan tetapi pada penelitian ini tidak menggunakan penilaian dari para ahli, melainkan analisis dilakukan dengan melihat apakah butir soal UAS genap mata pelajaran matematika kelas IV sudah sesuai dengan SK KD yang terdapat pada KTSP. Pengujian validitas isi tidak perlu menggunakan analisis statistik tetapi menggunakan analisis rasional dengan membandingkan butir soal apakah sudah sesuai dengan kriteria yang ditentukan (Azwar, 2015 a: 175).

91

Berdasarkan hasil analisis data didapatkan validitas isi dari soal UAS genap mata pelajaran matematika kelas IV SD di Kecamatan Depok sudah sesuai dengan SK KD yang terdapat pada KTSP, meskipun ada satu materi pada semester I yang tidak tercantum dalam soal yang diujikan.

Hasil penelitian tersebut akan tetapi belum sesuai dengan pernyataan dari Jihad dan Haris (2012: 179) bahwa validitas isi digunakan untuk mengukur kesesuaian soal dengan materi yang diajarkan. Kemudian berhubungan pula dengan pernyataan dari Basuki dan Hariyanto (2014: 124) bahwa validitas isi mengukur tes sesuai dengan ranah yang ingin diukur. Pernyataan dari Sukardi (2008: 32) juga sesuai dengan hasil analisis yaitu validasi isi bertujuan melihat tes evaluasi dalam mengukur cakupan yang ingin diukur. Pernyataan dari Azwar (2015 a: 175) sedikit berbeda dengan hasil analisis penelitian, validitas isi menunjukkan sejauhmana sebuah tes mencakup keseluruhan materi yang ingin diukur. Meskipun demikian hasil analisis validitas isi sudah sesuai dengan SK KD.

Analisis validitas isi merupakan tipe validitas yang paling penting dalam penyusunan butir soal (Azwar, 2015 b: 111). Analisis validitas isi juga muncul dalam penelitian Wirastri (2014) dengan hasil dari penelitian yaitu, satu soal mencakup materi di luar SK KD, sedangkan pada penelitian ini satu materi tidak masuk dalam butir soal yang diujikan. Penelitian yang juga menggunakan validitas isi adalah miliki Amalia dan Widayati (2012), jurnal

92

yang mereka menggunakan dua jenis validitas, yaitu validitas isi dan empiris. Dalam penelitian tersebut sama-sama menggunakan indikator sebagai analisis validitas isi. Hasil yang diperoleh pun beberapa dari indikator juga tidak masuk dalam tes, akan tetapi sebagain besar sudah sesuai dengan indikator yang disusun. Penelitian dari Ariyana (2011) tidak menggunakan validitas untuk menganalisis butir soal UAS, beliau berpendapat bahwa analisis validitas meliput daya beda, tingkat kesukaran, dan efektivitas pengecoh. b. Reliabilitas

Reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen (Arifin, 2009: 258). Reliabilitas adalah indeks untuk mengetahui seberapa jauh hasil pengukuran suatu alat ukur dapat konsisten, apabila dilakukan pengukuran dua kali atau lebih (Siregar, 2013: 55). Reliabilitas soal merupakan ukuran yang menyatakan tingkat keajegan atau kekonsistenan suatu soal tes (Jihad & Haris, 2012: 180). Berdasarkan definisi tersebut dapat disimpulkan bahwa reliabilitas adalah analisis soal mengenai keajegan dan kekonsistenan hasil dari tes tersebut.

Analisis reabilitas didapat dengan bantuan aplikasi komputer MicroCat

Iteman versi 3.00 dengan melihat hasil olah data koefisien reliabilitas

ditunjukkan pada bagian akhir yaitu Alpha. Koefisien reliabilitas alpha diperoleh melalui satu kali perhitungan dalam penyajian data (Azwar, 2015 c: 115). Berdasarkan hasil aplikasi MicroCat Iteman didapatkan hasil Alpha

93

sebesar 0,852. Sesuai dengan kriteria dari Jihad dan Haris (2012: 181) maka 0,852 termasuk dalam kriteria realibilitas tinggi dengan rentang 0,70 < <

0,90.

Berdasarkan hasil analisis data yang telah didapat bahwa kriteria reliabilitas yaitu tinggi, hal ini berarti sesuai dengan pendapat para tokoh yang mengatakan bahwa reliabilitas adalah analisis soal mengenai keajegan dan kekonsistenan hasil dari tes tersebut. Arifin (2009: 258) mengatakan reliabilitas adalah konsistensi suatu instrumen, Siregar (2013: 55) mengatakan reliabilitas digunakan untuk mengetahui sejauhmana alat ukur dapat konsisten. Jihad dan Haris (2012: 180) menyatakan reliabilitas adalah tingkat keajegan suatu soal tes. Sesuai dengan hasil analisis yang menyatakan bahwa reliabilitas dari butir soal UAS semester genap mata pelajaran matematika kelas IV SD di Kecamatan Depok adalah tinggi, artinya tes memiliki tingkat keajegan yang tinggi. Hasil data tersebut juga didukung oleh pendapat dari Kunandar (2014: 201) bahwa syarat tes pilihan ganda harus memiliki reliabilitas yang tinggi sehingga mampu menunjukkan keajegan pengukurannya.

Hasil analisis reliabilitas yang tinggi juga muncul dalam penelitian analisis butir soal, diantaranya ialah miliki Amalia dan Widayati (2012) menunjukkan kriteria reliabilitas yang juga tinggi dalam kelima seri soal TKM, yaitu 0,833; 0,843; 0,803; 0,785; dan 0,768. Semua memiliki kriteria

94

reliabilitas tinggi karena berada pada rentang 0,70 < < 0,90. Penelitian dari Ariyana (2011) juga memiliki kriteria reliabilitas tinggi dengan nilai koefisien alpha 0,711. Sedangkan, penelitian analisis butir soal dari Wirastri (2014) tidak menggunakan analisis reliabilitas.

c. Daya Beda

Analisis daya pembeda dalam tes dimaksudkan untuk mengetahui kemampuan soal untuk membedakan antara siswa yang berprestasi tinggi dengan siswa berprestasi rendah (Uno & Koni, 2012: 157). Tingkat daya beda adalah kemampuan butir soal untuk membedakan siswa berpretasi tinggi dan siswa berprestasi rendah (Endrayanto & Harumurti, 2014: 256). Daya beda dalam penelitian ini adalah kemampuan yang dimiliki butir-butir soal UAS genap mata pelajaran Matematika kelas IV tahun pelajaran 2014/2015 di SD Kecamatan Depok, Sleman untuk dapat mengetahui peserta didik yang berprestasi dan yang lemah prestasinya.

Hasil analisis data menunjukkan tingkat keberagaman daya beda, yaitu 18 butir soal memiliki kriteria amat baik, 11 butir soal memiliki kriteria cukup, dan 1 soal memiliki kriteria kurang baik dari keseluruhan soal UAS genap mata pelajaran matematika kelas IV SD Kecamatan Depok. Hasil tersebut telah sesuai dengan pernyataan dari Kunandar (2014: 201) bahwa syarat tes pilihan ganda harus memiliki daya beda yang memadai guna membedakan siswa berprestasi atas dan siswa berprestasi rendah. Berikut akan dipaparkan

95

jawaban siswa yang menjawab benar berdasarkan siswa berpretasi atas dan siswa berprestasi rendah untuk membuktikan apakah daya beda dalam soal UAS genap mata pelajaran matematika kelas IV sudah memadai.

Tabel 4.13 Pembuktian Daya Beda Berdasarkan Jawaban Benar Siswa Berprestasi Atas dan Siswa Berprestasi Rendah

Butir Soal

Siswa yang Menjawab Benar Siswa Berprestasi Atas Siswa Berprestasi Rendah 1 241 88 2 240 69 3 211 52 4 225 54 5 240 40 6 237 77 7 214 26 8 189 40 9 189 46 10 188 42 11 197 23 12 239 84 13 235 44 14 183 26 15 239 91 Butir Soal

Siswa yang Menjawab Benar Siswa Berprestasi Atas Siswa Berprestasi Rendah 16 240 94 17 188 22 18 277 22 19 277 51 20 244 98 21 226 42 22 236 35 23 238 76 24 231 92 25 153 60 26 239 58 27 242 51 28 224 64 29 170 38 30 235 63

Berdasarkan tabel 4.13 data dilihat bahwa siswa berpretasi atas lebih banyak menjawab benar dibandingkan siswa berprestasi bawah. Pembagian 911 siswa menggunakan 27% siswa untuk mewakili dari keseluruhan siswa (Azwar, 2015 a: 132-133). Sehingga didapatkan 27% dari 911 adalah 246 dari kelompok siswa berprestasi atas dan 246 siswa berprestasi bawah.

96

Analisis daya beda juga terlihat pada penelitian analisis butir soal seperti milik Wirastri (2014), hasil analisis daya beda menunjukkan rata-rata butir soal berada pada rentang 0,22 yang berarti memiliki kriteria cukup. Jurnal penelitian dari Amalia dan Widayati (2012) menunjukkan hasil analisis daya beda berupa 10% memiliki kriteria jelek; 20% memiliki kriteria cukup; 50% memiliki kriteria baik; dan 10% memiliki kriteria baik sekali. Penelitian dari Ariyana (2011) juga menunjukkan bahwa 26 % dari keseluruhan butir soal memiliki kriteria daya beda yang baik; 62% memiliki kriteria daya beda yang cukup; dan 10% memiliki kriteria daya beda yang jelek. Keseluruhan hasil penelitian tersebut telah menunjukkan keberagaman daya beda yang memadai guna membeda siswa prestasi atas dan siswa prestasi bawah.

d. Tingkat Kesukaran

Tingkat kesukaran item atau yang sering disebut sebagai indeks kesulitan item adalah angka yang menunjukan proporsi siswa yang menjawab betul dalam suatu soal tes yang dilakukan dengan menggunakan tes objektif (Sukardi, 2008: 136). Tingkat kesulitan tes biasanya ditunjukan dengan persentase siswa yang memperoleh jawaban item benar. Tingkat kesukaran adalah pengukuran seberapa besar kesukaran suatu soal (Arifin, 2009: 266). Analisis tingkat kesulitan butir tes dimaksudkan untuk mengetahui seberapa sulit atau mudah suatu soal tes yang telah diselenggarakan, baik secara keseluruhan maupun masing-masing butir soal tersebut (Djiwandono, 2008:

97

219). Berdasarkan definisi yang telah diuraikan sebelumnya dapat disimpulkan bahwa tingkat kesulitan atau indeks kesukaran adalah analisis yang digunakan untuk melihat sulit atau mudahnya suatu butir soal tes.

Hasil analisis tingkat kesukaran didapatkan hasil yaitu 15 butir soal memiliki tingkat kesukaran yang mudah dan 15 butir soal yang lain memiliki tingkat kesulitan sedang. Berdasarkan pendapat dari Kunandar (2014: 201) mengenai syarat tes pilihan ganda bahwa ada 30% soal mudah, 50% soal sedang, dan 20% soal sulit. Jumlah total keseluruhan soal UAS genap mata pelajaran matematika kelas IV SD di Kecamatan Depok ada 30 butir soal, ysng berarti harus ada 9 butir soal mudah, 15 butir soal sedang, dan 6 butir soal sulit. Berdasarkan hasil yang didapat hal tersebut membuktikan bahwa syarat yang dikemukakan Kunandar (2014) tidak terpenuhi. Meskipun demikian, Azwar (2015 a: 135) menyatakan bahwa terkadang suatu tes juga memiliki lebih banyak butir soal mudah dibanding yang sulit. Adapun pendapat Azwar (2015 a: 136) yang lain menyatakan bahwa tingkat kesukaran ditentukan oleh tujuan dari pembuatan suatu tes. Butir soal UAS bertujuan untuk mengetahui ketercapaian tujuan pembelajaran pada akhir semester.

Penelitian tentang analisis butir soal mengenai tingkat kesukaran juga terlihat pada penelitian milik Wirastri (2014), menunjukkan hasil analisis tingkat kesukaran dari 10 butir soal, 1 soal sukar; 2 soal sedang; dan 7 soal mudah. Menurut Wirastri soal tersebut belum mampu menggambarkan tingkat

98

kesukaran yang ideal karena terlalu banyak soal dengan tingkat kesukaran mudah. Hasil penelitian yang lainnya miliki Amalia dan Widayati (2012) menunjukkan hasil analisis tingkat kesukaran 30% sukar; 60% sedang; dan 10% mudah. Kesimpulan yang diperoleh Amalia dan Widayati (2012) menyatakan bahwa tingkat kesukaran soal adalah sedang. Penelitian miliki Ariyana (2011) menunjukkan hasil analisis tingkat kesukaran 22% sukar; 70% sedang; dan 8% mudah. Kesimpulan dari penelitian Ariyana (2011) menyatakan bahwa tingkat kesukaran soal adalah sukar.

e. Efektivitas Pengecoh

Khusus untuk tes pilihan ganda, selain analisis tingkat kesulitan dan daya pembeda, juga diperlukan analisis efektivitas pengecoh atau distractor (Uno & Koni, 2012: 157). Miller et al, 2009; Kubizyn and Borich, 2013 (dalam Endrayanto & Harumurti, 2014: 270) menjelaskan bahwa sebuah pilihan jawaban dalam soal pilihan ganda dikatakan sebagai pengecoh apabila lebih banyak siswa yang berprestasi rendah memilih jawaban tersebut dibandingkan siswaa berprestasi tinggi. Distractor disiapkan untuk mengecoh siswa yang tidak benar-benar belajar agar tidak memilih jawaban yang benar (Sukardi, 2008: 143). Berdasarkan definisi tersebut dapat disimpulkan bahwa efektivitas pengecoh atau distractor adalah opsi jawaban pada soal pilihan ganda guna menjebak siswa agar tidak memilih jawaban yang benar.

99

Hasil analisis data mengenai efektivitas pengecoh belum berfungsi, karena terdapat 46% pengecoh soal yang belum berfungsi. Efektivitas pengecoh juga kebanyakan memiliki kriteria jelas karena hanya dipilih oleh 0 – 25% dari keseluruhan peserta tes. Keberfungsian efektivitas pengecoh mengikuti kriteria yang diberikan oleh Basuki dan Hariyanto (2014: 144) bahwa pilihan jawaban yang berperan sebagai pengecoh sudah berfungsi apabila telah dipilih oleh 5% dari keseluruhan peserta tes. Sedangkan, kriteria baik, kurang baik, maupun jelek sebuah pilihan jawaban menggunakan kriteria dari Arifin (2009: 279).

Analisis efektivitas pengecoh juga terlihat pada penelitian analisis butir soal pada penelitian lainnya, seperti penelitian milik Wirastri (2014). Penelitian beliau menunjukkan hasil analisis efektivitas pengecoh yang kurang berfungsi karena soal nomor 1 dan 2 efektivitas pengecohnya tidak berfungsi, sehingga beliau menyarankan untuk memperbaiki pilihan jawaban untuk soal nomor 1 dan 2.

Hasil penelitian efektivitas pengecoh milik Amalia dan Widayati (2012) menunjukan hasil 50% efektivitas pengecoh sangat baik; 25% baik; 15% cukup; 7% kurang baik; dan 3% tidak baik. Amalia dan Widayati (2012) membuat kesimpulan bahwa efektivtas pengecoh sudah berfungsi. Penelitian terdahulu miliki Ariyana menunjukkan hasil analisis efektivitas pengecoh

100

MicroCAT (tm) Testing System Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation

Item and Test Analysis Program -- ITEMAN (tm) Version 3.00 Item analysis for data from file oke.txt Page 4

Item Statistics Alternative Statistics --- ---

Seq. Scale Prop. Point Prop. Point No. -Item Correct Biser. Biser. Alt. Endorsing Biser. Biser. Key ---- --- --- --- --- --- --- --- --- --- 22 0-22 0.685 0.722 0.552 A 0.054 -0.475 -0.230 B 0.685 0.722 0.552 * C 0.175 -0.561 -0.380 D 0.080 -0.304 -0.167 Other 0.007 -0.812 -0.185 82% berfungsi dan 18% tidak berfungsi. Beliau membuat kesimpulan bahwa effektivitas pengecoh dari soal tersebut telah berfungsi.

f.

Contoh Analisis Data MicroCat Iteman versi 3.00

Gambar 4.6 Analisis Hasil Olah data MicroCat Iteman versi 3.00 Analisis tingkat kesukaran dan daya beda suatu butir soal tidak cukup memberikan informasi mengenai kualitas tes, maka kita perlu melihat keberfungsian dari efektivitas pengecohnya (Azwar, 2015 a: 144). Tingkat kesukaran dapat dilihat pada bagian prop. correction. Daya beda dapat dilihat pada bagian point biserial. Efektivitas pengecoh dapat dilihat pada bagian

prop. endorsing. Berikut akan diuraikan analisis berdasarkan olah data dari

aplikasi komputer MicroCat Iteman versi 3.00.

Tingkat kesukaran pada butir soal nomor 22 adalah 0,685 yang berdasarkan kriteria dari Uno dan Satria (2012: 156) termasuk dalam kriteria sedang. Daya beda menunjukkan biser dan point biser sama-sama

101

menunjukkan angka yang positif, artinya butir soal mampu membedakan siswa berprestasi atas dan siswa berprestasi bawah. Point biser butir soal nomor 22 menunjukkan angka 0,552, menurut kriteria dari Djiwandono (2008: 224) memiliki kriteria baik.

Kunci jawaban butir soal nomor 22 adalah B dengan 68,5% dari keseluruhan peserta tes menjawab benar. Pilihan jawaban A adalah pengecoh dengan 5,4% dipilih dari keseluruhan peserta. Pilihan jawaban C sebagai pengecoh dipilih oleh 17,5% peserta tes. Pilihan jawaban D sebagai pengecoh dipilih oleh 8% peserta tes. Ketiga pilihan jawaban A, C, dan D berfungsi sebagai pengecoh karena telah memenuhi kriteria dari Basuki dan Hariyanto (2014: 144).

Efektivitas pengecoh juga dapat dilihat melalui biser dan point biser yang pada kunci jawaban harus menunjukkan angka positif dan tinggi, sedangkan pada pilihan pengecoh harus bernilai negatif dan tinggi (Azwar, 2015 a: 151). Butir soal nomor 22 menunjukkan biser dan point biser pada pilihan jawaban A, C, dan D bernilai negatif, artinya siswa berprestasi rendah cenderung memilih pilihan jawaban tersebut dibandingkan dengan siswa berprestasi atas.

102

Dokumen terkait