ANALISIS BUTIR SOAL PILIHAN GANDA ULANGAN AKHIR SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN PKn KELAS IV SD DI KECAMATAN DEPOK,
SLEMAN, YOGYAKARTA.
Oleh: Intan Utami
121134175
Latar belakang penelitian ini adalah jarang dilakukannya penelitian analisis butir soal di Kecamatan Depok. Kualitas butir soal dapat dilakukan dengan cara menganalisis butir soal. Untuk itu peneliti melakukan penelitian dengan tujuan untuk mengetahui kualitas butir soal pilihan ganda Ulangan Akhir Semester (UAS) di Kecamatan Depok dengan cara menganalisis validitas isi, reliabilitas, daya beda, tingkat kesukaran dan keberfungsian pengecoh butir soal Penelitian ini bertujuan untuk mengetahui kualitas butir soal pilihan ganda Ulangan Akhir Semester (UAS) di Kecamatan Depok.
Jenis penelitian ini adalah kuantitatif deskriptif. Populasi penelitian adalah seluruh SD baik yang swasta maupun negeri di Kecamatan Depok yang menggunakan Kurikulum Tingkat Satuan Pendidikan (KTSP). Sampel pada penelitian ini ditentukan dengan menggunakan teknik pengambilan purposive sampling. Sampel dalam penelitian ini adalah SD di Kecamatan Depok yang menggunakan KTSP. Instrumen penelitian ini berupa wawancara dan daftar cek yang berisi daftar SD yang telah menyerahkan soal, jawaban siswa dan kunci jawaban.
Hasil penelitian menunjukkan bahwa (1) Validitas isi butir soal pilihan ganda UAS dinyatakan valid dengan persentase sebesar 100%. (2) Reliabilitas butir soal pilihan ganda UAS dinyatakan tinggi atau 1eliable yaitu sebesar 0,749%. (3) Daya beda butir soal pilihan ganda UAS dinyatakan baik dengan persentase sebesar 66,67%. (4) Tingkat kesukaran butir soal pilihan ganda UAS dinyatakan baik sebesar 50%. (5) Keberfungsian pengecoh butir soal UAS yang berfungsi dengan baik, yaitu sebesar 73,33%.
ABSTRACT
ANALYSIS MULTIPLE-CHOICE QUESTIONS ITEM DURING SEMESTER TEST ON CIVIC EDUCATION SUBJECT BY FOURTH GRADERS OF ELEMENTARY SCHOOL, YEAR
2014/2015 IN DEPOK, SLEMAN, YOGYAKARTA.
By: Intan Utami
121134175
The background of this study is to know the quality of a test in Depok. In Depok rarely uses an analysis of the test items. The quality of test can be detected by analyzing on each item from the questions. The aim of this study was to describe the criteria about the good in accordance with the content validity, reliability, power difference, level of difficulty and the functioning of humbug items on the semester final test towards the fourth graders in Depok specifically on the civic education subjects in the academic year 2014/2015.
This research used quantitative descriptive. The subject population was all elementary school students both the public and private school in Depok using Education Unit Level Curriculum (SBC)/ Kurikulum Tingkat Satuan Pendidikan (KTSP). Samples in this study were determined by using purposive sampling technique of sampling. The sample in this study was a primary school in Depok are using SBC/KTSP. This research instrument was in the form of a check list containing the list of elementary schools which have submitted questions,
students’ answers and answer keys.
The results showed that (1) The validity item of the multiple choice questions content during the Semester test was declared as valid with a percentage of 100%. (2) Reliability item of multiple choice questions during semester test expressed highly reliable in the amount of 0.749%. (3) Power difference of the multiple choice questions during semester test is declared good with a percentage of 66.67%. (4) The difficulty level of multiple choice questions during semester test showed a good result with the percentage of 50%. (5) the functioning of humbug items during semester test had been functioning properly, which scored 73.33%.
ANALISIS BUTIR SOAL PILIHAN GANDA ULANGAN AKHIR SEMESTER GENAP TAHUN PELAJARAN 2014/2015
MATA PELAJARAN PKn KELAS IV SD
DI KECAMATAN DEPOK, SLEMAN, YOGYAKARTA
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Pendidikan
Program Studi Pendidikan Guru Sekolah Dasar
Oleh:
Intan Utami
NIM: 121134175
PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR JURUSAN ILMU PENDIDIKAN
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SANATA DHARMA
i
ANALISIS BUTIR SOAL PILIHAN GANDA ULANGAN AKHIR SEMESTER GENAP TAHUN PELAJARAN 2014/2015
MATA PELAJARAN PKn KELAS IV SD
DI KECAMATAN DEPOK, SLEMAN, YOGYAKARTA
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Pendidikan
Program Studi Pendidikan Guru Sekolah Dasar
Oleh:
Intan Utami
NIM: 121134175
PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR JURUSAN ILMU PENDIDIKAN
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SANATA DHARMA
iv
PERSEMBAHAN
Karya tulis ini kupersembahkan sebagai ucapan Syukur dan Terimakasih kepada :
1. Allah SWT yang selalu menyertai, memberikan jalan serta menuntun tiap
langkahku.
2. Orang tuaku tersayang, Wibowo dan Annastasia Patrisia Gillipa
3. Kedua kakakku tercinta, Arry Mukti Prabowo dan Puspa Wulandari
4. Teman-teman seperjuangan payungku Tina Yuniasari, Natalia Desy
Cahyaningtyas, Feriza Anggraeni, Arum Tyas Asih, Annisa Sinta Putri, Maria
Stefani Mustida Nugraha, Yosica Ronanda, Laurensia Erlina Apriliawati,
Antonius Ade, Mustika Ayu Kunandari, Adinda Titis, Felix Nolayan Fajar,
Bonifantinus Rudi, Kurniawan Harianto.
5. Teman-teman seangkatanku Luky Erningtyas, Fransisca Herning Tyastuti,
Ana Andriyastuti, Anastasia Desi Hartanti, Intansari Desy Saputri.
6. Sahabat-sahabatku tersayang Surya Guritno, Sintani Rahmawati, Yogie
Yolanda, Kusuma Wardhani, Tri Wijayanti, Almas Yusuf Kusuma, Diyah
Retnosari, Aji Dwiantoro, Mufti Hidayat, Andi Tri Sulistyawan, Yoga
v
MOTTO
The best way to predict your future is to create it
- Abraham Lincoln-
Kebanggan kita yang terbesar adalah bukan kita pernah gagal, tetapi bangkit
kembali setiap kali kita jatuh
- Muhammad Ali -
If yo do what you’ve always done, you’ll get what you’ve alw
ays
gotten
–
Tony Robbins
–
Barang siapa keluar mencari ilmu maka dia berada di jalan Allah
(HR. Turmudzi)
Apapun masalah yang sedang terjadi dalam hidupmu hadapilah dengan penuh
kesabaran, karena dengan kesabaran akan membantu mendewasakanmu dengan
sendirinya
viii
ABSTRAK
ANALISIS BUTIR SOAL PILIHAN GANDA ULANGAN AKHIR SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN PKn KELAS IV SD DI KECAMATAN DEPOK,
SLEMAN, YOGYAKARTA.
Oleh: Intan Utami
121134175
Latar belakang penelitian ini adalah jarang dilakukannya penelitian analisis butir soal di Kecamatan Depok. Kualitas butir soal dapat dilakukan dengan cara menganalisis butir soal. Untuk itu peneliti melakukan penelitian dengan tujuan untuk mengetahui kualitas butir soal pilihan ganda Ulangan Akhir Semester (UAS) di Kecamatan Depok dengan cara menganalisis validitas isi, reliabilitas, daya beda, tingkat kesukaran dan keberfungsian pengecoh butir soal Penelitian ini bertujuan untuk mengetahui kualitas butir soal pilihan ganda Ulangan Akhir Semester (UAS) di Kecamatan Depok.
Jenis penelitian ini adalah kuantitatif deskriptif. Populasi penelitian adalah seluruh SD baik yang swasta maupun negeri di Kecamatan Depok yang menggunakan Kurikulum Tingkat Satuan Pendidikan (KTSP). Sampel pada penelitian ini ditentukan dengan menggunakan teknik pengambilan purposive sampling. Sampel dalam penelitian ini adalah SD di Kecamatan Depok yang menggunakan KTSP. Instrumen penelitian ini berupa wawancara dan daftar cek yang berisi daftar SD yang telah menyerahkan soal, jawaban siswa dan kunci jawaban.
Hasil penelitian menunjukkan bahwa (1) Validitas isi butir soal pilihan ganda UAS dinyatakan valid dengan persentase sebesar 100%. (2) Reliabilitas butir soal pilihan ganda UAS dinyatakan tinggi atau viiieliable yaitu sebesar 0,749%. (3) Daya beda butir soal pilihan ganda UAS dinyatakan baik dengan persentase sebesar 66,67%. (4) Tingkat kesukaran butir soal pilihan ganda UAS dinyatakan baik sebesar 50%. (5) Keberfungsian pengecoh butir soal UAS yang berfungsi dengan baik, yaitu sebesar 73,33%.
ix
ABSTRACT
ANALYSIS MULTIPLE-CHOICE QUESTIONS ITEM DURING SEMESTER TEST ON CIVIC EDUCATION SUBJECT BY FOURTH GRADERS
OF ELEMENTARY SCHOOL, YEAR 2014/2015 IN DEPOK, SLEMAN, YOGYAKARTA.
By: Intan Utami
121134175
The background of this study is to know the quality of a test in Depok. In Depok rarely uses an analysis of the test items. The quality of test can be detected by analyzing on each item from the questions. The aim of this study was to describe the criteria about the good in accordance with the content validity, reliability, power difference, level of difficulty and the functioning of humbug items on the semester final test towards the fourth graders in Depok specifically on the civic education subjects in the academic year 2014/2015.
This research used quantitative descriptive. The subject population was all elementary school students both the public and private school in Depok using Education Unit Level Curriculum (SBC)/ Kurikulum Tingkat Satuan Pendidikan (KTSP). Samples in this study were determined by using purposive sampling technique of sampling. The sample in this study was a primary school in Depok are using SBC/KTSP. This research instrument was in the form of a check list containing the list of elementary schools which have submitted questions,
students’ answers and answer keys.
The results showed that (1) The validity item of the multiple choice questions content during the Semester test was declared as valid with a percentage of 100%. (2) Reliability item of multiple choice questions during semester test expressed highly reliable in the amount of 0.749%. (3) Power difference of the multiple choice questions during semester test is declared good with a percentage of 66.67%. (4) The difficulty level of multiple choice questions during semester test showed a good result with the percentage of 50%. (5) the functioning of humbug items during semester test had been functioning properly, which scored 73.33%.
x
KATA PENGANTAR
Puji syukur ke hadirat Tuhan Yang Maha Esa, atas semua berkat, rahmat,
karunia dan hidayah-Nya yang diberikan kepada penulis sehingga penulis mampu
menyelesaikan skripsi ini. Skripsi ini berjudul “Analisis Butir Soal Pilihan Ganda Ulangan Akhir Semester Genap Tahun Pelajaran 2014/2015 Mata Pelajaran PKn
Kelas IV SD Di Kecamatan Depok, Sleman, Yogyakarta” disusun untuk memenuhi salah satu syarat memperoleh gelar Sarjana Pendidikan Guru Sekolah
Dasar, Jurusan Ilmu Pendidikan, Fakultas Keguruan dan Ilmu Pengetahuan
Universitas Sanata Dharma Yogyakarta.
Dalam penyusunan skripsi ini tidak lepas dari banyak pihak yang telah
memberikan bantuan moril, materiil, dukungan, bimbingan, kerjasama, dan doa.
Untuk itu penulis mengucapkan terima kasih kepada:
1. Rohandi, Ph.D. selaku Dekan Fakultas Keguruan dan Ilmu Pendidikan
Universitas Sanata Dharma.
2. Christiyanti Aprinastuti, S.Si., M.Pd. selaku Ketua Prodi Pendidikan Guru
Sekolah Dasar Universitas Sanata Dharma.
3. Apri Damai Sagita Krissandi, S.S., M.Pd. selaku Wakil Program Studi
Pendidikan Guru Sekolah Dasar Universitas Sanata Dharma.
4. Maria Melani Ika Susanti, S.Pd., M.Pd. selaku Dosen Pembimbing I yang
selalu sabar dalam memberikan bimbingan, arahan, dan sarannya dalam
penyusunan skripsi ini
5. Irine Kurniastuti, S.Psi., M.Psi. selaku Dosen Pembembing II yang tak kalah
luar biasa sabar membimbing peneliti dalam penyusunan skripsi ini.
6. Seluruh dosen Program Studi Pendidikan Guru Sekolah Dasar dan staf
karyawan Universitas Sanata Dharma yang memberikan ilmu dan pelayanan
selama penulis menjadi mahasiswa Pendidikan Guru Sekolah Dasar.
7. Kepala dan staf karyawan Bapeda yang telah mengizinkan penulis untuk
xi
8. Kepala dan staf karyawan UPTD Pendidikan Kecamatan Depok, yang telah
bersedia meluangkan waktu untuk kami wawancarai dan memfasilitasi
selama proses penelitian yang dilakukan oleh peneliti.
9. Seluruh Kepala SD di Kecamatan Depok yang sudah bekerjasama, membantu
serta memfasilitasi peneliti pada saat penelitian akan dan sedang berlangsung.
10.Kedua orang tuaku tersayang, Bapak Wibowo dan Ibu Annastasia Patrisia
Gillipa yang sungguh luar biasa hebat dan tak pernah letih memberikan
dukungan, perhatian, cinta, kasih sayang, semangat serta motivasi. Happist
and luckiest person in the world have a great parents like yours in my life. 11.Kedua kakakku Arry Mukti Prabowo dan Puspa Wulandari yang selalu
memberiku penguatan dan perhatian yang begitu besar untukku. The one of
my moodbosters.
7. Teman-teman seperjuangan payungku Teman-teman seperjuangan payungku
Tina Yuniasari, Natalia Desy Cahyaningtyas, Feriza Anggraeni, Arum Tyas
Asih, Annisa Sinta Putri, Maria Stefani Mustida Nugraha, Yosica Ronanda,
Laurensia Erlina Apriliawati, Antonius Ade, Mustika Ayu Kunandari, Adinda
Titis, Felix Nolayan Fajar, Bonifantinus Rudi, Kurniawan Harianto.
12.Teman-teman seangkatanku Luky Erningtyas, Fransisca Herning Tyastuti,
Ana Andriyastuti, Anastasia Desi Hartanti, Intansari Desy.
13. Sahabat-sahabatku tersayang, Surya Guritno, Sintani Rahmawati, Yogie
Yolanda, Kusuma Wardhani, Tri Wijayanti, Almas Yusuf, Diyah Retnosari,
Aji Dwiantoro, Mufti Hidayat, Andi Tri Sulistyawan, Yoga Prakoso, Sri
Satini, Davit Riyanto, Theresia Yuhanis, Dewi Setyo Wulan dan Kusnurul
Khotimah.
14.Semua pihak yang tidak dapat peneliti sebutkan satu persatu namun telah
xiii
DAFTAR ISI
Halaman
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN PEMBIMBING ... ii
HALAMAN PENGESAHAN ... iii
HALAMAN PERSEMBAHAN ... iv
HALAMAN MOTTO ... v
PERNYATAAN KEASLIAN KARYA ... vi
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ... vii
ABSTRAK ... viii
ABSTRACT ... ix
KATA PENGANTAR ... x
DAFTAR ISI ... xiii
DAFTAR TABEL ... xvi
DAFTAR GAMBAR ... xviii
DAFTAR LAMPIRAN ... xiv
BAB I PENDAHULUAN ... 1
A. Latar Belakang Masalah ... 1
B. Batasan Masalah ... 7
C. Rumusan Penelitian ... 8
D. Tujuan Penelitian ... 9
E. Manfaat Penelitian ... 9
F. Definisi Operasional ... 10
BAB II LANDASAN TEORI ... 12
A. Kajian Pustaka ... 12
1. Evaluasi ... 12
2. Instrumen ... 14
3. Analisis Butir Soal ... 18
xiv
5. Reliabilitas ... 24
6. Daya Beda ... 26
7. Tingkat Kesukaran ... 28
8. Keberfungsian Pengecoh ... 30
9. ITEMAN ... 32
10.Mata Pelajaran PKn ... 38
B. Hasil Penelitian yang Relevan ... 43
1. Literature Map Hasil Penelitian Relevan ... 48
C. Kerangka Berpikir ... 50
D. Hipotesis Penelitian ... 51
BAB III METODE PENELITIAN ... 53
A. Jenis Penelitian ... 54
B. Waktu dan Tempat Penelitian ... 55
C. Populasi dan Sampel ... 56
D. Variabel Penelitian ... 61
E. Teknik Pengumpulan Data ... 62
F. Instrumen Penelitian ... 63
G. Teknik Analisis Data ... 66
1. Analisis secara Kualitatif ... 69
2. Analisis secara Kuantitatif ... 69
BAB IV HASIL DAN PEMBAHASAN ... 75
A. Deskripsi Penelitian ... 75
B. Hasil Penelitian ... 77
1. Validitas Isi ... 77
2. Reliabilitas ... 87
3. Daya Beda ... 88
4. Tingkat Kesukaran ... 89
5. Keberfungsian Pengecoh ... 94
C. Pembahasan ... 108
BAB V PENUTUP ... 118
xv
B. Keterbatasan Penelitian ... 119
C. Saran ... 121
DAFTAR REFERENSI ... 122
LAMPIRAN ... 124
xvi
DAFTAR TABEL
Halaman
Tabel 2.1 Koefisien korelasi/ validitas ... 23
Tabel 2.2 Kriteria Reliabilitas ... 25
Tabel 2.3 Kriteria Daya Beda ... 27
Tabel 2.4 Kriteria Tingkat Kesukaran ... 28
Tabel 2.5 Kriteria Keberfungsian Pengecoh ... 31
Tabel 2.6 Output Statistik Butir Soal ITEMAN ... 35
Tabel 2.7 Statistik Tes ... 36
Tabel 2.8 SK, KD, dan Indikator ... 41
Tabel 3.1 Populasi Penelitian ... 56
Tabel 3.2 Sampel Penelitian ... 59
Tabel 3.3 Instrumen penelitian berupa daftar check list ... 64
Tabel 3.4 Input data ... 66
Tabel 3.5 Hasil output ITEMAN ... 67
Tabel 3.6 Kriteria Reliabilitas ... 70
Tabel 3.7 Kriteria Daya Beda ... 72
Tabel 3.8 Kriteria Tingkat Kesukaran ... 73
Tabel 3.9 Kriteria Keberfungsian Pengecoh ... 74
Tabel 4.1 Validitas Isi ... 78
Tabel 4.2 Validitas ... 84
Tabel 4.3 Kategori Validitas ... 85
Tabel 4.4 Output ITEMAN ... 87
Tabel 4.5 Reliability Statistic ... 88
Tabel 4.6 Daya Beda ... 89
Tabel 4.7 Kategori Daya Beda ... 90
Tabel 4.8 Tingkat Kesukaran ... 91
Tabel 4.9 Kategori Tingkat Kesukaran... 93
Tabel 4.10 Keberfungsian Pengecoh ... 94
xvii
xviii
DAFTAR GAMBAR
Halaman
Gambar 2.1 Literature Map penelitian sebelumnya ... 48
Gambar 4.1 Diagram Validitas isi ... 86
Gambar 4.2 Diagram Daya Beda ... 91
Gambar 4.3 Diagram Tingkat Kesukaran ... 93
xix
DAFTAR LAMPIRAN
Halaman Lampiran 1 Pedoman dan Hasil Wawancara ... 125
Lampiran 2 Surat Perizinan dari Bapeda ... 126
Lampiran 3 Surat Perizinan dari UPTD ... 127
Lampiran 4 Daftar Nama Mahasiswa Kelompok payung ... 128
Lampiran 5 Daftar Cek Instrumen Penelitian ... 129
Lampiran 6 Soal Ulangan Akhir Semester Genap ... 130
Lampiran 7 Kunci Jawaban ... 135
Lampiran 8 Lembar Jawab Siswa ... 136
Lampiran 9 Rekapan Hasil Analisis Validitas, Reliabilitas, Daya
Beda, Tingkat Kesukaran Keberfungsian Pengecoh ... 137
1
PENDAHULUAN
A. Latar Belakang
Pendidikan adalah sebagai proses pembentukan kemampuan dasar yang
fundamental, yang menyangkut daya berpikir (intelektual) maupun daya rasa
(emosi) manusia (Dewey dalam Arifin, 2003: 3). Proses pendidikan adalah
proses perkembangan yang memiliki tujuan. Proses pendidikan umumnya terjadi
dalam pembelajaran di kelas. Pembelajaran di kelas yang berlangsung secara
efektif dan menyenangkan akan lebih berdampak positif bagi siswa sekolah
dasar. Pendidikan bertujuan untuk meningkatkan kualitas sumber daya manusia.
Peningkatan kualitas sumber daya manusia bukanlah hal yang mudah untuk
ditentukan ukuran kuantitasnya. Oleh karena itu, ukuran kuantitatif tersebut
umumnya didekati dengan pencapaian prestasi dalam belajar. Sementara, prestasi
belajar dapat ditentukan berdasarkan hasil evaluasi belajarnya. Prestasi belajar
yang dicapai siswa adalah hasil dari kegiatan belajarnya. Syah (2003:133)
mengatakan bahwa pendekatan belajar (approach to learning), strategi belajar,
dan metode belajar adalah faktor-faktor yang menentukan tingkat efisiensi
kegiatan belajar dan prestasi belajar siswa.
Kenyataannya permasalahan yang terlihat dalam pendidikan sekarang
adalah rendahnya mutu pendidikan di Indonesia dibandingan dengan
negara-negara sekitar, karena sistem pendidikan di Indonesia belum berfungsi dengan
negara (OECD (2013), PISA 2012 Result). Penilaian merupakan salah satu faktor
yang menentukan keberhasilan proses dan hasil belajar selain itu untuk
meningkatkan kemampuan mengajar guru dan membantu siswa untuk mencapai
perkembangan belajarnya secara optimal (Arifin, 2009: 5). Kegiatan untuk
menilai atau pemberian nilai atau mentukan suatu kualitas disebut sebagai
evaluasi. Evaluasi pendidikan memerlukan suatu alat evaluasi atau instrumen
penilaian untuk dapat memenuhi tujuan, sedangkan definisi alat evaluasi atau
instrumen penilaian adalah sesuatu yang dapat digunakan untuk mempermudah
seseorang dalam mencapai tujuan secara lebih efektif dan efisien (Arikunto,
2012: 40). Alat evaluasi atau instrumen penilaian memiliki dua teknik, yaitu
teknik nontes dan teknik tes (Arikunto, 2012: 40). Teknik nontes meliputi skala
bertingkat, kuesioner, check list, wawancara, dan observasi (Arikunto, 2012: 41).
Tes adalah sekumpulan pernyataan yang harus dijawab atau dikerjakan yang
nantinya akan memberikan informasi (Azwar, 1996: 2). Tes prestasi merupakan
hasil salah-satu alat pengukuran dibidang pendidikan yang sangat penting yang
nantinya digunakan untuk sumber informasi pengambilan keputusan. Tes prestasi
belajar berupa tes yang disusun secara terencana untuk mengungkap performasi
maksimal subjek dalam menguasai bahan-bahan atau materi yang telah diajarkan.
Seorang tenaga pengajar haruslah mengetahui dasar-dasar penyusunan tes
prestasi belajar yang baik agar dapat memperoleh hasil yang akurat (valid) dan
dapat dipercaya (reliabel) (Azwar, 1996: 9). Penilaian hasil belajar siswa dapat
suatu materi. Maka dari itu soal yang akan diberikan kepada siswa haruslah
memiliki kualitas yang baik dari segi karakterisik atau cirinya. Ciri-ciri soal yang
baik dijadikan sebagai alat ukur harus memenuhi 5 persyaratan tes, yaitu
memiliki : a) validitas, b) reliabilitas, c) tingkat kesukaran, d) daya pembeda, e)
analisis pengecoh. Penyusunan soal yang baik pun harus disusun sesuai dengan
prinsip dan prosedur penyusunan soal. Untuk mengetahui apakah soal yang
dibuat itu baik atau tidak, maka perlu dilakukan analisis kualitas butir soal.
Analisis kualitas butir soal merupakan suatu tahapan yang harus ditempuh
untuk mengetahui tingkat kualitas suatu tes secara keseluruhan maupun butir soal
saja yang menjadi bagian dari tes tersebut (Arifin, 2009: 246). Analisis butir soal
berkaitan dengan pertanyaan apakah butir soal sebagai suatu alat ukur
benar-benar mengukur apa yang hendak dan yang seharusnya diukur. Pertanyaan
tersebut merujuk pada karakteristik alat ukur yang baik. Ciri-ciri soal yang baik
dijadikan sebagai alat ukur harus memenuhi 5 persyaratan tes, yaitu memiliki : a)
validitas, b) reliabilitas, c) tingkat kesukaran, d) daya pembeda, e) analisis
pengecoh (Azwar, 1996 173). Baik atau tidak baiknya suatu soal dapat kita lihat
berdasarkan karakteristik-karakteristik tersebut. Karakteristik tersebut dijadikan
sebagai patokan/ parameter kualitas soal (Surapranata, 2004: 10). Untuk lebih
jelasnya akan dibahas pada bab kajian teori.
Validitas merupakan kata benda yang merujuk pada arti kata tepat. Suatu
alat ukur dikatakan valid, apabila mampu mengukur apa yang diingikan dan bisa
pada suatu kuesioner akan mengukur apa yang ingin diukur. Validitas isi adalah
kesesuaian antara indikator dengan butir soal yang diujikan (Azwar, 1996: 175).
Reliabilitas berasal dari kata reliable yang artinya dapat dipercaya. Suatu
alat ukur dikatakan reliabel, bila memberikan hasil yang konsisten/tepat/benar
walaupun dilakukan oleh siapa saja dan kapan saja sehingga alat ukur tersebut
dapat dipercaya atau dapat diandalkan (Oemar, 2003:72). Reliabilitas adalah
istilah yang dipakai untuk menunjukkan sejauh mana suatu hasil pengukuran
relatif konsisten apabila alat ukur digunakan berulangkali.
Daya pembeda adalah pengukuran sejauh mana suatu butir soal mampu
membedakan siswa yang sudah menguasai kompetensi dengan siswa yang belum
atau kurang menguasai kompetensi berdasarkan kriteria tertentu (Surapranata,
2004: 23). Semakin tinggi koefisien daya pembeda suatu butir soal, semakin
mampu butir soal tersebut membedakan antara siswa yang yang sudah menguasai
kompetensi dan siswa yang belum atau kurang menguasai kompetensi (Arifin,
2009:273).
Tingkat kesukaran adalah bilangan yang menunjukkan tingkat kesukaran
atau kemudahan suatu soal (Arikunto, 2010:223). Rentang perbandingan indeks
kesukaran ini berkisar antara 0,00 sampai dengan 1,0. Jika indeks kesukaran
menunjukkan angka 1,0 maka itu berarti soal itu tidak terlalu sukar dikerjakan.
Sebaliknya jika indeks kesukarannya 0,00 maka soal tersebut sangat sukar
alternatif pilihan jawaban pada soal tipe pilihan ganda yang apabila dipilih siswa
dapat menyebabkan jawaban menjadi salah atau tidak sesuai dengan kunci
jawaban. Butir soal yang baik adalah jika pengecohnya dipilih secara merata oleh
siswa yang menjawab salah (Arifin, 2009: 279).
Pendidikan Kewarganegaraan (PKn) merupakan materi yang
menyangkut pemahaman tentang persatuan dan kesatuan, kesadaran warga
Negara dalam bernegara, hak dan kewajiban warga Negara dalam
berbangsa dan bernegara, serta pendidikan bela negara. Pendidikan
Kewarganegaraaan sangat penting diajarkan bagi siswa sekolah dasar
untuk membentuk manusia Pancasila yang dapat bermanfaat dan
membanggakan bangsa. Melalui pelajaran PKn siswa dapat belajar menjadi
warga negara yang baik mulai dari lingkungan keluarga hingga lingkungan
Pemerintahan.
Pembelajaran PKn di SD selama ini sangat beragam materi
pembahasannya. Sampel dalam penelitian ini adalah mata pelajaran PKn kelas
IV. Alasan peneliti memilih mata pelajaran ini karena mata pelajaran PKn mulai
dari kelas IV sudah diperkenalkan globalisasi. Hal itu menunjukkan bahwa
materi mulai kelas IV ini diperluas lagi hingga internasional. Selain itu pada
soal-soal yang diujikan pada mata pelajaran ini masih banyak soal-soal yang sulit
dikerjakan siswa dan memiliki banyak pengecoh di setiap soalnya. Untuk alasan
pemilihan kelasnya peneliti memilih kelas IV karena pada kelas ini, cangkupan
mengambil mata pelajaran dan kelas IV.
Lokasi atau daerah yang peneliti gunakan dalam mengambil sampel soal
dan jawaban dalam penelitian ini adalah seluruh SD yang berada di dalam
Kecamatan Depok. Peneliti melakukan penelitian di Kecamatan Depok ini
karena sebelumnya jarang ada penelitian tentang analisis butir soal UAS
semester genap mata pelajaran PKn kelas IV SD. Berdasarkan data yang sudah
didapatkan dari UPT Pendidikan Kecamatan Depok, total SD Se-Kecamatan
Depok ada 53 SD, terbagi menjadi 2 yaitu Swasta dan Negeri. Jumlah SD Negeri
yaitu ada 37 dan swasta ada 16 Sekolah Dasar. Jumlah siswa yang akan
mengikuti Ulangan Akhir Sekolah ada 2670 siswa.
Berdasarkan hasil wawacara yang telah kami laksanakan dengan Kepala
UPT Pendidikan Kecamatan Depok, kami telah menemukan beberapa data untuk
mememperkuat alasan peneliti mengambil judul penelitian ini yaitu yang
pertama, sebelumnya jarang ada penelitian mengenai analisis butir soal di
Kecamatan ini, kedua keistimewaan Kecamatan Depok itu sendiri baik dari segi
kependudukan maupun segi pendidikan, ketiga prestasi di Kecamatan Depok ini
selalu masuk dalam 10 besar.
Dari segi pendidikan, ada beberapa sekolah favorit yang terdapat di
Kecamatan ini baik negeri maupun swasta sama-sama favoritnya. Sekolah Dasar
Negeri berjumlah 3 yang masing-masing Sekolah Dasar Negeri ini memiliki
karakteristik dalam mendidik siswa-siswi mereka. Sekolah Dasar Swasta yang
para orang tua siswa tentang pentingnya pendidikan untuk masa depan siswa
mereka, b) orang tua sisawa mendukung semua program yang akan dijalankan
sekolah baik kurikuler maupun non-kurikuler, c) siswa-siswa di Kecamatan
Depok pun sudah mengerti mengenai cita-cita mereka dan bagaimana mereka
harus meraihnya melalui prestasi di sekolah mereka masing-masing, d) adanya
komunikasi yang intensif antara orang tua wali siswa dengan guru kelas tentang
perkembangan anaknya, e) adanya komitmen antara siswa dan guru yang tinggi
untuk menciptakan suasana pembelajaran yang bermutu.
Dari segi Prestasi, Kecamatan Depok ini selalu menduduki peringkat 10
besar, seperti tahun lalu Kecamatan Depok mendapatkan peringkat 5 besar dari
17 Kecamatan yang ada di Kabupaten Sleman. Hal ini menunjukkan bahwa di
Kecamatan Depok ini banyak SD lain yang berprestasi.
Berdasarkan wawancara dengan kepala UPT Pendidikan Kecamatan
Depok, didapatkan data bahwa jarang ada penelitian mengenai analisis butir soal
pilihan ganda semester genap UAS SD di Kecamatan Depok. Maka dari itu
peneliti tertarik untuk melakukan penelitian analisis butir soal untuk mengetahui
kualitas butir soal UAS di Kecamatan Depok ini.
B. Batasan Masalah
Masalah dalam penelitian ini adalah kualitas butir soal ulangan akhir
sekolah (UAS). Penelitian ini dibatasi oleh analisis butir soal pilihan ganda
Pendidikan.
C. Rumusan Penelitian
Berdasarkan latar belakang yang telah dijelaskan di atas, peneliti
merumuskan masalah sebagai berikut:
1. Bagaimanakah validitas isi butir soal pilihan ganda UAS SD semester genap
tahun pelajaran 2014/2015 mata pelajaran PKn kelas IV SD di Kecamatan
Depok, Sleman, Yogyakarta?
2. Bagaimanakah reliabilitas butir soal pilihan ganda UAS SD semester genap
tahun pelajaran 2014/2015 mata pelajaran PKn kelas IV SD di Kecamatan
Depok, Sleman, Yogyakarta?
3. Bagaimanakah tingkat kesukaran butir soal pilihan ganda UAS SD semester
genap tahun pelajaran 2014/2015 mata pelajaran PKn kelas IV SD di
Kecamatan Depok, Sleman, Yogyakarta?
4. Bagaimanakah daya pembeda butir soal pilihan ganda UAS SD semester
genap tahun pelajaran 2014/2015 mata pelajaran PKn kelas IV SD di
Kecamatan Depok, Sleman, Yogyakarta?
5. Bagaimanakah keberfungsian pengecoh butir butir soal pilihan ganda UAS
SD semester genap tahun pelajaran 2014/2015 mata pelajaran PKn kelas IV
Berdasarkan rumusan masalah di atas, tujuan dari penelitian ini adalah:
1. Untuk memaparkan validitas isi butir soal pilihan ganda UAS SD semester
genap tahun pelajaran 2014/2015 mata pelajaran PKn kelas IV SD di
Kecamatan Depok, Sleman, Yogyakarta.
2. Untuk memaparkan reliabilitas butir soal pilihan ganda UAS SD semester
genap tahun pelajaran 2014/2015 mata pelajaran PKn kelas IV SD di
Kecamatan Depok, Sleman, Yogyakarta.
3. Untuk memaparkan indeks kesukaran butir soal pilihan ganda UAS SD
semester genap tahun pelajaran 2014/2015 mata pelajaran PKn kelas IV SD
di Kecamatan Depok, Sleman, Yogyakarta.
4. Untuk memaparkan daya butir soal pilihan ganda UAS SD semester genap
tahun pelajaran 2014/2015 mata pelajaran PKn kelas IV SD di Kecamatan
Depok, Sleman, Yogyakarta.
5. Untuk memaparkan keberfungsian pengecoh butir soal pilihan ganda UAS
SD semester genap tahun pelajaran 2014/2015 mata pelajaran PKn kelas IV
SD di Kecamatan Depok, Sleman, Yogyakarta.
E. Manfaat Penelitian
1. Bagi Peneliti
Hasil penelitian ini merupakan kesempatan bagi penulis untuk menambah
beda, tingkat kesukaran dan keberfungsian pengecoh
2. Bagi Sekolah
Hasil penelitian ini bisa menjadi koreksi diri supaya lebih selektif lagi
jika memberikan soal kepada siswa.
3. Bagi UPT
Hasil penelitian ini dapat dijadikan motivasi untuk penelitian selanjutnya
mengenai analisis butir soal.
F. Definisi Operasional
Berdasarkan latar belakang penelitian di atas, definisi operasional
penelitian ini adalah:
1. Validitas isi adalah kesesuaian antara butir soal dengan materi yang telah
diajarkan dalam pembelajaran.
2. Reliabilitas adalah sesuatu untuk menunjukkan sejauh mana suatu hasil
pengukuran relatif konsisten apabila alat ukur digunakan berulangkali.
3. Daya beda adalah pengukuran sejauh mana suatu butir soal mampu
membedakan siswa yang sudah menguasai kompetensi dengan siswa yang
belum atau kurang menguasai kompetensi berdasarkan kriteria tertentu.
4. Tingkat kesukaran adalah bilangan yang menunjukkan tingkat kesukaran
pilihan jawaban pada bentuk soal pilihan ganda.
6. Tes adalah sekumpulan pertanyaan yang harus dijawab oleh siswa yang
digunakan untuk mengukur sejauh mana kemampuan siswa memahami suatu
materi.
7. Pilihan ganda adalah beberapa alternatif jawaban yang terdiri dari kunci
jawaban dan pengecoh yang terdapat dalam suatu tes.
8. Pendidikan Kewarganegaraan adalah mata pelajaran yang memfokuskan
pada pembentukan warga negara yang memahami dan mampu melaksanakan
hak-hak serta kewajiban untuk menjadi warga negara Indonesia yang cerdas,
terampil dan berkarakter oleh Pancasila dan Undang-undang Dasar (UUD)
12
BAB II
LANDASAN TEORI
Pada bab ini membahas kajian pustaka, hasil penelitian sebelumnya dan
kerangka berfikir.
A. Kajian Pustaka 1. Evaluasi
Evaluasi adalah suatu kegiatan untuk mengukur suatu hal dengan
menggunakan satu ukuran yang bersifat kuantitatif yang kemudian
dilanjutkan dengan kegiatan mengambil keputusan baik atau buruknya
terhadap sesuatu yang bersifat kualitatif atau sering dikenal dengan menilai
(Arikunto, 2012: 3). Evaluasi adalah suatu proses yang sistematis yang
dilaksanakan untuk mengetahui tingkat keberhasilan dan efisiensi dari
program yang bersangkutan (Subali, 2012: 3).
Berdasarkan pengertian di atas, dapat peneliti simpulkan bahwa
evaluasi adalah suatu proses untuk mengukur suatu benda yang bersifat
kuantitatif.
Evaluasi pendidikan adalah proses evaluasi bukan sekedar mengukur
sejauh mana tujuan suatu pendidikan itu tercapai, tetapi digunakan juga
ketika akan membuat suatu keputusan (Cronbach dalam Arikunto, 2012: 3).
Evaluasi pendidikan dilakukan dalam rangka pengendalian mutu pendidikan
kepada pihak-pihak berkepentingan, diantaranya terhadap siswa, lembaga
dan program pendidikan (UU RI No 20 Th 2003).
Berdasarkan definisi evaluasi pendidikan, maka dapat peneliti
simpulkan evaluasi pendidikan adalah proses pengukuran sejauh mana suatu
tujuan pendidikan itu tercapai dalam rangka menjaga pengendalian mutu
pendidikan secara nasional.
Tujuan evaluasi ada tujuh, yaitu: untuk mengetahui tingkat
penguasaan peseta didik terhadap materi yang diberikan; untuk mengetahui
kecakapan, motivasi, bakat, minat, dan sikap siswa terhadap program
pembelajaran; meningkatkan kemajuan dan kesesuaian hasil belajar dengan
SK dan KD yang sudah di tetapkan; mendiagnosis keunggulan dan
kelemahan siswa dalam mengikuti pembelajaran; untuk seleksi; menentukan
kenaikan kelas; menempatkan siswa sesuai dengan potensi yang dimilikinya
(Arifin, 2009: 15). Secara umum tujuan evaluasi ada tiga, yaitu: untuk
mengukur kemajuan; menunjang penyusunan rencana; memperbaiki/
menyempurnakan kembali (Sudijono, 2006: 9).
Berdasarkan tujuan evaluasi di atas peneliti menyimpulkan ada
sepuluh. Tujuan evaluasi pendidikan antara lain, untuk mengukur kemajuan;
mengetahui kecakapan, motivasi, bakat, minat, dan sikap siswa terhadap
program pembelajaran; meningkatkan kemajuan dan kesesuaian hasil belajar
dengan SK dan KD yang sudah ditetapkan; mendiagnosis keunggulan dan
kenaikan kelas; menempatkan siswa sesuai dengan potensi yang dimilikinya;
menunjang penyususan rencana dan memperbaiki/ menyempurnakan suatu
rencana.
2. Instrumen
Instrumen atau yang biasa disebut juga dengan istilah “alat” secara umum, adalah sesuatu yang dapat digunakan untuk mempermudah seseorang
dalam melaksanakan tugas atau untuk mencapai tujuan secara efektif dan
efisien. Alat evaluasi juga dikenal dengan instrumen evaluasi. Dalam
kegiatan mengevaluasi, fungsi instrumen digunakan untuk memperoleh hasil
yang lebih baik sesuai kenyataan yang dievaluasi. Instrumen penilaian
dikatakann baik jika memenuhi beberapa persyaratan yaitu memiliki
validitas, reliabilitas, objektivitas, praktikabilitas, ekonomis (Arikunto, 2012:
72). Berikut keterangan dari masing-masing persyaratan.
a. Validitas
Sebuah instrumen penilaian dikatakan valid apabila data yang
dihasilkan atau didapatkan sesuai dengan keadaan
kenyataannya. Instrumen dikatakan valid apabila dapat
mengukur apa yang hendak di ukur.
b. Reliabilitas
Instrumen penilaian dikatakan reliabel apabila instrumen
apabila di uji cobakan secara berulang-ulang hasilnya
sama/tetap.
c. Objektivitas
Instrumen penilaian dikatakan dikatakan objektif jika dalam
pelaksanaan sistem skoringnya tidak dipengaruhi faktor
pribadi.
d. Praktikabilitas
Instrumen penilaian dikatakan praktis jika mudah
dilaksanakan, mudah dalam pemeriksaan dan memiliki
petunjuk yang jelas.
e. Ekonomis
Instrumen penilaian dikatakan ekonomis jika dalam
pelaksanaan tidak membutuhkan biaya yang banyak, tenaga
yang banyak, dan waktu yang lama.
Teknik tes merupakan suatu alat yang digunakan untuk menilai atau
mengukur secara keseluruhan kemampuan seorang siswa (Arikunto, 2012:
33). Ditinjau dari segi kegunaan, tes dibagi menjadi 3, yaitu: 1) tes
diagnostik, 2) tes formatif, 3) tes sumatif (Arikunto, 2012: 47). Berikut
penjelasan singkat mengenai ketiga bagian tes di atas:
Adalah tes yang digunakan untuk mengetahui
kelemahan-kelemahan siswa sehingga berdasarkan hal tersebut dapat dilakukan
penanganan yang tepat.
b. Tes formatif
Adalah tes yang digunakan untuk mengetahui sejauh mana siswa
telah terbentuk setelah mengikuti program tertentu.
c. Tes sumatif
Adalah tes yang digunakan untuk memberikan tanda kepada
siswa bahwa mereka telah mengikuti suatu program, serta menentukan
posisi kemampuan siswa dibandingkan dengan temannya yang lain
dalam suatu kelompok.
Peneliti manganalisis butir soal pilihan ganda Ulangan Akhir
Semester (UAS) termasuk dalam kategori tes sumatif. Bentuk tes
dibedakan menjadi dua yaitu, tes subjektif dan tes objektif. Tes subjektif
umumnya dalam bentuk esai/uraian. Tes subjektif ini bertujuan untuk
memantau kemajuan belajar siswa yang memerlukan jawaban bersifat
pembahasan atau dengan uraian kata-kata. Sedangkan tes objektif
merupakan tes yang pemeriksaannya dapat dilakukan secara objektif.
Hal ini dilakukan untuk mengatasi kelemahan-kelemahan yang ada pada
tes berbentuk esai (Arikunto, 2014: 162).
Macam-macam tes objektif dibagi menjadi empat yaitu, tes
objektif yang digunakan peneliti dalam menganalisis buti soal adalah tes
obektif tipe pilihan ganda.
Tes bentuk pilihan ganda merupakan tes yang memiliki satu
pemberitahuan tentang suatu materi tertentu yang belum sempurna serta
beberapa alternatif jawaban yang terdiri dari kunci jawaban dan
pengecoh (Arikunto, 2012: 183). Pilihan ganda umumnya terdiri dari
satu kalimat pertanyaan atau kalimat pernyataan dan beberapa pilihan
jawaban yang salah satu pilihan jawaban tersebut merupakan jawaban
yang benar (Azwar, 2015: 80). Berikut penjelasan singkat mengenai
kelebihan dan kekurangan tes tipe pilihan ganda (Sukardi, 2009: 125).
1) Kelebihan Tes Pilihan Ganda
a) Waktu untuk mengerjakan tes pilihan ganda relatif lebih
singkat.
b) Cangkupan materi pelajaran lebih banyak
c) Pengoreksian jawaban lebih cepat dikoreksi karena adanya
kunci jawaban dan dapat dikoreksikan bersama siswa atau
orang lain.
2) Kekurangan tes pilihan ganda
a) Penyusunan tes pilihan ganda membutuhkan waktu yang lebih
lama dibandingkan tes obyektif jenis lain.
b) Tes pilihan ganda memberi peluang kepada siswa untuk
3. Analisis Butir Soal
Analisis kualitas butir soal berkaitan dengan pertanyaan apakah butir
soal sebagai suatu alat ukur benar-benar mengukur apa yang hendak dan
yang seharusnya diukur. Pertanyaan tersebut merujuk pada karakteristik alat
ukur yang baik. Alat ukur yang baik adalah alat ukur yang valid ran reliabel.
Ciri-ciri soal yang baik dijadikan sebagai alat ukur harus memenuhi lima (5)
persyaratan tes, yaitu memiliki : a) validitas, b) reliabilitas, c) objektifitas, d)
praktikabilitas, e) ekonomis (Arikunto, 2012: 72). Analisis butir soal adalah
proses penelaah butir soal melalui informasi dari jawaban peserta tes guna
meningkatkan mutu butir soal yang bersangkutan dengan menggunakan
teori. Aspek yang diperhatikan dalam analisis butir soal secara klasik
ditelaah dari tiga segi yaitu, a) tingkat kesukaran butir, b) daya pembeda
butir dan c) penyebaran jawaban pada setiap pilihan jawaban (Kusaeri &
Suprananto, 2012: 173). Analisis butir soal dapat dilakukan dengan cara
menganalisis tingkat kesukaran, menganalisis efektifitas pengecoh,
menganalisis validitas, dan menganalisis reliabilitas (Azwar, 2015: 134).
Berdasarkan definisi di atas, analisis butir soal adalah pengkajian
atau penelaahan butir soal jawaban peserta tes guna meningkatkan kualitas
butir soal. Salah satu tujan utama dilakukan analisis adalah untuk
meningkatkan kualitas soal apakah soal tersebut dapat diterima karena
didukung statistik yang memadai, diperbaiki karena terbukti beberapa
dapat berfungsi (Surapranata, 2004:11). Cara untuk mengetahui kualitas
butir soal yaitu dengan menganalisisnya. Ada lima cara untuk menganalisis
butir soal yaitu dengan menganalisis validitas isi soal, kereliabilitas soal,
daya beda, tingkat kesukaran dan keberfungsian pengecoh.
Analisis soal digunakan untuk mengetahui kualitas butir soal sejauh
mana butir soal tersebut dapat membedakan antara siswa yang memiliki
kemampuan tinggi dengan siswa dengan kemampuan rendah. Analisis soal
dapat dilakukan dengan dua cara yaitu dengan analisis kualitatif dan
kuantitatif. Analisis kualitaitf digunakan untuk menganalisis soal yang
ditinjau berdasarkan isi/kandungan, teknis dan editorial. Sedangkan analisis
kuantitatif digunakan untuk menangalisis karakteristik internal tes melalui
data yang sudah diperoleh.
Penelitian ini membahas atau menganalisis butir soal dengan cara
analisis kualitatif yaitu dengan menganalisis validitas isi suatu soal. Validitas
isi suatu soal disusun harus berdasarkan tujuan yang telah dirumuskan jika
tidak valid dan sesuai dengan tujuan maka soal tersebut (Sugiono, 2015:
176). Analisis yang kedua menggunakan analisis kuantitatif yaitu penelaahan
butir soal yang didasarkan pada data yang diperoleh dari soal yang telah
diujikan. Analisis kuantitatif dapat dilakukan dengan empat cara yaitu
menganalisis reliabilitas, daya beda, tingkat kesukaran dan keberfungsian
Analisis validitas isi dilakukan dengan cara menganalisis kesesuaian
butir soal Ujian Akhir Semester (UAS) siswa kelas IV mata pelajaran PKn
dengan dengan indikator yang telah dirumuskan oleh Pemerintah Kecamatan
Depok. Sedangkan program Iteman digunakan untuk menganalisis
reliabilitas, tingkat kesukaran, daya beda, dan keberfungsian pengecoh.
Berdasarkan analisis butir soal, disimpulkan bahwa analisis butir soal dalam
penelitian ini dilakukan dengan lima cara yaitu menganalisis validitas isi,
reliabilitas, daya beda, tingkat kesukaran dan keberfungsian pengecoh
4. Validitas
Validitas merupakan instrumen tertentu yang dapat digunakan untuk
mengukur apa yang seharusnya diukur. Validitas adalah sebuah tes yang
dapat memberikan informasi yang sesuai dan dapat digunakan untuk
mencapai tujuan tertentu (Arifin, 2009: 247). Berdasarkan definisi di atas,
dapat peneliti simpulkan bahwa instrument tes yang digunakan untuk
mengukur apa yang seharusnya diukur untuk mendapatkan informasi yang
sesuai dengan tujuan yang akan di capai. Suatu alat ukur dikatakan valid,
apabila mampu mengukur apa yang diingikan dan bisa mengungkapkan data
dari variabel yang diteliti secara tepat.
Hasil penelitian yang valid bila terdapat kesamaan antara data yang
terkumpul dengan data yang sesungguhnya terjadi pada obyek yang diteliti.
data dan mengukurnya itu valid (dapat digunakan untuk mengukur apa yang
seharusnya diukur).
Validitas dibagi menjadi dua macam, yaitu validitas logis dan
validitas empiris (Arikunto, 2012: 80).
a. Validitas Logis
Validitas logis adalah sebuah instrumen evaluasi yang menunjuk
pada kondisi bagi sebuah instrumen yang memenuhi persyaratan valid
berdasarkan hasil penalaran. Kondisi valid dipandang terpenuhi karena
instrumen yang bersangkutan sudah dirancang secara baik, mengikuti
teori dan ketentuan yang sudah ada. Validitas logis tidak perlu diuji
kondisinya, tetapi langsung diperoleh sesudah instrumen sudah selesai
disusun. Validitas logis ada dua macam, yaitu: validitas isi dan validitas
konstrak (Arikunto, 2012: 81).
1) Validitas isi
Sebuah tes dikatakan memiliki validitas isi apabila mengukur
tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang
diberikan. Oleh karena nya materi yang diajarkan sudah tertera dalam
kurikulum (Sudijono, 2006: 164). Maka validitas isi ini sering disebut
juga sebagai validitas kurikulum. Validitas isi dapat diusakan
tercapainya sejak saat penyusunan dengan cara merinci materi
kurikulum, buku pelajaran. Dapat peneliti simpulkan bahwa validitas isi
dalam pembelajaran Pengujian validitas isi tidak melalui analisis
statistika tetapi menggunakan analisis rasional. Pengujian validitas isi
sangat penting dalam proses penyusunan tes prestasi belajar dan harus
dilakukan dengan seksama. Salah satu cara untuk mengetahui terpenuhi
atau kesesuaian validitas isi adalah dengan menyesuaikan butir-butir
soal yang diujikan dengan blue print atau domain ukurnya. Domain ukur
dalam penelitian ini adalah standar kompetensi, kompetensi dasar, dan
indikator yang didapatkan peneliti melalui Lembar Kerja Siswa (LKS).
Validitas isi ini sangat penting dalam proses penyusunan tes prestasi
belajar dan harus dilakukan dengan seksama, butir soal harus di
validitaskan terlebih dahulu kepada suatu panel ahli dibidang tersebut
(Azwar, 1996: 175). Validitas isi inilah yang digunakan oleh peneliti
untuk menganalisis kualitas soal yang diujikan kepada siswa. Sesuai
atau tidak dengan apa yang indikator yang telah dibuat oleh pemerintah.
2) Validitas konstrak
Sebuah tes dikatakan memiliki validasi konstrak apabila
butir-butir soal yang membangun tes tersebut mengukur setiap aspek berpikir.
Validitas konstruk dapat diketahui dengan cara merinci dan
memasangkan setiap butir soal dengan setiap aspek. Proses validasinya
b. Validitas Empiris
Validitas empiris adalah sebuah instrumen evaluasi yang
menunjuk pada kondisi bagi sebuah instrumen yang memenuhi
persyaratan valid setelah diuji dari pengalaman (Arikunto, 2012: 81).
Suatu instrumen dikatakan valid, apabila mampu mengukur apa
yang diingikan dan bisa mengungkapkan data dari variabel yang diteliti
secara tepat. Pengujian validitas dilakukan dengan mengkorelasikan
antara skor jawaban masing-masing item pertanyaan pengujian validitas
dilakukan dengan menggunakan rumus teknik korelasi product moment
simpangan dan product moment dengan angka kasar (Arikunto,
2012:85).
Adapun kriteria koefisien korelasi/ validitas soal sebagai berikut
(Arifin, 2009: 257):
Tabel 2.1 Koefisien Korelasi/ Validitas
No Rentang Angka Kriteria
1 0,81 – 1,00 Sangat tinggi
2 0,61 – 0,80 Tinggi
3 0,41 – 0,60 Cukup
4 0,21 – 0,40 Rendah
5 0,00 – 0,20 Sangat Rendah
Sumber: Arifin (2009: 257)
Tabel 2.1 menunjukkan nilai koefisien korelasi/ validitas, dapat
dilihat bahwa koefisien korelasi dibagi menjadi lima kriteria yaitu
sangat rendah, 0,21 – 0,40 menunjukkan kategori rendah, 0,41 – 0,60 menunjukkan kategori cukup, 0,61 – 0,80 menunjukkan kategori tinggi, dan 0,81 – 1,00 menunjukkan kategori sangat tinggi.
5. Reliabilitas
Reliabilitas berasal dari kata reliable yang artinya dapat dipercaya.
Suatu alat ukur dikatakan reliabel, bila memberikan hasil yang tepat/benar
walaupun dilakukan oleh siapa saja dan kapan saja sehingga alat ukur dapat
dipercaya atau dapat diandalkan. Reliabilitas adalah istilah yang dipakai
untuk menunjukkan sejauh mana suatu hasil pengukuran relatif konsisten
apabila alat ukur digunakan berulangkali (Oemar, 2003: 72).
Setuju dengan pendapat tokoh di atas, reliabilitas menunjukkan
kemantapan atau konsistensi hasil pengukuran. Suatu alat pengukur
dikatakan mantap atau konsisten, apabila untuk mengukur berulang kali, alat
pengukur itu menunjukkan hasil yang sama, dalam kondisi yang sama. Suatu
instrumen atau alat ukur dikatakan reliabel jika jawaban seseorang terhadap
instrumen itu ajeg atau stabil.
Instrumen dikatakan reliabel, bila memberikan hasil yang tepat/benar
walaupun dilakukan oleh siapa saja dan kapan saja sehingga instrumen dapat
dipercaya atau dapat diandalkan. Pengujian reliabilitas didasarkan pada
perhitungan koefisien alpha (α) dari Cronbach (Arikunto, 2000:235-236) Faktor utama yang mempengaruhi reliabilitas adalah adanya
oleh beberapa faktor antara lain panjang suatu tes, kecepatan, homogenitas
belahan, dan tingkat kesukaran soal (Crocker & Algina dalam Surapranata,
2004:92). Secara empirik, angka yang menunjukka tinggi-rendahnya
reliabilitas disebut koefisien reliabilitas Berikut kriteria soal dikatakan
reliabel. Semakin tinggi koefisien korelasi antara hasil ukur dari dua tes
parallel, menandakan keduanya semakin baik dan dapat dikatakan reliabel
dan sebaliknya. Kriteria reliabilitas berdasarkan pendapat Basuki &
Hariyanto (2014: 119) seperti pada tabel berikut ini.
Tabel 2.2 Kriteria Reliabilitas
No Rentang Angka Kriteria
1 0,90 – 1,00 Sangat tinggi
2 0,70 – 0,89 Tinggi
3 0,40 – 0,69 Cukup
4 0,20 – 0,39 Rendah
5 0,00 – 0,19 Amat rendah
Sumber: Basuki & Hariyanto (2014:119)
Kriteria reliabilitas dibedakan menjadi lima, yaitu koefisien
reliabilitas pada angka di antara 0,00 – 0,19, di antara 0,20 – 0,39, di antara 0,40 – 0,69, di antara 0,70 – 0,89, dan 0,90 – 1,00 (Basuki & Hariyanto, 2014: 119). Angka di antara 0,00 – 0,19 bermakna korelasi yang amat rendah, di antara 0,20 – 0,39 bermakna korelasi yang rendah, di antara 0,40
Uji reliabilitas butir soal peneliti menggunakan program Iteman 3.0 dengan
melihat nilai Alfa.
6. Daya Beda
Daya beda adalah pengukuran sejauh mana suatu butir soal mampu
membedakan siswa atau kelompok yang sudah menguasai kompetensi
dengan siswa atau kelompok lain yang belum atau kurang menguasai
kompetensi berdasarkan kriteria tertentu (Azwar, 1996: 137). Semakin tinggi
koefisien daya beda suatu butir soal, semakin mampu butir soal tersebut
membedakan antara siswa yang yang sudah menguasai kompetensi dan
siswa yang belum atau kurang menguasai kompetensi. Apabila proporsisi
penjawab benar dari dua kelompok sama, itu menunjukkan butir soal yang
bersangkutan tidak mampu membedakan antara siswa yang memiliki
kemampuan tinggi dengan kelompok siswa yang memiliki kemampuan
rendah. Setiap butir soal yang memiliki indeks/angka pembeda lebih bedar
daripada 0,50 dapat langsung dianggap sebagai butir soal yang berdaya beda
baik. Sedangkan untuk butir soal yang memilili indeks/angka deskriminasi
kurang dari 0,20 dapat langsung dibuang dan sisa lainnya dapat ditelaah atau
direvisi (Thorndike & Cunningham dalam Azwar, 1996: 139)
Rumus daya beda menurut Azwar (1996: 137) adalah sebagai berikut:
D = N it / NT– nir / NR
Keterangan:
n it = banyaknya penjawab butir soal dengan benar dari kelompok tinggi
NT = banyaknya penjawab dari kelompok tinggi
n ir = banyaknya penjawab butir soal dengan benar dari kelompok rendah
NR = banyaknya penjawab dari kelompok rendah
Daya beda adalah indeks/angka yang digunakan untuk membedakan
antara peserta tes yang berkemampuan tinggi dengan peserta yang
berkemampuan rendah. Angka daya pembeda berkisar antara -1 sampai +1.
Tanda negatif menunjukkan siswa yang memiliki kemampuan rendah dapat
menjawab benar dan sebaliknya angka positif menunjukkan peserta dengan
kemampuan tinggi yang menjawab salah. Dengan penjabaran tersebut soal
yang indeks daya pembedanya negatif menunjukkan terbaliknya kualitas
peserta tes (Azwar, 1996: 139). Berikut empat kriteria daya beda (Arikunto,
2012: 232):
Tabel 2.3 Kriteria Daya Beda
No Indeks Daya Beda Kriteria
1 0,00 – 0,20 Jelek
2 0,21 – 0,40 Cukup
3 0,41 – 0,70 Baik
4 0,70 - 1,00 Baik Sekali
Sumber: Arikunto (2012: 232)
Tabel 2.3 menunjukkan kriteria daya beda kriteria yang terdiri dari
7. Tingkat Kesukaran
Tingkat kesukaran atau taraf kesukaran adalah bilangan yang
menunjukkan tingkat kesukaran atau kemudahan suatu soal (Arikunto: 2010,
223). Tingkat kesukaran merupakan rasio antara penjawab butir soal dengan
benar dan banyaknya penjawab butir soal (Azwar, 1996: 134). Dapat peneliti
simpulkan bahwa tingkat kesukaran adalah perbandingan antara penjawab
benar dengan banyaknya penjawab yang di tunjukkan dengan angka.
Rentang perbandingan indeks kesukaran ini berkisar antara 0,00 sampai
dengan 1,0. Jika indeks kesukaran menunjukkan angka 1,0 maka itu berarti
soal itu tidak terlalu sukar dikerjakan. Sebaliknya jika indeks kesukarannya
0,00 maka soal tersebut sangat sukar dikerjakan. Tingkat kesukaran suatu
butir soal tidak selalu sama antara satu kelompok dengan kelompok siswa
yang lain karena memang suatu butir soal yang dirasakan sulit bagi satu
kelompok siswa, mungkin terasa mudah bagi kelompok siswa yang lain yang
lebih pandai. Apabila siswa dapat menjawab benar suatu butir soal itu
menunjukkan bahwa tingkat kesukaran butir soal tersebut lebih rendah dari
pada taraf kemampuan menjawabnya (Azwar, 1996: 136).
Tingkat kesukaran diberi simbol P yaitu merupakan singkatan dari
proporsi. Rumus untuk mencari P yang dikemukakan oleh Arikunto (2012:
223) adalah:
Keterangan :
P = tingkat kesukaran
B = banyaknya peserta yang menjawab dengan benar
JS = jumlah seluruh peserta tes
Tabel 2.4 Kategori tingkat kesukaran
No Nilai p Kategori
1 0,00 ≤ 0,30 Sukar
2 0,31 ≤p ≤ 0,70 Sedang
3 0,7 ≤ 1,00 Mudah
Sumber: Arifin (2009: 273)
Kategori tingkat kesukaran dibedakan menjadi 3 kategori seperti
pada tabel di atas. karakteristik tingkat kesukaran yang berkisar antara 0,00 ≤ 0,30 termasuk soal yang sulit, antara 0,31 ≤ p ≤ 0,70 termasuk soal yang sedang, dan 0,7 ≤ 1,00 termasuk soal yang mudah (Arifin, 2009: 273).
Analisis tingkat kesukaran dapat digunakan sebagai suatu indikator
untuk menentukan adanya perbedaan kemampuan peserta tes. Soal yang
memiliki tingkat kesukaran 0 maupun 1 hanya akan berpengaruh terhadap
rerata (mean), tetapi tidak akan berpengaruh terhadap reliabilitas, validitas
ataupun keputusan berdasarkan skor yang diperoleh peserta tes. Tingkat
kesukaran akan berpengaruh pada variabilitas skor dan ketepatan
8. Keberfungsian Pengecoh
Keberfungsian merupakan suatu jawaban salah yang berfungsi jika
dipilih secara merata oleh siswa. Arikunto (2012: 234) menyebutkan bahwa
suatu pengecoh dikatakan dapat berfungsi dengan baik jika paling sedikit
dipilih oleh 5% pengikut tes. Butir soal yang baik adalah jika pengecohnya
dipilih secara merata oleh siswa yang menjawab salah (Arifin, 2009: 279).
Kombinasi penyebaran jawaban akan bervariasi namun dasar terpenting
dalam melakukan penilaian terhadap kualitas butir soal adalah dengan
melihat fungsi pilihan jawaban, terutama pengecohnya yang harus terlihat
sebagai jawaban benar bagi subjek dari kelompok rendah. Idealnya jika
penyusunan butir soal yang pengecohnya dapat dijawab dengan benar oleh
semua subjek kelompok tinggi, sedangkan subjek kelompok rendah semua
memilih pengecoh (Azwar, 1996: 144). Keberfungsian pengecoh dapat
diperiksa dengan frekuensi pemilih masing-masing alternatif jawaban, yakni
jumlah pemilih yang sudah terdistribusi dengan cukup merata. Apabila
pengecoh dipilih oleh sedikit sekali peserta, tes itu menunjukkan bahwa
terlalu jelas salahnya sehingga tidak dapat berfungsi. (Azwar, 1996: 149).
Perhitungan efektivitas pengecoh dapat menggunakan rumus Arifin (2009:
279) adalah sebagai berikut:
Keterangan :
IP = indeks pengecoh
P = jumlah siswa yang memiliki pengecoh
N = jumlah siswa yang ikut tes
B = jumlah siswa yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban (opsi)
1 = bilangan tetap
Keberfungsian pengecoh dapat dilihat dari dua kriteria: a.) pengecoh
yang dipilih oleh siswa dari kelompok rendah, b.) pengecoh yang dipilih
oleh kelompok tinggi (Azwar, 1996: 142). Jika nilai IP = 0 maka soal
tersebut jelek, dan demikian pengecoh tidak berfungsi. Berikut kriteria
keberfungsian pengecoh Arifin (2009: 280).
Tabel 2.5 Kriteria Keberfungsian Pengecoh
No Nilai IP Kriteria
1 76% - 125% Sangat baik
2 51% - 75% atau 126% - 150% Baik
3 26% - 50% atau 151% - 175% Kurang baik
4 0% - 25% atau 176% - 200% Jelek
5 Lebih dari 200% Sangat jelek
Sumber: Arifin (2009: 280)
Tabel 2.5 menunjukkan kriteria pengecoh yang dibagi menjadi 5
kategori. Jika pengecoh menunjukkan persentase sebesar 76% - 125% maka
persentase sebesar 51% - 75% atau 126% - 150% maka pengecoh tersebut
berfungsi dengan baik, jika pengecoh menunjukkan persentase sebesar 26% -
50% atau 151% - 175% maka pengecoh tersebut berfungsi dengan kurang
baik, jika pengecoh menunjukkan persentase sebesar 0% - 25% atau 176% -
200% maka pengecoh tersebut jelek, jika pengecoh menunjukkan persentase
sebesar Lebih dari 200% maka pengecoh tersebut sangat jelek.
9. ITEMAN
Item and Test Analysis (ITEMAN) merupakan sebuah perangkat
lunak yang dibuat melalui bahasa pemrograman komputer yang diciptakan
khusus untuk analisis statistik butir soal dan tes. Program ini berguna untuk
menentukan kualitas butir soal dan tes berdasarkan data empiris hasil uji
coba. Hasil analisis butir mencangkup tingkat kesukaran, daya beda dan
keberfungsian pengecoh. Selain statistik butir soal, ITEMAN juga
menghasilkan statistik tes (Kusaeri & Suprananto, 2012: 178).
Berikut statistik dari output dari butir soal yang dianalisis peneliti
(Kusaeri & Suprananto, 2012: 179):
a. Sequence. No adalah nomor urut butir soal dalam file data. Fungsinya
untuk penomoran butir soal.
b. Scala-item adalah nomor urut butir soal dalam skala (tes/subtes)
c. Prop. Correct adalah proporsi siswa( peserta tes) yang menjawab benar
butir soal tersebut terlalu sukar atau terlalu mudah untuk peserta tes.
Indeks ini disebut juga indeks tigkat kesukaran soal secara klasikal.
d. Biser adalah indeks daya pembeda soal dengan menggunakan koefisien
korelasi biserial. Nilai positif menunjukkan bahwa peserta tes yang
menjawab benar butir soal, mempunyai skor yang relatif tinggi dalam
tes/skala tersebut. Sebaliknya nilai negatif menunjukkan bahwa peserta
tes yang menjawab benar butir soal, memperoleh skor yang relatif
rendah dalam tes/skala tersebut. Untuk statistik pilihan jawaban
(alternatif) korelasi biserial negatif sangat tidak dikehendaki untuk kunci
jawaban dan sangat dikehendaki untuk pilihan jawaban yang lain
(pengecoh).
e. Point-biser adalah juga indeks daya pembeda soal dan pilihan jawaban
(alternatif) dengan menggunakan koefisien korelasi point-biserial.
Penafsirannya sama dengan statistik biserial.
Catatan: Nilai -9.000 menunjukkan bahwa statistik butir soal atas pilihan
jawaban tidak dapat dihitung. Hal ini sering kali terjadii apabila tidak ada
peserta tes yang menjawab butir soal/ pilihan jawaban tersebut
Statistik pilihan jawaban (alternatif) memberikan informasi yang
sama dengan statistik butir soal. Perbedaannya adalah bahwa statistik pilihan
jawaban dihitung secara terpisah. Untuk setiap piihan jawaban dan
jawaban. Tanda (*) yang muncul di sebelah kanan hasil analisis
menunjukkan kunci jawaban.
Langkah kerja input data pada program ITEMAN sebagai berikut:
Contoh data penelitian peneliti adalah sebagai berikut.
a. Buka file data (misalkan: skripsi.txt), contoh dibawah ini yang berisi:
030 o N 14 (MUSTOKOREJO, RINGINSARI, ADI SUCIPTO 1, 2 )
BABDDCCBACBCADCBCABDBDBCACDBCA
4444444444444444444444444444444444444444
YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY
000001 BABBABCBACBCAACCDABDBDACAAADCA
000002 BDBBDBBBDCDCCADCAADDBCBACCDBCB
000003 OABADCDABCACAOABDABDBBADCCDBAA
000004 AACBAADBDACDAAABBDCDBDCADCDCCB
Berikut penjelasan singkat program ITEMAN:
1) Baris pertama adalah baris pengontrol yang mendeskripsikan data.
Kolom Keterangan
1-3 Jumlah soal (30 butir soal)
4 Kosong (spasi)
5 Jawaban omit (kosong)
6 Kosong (spasi)
7 Soal yang belum sempat dijawab (N)
9-10 Jumlah identitas (14)
2) Baris kedua adalah daftar kunci jawaban setiap butir soal.
3) Baris ketiga adalah daftar jumlah option untuk setiap butir soal.
4) Baris keempat adalah daftar butir soal yang hendak dianalisis (jika
butir yang akan dianalisis diberi tanda Y (yes), jika tidak diikutkan
dalam analisis diberi tanda N (no).
5) Baris kelima dan seterusnya adalah data siswa dan pilihan jawaban
siswa.
Setiap pilihan jawaban siswa (untuk soal bentuk pilihan
ganda) diketik dengan menggunakan huruf, misal ABCD atau angka
1234 untuk 4 pilihan jawaban atau ABCDE atau 12345 untuk 5
pilihan jawaban.
b. Double click pada software ITEMAN
1) Isikan nama input data yang akan diolah dalam ITEMAN (misalkan
skripsi.txt) tekan enter.
2) Isikan nama output data (misalkan skripsi-out.txt) tekan enter.
3) Tuliskan Y/N untuk pemunculan hasil skor.
4) Jika Y tuliskan nama output hasilnya (misalkan skripsi-scr.txt)
Tabel 2.6 Output Statistik Butir Soal ITEMAN
MicroCAT (tm) Testing System
Copyright (c) 1982, 1984, 1986, 1988 by Assessment Systems Corporation
Item and Test Analysis Program -- ITEMAN (tm) Version 3.00
Tabel 2.6 di atas menunjukkan output ITEMAN. Bersadarkan tabel di
atas diketahui bahwa Prop.correct menunjukkan angka 0.658. Berdasarkan
penjelasan sebelumnya tentang ITEMAN, Prop.correct menunjukkan besarnya
angka tingkat kesukaran butir soal. Sebagai contoh butir soal nomor 1 pada
Prop.correct menunjukkan angka 0.658 menunjukkan kategori sedang.
Berdasarkan penjelasan sebelumnya, Point biser menunjukkan kategori daya
beda butir soal. Point biser menunjukkan angka 0.410 yang termasuk dalam
kategori baik. Sedangkan Prop. Endorsing menunjukkan besarnya angka