Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD di Kecamatan Depok. Oleh :
Maria Stefani Mustida Nugraha (121134042)
Perencanaan yang baik dapat dinilai melalui evaluasi berupa analisis butir soal. Kecamatan Depok belum pernah melakukan analisis butir soal. Penelitian ini bertujuan untuk menganalisis butir soal pilihan ganda UAS genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di Kecamatan Depok ditilik dari 1) validitas, 2) reliabilitas soal, 3) tingkat kesukaran, 4) daya pembeda, dan 5) efektivitas pengecoh.
Penelitian ini merupakan penelitian kuantitatif deskriptif non experimental. Populasi penelitian ini adalah semua Sekolah Dasar (SD) Sekecamatan Depok yang mengimplementasikan KTSP, sedangkan sampel dalam penelitian ini adalah 27 SD di Kecamatan Depok. Teknik pengumpulan data dalam penelitian ini adalah dokumentasi dan wawancara. Instrumen penelitian menggunakan daftar check list dan pedoman wawancara. Teknik analisis data pada penelitian ini menggunakan 1) analisis kualitas ditilik dari validitas, 2) analisis kuantitatif meliputi a. reliabilitas soal, b. analisis butir soal, meliputi (1) tingkat kesukaran butir soal, dan (2) daya pembeda butir soal, dan efektivitas pengecoh bantuan software MicroCat Iteman versi 3.00.
Hasil penelitian menunjukkan bahwa 1) ditinjau dari validitas isi 100% valid, 2) reliabilitas soal koefisien Alpha 0,759, 3) tingkat kesukaran butir soal mudah 30%, sedang 50%, dan sukar 20%, dan 4) daya pembeda butir soal sangat baik 50%, cukup baik 16,67%, sedang 16,67%, dan buruk 16,67% dan 5) efektivitas pengecoh berfungsi 66,7%, dan tidak berfungsi 33,3%.
Year 2014/2015 Grade 5 Elementary School in District of Depok
By :
Maria Stefani Mustida Nugraha (121134042)
A proper planning can be rated through an items’ analysis. Depok had never conducted an items’ analysis before. This study is aimed to analyze the second semester final examination multiple-choice items in social science subject academic year 2014/2015 of 5th grade elementary school in Depok, judged from 1) validity, 2) items’ reliability, 3) level of difficulty, 4) distinguishing powers, and 5) detractor’s effectiveness.
This research is non experimental descriptive quantitative type. The study population is all elementary schools in Depok implementing KTSP, while the samples are 27 elementary schools in Depok. The data collection techniques used in this study are documentation and interviews. The research instruments used in this study are a check list and interview guides. Data analysis techniques used in this study are 1) quality analysis judged from the validity, 2) quantitative analysis, such as: a. items’ reliability, b. analysis of items including (1) the difficulty level of items, and (2) items’ distinguishing powers, and the detractor’s effectiveness, generated from Iteman MICROCAT software version 3.00.
The study’s results reveal that 1) in terms of the content validity, 100% valid, 2) items’ reliability Alpha coefficient is 0.759, 3) level of difficulty of items is 30% easy, 50% moderate, and 20% hard, 4) items’ distinguishing powers are 50% very good, 16.67% almost good, 16.67% moderate and 16.67% poor and 5) the detractor’s effectiveness are 66.7% function well, and 33.3% do not function well.
SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN IPS KELAS V SD DI KECAMATAN DEPOK
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Pendidikan Program Studi Pendidikan Guru Sekolah Dasar
Oleh:
Maria Stefani Mustida Nugraha
NIM: 121134042
PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR JURUSAN ILMU PENDIDIKAN
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SANATA DHARMA
i
SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN IPS KELAS V SD DI KECAMATAN DEPOK
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Pendidikan Program Studi Pendidikan Guru Sekolah Dasar
Oleh:
Maria Stefani Mustida Nugraha
NIM: 121134042
PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR JURUSAN ILMU PENDIDIKAN
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SANATA DHARMA
iv Karya tulis ilmiah ini kupersembahkan sebagai ucapan syukur dan
terima kasih kepada :
Tuhan Yesus Kristus sumber pengharapanku
Papah, Mamah, kakakku yang selalu mendukung setiap langkahku
Saudara dan teman-temanku yang selalu membantu dan menyemangatiku
v Iman Tanpa Perbuatan adalah Mati
Yak 2: 14-26
Semua Mimpimu akan Terwujud Asalkan Kamu Punya Keberanian untuk
Mengejarnya
Walt Disney
Bukan seberapa lama kita hidup, namun sebermanfaat apa hidup kita
viii
Analisis Butir Soal Pilihan Ganda Ulangan Akhir Semester Genap Tahun Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD di Kecamatan Depok.
Perencanaan yang baik dapat dinilai melalui evaluasi berupa analisis butir soal. Kecamatan Depok belum pernah melakukan analisis butir soal. Penelitian ini bertujuan untuk menganalisis butir soal pilihan ganda UAS genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di Kecamatan Depok ditilik dari 1) validitas, 2) reliabilitas soal, 3) tingkat kesukaran, 4) daya pembeda, dan 5) efektivitas pengecoh.
Penelitian ini merupakan penelitian kuantitatif deskriptif non experimental. Populasi penelitian ini adalah semua Sekolah Dasar (SD) Sekecamatan Depok yang mengimplementasikan KTSP, sedangkan sampel dalam penelitian ini adalah 27 SD di Kecamatan Depok. Teknik pengumpulan data dalam penelitian ini adalah dokumentasi dan wawancara. Instrumen penelitian menggunakan daftar check list dan pedoman wawancara. Teknik analisis data pada penelitian ini menggunakan 1) analisis kualitas ditilik dari validitas, 2) analisis kuantitatif meliputi a. reliabilitas soal, b. analisis butir soal, meliputi (1) tingkat kesukaran butir soal, dan (2) daya pembeda butir soal, dan efektivitas pengecoh bantuan software MicroCat Iteman versi 3.00.
Hasil penelitian menunjukkan bahwa 1) ditinjau dari validitas isi 100% valid, 2) reliabilitas soal koefisien Alpha 0,759, 3) tingkat kesukaran butir soal mudah 30%, sedang 50%, dan sukar 20%, dan 4) daya pembeda butir soal sangat baik 50%, cukup baik 16,67%, sedang 16,67%, dan buruk 16,67% dan 5) efektivitas pengecoh berfungsi 66,7%, dan tidak berfungsi 33,3%.
ix Multiple Choice Items Analysis of Social Subject Final Examination Academic
Year 2014/2015 Grade 5thElementary School in District of Depok
A proper planning can be rated through an items’ analysis. Depok had
never conducted an items’ analysis before. This study is aimed to analyze the
second semester final examination multiple-choice items in social science subject
academic year 2014/2015 of 5th grade elementary school in Depok, judged from
1) validity, 2) items’ reliability, 3) level of difficulty, 4) distinguishing powers, and
5) detractor’s effectiveness.
This research is non experimental descriptive quantitative type. The study
population is all elementary schools in Depok implementing KTSP, while the
samples are 27 elementary schools in Depok. The data collection techniques used
in this study are documentation and interviews. The research instruments used in
this study are a check list and interview guides. Data analysis techniques used in
this study are 1) quality analysis judged from the validity, 2) quantitative analysis,
such as: a. items’ reliability, b. analysis of items including (1) the difficulty level
of items, and (2) items’ distinguishing powers, and the detractor’s effectiveness,
generated from Iteman MICROCAT software version 3.00.
The study’s results reveal that 1) in terms of the content validity, 100%
valid, 2) items’ reliability Alpha coefficient is 0.759, 3) level of difficulty of items
is 30% easy, 50% moderate, and 20% hard, 4) items’ distinguishing powers are
50% very good, 16.67% almost good, 16.67% moderate and 16.67% poor and 5)
the detractor’s effectiveness are 66.7% function well, and 33.3% do not function
well.
x
Puji dan syukur kepada Tuhan Yang Maha Kuasa atas tuntunan, kasih, berkat dan rahmat-Nya, penulis dapat menyelesaikan skripsi dengan tepat waktu. Penulis menyusun skripsi dengan judul : “Analisis Butir Soal Pilihan Ganda Ulangan Akhir Semester Genap Tahun Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD di Kecamatan Depok”. Skripsi ini disusun untuk memenuhi salah satu syarat memperoleh gelar sarjana pada Fakultas Keguruan dan Ilmu Pendidikan khususnya Program Studi Pendidikan Guru Sekolah Dasar Universitas Sanata Dharma.
Penulis menyadari bahwa terselesainya skripsi ini tidak terlepas dari bimbingan, dorongan, dan dukungan yang telah diberikan oleh berbagai pihak. Oleh karena itu, penulis mengucapkan terimakasih yang sebesar-besarnya kepada: 1. Tuhan Yesus Kristus atas kasih dan karunia-Nya.
2. Rohandi, Ph.D. selaku Dekan Fakultas Keguruan dan Ilmu Pendidikan. 3. Christiyanti Aprinastuti, S.Si., M.Pd., selaku Ketua Program Studi PGSD. 4. Apri Damai Sagita Krissandi, S. S., M. Pd. selaku Wakil Ketua Program Studi
PGSD.
5. Maria Melani Ika Susanti, M.Pd. selaku dosen pembimbing I, yang telah memberikan arahan, bimbingan, kritik, ide, semangat, dorongan, dan pikiran yang penulis butuhkan untuk menyelesaikan penelitian.
6. Irine Kurniastuti, S. Psi., M. Psi. selaku dosen pembimbing II, yang telah memberikan arahan, bimbingan, kritik, ide, semangat, dorongan, dan pikiran yang penulis butuhkan untuk menyelesaikan penelitian.
7. Andri Anugrahana, S.Pd., M.Pd. selaku dosen penguji yang telah berkenan menguji saya.
xii
HALAMAN JUDUL………. i
HALAMAN PERSETUJUAN PEMBIMBING... ii
HALAMAN PENGESAHAN... iii
HALAMAN PERSEMBAHAN... iv
HALAMAN MOTTO... v
PERNYATAAN KEASLIAN KARYA... vi
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS... vii
ABSTRAK... viii
ABSTRACT... ix
KATA PENGANTAR... x
DAFTAR ISI... xii
DAFTAR TABEL... xv
DAFTAR GAMBAR... xvii
DAFTAR LAMPIRAN SKRIPSI... xviii
BAB I PENDAHULUAN... 1
A. Latar Belakang Masalah... 1
B. Pembatasan Masalah... 7
C. Rumusan Masalah... 9
D. Tujuan Penelitian... 10
E. Manfaat Penelitian... 10
F. Definisi Operasional... 12
BAB II LANDASAN TEORI... 14
A. Kajian Pustaka... 14
1. Evaluasi... 14
2. Instrumen Penilaian... 15
3. Tes ... 16
xiii
6. Analisis Butir Soal... 23
7. Validitas………... 24
8. Reliabilitas……….………... 27
9. Tingkat Kesukaran... 29
10. Daya Pembeda... 32
11. Efektivitas Pengecoh... 34
12.Software MicroCat Itemanversi 3.00 ……….. 36
13. Ilmu Pengetahuan Sosial (IPS)………. 37
B. Hasil Penelitian yang Relevan... 39
C. Kerangka Berpikir... 44
D. Hipotesis Penelitian... 46
BAB III METODE PENELITIAN... 48
A. Jenis Penelitian... 48
B. Waktu dan Tempat Penelitian... 49
C. Populasi dan Sampel... 51
D. Variabel Penelitian... 53
E. Teknik Pengumpulan Data... 54
F. Instrumen Penelitian... 56
G. Teknik Analisis Data... 58
BAB IV HASIL PENELITIAN DAN PEMBAHASAN... 69
A. Deskripsi Penelitian... 69
B. Hasil Penelitian... 70
1. Hasil Analisis Validitas ....……… 70
2. Hasil Analisis Reliabilitas………. 74
3. Hasil Analisis Tingkat Kesukaran... 75
4. Hasil Analisis Daya Pembeda... 79
5. Hasil Analisis Efektivitas Pengecoh... 83
C. Pembahasan... 107
1. Validitas ………... 107
xiv
4. Daya Pembeda... 113
5. Efektivitas Pengecoh... 116
6. Tingkat Kesukaran, Daya Pembeda, dan Efektivitas Pengecoh dalam Butir Soal………...………….………... 117
BAB V PENUTUP... 120
A. Kesimpulan... 120
B. Keterbatasan Penelitian... 121
C. Saran... 122
DAFTAR REFERENSI... 123
xv
Tabel 2.1 Tingkat Reliabilitas Berdasarkan KoefisienAlpha…………... 28
Tabel 2.2 Kategori Tingkat Kesukaran………... 31
Tabel 2.3 Proporsi Tingkat Kesukaran………... 32
Tabel 2.4 Kategori Daya Pembeda………... 33
Tabel 2.5 SK dan KD Mata Pelajaran IPS Kelas V SD Semester Genap... 38
Tabel 3.1 Jadwal Penelitian ……… 49
Tabel 3.2 Populasi Penelitian………... 51
Tabel 3.3 Sampel Penelitian………... 53
Tabel 3.4 Daftar Centang (check list).………... 57
Tabel 3.5 Pedoman Wawancara ………... 58
Tabel 3.6 Output Itemanpada Alpha……….. 62
Tabel 3.7 Tingkat Reliabilitas Berdasarkan Koefisien Alpha………. 62
Tabel 3.8 Output Iteman padaProp. Correct……… 64
Tabel 3.9 Kategori Tingkat Kesukaran………... 64
Tabel 3.10 Proporsi Tingkat Kesukaran………... 65
Tabel 3.11 Output Itemanpada Point Biser……… 66
Tabel 3.12 Kategori Daya Pembeda Butir Soal………. 67
Tabel 3.13 Output Itemanpada Prop. Endorsing………... 68
Tabel 4.1 Hasil Analisis Validitas Isi………... 71
Tabel 4.2 Persentase Butir Soal Valid dan Butir Soal Tidak Valid………. 74
Tabel 4.3 Reliabilitas ditunjukkan oleh koefisienAlpha………. 75
Tabel 4.4 Kategori Tingkat Kesukaran Butir Soal……….. 76
Tabel 4.5 Hasil Analisis Tingkat Kesukaran Butir Soal UAS Genap Mata Pelajaran IPS Kelas V………... 76
Tabel 4.6 Persentase Jumlah Soal Berdasarkan Kategori Tingkat Kesukaran………... 77
Tabel 4.7 Proporsi Tingkat Kesukaran………... 78
xvi
Tabel 4.10 Persentase Jumlah Soal Berdasarkan Kategori Daya Pembeda Butir Soal………... 81 Tabel 4.11 Hasil Analisis Efektivitas Pengecoh Butir Soal UAS Genap
Mata Pelajaran IPS Kelas V………... 83 Tabel 4.12 Persentase Jumlah Butir Soal berdasarkan Keefektivan
Pengecoh………... 105 Tabel 4.13 Pembuktian Daya Pembeda Berdasarkan Jawaban Benar
Peserta didik Berprestasi Atas dan Peserta didik Berprestasi
Rendah ……… 114
xvii
Gambar 2.1 Literature Map Hasil Penelitian yang Relevan……….. 42 Gambar 2.2 Alur Kerangka Berpikir Analisis Butir Soal……….. 45 Gambar 4.1 Diagram Persentase Tingkat Kesukaran Butir Soal…………... 78 Gambar 4.2 Diagram Persentase Kategori Daya Pembeda Butir
Soal……...……….………... 82
Gambar 4.3 Diagram Persentase Jumlah Butir Soal
xviii
Lampiran 1 Surat Ijin Pelaksanaan Penelitian……….. 127
Lampiran 2 Surat Keterangan Telah Melaksanakan Penelitian ………... 128
Lampiran 3 Nama Mahasiswa………... 129
Lampiran 4 Paket Soal Pilihan Ganda UAS Genap Tahun Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD Di Kecamatan Depok……… 130
Lampiran 5 Kunci Jawaban Soal Pilihan Ganda UAS Genap Tahun Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD Di Kecamatan Depok………. 134
Lampiran 6 Lembar Jawaban Salah Satu Siswa Kelas V... 135
Lampirab 7 Daftar Centang (check list)……… 136
Lampiran 8 Hasil Wawancara………... 137
Lampiran 9 Tabel Analisis Kesesuaian Butir Soal dengan SK danKD ... 138
Lampiran 10 Tabel Rekapitulasi Hasil Penelitian………... 148
BAB I
PENDAHULUAN
Bab I pada penelitian ini membahas tentang enam sub bab, yaitu (A) latar
belakang masalah, (B) pembatasan masalah, (C) rumusan masalah, (D) tujuan
penelitian, (E) manfaat penelitian, dan (F) definisi operasional.
A. Latar Belakang Masalah
Pendidikan di era globalisasi ini menjadi salah satu aspek terpenting dalam
kehidupan manusia. Pendidikan merupakan usaha sadar dan terencana untuk
mewujudkan kegiatan belajar dan proses pembelajaran agar peserta didik secara aktif
dapat mengembangkan potensi dirinya untuk memiliki kekuatan spiritual keagamaan,
pengendalian diri, kepribadian, akhlak mulia, beserta keterampilan yang diperlukan
pada dirinya, masyarakat, bangsa, dan negara (Undang-undang No. 20 Tahun 2003
pasal 1 ayat 1). Pendidikan membuat seseorang dari tidak bisa menjadi bisa dan
mengembangkan potensi yang dimilikinya untuk mencapai tujuan. Tujuan pendidikan
nasional adalah mencerdaskan kehidupan bangsa, maka dalam hal ini pemerintah
mengusahakan dan menyelenggarakan suatu sistem pendidikan nasional mulai tingkat
dasar sampai perguruan tinggi. Untuk mencapai tujuan pendidikan seperti yang
diharapkan dalam tujuan pendidikan nasional, perlu adanya susunan perencanaan
Kunandar (2014: 3) berpendapat bahwa guru memiliki kewajiban untuk
menyusun suatu perencanaan pembelajaran sebelum dilaksanakannya suatu proses
kegiatan belajar mengajar. Beberapa hal yang harus disusun oleh guru pada tahap
perencanaan sebelum melaksanakan suatu kegiatan pembelajaran antara lain adalah
program tahunan, program semester, silabus, dan Rencana Pelaksanaan Pembelajaran
(RPP). Dengan perencanaan yang baik akan berpengaruh terhadap hasil belajar
peserta didik. Hasil belajar peserta didik dapat kita ketahui dari perolehan penilaian
melalui pemberian evaluasi.
Stark & Thomas (dalam Widoyoko, 2009: 4) berpendapat bahwa evaluasi
merupakan proses yang sistematis dan berkelanjutan mengumpulkan, menganalisis,
dan menyajikan informasi suatu program yang dapat digunakan sebagai dasar
membuat keputusan, menyusun kebijakan maupun menyusun program selanjutnya.
Evaluasi inilah yang merupakan suatu bagian terpenting dalam sistem pendidikan.
UU Nomor 20 tahun 2003 tentang Sistem Pendidikan Nasional, evaluasi diatur dalam
Bab XVI Pasal 58 ayat 1 merupakan sebuah proses pengumpulan data untuk
menentukan atau memantau kemajuan dan perbaikan hasil belajar siswa yang sudah
dicapai. Evaluasi ini merupakan salah satu kegiatan untuk mengadakan penilaian.
Kegiatan yang dilakukan oleh guru dalam melakukan penilaian, pengukuran, adalah
melalui evaluasi dengan memberikan tes kepada peserta didik.
Tes adalah salah satu cara untuk memperoleh penilaian. Basuki dan Hariyanto
(2014: 21) mengemukakan bahwa tes adalah suatu cara untuk melaksanakan
peserta didik. Kegiatan tes tersebut akan menghasilkan nilai atau prestasi yang
dicapai peserta didik dan menunjukkan kemampuan peserta didik dalam munguasai
materi pelajaran. Salah satu tes yang dilakukan di SD adalah tes pada UAS. Tujuan
dilaksanakannya UAS adalah untuk mengukur pemahaman peserta didik terhadap
materi yang telah diberikan selama satu semester. Soal yang dikerjakan peserta didik
pada saat UAS merupakan soal yang disusun oleh guru. Salah satu tipe yang dibuat
oleh guru pada UAS adalah tipe soal pilihan ganda. Penyusunan butir soal pilihan
ganda pada soal UAS harus memenuhi syarat tes pilihan ganda yang baik, sehingga
dapat menghasilkan butir soal yang dapat digunakan sebagai alat ukur keberhasilan
pembelajaran yang berkualitas.
Suatu butir soal dapat dikatakan baik apabila memenuhi syarat-syarat yang
telah ditentukan. Syarat tes pilihan ganda yang baik, menurut Kunandar (2014: 201)
yaitu suatu tes pilihan ganda harus memiliki validitas dan reliabilitas tinggi, selain itu
setiap butir soal memiliki daya pembeda yang baik, dan memiliki tingkat kesukaran
dengan proporsi 30% butir soal dengan kategori mudah, 50% butir soal kategori
sedang, dan 20% butir soal kategori sukar, serta tes pilihan ganda yang baik adalah
mudah diadministrasikan. Pendapat tersebut diperkuat oleh pendapat Djiwandono
(2008: 163) yang menyatakan bahwa syarat butir soal yang baik adalah memiliki
validitas dan reliabilitas yang tinggi. Sementara itu, Basuki dan Hariyanto (2014:
138) menambahkan bahwa syarat tes pilihan ganda yang baik yaitu butir soal harus
memiliki tingkat kesukaran, daya pembeda, dan efektivitas pengecoh. Kualitas butir
Kubiszyn dan Borich (dalam Endrayanto dan Harumurti, 2014: 259) analisis
butir soal bertujuan mengetahui atau memeriksa dan mengidentifiikasi butir-butir soal
yang kurang baik dan sudah baik dalam suatu tes menggunakan teknik tertentu
sehingga guru dapat melakukan perbaikan butir-butir soal yang kurang baik tersebut.
Analisis butir soal terdiri dari dua cara, yaitu dengan menggunakan analisis kualitatif
dan analisis kuantitatif. Pendapat ini diperkuat oleh Basuki dan Hariyanto (2014: 131)
yang berpendapat bahwa terdapat dua cara dalam melaksanakan proses analisis butir
soal yaitu dengan analisis kualitatif digunakan untuk menganalisis validitas soal
terutama validitas isi, sedangkan pada analisis kuantitatif meliputi reliabilitas, tingkat
kesukaran, daya pembeda, dan efektivitas pengecoh.
Analisis validitas soal bertujuan untuk mengetahui kesesuaian atau ketepatan
soal dengan apa yang ingin diukur. Arifin (2009: 247) menyatakan bahwa tes
dikatakan valid apabila dapat memberikan informasi yang sesuai dan dapat digunakan
untuk mencapai tujuan tertentu. Arikunto (2012: 82) berpendapat bahwa validitas
dibagi menjadi empat, yaitu validitas isi, validitas kontruksi, validitas “ada sekarang”
atau empiris, dan validitas prediksi.
Analisis reliabilitas soal bertujuan untuk mengetahui keajegan atau konsistensi
soal. Jihad & Haris (2012: 180) mengemukakan bahwa relibilitas soal merupakan
ukuran yang menyatakan tingkat keajegan atau kekonsistenan suatu soal tes. Arifin
(2009: 258) menjelaskan bahwa reliabilitas adalah tingkat atau derajat konsistensi
dari suatu instrumen. Tes yang dikatakan memiliki tingkat reliabilitas tinggi apabila
Analisis tingkat kesukaran butir soal dilakukan dengan tujuan untuk
mengetahui kategori butir soal yang memiliki tingkat kesukaran dengan kategori
mudah, sedang, dan sukar. Tingkat kesukaran menurut Arikunto (2012: 222)
mengatakan bahwa bilangan yang menunjukkan sukar/mudahnya sesuatu soal. Soal
yang terlalu mudah tidak membuat peserta didik berusaha lebih tinggi dalam
memecahkan soal tersebut, sedangkan soal yang terlalu sukar membuat peserta didik
menjadi putus asa untuk menyelesaikan soal tersebut.
Analisis daya pembeda butir soal bertujuan untuk mengetahui kemampuan
suatu soal dalam membedakan peserta didik yang telah memahami materi dengan
peserta didik yang belum memahami materi. Kusaeri dan Suprananto (2012: 175)
berpendapat bahwa daya pembeda adalah kemampuan butir soal untuk membedakan
peserta didik yang telah menguasai materi dan peserta didik yang belum menguasai
materi pelajaran. Berdasarkan pendapat tersebut maka dapat dipahami bahwa butir
soal yang memiliki daya pembeda yang baik adalah butir soal yang mampu
membedakan antara peserta didik yang telah memahami materi dengan peserta didik
yang belum memahami materi.
Analisis efektivitas pengecoh memiliki tujuan untuk mengetahui keberfungsian
pilihan jawaban selain kunci jawaban pada butir soal pilihan ganda. Pernyataan
tersebut diperkuat oleh pendapat Uno dan Koni (2012: 157) yang mengatakan bahwa
tujuan melaksanakan analisis pengecoh butir soal adalah untuk mengetahui
Guru sebagai tim penyusun soal perlu memperhatikan beberapa hal dalam
proses penyusunan butir soal. Butir soal yang disusun akan menghasilkan butir soal
yang baik dengan memperhatikan kelima analisis tersebut, sehingga mampu
mengukur kemampuan dan keberhasilan peserta didik dalam memahami materi yang
telah diajarkan.
Berdasarkan pertimbangan yang telah diuraikan sebelumnya, bahwa analisis
perlu dilakukan. Pada saat penyususnan soal guru harus memiliki keterampilan dalam
menganalisis butir soal. Peneliti sebagai calon guru ingin memiliki keterampilan
tersebut, sehingga dapat melakukan analisis butir soal guna untuk mengetahui
kemampuan peserta didik yang sesungguhnya. Perumusan kelima analisis tersebut,
membantu peneliti dalam memilih untuk menganalisis butir soal pada mata pelajaran
Ilmu Pengetahuan Sosial (IPS) khususnya pada kelas V.
Hasil wawancara dengan pihak Unit Pelaksana Teknis Daerah (UPTD),
beberapa kepala sekolah dan guru, selama ini belum ada penelitian butir soal pada
Ujian Akhir Semester (UAS) melalui tahap analisis yang meliputi vaiditas,
reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh. Oleh karena itu,
peneliti tertarik untuk melakukan penelitian di kelas V pada mata pelajaran IPS.
Susanto (2014: 6) mendefinisikan Ilmu Pengetahuan Sosial (IPS) merupakan
integrasi dari pengetahuan tentang manusia dalam masyarakat dan ilmu-ilmu sosial
seperti ilmu politik, ekonomi, sejarah, geografi, sosiologi, antropologi, dan
Kecamatan Depok merupakan salah satu Kecamatan di Kabupaten Sleman.
Kecamatan Depok memiliki beberapa SD favorit yang menjadikan sekolah di
Kecamatan Depok cukup diminati. Kecamatan Depok juga dikelilingi oleh
universitas seperti Universitas Sanata Dharma, UNY, UGM, dan lain sebagainya, hal
ini berdampak pada kesadaran orangtua terhadap pentingnya pendidikan dan cita-cita
anaknya.
Berdasarkan masalah yang telah diuraian sebelumnya, bahwa belum pernah
adanya penelitian mengenai analisis butir soal UAS, peneliti tertarik untuk
mengangkat masalah ini karena ingin mengetahui validitas, realiabilitas, tingkat
kesukaran, daya pembeda, dan efektivitas pengecoh pada setiap butir soal UAS.
Peneliti ingin mengetahui soal UAS yang telah dibuat sudah memenuhi criteria atau
belum, peneliti juga ingin belajar untuk menganalisis soal agar mampu membuat soal
yang lebih baik dikemudian hari. Ketertarikan ini yang membuat peneliti memilih
judul “Analisis Butir Soal Pilihan Ganda Ulangan Akhir Semester Genap Tahun
Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD di Kecamatan Depok.”
B. Pembatasan Masalah
Penelitian ini dibuat untuk menganalisis butir soal pilihan ganda Ulangan Akhir
Semester (UAS) genap tahun pelajaran 2014/2015 pada mata pelajaran IPS kelas V.
Adapun pembatasan masalah pada penelitian ini sebagai berikut:
1. Analisis butir soal pilihan ganda Ulangan Akhir Semester (UAS) genap
Kecamatan Depok ditilik dari validitas, reliabilitas, daya pembeda, tingkat
kesukaran, dan efektivitas pengecoh.
2. Analisis validitas dalam penelitian ini menganalisis validitas isi, dengan
cara menganalisis kesesuaian butir soal dengan Standar Kompetensi (SK)
dan Kompetensi Dasar (KD) pada KTSP. Analisis reliabilitas, tingkat
kesukaran, daya pembeda, dan efektivitas pengecoh dianalisis dengan
menggunakan software Micro Cat Iteman versi 3.00.
3. Penelitian dilakukan pada SD Negeri dan SD Swasta di Kecamatan Depok,
Sleman, kelas V Tahun Pelajaran 2014/2015 yang menggunakan Kurikulum
Tingkat Satuan Pendidikan (KTSP). Di Kecamatan Depok terdapat 49 SD
yang mengimplementasikan KTSP. Namun, dalam penelitian ini peneliti
melakukan penelitian pada 27 SD. Hal tersebut dikarenakan dari 49 SD yang
memberikan ijin hanyalah 27 sedangkan 18 SD tidak memberikan ijin untuk
digunakan sebagai tempat penelitian. Tidak hanya kesulitan dalam
memberikan ijin namun juga mengalami kendala, yaitu kurangnya
koordinasi antara kepala sekolah dengan guru yang menyebabkan dokumen
lembar jawab peserta didik sudah dibagikan sehingga tidak dapat
C. Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan di atas, maka untuk
mempermudah dalam pembahasan penelitian ini perlu disederhanakan dalam sebuah
rumusan masalah, yaitu
1. Bagaimanakah validitas butir soal pilihan ganda Ulangan Akhir Semester (UAS)
genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di Kecamatan
Depok?
2. Bagaimanakah reliabilitas butir soal pilihan ganda Ulangan Akhir Semester
(UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di
Kecamatan Depok?
3. Bagaimanakah tingkat kesukaran butir soal pilihan ganda Ulangan Akhir
Semester (UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V
SD di Kecamatan Depok?
4. Bagaimanakah daya pembeda butir soal pilihan ganda Ulangan Akhir Semester
(UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di
Kecamatan Depok?
5. Bagaimanakah efektivitas pengecoh butir soal pilihan ganda Ulangan Akhir
Semester (UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V
D. Tujuan Penelitian
Tujuan yang ingin dicapai peneliti dalam melakukan penelitian ini adalah :
1. Untuk mengetahui validitas butir soal pilihan ganda Ulangan Akhir Semester
(UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di
Kecamatan Depok.
2. Untuk mengetahui reliabilitas butir soal pilihan ganda Ulangan Akhir Semester
(UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di
Kecamatan Depok.
3. Untuk mengetahui tingkat kesukaran butir soal pilihan ganda Ulangan Akhir
Semester (UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V
SD di Kecamatan Depok.
4. Untuk mengetahui daya pembeda butir soal pilihan ganda Ulangan Akhir
Semester (UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V
SD di Kecamatan Depok.
5. Untuk mengetahui efektivitas pengecoh butir soal pilihan ganda Ulangan Akhir
Semester (UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V
SD di Kecamatan Depok.
E. Manfaat Penelitian
Manfaat penelitian ini adalah sebagai berikut :
1. Manfaat Teoritis
a. Memberikan informasi dan manfaat pada kualitas soal pilihan ganda
pada Ulangan Akhir Semester (UAS) genap tahun pelajaran 2014/2015
pada mata pelajaran Ilmu Pengetahuan Sosial (IPS) kelas V SD di
Kecamatan Depok.
b. Mengembangkan evaluasi pembelajaran khususnya dalam bidang mata
pelajaran IPS pada butir soal pilihan ganda UAS.
c. Sebagai referensi penelitian selanjutnya.
2. Manfaat Praktis
Secara praktis penelitian ini diharapkan dapat :
a. Bagi Peneliti
Peneliti dapat mengetahui kualitas soal dengan cara menganalisis butir
soal dan dapat menyusun soal dengan baik menurut standar penyusunan
soal.
b. Bagi Guru
Guru dapat lebih baik dalam meyusun soal dengan baik menurut standar
penyusunan soal.
c. Bagi UPT
Penelitian ini memberikan masukan terkait kebijakan evaluasi UAS
F. Definisi Operasional
Peneliti menyusun definisi operasional sebagai berikut :
1. Analisis Butir Soal
Analisis butir soal adalah suatu tahap untuk mendefinisikan sebuah butir soal
yang digunakan untuk melihat kualitas butir soal tersebut yang kurang
berkualitas dan sudah berkualitas baik.
2. Validitas
Validitas adalah kesesuaian atau kecocokan suatu tes dengan tujuan yang
ingin diukur.
3. Validitas Isi
Validitas isi adalah kesesuaian tes antara apa yang seharusnya diukur oleh
suatu tes dan seberapa cermat tes tersebut diukur dengan menggunakan alat
untuk mengukur kompetensi.
4. Reliabilitas
Reliabilitas merupakan ukuran yang menyatakan kekonsistenan alat atau
instrumen dalam menilai, apabila diujikan berulang kali pada objek yang sama
pada waktu yang berbeda hasilnya relatif sama.
5. Tingkat Kesukaran
Tingkat kesukaran butir soal adalah suatu cara yang digunakan untuk
mengetahui proporsi seberapa mudah atau sukar soal yang diujikan, serta
dapat digunakan untuk mengetahui kualitas soal tersebut mudah atau sukar
6. Daya Pembeda
Daya pembeda adalah kemampuan butir soal tes untuk membedakan siswa
berprestasi tinggi yang sudah menguasai materi yang diujikan dengan siswa
berprestasi rendah yang belum menguasai materi yang diujikan.
7. Efektivitas Pengecoh
Efektivitas pengecoh adalah pilihan jawaban pada soal pilihan ganda yang
mempunyai kemiripan dengan jawaban yang benar, sehingga dapat
mengecoh jawaban yang tidak sama dengan kunci jawaban yang benar.
8. Ulangan Akhir Semester (UAS)
Ulangan Akhir Semester (UAS) adalah tes yang digunakan untuk mengetahui
ketercapaian tujuan pembelajaran pada akhir pada akhir semester.
9. Tes Pilihan Ganda
Tes pilihan ganda merupakan soal yang sudah disediakan beberapa pilihan
jawaban yang diantara pilihan tersebut terdapat satu pilihan yang paling benar
dan jawaban yang lain sebagai pengecoh yang dapat memungkinkan peserta
didik memilih pengecoh tersebut jika tidak benar-benar menguasai materi
pembelajaran.
10. Ilmu Pengetahuan Sosial (IPS)
Ilmu Pengetahuan Sosial (IPS) adalah ilmu yang mempelajari tentang
manusia sebagai salah satu anggota di dalam masyarakat, ditinjau dari segi
BAB II
LANDASAN TEORI
Bab II pada penelitian ini membahas tentang empat sub bab yaitu (A) kajian
pustaka, (B) hasil penelitian yang relevan, (C) kerangka berpikir, dan (D) hipotesis.
A. Kajian Pustaka
1. Evaluasi
a. Pengertian Evaluasi
Sukardi (2008: 1) mengatakan bahwa evaluasi merupakan proses
yang menentukan, suatu tujuan yang telah disepakati sehingga dapat
tercapai. Harjanto (2008: 277) mengemukakan bahwa evaluasi pengajaran
adalah penilaian terhadap pertumbuhan dan kemajuan peserta didik ke arah
tujuan yang telah ditetapkan. Di sisi lain, Stark & Thomas (dalam
Widoyoko, 2009: 4) berpendapat bahwa evaluasi merupakan proses yang
sistematis dan berkelanjutan mengumpulkan, menganalisis, dan
menyajikan informasi suatu program yang dapat digunakan sebagai dasar
membuat keputusan, menyusun kebijakan maupun menyusun program
selanjutnya.
Pada uraian di atas, disimpulkan bahwa evaluasi adalah kegiatan
mengumpulkan informasi tentang suatu program yang sudah dilaksanakan
dan selanjutnya digunakan untuk mengukur sejauh mana tujuan telah
Evaluasi dalam kegiatan belajar memiliki peran yang penting. Evaluasi
berfungsi sebagai alat dalam mengukur sejauh mana keberhasilan dalam
proses belajar mengajar yang telah dilakukan guna memperbaiki dan
menentukan langkah selanjutnya dalam kegiatan belajar mengajar.
b. Tujuan Evaluasi
Widoyoko (2009: 6) mengemukakan bahwa evaluasi bertujuan untuk
mendapatkan informasi yang akurat dan obyektif mengenai suatu program.
Arifin (2009: 15) mengemukakan bahwa evaluasi memiliki beberapa tujuan
yaitu mengetahui tingkat pemahaman peserta didik, mengetahui tingkat
kemajuan dan kesesuaian hasil belajar peserta didik dengan kompetensi
yang telah ditentukan, mengetahui keunggulan dan kelemahan peserta
didik, dan menentukan kenaikan kelas. Kedua pendapat tersebut
menunjukkan bahwa evaluasi bertujuan untuk memperoleh informasi serta
untuk mengetahui kelebihan dan kekurangan peserta didik dalam proses
pembelajaran.
2. Instrumen Penilaian
Arikunto (2012: 40) berpendapat bahwa instrumen penilaian merupakan
suatu alat yang dapat digunakan untuk mempermudah seseorang dalam
melaksanakan tugas atau mencapai tujuan secara lebih berrguna dan tepat. Jihad
dan Haris (2012: 67) mengemukakan tujuan penyusunan instrumen penilaian
digunakan untuk mengetahui kemampuan peserta didik terhadap pengusaan suatu
Berdasarkan kedua pendapat tersebut mengenai definisi instrumen penilaian
dapat diketahui bahwa instrumen penilaian adalah alat yang digunakan untuk
mengukur dan menilai dalam rangka mengetahui kemampuan peserta didik.
Instrumen penilaian terdiri dari dua macam yaitu tes dan nontes.
Majid (2014: 38) berpendapat bahwa instrumen penilaian ada dua
macam, yaitu tes dan non tes. Jihad dan Haris (2012: 67) menambahkan bahwa
alat penilaian teknis tes meliputi tes tertulis, tes lisan, dan tes perbuatan.
Berdasarkan uraian mengenai instrumen penilaian, peneliti menyimpulkan bahwa
instrumen penilaian terdiri dari dua macam yaitu tes dan nontes. Sedangkan, pada
penelitian ini peneliti menganalisis instrumen penilaian berupa tes. Hal ini
dikarenakan soal UAS yang diujikan di Kecamatan Depok mata pelajaran IPS
merupakan soal ulangan yang berbentuk tes tertulis.
3. Tes
a. Pengertian tes
Sudjana (2010: 35) tes merupakan pertanyaan-pertanyaan yang
diberikan kepada peserta didik untuk mendapat jawaban dari peserta didik
dalam bentuk lisan (tes lisan), dalam bentuk tulisan (tes tulisan), atau
dalam bentuk perbuatan (tes tindakan). Pada umumnya tes digunakan
untuk mengukur dan menilai hasil belajar peserta didik. Jihad dan Haris
(2012: 67) menyatakan bahwa tes adalah suatu cara yang digunakan untuk
mengadakan penilaian berbentuk suatu tugas yang harus dikerjakan baik
tentang tingkah laku atau prestasi peserta didik dan dapat dibandingkan
dengan standar penilaian yang ditetapkan. Arikunto (2012: 46) yang
menyatakan bahwa tes adalah sejumlah pertanyaan atau latihan yang
berfungsi mengukur keterampilan, pengetahuan, kemampuan atau bakat
yang dimiliki oleh individu atau kelompok.
Berdasarkan pendapat para ahli peneliti mengambil kesimpulan
bahwa tes merupakan pertanyaan-pertanyaan yang diajukan kepada peserta
didik dan harus dijawab oleh peserta didik baik secara lisan maupun tertulis
untuk menilai pengetahuan, sikap, maupun keterampilan. Tes yang dapat
diberikan kepada peserta didik bertujuan untuk mengetahui ketercapaian
kegiatan belajar mengajar.
b. Jenis-jenis Tes
Mardapi (2008: 68) mengatakan bahwa ditinjau dari tujuan tes yang
digunakan di lembaga pendidikan, tes dibagi menjadi empat macam, yaitu
tes penempatan, tes diagnostik, tes formatif, dan tes sumatif. Pendapat
senada dikemukakan oleh Gronlund dan Linn (dalam Purwanto, 2009: 67)
yang membagi tes hasil belajar menjadi empat macam, yaitu tes formatif,
tes sumatif, tes diagnostik, dan tes penempatan. Berdasarkan kedua
pendapat di atas, dapat ditarik kesimpulan bahwa tes dikategorikan ke
dalam empat jenis, yaitu tes penempatan, tes diagnostik, tes formatif, dan
1.) Tes Penempatan
Mardapi (2008: 68) menjelaskan bahwa tes penempatan
merupakan tes untuk mengetahui tingkat kemampuan awal peserta
didik. Tes penempatan dilaksanakan di awal tahun pelajaran baru.
Tujuan dari tes penempatan ini digunakan untuk menempatkan
peserta didik pada tingkat kemampuan yang sesuai dengan
kemampuannya.
2.) Tes Diagnostik
Arikunto (2012: 48) menyatakan bahwa tes diagnostik
merupakan tes yang digunakan untuk mengetahui
kelemahan-kelemahan peserta didik sehingga berdasarkan kelemahan-kelemahan tersebut
dapat dilakukan pemberian perlakuan yang tepat.
3.) Tes Formatif
Basuki dan Hariyanto (2014: 32) mengemukakan bahwa tes
formatif merupakan kegiatan tes yang dilakukan secara periodik
yang digunakan untuk mengukur pencapaian kompetensi peserta
didik setelah menyelesaikan satu Kompetensi Dasar (KD) atau
lebih. Tes formatif diberikan pada akhir setiap program, misalnya
ulangan harian.
4.) Tes Sumatif
Sudijono (2011: 72) mengatakan bahwa tes sumatif
program pengajaran selesai diberikan. Tes sumatif diberikan pada
akhir semester atau akhir tahun pelajaran. Tujuan dilaksanakannya
tes sumatif adalah untuk mengetahui hasil yang dicapai peserta
didik, yaitu seberapa jauh tujuan-tujuan pembelajaran dapat dicapai
oleh peserta didik dalam satu semester. Pendapat senada juga
disampaikan oleh Arikunto (2012: 53) yang menyatakan bahwa tes
sumatif dilaksanakan setelah berakhirnya sebuah program satu
semester pembelajaran yaitu, dengan melaksanakan ulangan umum
atau Ulangan Akhir Semester (UAS) yang dilaksanakan setiap akhir
semester.
Berdasarkan jenis tes yang sudah diuraikan di atas, peneliti dapat
menyimpulkan terdapat empat jenis tes yang disesuaikan dengan tujuannya
yaitu tes penempatan, tes diagnosis, tes formatif, dan tes sumatif. Jenis tes
yang sesuai dengan penelitian yang dilakukan adalah tes sumatif. Tes
sumatif adalah tes yang diberikan meliputi materi pembelajaran selama
satu semester dan digunakan untuk mengetahui seberapa jauh penguasaan
materi pembelajaran peserta didik yang dilaksanakan pada akhir semester
dalam bentuk Ulangan Akhir Semester (UAS).
4. Ulangan Akhir Semester (UAS)
Ulangan Akhir Semester (UAS) dilaksanakan setelah peserta didik
menempuh pembelajaran selama satu semester. Hal ini sesuai dengan pendapat
Akhir Semester (UAS) digunakan untuk mengetahui hasil atau kemampuan yang
dicapai peserta didik dalam program pembelajaran selama satu semester. Salah
satu mata pelajaran yang diujikan dalam Ulangan Akhir Semester (UAS) adalah
mata pelajaran Ilmu Pengetahuan Sosial (IPS).
5. Tes Pilihan Ganda
a. Pengertian Tes Pilihan Ganda
Djiwandono (2008: 41) mengungkapkan tes pilihan ganda adalah
jenis tes objektif yang masing-masing butir soalnya memiliki dua atau
lebih pilihan jawaban. Kunandar (2014: 183) berpendapat bahwa tes bentuk
pilihan ganda adalah suatu soal yang jawabannya harus dipilih dari
beberapa pilihan jawaban yang telah disediakan. Pendapat ini diperkuat
oleh Jihad dan Haris (2012: 81) yang menyatakan bahwa tes pilihan ganda
adalah tes yang memiliki tiga sampai lima pilihan jawaban namun hanya
ada satu jawaban yang tepat. Secara umum, pada setiap tes pilihan ganda
terdiri dari soal dan pilihan jawaban. Pilihan jawaban terdiri dari kunci
jawaban dan pengecoh. Kunci jawaban merupakan jawaban yang paling
benar, sedangakan pengecoh merupakan jawaban yang tidak benar, namun
memungkinkan seseorang untuk memilihnya jika tidak menguasai materi.
Berdasarkan uraian menurut para ahli mengenai tes pilihan ganda,
peneliti menyimpulkan bahwa tes pilihan ganda adalah soal yang sudah
disediakan beberapa pilihan jawaban yang diantara pilihan tersebut terdapat
yang dapat memungkinkan peserta didik memilih pengecoh tersebut jika
tidak benar-benar menguasai materi pembelajaran. Pada penelitian ini
diketahui bahwa setiap butir soal pilihan ganda UAS genap mata pelajaran
IPS kelas V SD memiliki empat pilihan jawaban yaitu a, b, c, dan d. Selain
memperhatikan mengenai keberfungsian setiap pengecoh pada
masing-masing butir soal pilihan ganda, hal lain yang perlu diketahui adalah syarat
tes pilihan ganda yang baik.
b. Syarat Tes Pilihan Ganda
Kunandar (2014: 201) memaparkan beberapa syarat tes pilihan ganda
yang baik sebagai berikut.
1) Memiliki validitas yang tinggi. Artinya suatu tes mampu
mengungkapkan hasil belajar peserta didik secara tepat, sehingga
mampu mengukur apa yang ingin diukur.
2) Memiliki reliabilitas yang tinggi. Artinya suatu tes mampu
memberikan gambaran hasil tes yang relatif sama dan konsisten
tentang kompetensi yang dimiliki peserta didik walaupun tes
dilakukan berulang kali.
3) Memiliki tingkat kesukaran yang sesuai dengan pedoman
proporsi tingkat kesukaran soal UAS yang telah ditentukan yaitu
30% soal mudah, 50% soal sedang, dan 20% soal sulit.
4) Setiap butir soal memiliki daya pembeda yang baik. Artinya
telah memahami materi yang diujikan dengan peserta didik yang
belum memahami materi.
5) Serta tes pilihan ganda yang baik adalah mudah
diadministrasikan.
Pendapat tersebut diperkuat oleh pendapat Djiwandono (2008: 163)
yang menyatakan bahwa syarat butir soal yang baik adalah memiliki
validitas dan reliabilitas yang tinggi. Sementara itu, Basuki dan Hariyanto
(2014: 138) menambahkan bahwa syarat tes pilihan ganda yang baik yaitu
butir soal harus memiliki tingkat kesukaran (difficulty index), daya
pembeda (discriminating power), dan efektivitas pengecoh (distractor).
c. Kelebihan dan Kelemahan Tes Pilihan Ganda
Menurut Widoyoko (2009: 52-59), kelebihan tes pilihan ganda
adalah waktu mengerjakan sangat minimal, penskoran dapat dilakukan
secara objektif, tipe butir soal dapat disusun sedemikian rupa sehingga
menuntut kemampuan peserta tes membedakan berbagai tingkat kebenaran
sekaligus. Kelebihan lain dalam tes pilihan ganda adalah pilihan yang
disediakan melebihi dua sehingga mengurangi keinginan peserta tes untuk
menebak, tingkat kesukaran butir soal dapat diatur dengan hanya
mengubah tingkat homogenitas alternatif jawaban, dan informasi yang
diberikan lebih banyak.
Meskipun banyak kelebihan, tes bentuk pilihan ganda ini juga
lebih sulit dalam penyusunan butir soal, serta pengaruh kebiasaan peserta
tes terhadap tes bentuk pilihan ganda terhadap hasil peserta.
6. Analisis Butir Soal
Arikunto (2012: 222) menyatakan bahwa analisis butir soal adalah kegiatan
yang bertujuan untuk mengadakan identifikasi terhadap soal-soal yang baik dan
kurang baik, sehingga dapat diperoleh informasi mengenai kekurangan sebuah
soal untuk dapat diadakan perbaikan. Sementara itu, Basuki & Hariyanto (2014:
129) analisis butir soal adalah cara untuk menguji kecocokan atau kesesuaian,
tingkat kesukaran, dan perbedaan kemampuan dari setiap soal yang diujikan
kepada para peserta didik. Kubiszyn dan Borich (dalam Endrayanto dan
Harumurti, 2014: 259), analisis butir soal bertujuan memeriksa dan
mengidentifiikasi butir-butir soal yang kurang baik dan sudah baik dalam suatu
tes menggunakan teknik tertentu sehingga guru dapat melakukan perbaikan
butir-butir soal yang kurang baik tersebut. Dari ketiga pendapat para ahli mengenai
analisis butir soal, peneliti menyimpulkan bahwa analisis butir tes adalah suatu
metode atau cara yang digunakan untuk mengetahui kesalahan atau kekeliruan
dalam penyusunan tes, sehingga diperoleh tes yang berkualitas baik.
Basuki dan Hariyanto (2014: 131) berpendapat bahwa dalam melakukan
proses analisis butir soal terdapat dua cara yaitu yang dapat dilakukan pada
proses analisis butir soal yaitu analisis kualitatif dan analisis kuantitatif. Pendapat
tersebut diperkuat oleh Kubiszyn dan Borich (dalam Endrayanto dan Harumurti,
analisis kualitatif untuk mencakup tujuan tes atau penilaian, serta berdasarkan
kesesuaian materi yang terdapat pada butir soal yang diujikan dengan materi
yang telah disampaikan. Analisis kualitatif digunakan untuk menganalisis
validitas soal terutama validitas isi, sedangkan pada analisis kuantitatif
digunakan untuk menganalisis reliabilitas, tingkat kesukaran, daya pembeda, dan
efektivitas pengecoh.
7. Validitas
a. Definisi Validitas
Siregar (2013 : 46) mengemukakan bahwa validitas menunjukkan
sejauh mana suatu alat ukur mampu mengukur sesuatu yang ingin diukur.
Uno dan Koni (2012 : 151) bahwa validitas tes merupakan hubungan antara
ketepatan terhadap sesuatu yang mesti diukur oleh suatu tes dan seberapa
cermat tes melakukan pengukurannya. Djiwandono (2008: 164) validitas
adalah relevansi, kecocokan, atau kesesuaian antara suatu tes dengan jenis
kemampuan yang merupakan tujuan dari pengukuran. Arifin (2009: 247)
suatu tes dikatakan valid apabila dapat memberikan informasi yang sesuai
dan dapat digunakan untuk mencapai tujuan tertentu. Berdasarkan definisi
yang telah diuraikan peneliti menyimpulkan bahwa validitas adalah
b. Jenis-jenis Validitas
Menurut Arikunto (2012: 82-84) validitas dibagi menjadi empat
bagian yaitu validitas isi, validitas kontruksi, validitas “ada sekarang” atau
empiris, dan validitas prediksi.
1) Validitas Isi
Arikunto (2012: 82) sebuah tes dikatakan memiliki validitas isi
apabila mengukur tujuan tertentu yang sejajar dengan materi atau isi
pelajaran yang diberikan. Suraprana (2009: 51) mengemukakan bahwa
validitas isi sering juga disebut dengan validitas kurikulum yang
artinya, suatu alat ukur dikatakan valid apabila sesuai dengan
kurikulum yang hendak diukur. Azwar (2015: 175) validitas isi
menunjukkan sejauhmana butir soal dalam tes mencakup keseluruhan
isi yang ingin diukur oleh tes tersebut. Pengujian validitas isi tidak
perlu menggunakan analisis statistik tetapi menggunakan analisis
rasional dengan membandingkan butir soal apakah sudah sesuai
dengan kriteria yang ditentukan. Tujuan dilakukan uji validitas isi
adalah untuk mengetahui kesesuaian antara materi yang ada pada butir
soal dengan materi yang ingin diukur.
2) Validitas Kontruksi
Arikunto (2012: 83) validitas kontruksi adalah validitas yang
digunakan untuk mengukur sejauh mana hasil pengukuran dianggap
psikologi adalah kualitas psikologis yang kita asumsikan ada, supaya
dapat menjelaskan beberapa aspek perilaku atau ciri-ciri tingkah laku.
Kontruksi psikologis ini tidak dapat diukur langsung. Misalnya
pengukuran kreativitas. Tes yang digunakan tidak dapat langsung
mengukur kreativitas, tetapi hanya mengukur indikator-indikator dari
kreativitas. Endrayanto dan Harumurti (2014: 285) mengatakan bahwa
cara yang dilakukan guru untuk mendapatkan validitas kontruksi
dengan menelaah tes hasil belajar peserta didik dengaan cara
mencocokan pada ranah kognitif yang hendak diungkap berdasarkan
KD dan indikator.
3) Validitas “ada sekarang” atau validitas empiris
Arikunto (2012: 83) sebuah tes dikatakan memiliki validitas
empiris jika hasilnya dengan pengalaman. Artinya dalam hal ini hasil
tes dibandingkan dengan hasil tes yang telah diketahui. Pendapat
tersebut diperkuat oleh Sudjana (2010: 15) yang menyatakan bahwa
suatu tes dinyatakan valid dari segi validitas kesamaan apabila tes
tersebut memiliki persamaan atau korelasi tinggi dengan tes sejenis
yang telah ada.
4) Validitas Prediksi
Arikunto (2012: 64) sebuah tes dikatakan memiliki validitas
prediksi apabila mempunyai kemampuan meramalkan yang akan
(2009: 54) yang berpendapat bahwa suatu tes dikatakan memiliki
validitas prediksi apabila tes tersebut memiliki kemampuan untuk
memprediksi sesuatu yang terjadi di masa yang akan datang.
Berdasarkan pendapat yang telah diuraikan, peneliti dapat mengambil
kesimpulan bahwa penelitian ini menganalisis butir soal untuk melihat tingkat
validitas isi dari setiap butir soal. Hal ini dikarenakan validitas isi berhubungan
dengan kesanggupan tes untuk mengukur isi yang seharusnya diukur. Secara
sederhana dapat dikatakan bahwa tes yang disusun tidak boleh keluar dari isi
materi pelajaran yang ada di dalam kurikulum. Dalam hal ini, peneliti meninjau
kesesuaian materi yang diajarkan berdasarkan SK-KD pada materi IPS semester
II dengan materi yang diujikan, dikarenakan peneliti tidak mempunyai kisi-kisi
materi IPS dari Kecamatan Depok.
8. Reliabilitas
Siregar (2013: 55) bahwa reliabilitas digunakan untuk mengetahui sejauh
mana hasil pengukuran tetap konsisten, dengan melakukan pengukuran berulang
dengan menggunakan alat ukur yang sama. Jihad dan Haris (2012: 180)
mengatakan bahwa reliabilitas soal merupakan ukuran yang menyangkut tingkat
keajegan atau kekonsistenan suatu soal tes. Arifin, (2009: 258) berpendapat
bahwa reliabilitas adalah tingkat konsistensi dari suatu instrumen. Tes dikatakan
reliabel jika selalu memberikan hal yang sama bila diteskan pada kelompok yang
instrumen tes dikatakan dapat dipercaya (reliable) jika memberikan hasil yang
tetap atau ajeg (konsisten) apabila diteskan berkali-kali.
Berdasarkan definisi yang telah diuraikan dapat disimpulkan bahwa
reliabilitas merupakan ukuran yang menyatakan kekonsistenan alat atau
instrumen dalam menilai, artinya ketepatan hasil manakala alat penilaian tersebut
diberikan berulang-ulang pada objek yang sama pada waktu yang berbeda.
Dengan kata lain, suatu tes dikatakan reliabel jika perolehan dari suatu tes selalu
sama walaupun diberikan atau diujikan berkali-kali dalam waktu yang berbeda.
Guilford, (dalam Jihad dan Haris, 2012: 187) menjelaskan bahwa tingkat
reliabilitas suatu soal dapat ditentukan dengan berpedoman pada koefisien Alpha
seperti pada tabel 2.1 berikut.
Tabel 2.1 Tingkat Reliabilitas berdasarkan Koefisien Alpha
Koefisien Tingkat Reliabilitas
0,90 <r11≤ 1,00 Sangat Tinggi
0,70 <r11≤ 0,90 Tinggi
0,40 <r11≤ 0,70 Sedang
0,20 <r11≤0,40 Rendah
r11≤0,20 Sangat Rendah
(Sumber : Guilford, (dalam Jihad dan Haris, 2012: 187))
Berdasarkan tabel 2.1 mengenai Tingkat Reliabilitas dapat terlihat bahwa
terdapat lima (5) koefisien pada tingkat reliabilitas yang berhubungan dengan
koefisien dengan rentang 0,90 < r11 ≤ 1,00 menunjukkan tingkat reliabilitas
sangat tinggi, koefisien dengan rentang 0,70 < r11 ≤ 0,90 menunjukkan tingkat
reliabilitas tinggi, koefisien dengan rentang 0,40 < r11 ≤ 0,70 menunjukkan
tingkat reliabilitas cukup, koefisien dengan rentang 0,20 < r11 ≤ 0,40
menunjukkan tingkat reliabilitas rendah, dan koefisien dengan rentang r11≤0,20
menunjukkan tingkat reliabilitas sangat rendah. r11 pada kriteria tingkat
reliabilitas di atas menunjukkan koefisien reliabilitas. Berdasarkan pedoman
tersebut, maka peneliti dapat mengetahui tingkat reliabilitas berdasarkan
koefisien.
9. Tingkat Kesukaran
Penyusunan sebuah tes, seorang guru harus memperhatikan aspek
penyusunan tes, sehingga tes yang disusun menghasilkan kualitas yang baik.
Salah satu ciri atau kriteria agar tes dapat dikatakan memiliki kualitas yang baik
adalah yang tidak terlalu mudah atau tidak terlalu sukar. Sukardi (2008: 136)
tingkat kesukaran item atau yang sering disebut sebagai indeks kesulitan item
adalah angka yang menunjukan proporsi peserta didik yang menjawab betul
dalam suatu soal tes yang dilakukan dengan menggunakan tes objektif. Arikunto
(2012: 222) mengatakan bahwa soal yang berkualitas baik adalah soal yang tidak
terlalu mudah atau tidak terlalu sukar. Hal tersebut diperkuat oleh Endrayanto
dan Harumurti (2014: 261) yang mengemukakan bahwa butir soal yang baik
adalah butir soal yang tidak terlalu mudah dan tidak terlalu sukar. Soal yang
memecahkan suatu soal dalam tes. Soal yang terlalu sukar juga akan membuat
peserta didik putus asa untuk mencoba lagi menyelesaikan soalnya.
Uno dan Koni (2012: 156) analisis tingkat kesukaran digunakan untuk
mengkaji soal yang mudah, sedang dan sukar, sehingga bisa menyeimbangkan
pembagian atau proporsi soal yang mudah, sedang, dan sukar. Pendapat senada
disampaikan oleh Kunandar (2014: 201) yang menyatakan bahwa proporsi
jumlah soal dengan kategori tingkat kesukaran butir soal UAS adalah 30% soal
kategori mudah, 50% soal kategori sedang, dan 20% soal dengan kategori sukar.
Berdasarkan uraian di atas peneliti dapat menarik kesimpulan bahwa
analisis tingkat kesukaran butir soal adalah suatu cara yang digunakan untuk
mengetahui proporsi seberapa mudah atau sukar soal yang diujikan, serta dapat
digunakan untuk mengetahui kualitas soal tersebut baik atau tidak untuk
diberikan kepada peserta didik. Peneliti berpedoman pada pendapat ahli
mengenai proporsi jumlah soal dengan kategori tingkat kesukaran butir soal UAS
adalah 30% soal kategori mudah, 50% soal kategori sedang, dan 20% soal
dengan kategori sukar.
Uno dan Koni (2012 : 157) pada tingkat kesukaran dapat dihitung
menggunakan rumus seperti berikut.
=
Keterangan :
B = banyaknya peserta didik yang menjawab soal dengan betul
T = total seluruh peserta tes
Berdasarkan hasil penghitungan tingkat kesukaran butir soal maka akan
diperoleh koefisien tingkat kesukaran butir soal. Berikut ini akan ditampilkan
sebuah tabel yang berisi pedoman dalam menentukan kategori suatu butir tes
berdasarkan koefisien tingkat kesukaran butir soal menurut Kusaeri dan
Suprananto (2012: 175).
Tabel 2.2 Kategori Tingkat Kesukaran
Koefisien Tingkat Kesukaran Kategori Keputusan
0,7 – 1,00 Mudah Ditolak/direvisi 0,3 – 0,69 Sedang Diterima 0,0 – 0,29 Sulit Ditolak/direvisi
(Sumber : Kusaeri dan Suprananto (2012: 175))
Berdasarkan tabel 2.2 mengenai kategori tingkat kesukaran dapat diketahui
bahwa terdapat tiga kategori tingkat kesukaran. Pada tabel tersebut dapat terlihat
bahwa tingkat kesukaran dengan koefisien 0,70 – 1,00 menunjukkan butir soal
memiliki kategori mudah, tingkat kesukaran dengan koefisien 0,30 – 0,69
menunjukkan butir soal memiliki kategori sedang, dan tingkat kesukaran dengan
koefisien 0,00 – 0,29 menunjukkan butir soal memiliki kategori sukar.
Perbaikan pada butir soal dengan tingkat kesukaran mudah, sedang, dan
sukar dilakukan apabila proporsi tingkat kesukaran pada butir soal UAS belum
sesuai dengan pembagian kategori tingkat kesukaran. Kunandar (2014: 201)
memaparkan proporsi tingkat kesukaran pada butir soal UAS seperti pada tabel
Tabel 2.3 Proporsi Tingkat Kesukaran Kategori Tingkat
Kesukaran Butir Soal
Persentase (%)
Mudah 30%
Sedang 50%
Sukar 20%
(Sumber : Kunandar (2014: 201))
Berdasarkan tabel 2.3 mengenai proporsi tingkat kesukaran pada suatu soal
UAS dapat diketahui bahwa tingkat kesukaran soal UAS dapat dikatakan baik
apabila memiliki proporsi kategori soal mudah sebesar 30%, kategori soal sedang
sebesar 50%, dan kategori soal sukar sebesar 20%. Oleh karena itu, perbaikan
pada butir soal dapat dilakukan apabila proporsi tingkat kesukaran dengan
kategori mudah, sedang, dan sukar belum sesuai dengan proporsi tingkat
kesukaran soal UAS seperti yang telah diuraikan sebelumnya.
10. Daya Pembeda
Arifin (2009: 273) mengemukakan bahwa daya pembeda adalah
pengukuran sejauh mana suatu butir soal mampu membedakan peserta didik
yang sudah menguasai kompetensi dengan peserta didik yang belum /kurang
menguasai kompetensi berdasarkan kriteria tertentu. Pendapat lain dikemukakan
olehh Uno dan Koni (2012: 157) berpendapat bahwa daya pembeda tes
digunakan untuk mengkaji kemampuan soal untuk membedakan antara peserta
didik yang mempunyai prestasi tinggi dan yang mempunyai prestasi rendah. Hal
tersebut diperkuat oleh Azwar (2015: 137) berpendapat bahwa butir soal dapat
dinyatakan memiliki daya pembeda baik apabila butir soal tersebut dapat dijawab
materi dan dijawab salah oleh semua atau sebagian besar peserta didik yang
belum memahami materi yang diujikan.
Berdasarkan pendapat di atas dapat ditarik kesimpulan bahwa daya
pembeda adalah kemampuan butir soal tes untuk membedakan siswa berprestasi
tinggi yang sudah menguasai materi yang diujikan dengan siswa berprestasi
rendah yang belum menguasai materi yang diujikan.
Berikut ini adalah rumus yang dapat digunakan untuk menghitung daya
pembeda butir soal Azwar, (2015: 138)
= −
Keterangan :
DB = daya pembeda
niT = banyak peserta didik dari Kelompok Tinggi yang menjawab benar
NT = banyak peserta didik dari Kelompok Tinggi
niR = banyak peserta didik dari Kelompok Rendah yang menjawab benar
NR = banyak peserta didik dari kelompok Rendah
Berikut ini adalah tabel 2.4 yang menunjukkan kategori daya pembeda
berdasarkan pendapat Kunandar, (2014: 241)
Tabel 2.4 Kategori Daya Pembeda
Koefisien Daya Pembeda (DB) Kategori
0,40 atau lebih Sangat baik
(butir soal dapat diterima)
0,30 – 0,39 Butir soal cukup baik
(butir soal dapat diterima dengan perbaikan) 0,20 – 0,29 Sedang
(butir soal perlu pembahasan lebih lanjut dan perlu diperbaiki)
0,19 ke bawah Butir soal buruk
(butir soal ditolak atau dibuang dan diganti dengan butir lain)
Dari tabel 2.4 tersebut dapat dilihat, bahwa apabila hasil perhitungan
terhadap daya pembeda menunjukkan bahwa soal dapat dikategorikan dengan
kriteria yang sangat baik apabila memiliki koefisien daya pembeda dengan hasil
perhitungan 0,40 atau lebih. Koefisien daya pembeda dengan rentang 0,30 – 0,39
menunjukkan kategori butir soal cukup baik. Koefisien daya pembeda dengan
rentang 0,20 – 0,29 menunjukkan kategori butir soal sedang. Koefisien daya
pembeda dengan rentang kurang dari 0,19 menunjukkan kategori butir soal jelek.
11. Efektivitas Pengecoh
Purwanto (2009: 108) mengemukakan bahwa pengecoh atau distractor
merupakan pilihan jawaban yang bukan merupakan kunci jawaban. Sudijono
(2011: 409) yang mengatakan bahwa pengecoh adalah jawaban-jawaban yang
salah, kecuali kunci jawaban soal tersebut. Hal ini sesuai dengan pendapat
Djiwandono (2008: 225) yang mengemukakan bahwa kemiripan pengecoh
dengan kunci jawaban harus diusahakan sedemikian rupa sehingga hanya dapat
dikenali kekurangtepatannya melalui pemahaman dan telaah yang mendalam.
Tes juga dapat dikatakan memiliki kualitas yang baik, apabila melalui
tahap analisis efektivitas pengecoh. Uno dan Koni (2012: 157) mengemukakan
bahwa analisis efektivitas pengecoh digunakan untuk menentukan apakah
pengecoh (distractor) sudah berfungsi sebagai pengecoh dengan baik atau tidak.
Pendapat senada dikemukakan oleh Endrayanto dan Harumurti (2014: 270) yang
mengatakan bahwa untuk dapat mengetahui apakan pengecoh berfungsi atau
Berdasarkan pendapat ahli di atas dapat ditarik kesimpulan bahwa
efektivitas pengecoh adalah pilihan jawaban pada soal pilihan ganda yang
mempunyai kemiripan dengan jawaban yang benar, sehingga dapat mengecoh
jawaban yang tidak sama dengan kunci jawaban yang benar. Pengecoh
digunakan untuk mengecoh peserta didik dalam memilih jawaban soal. Pengecoh
yang baik adalah yang mampu membuat peserta didik harus melakukan
pemahaman terhadap pertanyaan dan jawaban yang benar.
Basuki dan Hariyanto (2014: 144) yang mengemukakan bahwa pengecoh
dapat dikatakan berfungsi dengan baik apabila pengecoh tersebut minimal dipilih
oleh 5% peserta tes. Hal senada diungkapkan oleh Sudijono (2011: 411) yang
mengatakan bahwa pengecoh dapat berfungsi dengan baik apabila pengecoh
tersebut sekurang-kurangnya telah dipilih oleh 5% dari seluruh peserta tes. Dari
kedua pendapat di atas maka dapat ditarik kesimpulan bahwa pengecoh dapat
dikatakan berfungsi dengan baik apabila pengecoh tersebut telah dipilih oleh
peserta tes sekurang-kurangnya 5% dari keseluruhan peserta tes. Pengecoh yang
tidak berfungsi dengan baik direkomendasikan untuk direvisi. Peneliti dapat
mengambil kesimpulan bahwa analisis efektivitas pengecoh adalah pilihan
jawaban befungsi baik apabila telah dipilih 5% dari seluruh peserta tes.
Arifin (2009: 279) menuliskan efektivitas pengecoh dapat dihitung
=
( − )
( −1)
100%
Keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh N = jumlah peserta didik yang mengikuti tes
B = jumlah peserta didik yang menjawab soal dengan benar pada setiap soal.
n = jumlah alternatif jawaban 1 = bilangan tetap
12.Software MicroCat Iteman versi 3.00(Iteman)
Pada penelitian ini peneliti menggunakan Iteman versi 3.00. Iteman versi
3.00 merupakan suatu perangkat atau program untuk menganalisis kuantitatif
butir soal. Hal ini sesuai dengan pendapat Kusaeri dan Suprananto (2012: 178)
yang mengemukakan bahwa Item and Test Analysis (Iteman) merupakan
perangkat lunak atau program yang dibuat dengan menggunakan bahasa
pemrogaman komputer yang khusus digunakan untuk analisis statistik butir soal.
Pada penelitian ini peneliti akan menganalisis hasil pengolahan data program
Iteman meliputi reliabilitas, tingkat kesukaran, daya pembeda, dan efektivitas
pengecoh butir soal. Pada reliabilitas dapat dilihat pada koefisien nilai Alphadari
Output Iteman. Prop. Correct dimaknai sebagai tingkat kesukaran butir soal.
Prop. Correct adalah proporsi peserta didik yang mengerjakan soal atau tes
menjawab benar. Daya pembeda dalam software Itemandinyatakan dalam Point
Biser. Point Biser adalah indeks daya pembeda soal dan pilihan jawaban dengan