ANALISIS BUTIR SOAL PILIHAN GANDA ULANGAN AKHIR SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN
BAHASA INDONESIA KELAS IV SD DI KECAMATAN DEPOK
Oleh: Tina Yuniasari NIM: 121134130
Kualitas suatu tes dapat diketahui dengan cara melakukan analisis pada setiap butir soalnya. Di Kecamatan Depok sangat jarang dilakukan penelitian mengenai analisis butir soal. Dengan demikian, penelitian ini memiliki tujuan untuk mengetahui validitas isi, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh soal pilihan ganda Ulangan Akhir Semester (UAS) Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia Kelas IV SD di Kecamatan Depok.
Jenis penelitian ini adalah kuantitatif deskriptif. Data dalam penelitian ini dikumpulkan melalui dua metode, yaitu dokumentasi dan wawancara. Populasi dalam penelitian ini adalah 49 SD di Kecamatan Depok dan sampel pada penelitian ini adalah 28 SD di Kecamatan Depok. Instrumen yang digunakan berupa check list. Teknik analisis data menggunakan software Item and Test
Analysis (ITEMAN) versi 3.00.
Hasil penelitian menunjukkan bahwa butir soal UAS memiliki validitas yang sebagian besar valid dengan hasil persentase sebesar 96,7%, memiliki reliabilitas tinggi dengan koefisien reliabilitas sebesar 0,777, memiliki tingkat kesukaran dalam kategori sangat mudah dengan hasil sebesar 40%, memiliki daya beda dalam kategori bagus sekali dengan hasil sebesar 50%, dan memiliki efektivitas pengecoh yang berfungsi dengan baik dengan hasil 53,3%.
THE ANALYSIS OF MULTIPLE CHOICE ITEMS IN THE LAST SEMESTER’S FINAL TEST OF THE ACADEMIC YEAR 2014/2015 ON BAHASA INDONESIA SUBJECT GRADE 4 ELEMENTARY SCHOOL IN
DEPOK DISTRICT
By: Tina Yuniasari NIM: 121134130
The quality of a test can be detected by analyzing on each item from the questions. Depok district rarely uses an analysis of the test items. Therefore, the aim of this research was to know about the content validity, reliability, level of
difficulty, different power, and the effectiveness of the test’s humbug in a multiple choice test in the last semester’s final test of the academic year 2014/2015 on
Bahasa Indonesia subject grade 4 elementary school in Depok district.
The type of this research was descriptive quantitative. The techniques for gathering the data in this research were documentation and interview techniques. The population for this research was 49 Elementary Schools and the sample was 26 Elementary Schools in Depok district. The instrument which was used in this research is check list. The researcher used Item and Test Analysis (ITEMAN) software 3.00 version to analyze the data.
The result showed that the test items of last semester final test had a validity which largely valid with the percentage 96,7% and had a high reliability with reliability coefficient 0,777, had a level of difficulty in the category of very easy with the percentage 40%, had a level of different power in a good category with the percentage 50% and also had a level of test’s humbug which had a good function with the percentage 53,3%.
ANALISIS BUTIR SOAL PILIHAN GANDA ULANGAN AKHIR SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN
BAHASA INDONESIA KELAS IV SD DI KECAMATAN DEPOK
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Pendidikan Program Studi Pendidikan Guru Sekolah Dasar
Oleh: Tina Yuniasari
121134130
PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR JURUSAN ILMU PENDIDIKAN
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SANATA DHARMA
i
ANALISIS BUTIR SOAL PILIHAN GANDA ULANGAN AKHIR SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN
BAHASA INDONESIA KELAS IV SD DI KECAMATAN DEPOK
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Pendidikan Program Studi Pendidikan Guru Sekolah Dasar
Oleh: Tina Yuniasari
121134130
PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR JURUSAN ILMU PENDIDIKAN
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SANATA DHARMA
iv
HALAMAN PERSEMBAHAN
Karya ini dipersembahkan untuk:
Allah SWT
Kedua orang tua saya Jaeno dan Sunaryanti
Kakak saya Dony Slamet Turyanto
Teman-teman seperjuangan dan
teman-teman payung
Sahabat-sahabat tercinta
v
MOTTO
“Maka sesungguhnya bersama kesulitan ada kemudahan. Sesungguhnya bersama
kesulitan ada kemudahan. Maka apabila engkau telah selesai (dari suatu urusan), tetaplah bekerja keras (untuk urusan yang lain). Dan hanya kepada Tuhanmulah engkau berharap.”
(QS. Al-Insyirah, 6-8)
Build your dreams, or someone else will hire you to build theirs
-Farrah Gray-
If a child can’t learn the way we teach, maybe we should teach the way they learn
-Ignacio Estrada-
Sesuatu yang belum dikerjakan seringkali tampak mustahil, kita baru yakin kalau
kita telah berhasil melakukannya dengan baik.
viii
ABSTRAK
ANALISIS BUTIR SOAL PILIHAN GANDA ULANGAN AKHIR SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN
BAHASA INDONESIA KELAS IV SD DI KECAMATAN DEPOK
Tina Yuniasari Universitas Sanata Dharma
2016
Kualitas suatu tes dapat diketahui dengan cara melakukan analisis pada setiap butir soalnya. Di Kecamatan Depok sangat jarang dilakukan penelitian mengenai analisis butir soal. Dengan demikian, penelitian ini memiliki tujuan untuk mengetahui validitas isi, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh soal pilihan ganda Ulangan Akhir Semester (UAS) Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia Kelas IV SD di Kecamatan Depok.
Jenis penelitian ini adalah kuantitatif deskriptif. Data dalam penelitian ini dikumpulkan melalui dua metode, yaitu dokumentasi dan wawancara. Populasi dalam penelitian ini adalah 49 SD di Kecamatan Depok dan sampel pada penelitian ini adalah 28 SD di Kecamatan Depok. Instrumen yang digunakan berupa check list. Teknik analisis data menggunakan software Item and Test
Analysis (ITEMAN) versi 3.00.
Hasil penelitian menunjukkan bahwa butir soal UAS memiliki validitas yang sebagian besar valid dengan hasil persentase sebesar 96,7%, memiliki reliabilitas tinggi dengan koefisien reliabilitas sebesar 0,777, memiliki tingkat kesukaran dalam kategori sangat mudah dengan hasil sebesar 40%, memiliki daya beda dalam kategori bagus sekali dengan hasil sebesar 50%, dan memiliki efektivitas pengecoh yang berfungsi dengan baik dengan hasil 53,3%.
ix ABSTRACT
THE ANALYSIS OF MULTIPLE CHOICE ITEMS IN THE LAST
SEMESTER’S FINAL TEST OF THE ACADEMIC YEAR 2014/2015 ON
BAHASA INDONESIA SUBJECT GRADE 4 ELEMENTARY SCHOOL IN DEPOK DISTRICT
Tina Yuniasari
Sanata Dharma University
2016
The quality of a test can be detected by analyzing on each item from the questions. Depok district rarely uses an analysis of the test items. Therefore, the aim of this research was to know about the content validity, reliability, level of
difficulty, different power, and the effectiveness of the test’s humbug in a multiple choice test in the last semester’s final test of the academic year 2014/2015 on
Bahasa Indonesia subject grade 4 elementary school in Depok district.
The type of this research was descriptive quantitative. The techniques for gathering the data in this research were documentation and interview techniques. The population for this research was 49 Elementary Schools and the sample was 26 Elementary Schools in Depok district. The instrument which was used in this research is check list. The researcher used Item and Test Analysis (ITEMAN) software 3.00 version to analyze the data.
The result showed that the test items of last semester final test had a validity which largely valid with the percentage 96,7% and had a high reliability with reliability coefficient 0,777, had a level of difficulty in the category of very easy with the percentage 40%, had a level of different power in a good category with
the percentage 50% and also had a level of test’s humbug which had a good
function with the percentage 53,3%.
x
KATA PENGANTAR
Puji syukur peneliti panjatkan ke hadirat Allah SWT. yang telah melimpahkan rahmat, hidayah, serta inayahNya kepada peneliti sehingga peneliti dapat menyelesaikan tugas skripsi yang berjudul “Analisis Butir Soal Pilihan Ganda Ulangan Akhir Semester Genap Tahun Pelajaran 2014/2015 Mata Pelajaran Bahasa Indonesia Kelas IV SD di Kecamatan Depok”. Skripsi ini disusun sebagai salah satu syarat memperoleh gelar Sarjana Pendidikan Guru Sekolah Dasar, Fakultas Keguruan dan Ilmu Pendidikan Universitas Sanata Dharma, Yogyakarta. Peneliti menyadari bahwa penulisan skripsi ini tidak akan berhasil tanpa bimbingan, arahan, dan bantuan dari berbagai pihak. Dengan demikian, peneliti ingin menyampaikan ucapan terimakasih yang sebesar-besarnya kepada:
1. Rohandi, Ph.D., Dekan Fakultas Keguruan dan Ilmu Pendidikan yang telah memberikan izin kepada peneliti untuk melakukan penelitian skripsi.
2. Christiyanti Aprinastuti, S.Si., M.Pd., Ketua Program Studi PGSD yang telah memberikan kesempatan dan dukungan peneliti untuk melakukan penelitian. 3. Apri Damai Sagita Krissandi, S.S., M.Pd., Wakil ketua program studi PGSD
yang telah memberikan dukungan kepada peneliti untuk segera menyelesaikan skripsi.
4. Maria Melani Ika Susanti, S.Pd., M.Pd., dosen pembimbing I yang telah memberikan bimbingan, arahan, waktu, tenaga, pikiran, dan kesabaran kepada peneliti untuk dapat menyelesaikan skripsi.
5. Irine Kurniastuti, S.Psi., M.Psi., dosen pembimbing II yang telah memberikan dorongan, bimbingan, arahan, waktu, tenaga, dan pikiran kepada peneliti untuk dapat menyelesaikan skripsi
6. Segenap dosen dan staf sekretariat Program Studi Pendidikan Guru Sekolah Dasar Universitas Sanata Darma.
xiii
C. Populasi dan Sampel ... 45
D. Variabel Penelitian ... 49
E. Teknik Pengumpulan Data ... 49
F. Instrumen Penelitian ... 50
G. Teknik Analisis Data ... 52
BAB IV HASIL PENELITIAN DAN PEMBAHASAN ... 59
A. Deskripsi Penelitian ... 59
B. Hasil Penelitian ... 60
1. Validitas Isi ... 60
2. Reliabilitas ... 69
3. Tingkat Kesukaran ... 71
4. Daya Beda ... 76
5. Efektifitas Pengecoh ... 82
C. Pembahasan ... 98
1. Validitas Isi ... 98
2. Reliabilitas ... 100
3. Tingkat Kesukaran ... 102
4. Daya Beda ... 103
5. Efektifitas Pengecoh ... 105
BAB V PENUTUP ... 108
A. Kesimpulan ... 108
B. Keterbatasan Penelitian ... 109
C. Saran ... 110
DAFTAR REFERENSI ... 111
LAMPIRAN ... 115
xiv
DAFTAR TABEL
Tabel 2.1 Kategori Korelasi Reliabilitas ... 26
Tabel 2.2 Tingkat Kesukaran dalam Tiga Kategori (1) ... 28
Tabel 2.3 Tingkat Kesukaran dalam Tiga Kategori (2) ... 28
Tabel 2.4 Tingkat Kesukaran dalam Lima Kategori ... 29
Tabel 2.5 Kategori Daya Beda (1) ... 30
Tabel 2.6 Kategori Daya Beda (2) ... 30
Tabel 2.7 Kategori Daya Beda (3) ... 30
Tabel 2.8 Standar Kompetensi dan Kompetensi Dasar ... 35
Tabel 3.1 Daftar Nama SD di Kecamatan Depok ... 45
Tabel 3.2 Daftar Nama SD yang Diteliti ... 48
Tabel 3.3 Instrumen Penelitian Check List ... 51
Tabel 4.1 Tabel Validitas Isi ... 61
Tabel 4.2 Hasil Persentase Validitas Isi ... 68
Tabel 4.3 Kategori Koefisien Reliabilitas ... 69
Tabel 4.4 Reliability Statistics ... 70
Tabel 4.5 Kategori Tingkat Kesukaran ... 71
Tabel 4.6 Hasil Tingkat Kesukaran ... 74
Tabel 4.7 Hasil Persentase Tingkat Kesukaran ... 75
Tabel 4.8 Kategori Daya Beda ... 77
Tabel 4.9 Indeks Daya Beda ... 80
Tabel 4.10 Hasil Persentase Daya Beda ... 81
Tabel 4.11 Hasil Efektivitas Pengecoh ... 83
xv
DAFTAR GAMBAR
Gambar 2.1. Literature Map ... 40
Gambar 3.1 Input Data ... 52
Gambar 3.2 Program ITEMAN ... 53
Gambar 3.3 Output ITEMAN ... 54
Gambar 3.4 Output ITEMAN Reliabilitas ... 55
Gambar 4.1 Pie Chart Validitas Isi ... 68
Gambar 4.2 Output ITEMAN Tingkat Kesukaran Nomor 11 ... 72
Gambar 4.3 Output ITEMAN Tingkat Kesukaran Nomor 14 ... 73
Gambar 4.4 Pie Chart Tingkat Kesukaran ... 76
Gambar 4.5 Output ITEMAN Tingkat Kesukaran dan Daya Beda ... 79
Gambar 4.6 Pie Chart Daya Beda ... 81
Gambar 4.7 Output ITEMAN Efektivitas Pengecoh Nomor 30 ... 95
xvi
DAFTAR LAMPIRAN
Lampiran 1. Surat izin melakukan penelitian ... 116
Lampiran 2. Surat keterangan melakukan penelitian ... 117
Lampiran 3. Daftar nama mahasiswa kelompok payung ... 118
Lampiran 4. Soal pilihan ganda UAS genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD ... 119
Lampiran 5. Kunci Jawaban UAS genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD ... 125
Lampiran 6. Lembar jawab siswa ... 126
Lampiran 7. Daftar check list ... 127
Lampiran 8. Kisi-kisi soal ... 128
Lampiran 9. Output ITEMAN ... 131
Lampiran 10. Rekapan hasil validitas isi, tingkat kesukaran, daya beda, dan efektivitas pengecoh ... 135
Lampiran 11. Data dan skor siswa dari kelompok atas ... 139
1
BAB I
PENDAHULUAN
A. Latar Belakang
Pendidikan merupakan investasi yang sangat baik dan juga berharga bagi masa depan semua orang. Pendidikan adalah usaha sadar
dan bertujuan untuk mengembangkan kualitas manusia (Djamarah, 2005: 22). Tercapainya suatu pendidikan dapat dilihat dari sistem evaluasinya.
Evaluasi sebagai tolok ukur sejauh mana, dalam hal apa, dan bagian mana tujuan pendidikan sudah tercapai. Evaluasi dalam pendidikan berdasarkan Undang-Undang tentang Sistem Pendidikan Nasional nomor 20 Tahun
2003 memiliki arti sebagai kegiatan pengendalian mutu pendidikan secara nasional sebagai bentuk akuntabilitas penyelenggara pendidikan kepada
pihak-pihak yang berkepentingan. Sanjaya (dalam Putra, 2013: 88) mengungkapkan bahwa evaluasi dalam pendidikan memiliki fungsi di
antaranya yaitu sebagai umpan balik bagi peserta didik, mengetahui proses ketercapaian peserta didik dalam menguasai tujuan yang telah ditentukan, memberikan informasi untuk mengembangkan program kurikulum, serta
sebagai umpan balik untuk semua pihak yang berkepentingan dengan pendidikan di sekolah.
Untuk memperoleh hasil dari evaluasi dalam pembelajaran, perlu adanya suatu instrumen penilaian yaitu salah satunya adalah tes. Untuk mengetahui kualitas suatu tes, perlu dilakukan analisis pada setiap butir
melakukan analisis butir soal, yaitu analisis tingkat kesukaran, analisis daya pembeda, analisis validitas, dan analisis reliabilitas. Menurut Azwar (2013: 141) dalam analisis butir soal perlu juga dianalisis efektivitas
distraktornya atau dapat disebut juga pengecoh, hal ini bertujuan untuk mengetahui berfungsi atau tidaknya pilihan jawaban yang tersedia.
Analisis pada umumnya dilakukan melalui dua cara, yaitu analisis kualitatif (qualitatif control) dan analisis kuantitatif (quantitatif control) (Surapranata, 2004: 1). Analisis kualitatif digunakan untuk menguji
validitas, sedangkan analisis kuantitatif digunakan untuk menguji reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh.
Berdasarkan hasil wawancara peneliti terhadap beberapa guru Sekolah Dasar (SD) di Kecamatan Depok, analisis butir soal sangat jarang dilakukan. Menurut Kepala SD Negeri Samirono, analisis butir soal
pernah dilaksanakan oleh mahasiswa Universitas Negeri Yogyakarta, namun pada sekitar 15 tahun yang lalu. Hasil wawancara dari salah satu pegawai UPTD juga serupa, beliau menyatakan bahwa jarang sekali
terdapat penelitian mengenai analisis butir soal di Kecamatan Depok dengan cara menguji validitas, reliabilitas, tingkat kesukaran, daya beda,
dan efektivitas pengecohnya, beliau menyatakan bahwa biasanya peneliti lain hanya menguji validitas dan reliabilitasnya saja dari soal Ulangan Akhir Semester (UAS). Hal tersebut menunjukkan bahwa penelitian
analisis butir soal dengan cara menguji validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh memang sangat jarang
Salah satu butir soal yang jarang dianalisis yaitu butir soal pada mata pelajaran Bahasa Indonesia. Bahasa Indonesia merupakan mata pelajaran yang memberikan pemahaman kepada guru dan peserta didik SD
dalam melaksanakan pembelajaran Bahasa Indonesia yang benar melalui membaca dan menulis (Zulela, 2012: 1). Untuk mencapai
kompetensi-kompetensi pada mata pelajaran Bahasa Indonesia, alangkah baiknya jika soal memiliki validitas yang sesuai, terkhusus validitas isinya karena suatu alat ukur dipandang valid apabila sesuai dengan isi kurikulum yang
hendak diukur (Mulyasa, 2009: 51). Selain itu, menurut pendapat Sudjana (2012: 17) soal yang baik juga harus memiliki koefisien reliabilitas yang
tinggi yang artinya soal memiliki keajegan atau ketetapan, sedangkan Purwanto (2009: 99) berpendapat bahwa soal diusahakan harus memiliki tingkat kesukaran yang sedang, memiliki daya beda positif dan setinggi
mungkin, serta memiliki efektivitas pengecoh yang berfungsi dengan baik. Pada semester genap kelas IV SD terdiri dari Standar Kompetensi 5 (mendengarkan), 6 (berbicara), 7 (membaca), dan 8 (menulis). Standar
Kompetensi 5 terdiri dari dua Kompetensi Dasar, Standar Kompetensi 6 terdiri dari dua Kompetensi Dasar, Standar Kompetensi 7 terdiri dari tiga
Kompetensi Dasar, dan Standar Kompetensi 8 terdiri dari tiga Kompetensi Dasar. Jadi, pada kelas IV semester genap terdiri dari empat Standar Kompetensi dan sepuluh Kompetensi Dasar.
Peneliti mengangkat masalah ini untuk mengetahui kualitas butir soal pilihan ganda melalui analisis butir soal dengan cara analisis kualitatif
mengetahui seberapa besar atau seberapa tinggi reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh soal. Alasan peneliti memilih soal pilihan ganda karena pada soal jenis tersebut bersifat
obyektif bukan subyektif, artinya dalam penilaian tidak ada pengaruh dari guru karena jawaban dalam soal pilihan ganda hanya ada satu dan bersifat
mutlak.
Peneliti melaksanakan analisis butir soal pilihan ganda ulangan akhir semester genap mata pelajaran Bahasa Indonesia kelas IV SD di
Kecamatan Depok, Sleman. Peneliti memilih melakukan penelitian di kelas IV pada mata pelajaran Bahasa Indonesia karena peneliti tertarik
untuk mengetahui seberapa baik kualitas soal pada mata pelajaran tersebut. Seiring dengan kemajuan teknologi dan informasi yang semakin canggih, peneliti ingin mengetahui seberapa besar dunia pendidikan mampu
mengembangkan dan meningkatkan salah satu budaya Indonesia yaitu Bahasa Indonesia pada anak-anak kelas IV SD.
Alasan peneliti memilih kelas IV karena menurut Piaget (Nuryanti,
2008: 21) pada usia kelas IV atau usia 7-11 tahun masuk dalam periode operasional konkret, mereka baru bisa menerima materi yang konkret dan
belum dapat menerima materi-materi yang masih abstrak. Namun, pada periode operasional konkret anak sudah mulai berpikir secara rasional. Hal tersebut membuat peneliti ingin meneliti lebih jauh lagi tentang
pemahaman mereka terhadap mata pelajaran Bahasa Indonesia karena pada umumnya mata pelajaran Bahasa Indonesia dijelaskan melalui
mana siswa kelas IV memahami mata pelajaran Bahasa Indonesia melalui jawaban dari soal ulangan akhir semester genap khususnya pada seluruh peserta didik di kecamatan Depok.
Kecamatan Depok memiliki beberapa keistimewaan, diantaranya adalah adanya berbagai obyek sarana pendidikan seperti SD, SMP/MTS,
SMA/SMK, dan Perguruan Tinggi. Salah satu Perguruan Tinggi yang ada di Kecamatan Depok adalah Universitas Sanata Dharma. Pada Kecamatan Depok terdiri dari tiga desa yaitu desa Caturtunggal, Condongcatur, dan
Maguwoharjo. Kecamatan Depok terdiri dari 9 Gugus Depan (Gudep). Selain itu, Kecamatan Depok terdiri dari 37 SD Negeri, dan 12 SD Swasta.
Dari 49 SD tersebut, 5 SD diantaranya pada saat ini telah menerapkan kurikulum 2013. SD yang menerapkan kurikulum 2013 adalah SD Negeri Nogopuro, SD Negeri Babarsari, SD Muhammadiyah Condongcatur, SD
Budi Mulia Dua Seturan, dan Budi Mulia Dua Pandansari. Dengan adanya penelitian ini diharapkan mampu memberikan tambahan wawasan dan pengetahuan untuk pihak-pihak yang terlibat seperti UPTD, sekolah, dan
guru.
B. Pembatasan Masalah
Penelitan ini dibatasi pada analisis butir soal yang meliputi
validitas isi, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh. Penelitian dilakukan pada 28 SD yang terdiri dari 24 SD Negeri dan 4 SD Swasta di Kecamatan Depok. Peneliti melaksanakan penelitian
penilaian dalam kurikulum tersebut masih terpisah-pisah atau lebih ke basis per mata pelajaran sehingga peneliti dapat melakukan analisis soal pada mata pelajaran Bahasa Indonesia kelas IV tahun pelajaran 2014/2015.
C. Rumusan Masalah
Rumusan masalah dalam penelitian ini adalah sebagai berikut:
1. Bagaimanakah validitas isi pada butir soal pilihan ganda Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran
Bahasa Indonesia kelas IV SD di Kecamatan Depok?
2. Bagaimanakah reliabilitas pada butir soal pilihan ganda Ulangan
Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok?
3. Bagaimanakah tingkat kesukaran pada butir soal pilihan ganda
Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok?
4. Bagaimanakah daya beda pada butir soal pilihan ganda Ulangan Akhir
Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok?
D. Tujuan Penelitian
Penelitian ini memiliki tujuan sebagai berikut:
1. Mengetahui validitas isi pada butir soal pilihan ganda Ulangan Akhir
Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok.
2. Mengetahui reliabilitas pada butir soal pilihan ganda Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok.
3. Mengetahui tingkat kesukaran pada butir soal pilihan ganda Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran
Bahasa Indonesia kelas IV SD di Kecamatan Depok.
4. Mengetahui daya beda pada butir soal pilihan ganda Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa
Indonesia kelas IV SD di Kecamatan Depok.
5. Mengetahui efektivitas pengecoh pada butir soal pilihan ganda Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata
pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok.
E. Manfaat Penelitian
Manfaat pada penelitian ini adalah sebagai berikut: 1. Manfaat Teoritis
b. Dapat menambah pengetahuan dalam bidang pendidikan, terutama dalam bidang evaluasi pendidikan.
2. Manfaat Praktis
a. Bagi Guru
1) Guru mendapatkan informasi agar lebih baik dalam membuat
soal khususnya pada mata pelajaran Bahasa Indonesia.
2) Hasil dari penelitian ini dapat menjadi bahan pertimbangan bagi guru dalam membuat soal tes yang sesuai dengan
rencana pembelajaran dan silabus. b. Bagi Sekolah
1) Hasil penelitian dapat digunakan sebagai bahan pertimbangan pada perencanaan sekolah pada masa berikutnya.
2) Dapat digunakan sebagai perbaikan kualitas pendidikan di
sekolah. c. Bagi UPTD
Hasil dari penelititan ini dapat memberikan masukan tentang
kualitas butir soal ulangan akhir semester SD agar kualitas dapat ditingkatkan dan diperhatikan dengan lebih baik lagi.
d. Bagi Peneliti
1) Peneliti dapat menambah wawasan dan pengetahuan tentang kualitas soal-soal ulangan akhir semester SD khususnya pada
2) Peneliti mendapatkan pengalaman secara langsung untuk menganalisis soal-soal ulangan akhir semester SD khususnya pada mata pelajaran bahasa Indonesia yang dibuat oleh
Dinas Pendidikan.
F. Definisi Operasional
Beberapa istilah yang digunakan dalam penelitian ini adalah sebagai berikut:
1. Analisis Butir Soal
Analisis butir soal adalah pengkajian dari pertanyaan-pertanyaan
dalam instrumen yang digunakan untuk mengukur kemampuan dalam proses pembelajaran meliputi validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektvitas pengecoh.
2. Validitas Isi
Validitas isi adalah pengujian validitas terhadap kesesuaian antara
suatu alat ukur dengan isi atau materi yang telah diberikan dengan cara mencocokkan antara soal dengan kisi-kisi soal.
3. Reliabilitas
Reliabilitas adalah ketetapan hasil suatu tes yang dilaksanakan secara berkali-kali, diberikan pada kelompok yang sama dalam waktu yang
berbeda.
4. Tingkat Kesukaran
Tingkat kesukaran adalah pengukuran kesulitan suatu soal berupa
5. Daya Beda
Daya beda adalah daya untuk membedakan kelompok dengan pengetahuan yang tinggi dan kelompok dengan pengetahuan yang
rendah.
6. Efektivitas Pengecoh
Efektivitas pengecoh adalah penyebaran pilihan jawaban yang digunakan untuk menguji peserta didik dalam pemahaman materi. 7. Pilihan Ganda
Pilihan ganda adalah tipe tes yang terdiri dari sebuah pertanyaan atau pernyataan yang memiliki beberapa alternatif pilihan jawaban.
8. Mata Pelajaran Bahasa Indonesia
Mata pelajaran Bahasa Indonesia merupakan suatu mata pelajaran yang memberikan pengetahuan dan pemahaman pada siswa tentang
11
BAB II
KAJIAN PUSTAKA
A. Landasan Teori 1. Evaluasi
a. Pengertian Evaluasi
Putra (2013: 71) mengartikan evaluasi sebagai proses sistematis untuk menentukan atau membuat keputusan sampai sejauh
mana tujuan-tujuan pengajaran dicapai oleh peserta didik. Arifin (2009: 5) berpendapat bahwa evaluasi merupakan suatu proses yang dilakukan secara sistematis dan berkelanjutan, dalam arti terencana,
sesuai dengan prosedur dan prinsip serta dilakukan secara terus-menerus. Evaluasi dipandang sebagai suatu proses bukan hasil
(produk). Hasil yang diperoleh dari proses evaluasi yaitu kualitas tentang nilai dan arti.
Evaluasi adalah pemberian keputusan tentang nilai sesuatu
yang yang mungkin dilihat dari segi tujuan, gagasan, cara bekerja, pemecahan, metode, materi, dan lain-lain (Sudjana, 2012: 28). Dari
segi tersebut maka perlu adanya kriteria atau standar tertentu dalam evaluasi. Untuk mempermudah mengetahui tingkat kemampuan
evaluasi seseorang, item dalam suatu tes harus menyebutkan kriteria secara jelas.
Dari definisi di atas dapat disimpulkan bahwa evaluasi
memberikan keputusan dalam ketercapaian tujuan yang memiliki kriteria atau standar tertentu. Evaluasi menjadi tolok ukur sejauh mana, dalam hal apa, dan bagian mana tujuan pendidikan sudah
tercapai. Dengan demikian, evaluasi juga dapat dijadikan sebagai bahan perbaikan mutu dalam pendidikan.
b. Tujuan Evaluasi
Evaluasi merupakan peranan penting dalam pendidikan karena memiliki beberapa tujuan yang baik. Tujuan evaluasi menurut
pernyataan Arifin (2009: 6) adalah untuk menentukan kualitas sesuatu, terutama yang berkenaan dengan nilai dan arti. Nilai dan arti
dalam proses evaluasi harus ada pemberian pertimbangan. Pemberian pertimbangan tentang nilai dan arti harus berdasarkan keriteria. Kiteria yang digunakan dapat berasal dari apa yang dievaluasi
(internal) dan juga dapat berasal dari luar apa yang dievaluasi.
Putra (2013: 82) berpendapat bahwa tujuan evaluasi dalam bidang pendidikan ada dua. Tujuan evaluasi yang pertama adalah
untuk menghimpun berbagai keterangan yang akan dijadikan sebagai bukti perkembangan yang dialami oleh para peserta didik setelah
mereka mengikuti proses pembelajaran dalam jangka waktu tertentu. Tujuan yang kedua adalah untuk mengetahui tingkat efektivitas dari berbagai metode pembelajaran yang telah digunakan dalam proses
pembelajaran.
Sudjana (2012: 2) mengemukakan pendapatnya mengenai
tercapai atau tidaknya tujuan instruksional dalam hal perubahan tingkah laku peserta didik saja. Tujuan evaluasi juga dapat digunakan sebagai umpan balik bagi upaya memperbaiki proses belajar
mengajar.
Berdasarkan tiga definisi di atas, tujuan evaluasi adalah untuk
menghimpun bukti ketercapaian proses belajar peserta didik. Evaluasi juga bertujuan sebagai upaya perbaikan pada proses belajar mengajar untuk mengetahui atau menemukan faktor-faktor penyebab
keberhasilan dan ketidakberhasilan peserta didik dalam mengikuti program pendidikan. Dengan demikian, akan ditemukan jalan keluar
atau cara-cara perbaikan pada kegiatan pembelajaran. c. Fungsi Evaluasi
Pada dasarnya diadakannya evaluasi bukanlah semata-mata
hanya untuk formalitas saja, namun evaluasi memiliki beberapa fungsi yang sangat penting. Menurut pendapat Putra (2013: 84) evaluasi memiliki tiga fungsi pokok yaitu untuk mengukur kemajuan,
menunjang penyusunan rencana, dan memperbaiki atau melakukan penyempurnaan kembali. Sebelumnya telah dijelaskan bahwa evaluasi
merupakan suatu proses yang sistematis untuk mengukur atau memberikan keputusan dalam ketercapaian tujuan yang memiliki kriteria atau standar tertentu. Evaluasi yang dilakukan secara terus
menerus dapat membuat perkiraan ketercapaian tujuan yang telah dirumuskan pada waktu yang telah ditentukan. Oleh karena itu,
pengkajian ulang terhadap rencana yang telah disusun dan memperbaiki pelaksanaannya.
2. Instrumen Penelitian
1) Pengertian Instrumen Penelitian
Instrumen penelitian adalah suatu alat yang dapat digunakan untuk mempermudah seseorang dalam melaksanakan tugas atau mencapai tujuan secara lebih lebih efektif dan efisien (Arikunto, 2012:
40). Sugiyono (2014: 148) menjelaskan bahwa instrumen penelitian merupakan suatu alat yang digunakan untuk mengukur fenomena alam
maupun sosial yang diamati. Instrumen dalam penelitian dapat dibedakan menjadi dua macam, yaitu instrumen tes dan instrumen non tes (Widoyoko, 2012: 52).
Berdasarkan definisi-definisi di atas, dapat disimpulkan bahwa instrumen penelitian merupakan alat ukur yang digunakan untuk mengukur sesuatu yang akan diteliti.
2) Instrumen Tes 1) Pengertian Tes
Tes adalah sejumlah pertanyaan yang membutuhkan jawaban, atau sejumlah pernyataan yang harus diberikan
tanggapan dengan tujuan mengukur tingkat kemampuan seseorang atau mengungkap aspek tertentu dari orang yang dikenai tes (Mardapi, 2008: 67). Pengertian tes yang selanjutnya
prosedur yang dipergunakan dalam rangka pengukuran dan penilaian. Sedangkan menurut Azwar (1996: 2) tes merupakan sekumpulan pertanyaan yang harus dijawab dan/atau tugas yang
harus dikerjakan yang akan memberikan informasi mengenai aspek psikologis tertentu berdasarkan jawaban terhadap
pertanyaan-pertanyaan atau cara dan hasil subjek dalam melakukan tugas-tugas tersebut.
Dari definisi-definisi di atas dapat disimpulkan bahwa tes adalah
sejumlah pertanyaan atau penyataan yang memerlukan suatu jawaban yang digunakan sebagai pengukuran atau penilaian
dalam aspek tertentu. 2) Jenis Tes
Sudijono (2011: 68-72) menyatakan bahwa tes memiliki jenis
atau golongan yang tergantung dari segi mana atau dengan alasan apa penggolongan tes itu dilakukan. Berdasarkan fungsinya, jenis tes terdiri dari:
a) Tes Seleksi
Tes ini biasanya digunakan untuk memilih calon peserta
didik yang tergolong paling baik dari beberapa calon yang mengikuti tes.
b) Tes Awal
Tes awal digunakan untuk mengetahui sejauh manakah materi atau bahan pelajaran yang akan diajarkan telah dapat
c) Tes Akhir
Tes akhir dilaksanakan dengan tujuan untuk mengetahui sejauh mana materi pelajaran dapat dikuasai dengan baik oleh
para peserta didik. d) Tes Diagnostik
Tes ini digunakan untuk menentukan secara tepat, jenis kesukaran yang dihadapi oleh peserta didik dalam suatu mata pelajaran tertentu.
e) Tes Formatif
Tes formatif ini biasanya dilaksanakan di tengah-tengah
perjalanan program pengajaran, yaitu dilaksanakan pada setiap kali satuan pelajaran berakhir atau dapat diselesaikan. f) Tes Sumatif
Tes sumatif adalah tes hasil belajar yang dilaksanakan setelah sekumpulan satuan program pengajaran selesai diberikan. Salah satu contoh dari tes sumatif adalah Ulangan Akhir
Semester. Ulangan Akhir Semester (UAS) sering disebut juga ulangan umum yang dilakukan pada akhir semester dengan
bahan yang diujikan, meliputi materi standar, standar kompetensi, dan kompetesi dasar semester pertama (UAS pertama), serta materi standar, standar kompetensi, dan
3) Tipe Tes
Azwar (1996: 79-106) menyatakan bahwa tes terdiri dari 5 tipe. Tipe-tipe tes tersebut adalah:
a) Tipe Pilihan Ganda
Tes tipe pilihan ganda adalah tes yang terdiri dari sebuah
pertanyaan atau pernyataan yang memiliki beberapa alternatif pilihan jawaban. Kelebihan dari soal pilihan ganda menurut Hamzah (2014: 36) yaitu pemeriksaan dan pemberian skor
jauh lebih mudah dan cepat, hasil penilaian bersifat obyektif karena tidak dipengaruhi oleh subyektivitas penilai, ruang
lingkup materi yang diujikan luas dan menyeluruh, jawaban yang benar sudah tertentu dan pasti, pemeriksaan bisa diserahkan ke orang lain, analisis butir tes dapat dilakukan
dengan lebih mudah. b) Tipe Benar-Salah
Tes tipe benar-salah adalah tes yang berupa suatu pernyataan
mengenai materi ukur yang diujikan, yang memiliki dua alternatif jawaban yaitu benar dan salah.
c) Tipe Jawaban Pendek
Tes tipe jawaban pendek adalah tes yang berupa kalimat pernyataan yang harus dijawab secara singkat yang pada
umumnya tidak lebih dari satu atau dua kalimat pernyataan yang belum selesai sehingga peserta didik diminta untuk
d) Tipe Pasangan
Tes tipe pasangan adalah tes yang menuntut peserta didik untuk memilih di antara beberapa pilihan yang cocok untuk
dipasangkan dengan stimulus yang ada. e) Tipe Karangan (Esai)
Tes tipe karangan (esai) merupakan tes yang berbentuk suatu pertanyaan atau perintah yang menuntut peserta didik untuk memberikan jawaban yang terurai.
4) Ciri-ciri Tes yang Baik
Ciri-ciri tes yang baik menurut Purwanto (2009: 99) yaitu:
a) Tingkat Kesukaran
Dalam tes, tingkat kesukaran butir-butir soal diusahaan sedang. Jika butir soal terlalu mudah atau terlalu sukar bagi
dua atau lebih peserta maka skor tidak lagi dapat membedakan kemampuan para peserta sekiranya di antara mereka terdapat perbedaan kemampuan.
b) Daya Beda
Daya beda harus diusahakan positif dan setinggi mungkin.
Butir soal dengan daya beda positif dan tinggi berarti butir soal tersebut dapat membedakan dengan baik siswa kelompok atas dan bawah.
c) Efektivitas Pengecoh
Pengecoh dikatakan berfungsi efektif apabila paling tidak ada
3. Analisis Butir Soal
a. Pengertian Analisis Butir Soal
Sebagai alat ukur, suatu tes dapat dikatakan berhasil jika sesuai
dengan fungsi dan tujuannya. Untuk mengetahui berhasil atau tidaknya suatu tes, harus ditinjau dari kualitas butir soalnya. Kualitas
butir soal dapat diketahui melalui analisis. Analisis butir soal merupakan pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai (Sudjana:
2012: 135).
Kusaeri dan Suprananto (2012: 173) mengartikan analisis butir
soal sebagai proses penelaahan butir soal melalui informasi dari jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan. Arikunto (2012: 222) berpendapat bahwa analisis butir
soal merupakan pengidentifikasian soal-soal yang baik, kurang baik, dan soal yang jelek. Dengan analisis butir soal, dapat memperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk
mengadakan perbaikan.
Dari definisi-definisi di atas, dapat disimpulkan bahwa analisis butir
soal merupakan pengkajian dari pertanyaan-pertanyaan dalam instrumen yang digunakan untuk mengukur kemampuan dalam proses pembelajaran yang meliputi validitas, reliabilitas, tingkat kesukaran,
b. Cara Menganalisis Butir Soal
Analisis pada umumnya dilakukan melalui dua cara, yaitu (Surapranata, 2004: 1) :
1) Analisis Kualitatif
Analisis kualitatif menurut Mulyasa (2009: 1) sering juga
disebut sebagai validitas logis (logical validity) yaitu berupa penelaahan yang dimaksudkan untuk menganalisis soal ditinjau dari segi teknis, isi, dan editorial. Artinya, analisis ini meninjau
soal dari segi eksternalnya. Pada penelitian ini analisis dengan cara kualitatif digunakan untuk menguji validitas isi dari soal
bahwa soal tersebut sesuai atau tidak dengan isi atau materi yang telah diberikan.
2) Analisis Kuantitatif
Surapranata (2004: 10) menyatakan bahwa analisis soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik
internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda, dan reliabilitas. Menurut
Azwar (1996: 141) dalam analisis butir soal perlu juga dianalisis efektivitas distraktornya atau dapat disebut juga pengecoh. Hal ini bertujuan untuk mengetahui berfungsi atau tidaknya pilihan
jawaban yang tersedia. Penyebaran (distribusi) jawaban atau efektivitas pengecoh menurut Kusaeri dan Suprananto (2012:
soal pada penelitian ini dengan menggunakan dua cara, yaitu cara kualiitatif untuk menentukan validitas isi, dan cara kuantitatif untuk menentukan reliabilitas, tingkat kesukaran, daya beda, dan
efektifitas pengecoh dari butir soal.
4. Validitas Isi
a. Pengertian Validitas
Validitas sangat erat kaitannya dengan pengukuran dalam
evaluasi. Azwar (1996: 173) mengemukakan bahwa validitas mempunyai arti sejauh mana ketepatan dan kecermatan suatu
instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes yang valid guna pengambilan suatu keputusan dapat saja tidak valid sama sekali guna pengambilan keputusan lain dan bagi kelompok lain.
Menurut Surapranata (2009: 50) validitas merupakan suatu konsep yang berkaitan dengan sejauhmana tes telah mengukur apa
yang seharusnya diukur. Validitas tes perlu ditentukan untuk mengetahui kualitas tes dalam kaitannya dengan mengukur hal yang seharusnya diukur. Oleh karena itu, validitas dapat digunakan dalam
memeriksa secara langsung seberapa jauh suatu alat telah berfungsi. Validitas menurut pendapat Sudjana (2012: 12) adalah ketetapan alat
Berdasarkan definisi-definisi di atas, dapat disimpulkan bahwa validitas adalah ketepatan suatu tes sesuai dengan tujuan dari diadakannya tes tersebut.
b. Bentuk-bentuk Validitas
Validitas terdiri dari empat bentuk, yaitu (Surapranata, 2004: 51):
1) Validitas Isi
Validitas isi (content validity) adalah pengujian validitas dilakukan atas isinya untuk memastikan apakah butir tes hasil
belajar (THB) mengukur secara tepat keadaan yang ingin diukur (Purwanto, 2009: 120). Contohnya soal pada mata pelajaran
Bahasa Indonesia dikatakan valid apabila hanya mengukur kemampuan bahasa, bukan mengukur kemampuan matematika. 2) Validitas Konstruk
Sudjana (2012: 14) menyatakan bahwa validitas konstruk (construct validity) berkenaan dengan kesanggupan alat penilaian untuk mengukur konsep kemampuan, minat, sikap dalam
berbagai bidang kajian yang terkandung dalam materi yang diukurnya. Contohnya dalam konsep mengenai hubungan sosial
jika dilihat dari pengalaman, indikator empirisnya adalah dapat bergaul dengan orang lain, dapat bekerja sama dengan siapa pun, dan lain-lain. Apabila hasil tes menunjukkan indikator-indikator
3) Validitas Prediksi
Memprediksi menurut pendapat Arikunto (2012, 84) artinya meramal, dengan meramal selalu mengenal hal yang akan datang
jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai
kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Contohnya tes penerimaan siswa baru pada SMP X berdasarkan hasil tes seleksi setelah peserta tes lulus SD.
Peserta tes yang memiliki nilai bagus di tes seleksi tersebut lalu diterima di SMP X diperkirakan akan berhasil ketika para peserta
tes masuk SMP tersebut. Apabila hal itu terjadi, maka tes seleksi tersebut dikatakan memiliki validitas prediksi yang bagus. Sebaliknya, apabila hasil belajar di SMP kurang baik maka tes
seleksi tersebut tidak memiliki validitas prediksi yang bagus. 4) Validitas Konkuren
Validitas konkuren (concurrent validity) menunjuk pada
hubungan antara tes skor dengan yang dicapai dengan keadaan sekarang (Mulyasa, 2009: 55). Sebuah tes dikatakan memiliki
validitas konkuren apabila hasilnya sesuai dengan pengalaman. Contohnya perbandingan antara ujian akhir nasional dan tugas memiliki korelasi tinggi atau rendah, apabila indeks korelasi
c. Validitas Isi 1) Pengertian
Validitas isi (content validity) adalah pengujian validitas
dilakukan atas isinya untuk memastikan apakah butir tes hasil belajar (THB) mengukur secara tepat keadaan yang ingin diukur
(Purwanto, 2009: 120). Sudjana (2012: 13) mengemukakan bahwa validitas isi berkenaan dengan kesanggupan alat penilaian dalam mengukur isi yang seharusnya. Artinya, tes tersebut
mampu mengungkapkan isi suatu konsep atau variabel yang hendak diukur. Sedangkan Kusaeri (2014: 54) menyatakan bahwa
validitas isi berkaitan dengan derajat kemampuan instrumen penilaian mengukur cakupan substansi yang ingin diukur. Jadi, kesimpulan dari definisi-definisi tersebut adalah bahwa validitas
isi merupakan pengujian validitas terhadap kesesuaian antara suatu alat ukur dengan isi atau materi yang telah diberikan dengan cara mencocokkan antara soal dengan kisi-kisi soal.
2) Kriteria Validitas Isi
Untuk pengujian validitas isi dapat dibantu dengan
menggunakan kisi-kisi instrumen, atau matrik pengembangan instrumen. Dalam kisi-kisi terdapat variabel yang diteliti, Indikator sebagai tolok ukur dan nomor butir (item) pertanyaan
atau pernyataan yang telah dijabarkan dari Indikator (Sugiyono: 2014: 182). Kusaeri (2014: 54) menyatakan bahwa validitas dapat
instrumen penilaian disesuaikan dengan kisi-kisi. Artinya, perlu adanya keselarasan antara item yang ada pada instrumen penilaian dengan kisi-kisi. Pendapat dari Purwanto (2009: 120) juga hampir
serupa yaitu butir-butir THB dinyatakan valid (logically valid) apabila setelah mencermati isi butir-butir yang ditulis telah
menunjukkan kesesuaian dengan kisi-kisi.
5. Reliabilitas
a. Pengertian Reliabilitas
Tidak semua pengukuran dalam evaluasi memiliki hasil yang
ajeg, pasti akan terdapat beberapa perbedaan. Oleh karena itu, untuk mengetahui kualitas dari tes salah satunya harus mengetahui nilai reliabilitasnya. Reliabilitas sendiri menurut Sudjana (2012: 16)
merupakan ketetapan atau keajegan alat tersebut dalam penilaian apa yang dinilainya. Artinya, kapanpun suatu alat penilaian digunakan akan memberikan hasil yang relatif sama.
Azwar (1996: 180) selain mengartikan reliabilitas sebagai keterpercayaan, keterandalan, keajegan, konsistensi, dan kestabilan,
reliabilitas juga memiliki arti sejauh mana hasil suatu pengukuran dapat dipercaya. Hasil ukur yang dapat dipercaya adalah hasil ukur yang memiliki hasil yang sama dalam beberapa kali pengukuran pada
kelompok yang sama. Jika perbedaan relatif besar, maka hasil pengukuran tersebut dinyatakan tidak dapat dipercaya. Reliabilitas
(Arifin, 2009: 258). Dalam pengertian tersebut, reliabilitas memiliki tujuan untuk mengetahui apakah suatu tes teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan. Jadi, kesimpulan dari
beberapa definisi tersebut adalah bahwa reliabilitas merupakan ketetapan hasil suatu tes yang dilaksanakan secara berkali-kali,
diberikan pada kelompok yang sama dalam waktu yang berbeda. b. Kriteria Reliabilitas
Basuki dan Hariyanto (2014: 119) membagi kategori korelasi
reliabilitas menjadi lima kelompok yaitu sebagai berikut: Tabel 2.1 Kategori Korelasi Reliabilitas
Korelasi Reliabilitas Kategori 0,00 ≤ r ≤ 0,19 Amat rendah 0,20 ≤ r ≤ 0,39 Rendah 0,40 ≤ r ≤ 0,69 Cukup 0,70 ≤ r ≤ 0,89 Tinggi 0,90 ≤ r ≤ 1,00 Amat tinggi
Sumber: Basuki dan Hariyanto (2014: 119)
Berpedoman dari tabel 2.1, korelasi reliabilitas dibagi menjadi
lima kategori yaitu korelasi amat rendah (angka di antara 0,00 ≤ r ≤ 0,19), korelasi rendah (angka di antara 0,20 ≤ r ≤ 0,39), korelasi
cukup (angka di antara 0,40 ≤ r ≤ 0,69), korelasi tinggi (angka di antara 0,70 ≤ r ≤ 0,89), dan korelasi amat tinggi (angka di antara 0,90 ≤ r ≤ 1,00). Menurut pendapat Arifin (2009: 258) suatu tes dapat
dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang
Hariyanto (2014: 119) karena memiliki lima kategori sehingga korelasi reliabilitas memiliki kategori yang lebih detail.
6. Tingkat Kesukaran
a. Pengertian Tingkat Kesukaran
Tingkat kesukaran adalah peluang menjawab benar suatu soal
pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks (Kusaeri & Suprananto, 2012: 174). Kunandar (2013:
240) menyatakan bahwa tingkat kesukaran soal adalah proporsi jumlah peserta tes yang menjawab benar, yaitu perbandingan jumlah
peserta tes yang menjawab benar dengan jumlah peserta tes seluruhnya. Menurut pendapat Arifin (2009: 266) tingkat kesukaran adalah pengukuran seberapa besar derajat kesukaran suatu soal. Dari
definisi-definisi tersebut dapat disimpulkan bahwa tingkat kesukaran memiliki arti pengukuran kesulitan suatu soal berupa tingkatan yang
dinyatakan dalam bentuk indeks atau bilangan. b. Rumus Tingkat Kesukaran
Berikut merupakan rumus tingkat kesukaran yang dikemukakan oleh
Arikunto (2012: 223):
Keterangan :
P = tingkat kesukaran
c. Kriteria Tingkat Kesukaran
Kriteria tingkat kesukaran berdasarkan pendapat Sudjana (2012: 137) terdiri dari tiga kategori, yaitu terdapat pada tabel di bawah ini:
Tabel 2.2 Tingkat Kesukaran dalam Tiga Ketegori (1)
Rentang Tingkat Kesukaran Kategori 1 - 0,30 Sukar 0,31 - 0,70 Sedang 0,71 - 1,00 Mudah
Sumber: Sudjana (2012: 137)
Dilihat dari tabel 2.2 dapat dijelaskan bahwa jika tingkat kesukaran
memiliki angka 1 - 0,30 maka soal memiliki kategori soal yang sukar, jika 0,31 - 0,70 maka soal berkategori sedang, dan jika 0,71 - 1,00
maka soal berkategori mudah. Kriteria tingkat kesukaran menurut Kusaeri (2014: 107) juga dikategorikan menjadi tiga, yaitu dapat dilihat pada tabel berikut ini:
Tabel 2.3 Tingkat Kesukaran dalam Tiga Ketegori (2)
Rentang Tingkat Kesukaran Kategori 0,7 - 1,0 Mudah 0,3 - 0,7 Sedang 0,00 - 0,03 Sulit
Sumber: Kusaeri (2014: 107)
Deskripsi dari tabel 2.3 yaitu jika range tingkat kesukaran 0,7 - 1,0
maka soal berkategori mudah, jika jika range tingkat kesukaran 0,3 - 0,7 maka maka soal berkategori sedang, dan jika range tingkat
Tabel 2.4 Tingkat Kesukaran dalam Lima Kategori
Rentang Tingkat Kesukaran Kategori 0,00 - 0,19 Sangat Sukar 0,20 - 0,39 Sukar 0,40 - 0,59 Sedang 0,60 - 0,79 Mudah 0,80 - 1,00 Sangat Mudah
Sumber: Purwanto (2009: 101)
Tabel 2.4 di atas memaparkan bahwa tingkat kesukaran dalam kategori sangat sukar memiliki indeks kesukaran antara 0,00 - 0,19,
tingkat kesukaran dalam kategori sukar memiliki indeks kesukaran antara 0,20 - 0,39, sedangkan tingkat kesukaran dalam kategori sedang
memiliki indeks kesukaran antara 0,40 - 0,59, tingkat kesukaran dalam kategori mudah memiliki indeks kesukaran antara 0,60 - 0,79,
sedangkan tingkat kesukaran dalam kategori sangat mudah memiliki indeks kesukaran antara 0,80-1,00. Kategori yang dipaparkan oleh Purwanto (2009: 101) menjadi acuan peneliti untuk menentukan
kriteria pada tngkat kesukaran, karena terdiri dari lima kategori yang artinya memiliki jumlah kategori lebih detail dibandingkan dengan
kategori dari para ahli lain yang telah disebutkan
7. Daya Beda
a. Pengertian Daya Beda
Arikunto (2012: 226) mengemukakan bahwa daya beda adalah
kemampuan suatu soal untuk membedakan antara peserta didik yang pandai (berkemampuan tinggi) dengan peserta didik bodoh (berkemampuan rendah). Daya beda adalah kemampuan butir soal
yang ditanyakan dan peserta didik yang belum menguasai materi yang diujikan (Kusaeri & Suprananto, 2012: 175). Daya beda adalah pengukuran sejauh mana suatu butir soal mampu membedakan peserta
didik yang sudah menguasai kompetensi dengan peserta didik yang kurang menguasai kompetensi berdasarkan kriteria tertentu (Arifin,
2009: 273).
Berdasarkan definisi-definisi di atas, dapat disimpulkan bahwa daya beda merupakan kemampuan suatu soal dalam membedakan antara
peserta didik yang memiliki pengetahuan tinggi dan pengetahuan yang rendah terhadap suatu materi.
b. Rumus Daya Beda
Rumus daya beda yang dikemukakan oleh Azwar (1996: 138) adalah sebagai berikut:
d
Keterangan:
NiT = banyaknya penjawab soal dengan benar dari kelompok tinggi
NT = banyaknya penjawab dari kelompok tinggi
NiR = banyaknya penjawab soal dengan benar dari kelompok rendah
NR = banyaknya penjawab dari kelompok rendah c. Kriteria Daya Beda
Daya beda memiliki empat kategori, yaitu sebagai berikut: Tabel 2.5 Kategori Daya Beda (1)
Indeks Daya Beda Kategori >0,40 Bagus Sekali 0,30-0,39 Lumayan Bagus 0,20-0,29 Belum Memuaskan
<0,20 Jelek
Tabel 2.5 memaparkan bahwa daya beda dengan kategori bagus sekali memiliki indeks lebih dari 0,40. Apabila indeks daya beda berkisar antara 0,30-0,39 maka daya beda pada butir soal
lumayan bagus tapi mungkin masih perlu peningkatan, apabila indeks daya beda berkisar antara 0,20-0,29 maka belum memuaskan dan
perlu diperbaiki, dan apabila indeks daya beda kurang dari 0,20 maka butir soal jelek dan harus dibuang. Kunandar (2013: 241) menyebutkan bahwa hasil penghitungan tingkat daya beda soal dapat
dikategorikan menjadi empat, yakni sebagai berikut: Tabel 2.6 Kategori Daya Beda (2)
Indeks Daya Beda Kategori 0,00 - 0,20 Jelek 0,21 - 0,40 Cukup 0,41 - 0,70 Baik 0,71 - 1,00 Baik Sekali
Sumber: Kunandar (2013: 241)
Tabel 2.6 menjelaskan bahwa daya beda dengan kategori jelek memiliki kisaran angka 0,00 - 0,20), cukup (kisaran angka 0,21 -
0,40), baik (kisaran angka 0,41 - 0,70), dan baik sekali (kisaran angka 0,71 - 1,00). Kategori daya beda menurut Kusaeri (2014: 109) juga terdiri dari empat kategori, yaitu dapat dilihat pada tabel di bawah ini:
Tabel 2.7 Kategori Daya Beda (3)
Indeks Daya Beda Kategori 0,40 - 1,00 Sangat Memuaskan 0,30 - 0,39 Memuaskan 0,20 - 0,29 Tidak Memuaskan 0,00 - 0,19 Sangat Tidak Memuaskan
Sumber: Kusaeri (2014: 109)
Berdasarkan tabel 2.7 di atas dapat dijelaskan bahwa daya beda
1,00, kategori memuaskan memiliki kisaran angka 0,30 - 0,39, kategori tidak memuaskan memiliki kisaran angka 0,20 - 0,29, dan kategori sangat tidak memuaskan memiliki kisaran angka 0,00 - 0,19.
Penelitian ini menggunakan acuan dari Ebel (dalam Azwar, 1996) yang memiliki empat kategori, alasan pemilihan kategori tersebut
karena lebih familiar.
8. Efektivitas Pengecoh
a. Pengertian Efektivitas Pengecoh
Pengecoh (distraktor) menurut pendapat Sudijono (2011:
409) adalah option atau alternatif yang berjumlah antara tiga sampai dengan lima buah, dan dari kemungkinan-kemungkinan jawaban yang terpasang pada setiap butir item itu salah satu diantaranya
adalah merupakan jawaban betul (kunci jawaban), sedangkan sisanya adalah merupakan jawaban salah. Arifin (2014: 241) mengartikan pengecoh jawaban sebagai pola yang dapat
menggambarkan bagaimana peserta tes menentukan pilihan jawaban terhadap kemungkinan-kemungkinan jawaban yang telah
dipasangkan pada setiap butir soal.
Azwar (1996: 137) menyatakan bahwa efektivitas pengecoh merupakan kemampuan soal dalam membedakan antara siswa yang
kemampuan rendah (diwakili oleh mereka yang termasuk dalam kelompok rendah).
Jadi, dari beberapa definisi di atas dapat disimpulkan bahwa
efektivitas pengecoh adalah penyebaran pilihan jawaban yang digunakan untuk menguji peserta didik dalam pemahaman materi.
b. Rumus Efektivitas Pengecoh
Berikut rumus efektivitas pengecoh yang dikemukakan oleh Arifin (2009: 279):
IP =
Keterangan:
IP = indeks pengecoh
P = jumlah peserta didik yang memilih pengecoh N = jumlah peserta didik yang ikut tes
B = jumlah peserta didik yang menjawab benar pada setiap soal
n = jumlah alternatif jawaban (opsi) 1 = bilangan tetap
c. Kriteria Efektivitas Pengecoh
Arikunto (2012: 234) memaparkan bahwa suatu pengecoh
dikatakan berfungsi dengan baik jika paling sedikit dipilih oleh 5% pengikut tes. Pendapat yang sama juga dikemukakan oleh Mulyasa (2009: 43) bahwa suatu pengecoh dapat dikatakan berfungsi dengan
baik jika paling sedikit dipilih oleh 5% peserta tes. Sedangkan menurut Kunandar (2013: 241) pengecoh dapat dikatakan berfungsi
9. Mata Pelajaran Bahasa Indonesia
a. Pengertian Bahasa
Bahasa adalah sistem tanda bunyi yang sudah disepakati untuk
dipergunakan oleh para anggota kelompok masyarakat tertentu di dalam bekerjasama, berkomunikasi, dan mengidentifikasi diri
(Kushartanti, 2005: 15). Bahasa menurut pendapat Walija (1996: 4) adalah komunikasi yang paling lengkap dan efektif untuk menyampaikan ide, pesan, maksud, perasaan, dan pendapat kepada
orang lain. Sementara Santoso (1990: 1) mengungkapkan bahwa bahasa memiliki arti rangkaian bunyi yang dihasilkan oleh alat ucap
manusia secara sadar.
Berdasarkan pedoman dari para ahli di atas dapat disimpulkan bahwa bahasa merupakan alat komunikasi yang sudah disepakati oleh
anggota kelompok tertentu dalam tujuan untuk menyampaikan maksud dari dalam diri seseorang.
b. Pengertian Mata Pelajaran Bahasa Indonesia
Mata Pelajaran Bahasa Indonesia merupakan mata pelajaran yang memberikan pemahaman kepada guru dan peserta didik SD dalam
melaksanakan pembelajaran Bahasa Indonesia yang benar melalui membaca dan menulis (Zulela, 2012: 1). Berdasarkan definisi tersebut, kesimpulan yang didapatkan oleh peneliti mengenai
siswa tentang Bahasa Indonesia yang baik dan benar melalui membaca dan menulis.
c. Standar kompetensi dan Kompetensi Dasar
Standar Kompetensi dan Kompetensi Dasar mata pelajaran Bahasa Indonesia kelas IV SD semester genap berdasarkan Standar Isi
terdapat pada tabel di bawah ini:
Tabel 2.8 Standar Kompetensi dan Kompetensi Dasar
Standar Kompetensi Kompetensi Dasar
6.1Berbalas pantun dengan lafal dan intonasi yang tepat
7.2 Membaca nyaring suatu pengumuman dengan lafal dan intonasi yang tepat
8.1Menyusun karangan tentang berbagai topik sederhana dengan memperhatikan penggunaan ejaan (huruf besar, tanda titik, tanda koma, dan lain-lain).
8.2 Menulis pengumuman dengan bahasa yang baik dan benar serta memperhatikan penggunaan ejaan 8.3 Membuat pantun anak yang menarik tentang
berbagai tema (persahabatan, ketekunan, kepatuhan, dan lain-lain) sesuai dengan ciri-ciri pantun
Tabel 2.8 memaparkan SK dan KD pada kelas IV SD
semester genap yang terdiri dari Standar Kompetensi 5 (mendengarkan), 6 (berbicara), 7 (membaca), dan 8 (menulis).
Kompetensi 7 terdiri dari tiga Kompetensi dasar, dan Standar Kompetensi 8 terdiri dari tiga Kompetensi Dasar. Jadi, pada kelas IV semester genap terdiri dari empat Standar Kompetensi dan sepuluh
Kompetensi Dasar.
B. Penelitian yang Relevan
Penelitian yang relevan dengan penelitian ini yaitu sebagai berikut:
Rofiqoh (2012) melakukan penelitian dengan judul “Analisis Butir Soal
Ulangan Madrasah Mata Pelajaran Fisika Menggunakan Taksonomi Bloom Ranah Kognitif Kelas XII”. Penelitian ini bertujuan untuk mengkategorikan
dan mengetahui prosentase tingkatan taksonomi Bloom ranah kognitif pada soal Ulangan Madrasah mata pelajaran fisika kelas XII MA Negeri Kendal tahun pelajaran 2010/2011 serta untuk mengetahui kualitas berdasarkan
analisis empiris yang meliputi validitas, reliabilitas, taraf kesukaran dan daya pembeda soal. Penelitian ini merupakan penelitian kualitatif deskriptif. Teknik
pengumpulan data berupa dokumentasi, wawancara dan tehnik korelasi. Hasil dari penelitian ini adalah validitas soal 40% digolongkan valid dan 60% tidak valid dengan besar r tabel 0,339 dan taraf kepercayaan 5%. Reliabilitas soal
digolongkan mempunyai reliabilitas tinggi yaitu 0,69 karena lebih besar dari r tabel. Untuk taraf kesukaran butir soal kriteria mudah 40 soal (100%). Daya
pembeda soal dengan kriteria jelek 25 soal (62,5%), kriteria cukup 10 soal (25%), kriteria baik 4 soal (10%) dan soal sangat jelek yang harus dibuang karena bernilai negatif 1 soal (2,5%). Dengan demikian, penelitian ini memiliki
penelitian, teknik pengumpulan data, dan tujuan yaitu menganalisis butir soal untuk mengetahui kualitas berdasarkan validitas, reliabilitas, taraf kesukaran dan daya pembeda soal.
Penelitian oleh Amalia dan Widayati (2012) dengan judul “Analisis
Butir Soal Tes Kedali Mutu Kelas XII SMA Mata Pelajaran Ekonomi Akuntansi di Kota Yogyakarta Tahun 2012”. Penelitian ini bertujuan
mengetahui kualitas butir soal Tes Kendali Mutu Kelas XII SMA mata pelajaran Ekonomi Akuntansi di Kota Yogyakarta Tahun 2012 baik soal seri A,
B, C, D, maupun E. Penelitian ini merupakan penelitian deskriptif dengan menggunakan pendekatan kuantitatif karena semua data atau informasi yang
diperoleh diwujudkan dalam bentuk angka-angka dan dianalisis dengan statistik menggunakan program Item and Test Analysis (ITEMAN). Teknik pengumpulan data dilakukan dengan menggunakan metode dokumentasi untuk
memperoleh data butir-butir soal, kunci jawaban, dan hasil tes siswa. Hasil penelitian menunjukkan bahwa butir soal sebagian besar valid dengan nilai 83%. Berdasarkan reliabilitas soal, soal tersebut memiliki koefisien reliabilitas
yang tinggi dengan koefisien rata-rata sebesar 0,806. Berdasarkan tingkat kesukaran, soal dengan tingkat kesukaran sedang dengan nilai rata-rata 59,5%.
Berdasarkan daya pembeda, soal dengan daya pembeda baik dengan nilai rata-rata 57,5%. Berdasarkan efektivitas penggunaan distractor, soal dengan
distractor yang berkualitas sangat baik dengan nilai rata-rata 45%. Penelitian
teknik pengumpulan data yang sama yaitu dengan metode dokumentasi untuk memperoleh data butir-butir soal, kunci jawaban, dan hasil tes siswa.
Dwipayani (2013) melakukan penelitian dengan judul “Analisis
Validitas dan Reliabilitas Butir Soal Ulangan Akhir Semester Bidang Studi Bahasa Indonesia Kelas X.D SMA N 1 Terhadap Pencapaian Kompetensi”.
Penelitian ini bertujuan mengetahui dan mendeskripsikan kualitas butir soal ulangan akhir semester ganjil bidang studi Bahasa Indonesia kelas X.D SMA N 1 Bangli berdasarkan uji validitas isi, tingkat kesukaran, analisis daya beda,
dan efektivitas opsion, mengetahui dan mendeskripsikan kualitas perangkat soal ulangan akhir semester ganjil bidang studi Bahasa Indonesia kelas X.D
SMA N 1 Bangli ditinjau dari analisis reliabilitas. Hasil penelitian menunjukkan bahwa validitas isi soal tidak valid atau tergolong rendah. Hasil tingkat kesukaran butir soal yang termasuk dalam kriteria soal sedang dengan
persentase sebesar 56%. Butir soal termasuk dalam kriteria daya beda jelek dengan persentase sebesar 40%. Analisis efektivitas opsi kunci butir soal yang berfungsi secara efektif dengan persentase sebesar 72%. Hasil uji reliabilitas
rata-rata persentase tingkat ketercapaian siswa yang menjawab benar pada soal sebesar 52% sedangkan rata-rata perentase tingkat ketercapaian siswa yang
menjawab salah sebesar 48%. Persamaan penelitian ini dengan penelitian yang dilakukan oleh peneliti adalah tentang analisis butir soal pada mata pelajaran bahasa Indonesia serta memiliki tujuan yang sama yaitu mengetahui kualitas
Karzuni (2011) melakukan penelitian dengan judul “Analisis Butir Soal
Ulangan Akhir Semester (UAS) Mata Pelajaran Bahasa Indonesia SMK Kelas X Semester Gasal Tahun Ajaran 2010/2011 (Studi Kasus di SMK Muhammadiyah Ungaran)”. Penelitian ini bertujuan untuk mengetahui
bagaimana kualitas butir soal ulangan akhir semester (TKM) mata pelajaran
Bahasa Indonesia bila ditinjau dari segi kesesuaian soal dengan kompetensi dasar pada kurikulum yang berlaku, penyebaran soal, validitas butir soal, daya beda soal, tingkat kesukaran soal, dan efektivitas distraktor soal. Jenis
penelitian ini termasuk jenis penelitian deskriptif. Teknik pengumpulan data pada penelitian ini menggunakan metode dokumentasi. Hasil dari penelitian ini
adalah validitas butir soal kelas X termasuk soal yang valid, daya beda soal kelas X termasuk dalam kriteria jelek, tingkat kesukaran untuk kelas X termasuk dalam kriteria mudah. Efektitivitas distraktor soal kelas X termasuk
dalam kriteria tidak efektif. Penelitian ini memiliki persamaan dengan penelitian yang dilakukan oleh peneliti yaitu menganalisis butir soal pada mata pelajaran Bahasa Indonesia. Tujuan, jenis penelitian, dan teknik pengumpulan
data juga memiliki persamaan yaitu jenis penelitian deskriptif dan teknik pengumpulan data dengan metode dokumentasi.
Literature Map dari penelitian yang relevan ini akan dipaparkan pada halaman
Gambar 2.1. Literature Map
Dari gambar 2.1 dapat dijelaskan bahwa penelitian yang relevan dengan penelitian ini terdiri dari empat judul penelitian. Penelitian tersebut
memiliki beberapa persamaan dengan penelitian yang dilakukan oleh peneliti yaitu tentang analisis butir soal dan tentang mata pelajaran yang sama yaitu
mata pelajaran Bahasa Indonesia. Penelitian yang memiliki persamaan
Mata Pelajaran Analisis Butir Soal
tentang analisis butir soal yaitu yang pertama berjudul Analisis Butir Soal Ulangan Madrasah Mata Pelajaran Fisika Menggunakan Taksonomi Bloom Ranah Kognitif Kelas XII dan Analisis Butir Soal Tes Kendali Mutu Kelas
XII SMA Mata Pelajaran Ekonomi Akuntansi di Kota Yogyakarta Tahun 2012.
Persamaan selanjutnya pada penelitian ini yaitu tentang mata pelajaran Bahasa Indonesia yang ada pada penelitian yang relevan dengan judul Analisis Validitas dan Reliabilitas Butir Soal Ulangan Akhir Semester Bidang
Studi Bahasa Indonesia Kelas X.D SMA N 1 Terhadap Pencapaian Kompetensi dan Analisis Soal-soal UKK Mata Pelajaran Bahasa Indonesia di
SMP Negeri Krian Tahun Ajaran 2010/2011. Persamaan-persamaan yang terdapat pada penelitian yang relevan dapat menjadikan sumber referensi dan juga evaluasi bagi peneliti untuk dapat mengembangkan penelitian yang lebih
baik.
C. Kerangka Berpikir
Dalam dunia pendidikan, kata “evaluasi” sering digunakan terutama
pada kegiatan atau proses belajar mengajar. Evaluasi memiliki kedudukan
yang sangat penting, karena dapat menjadi bahan acuan tentang berhasil atau tidaknya peserta didik dalam kegiatan pembelajaran. Evaluasi merupakan
tujuan pendidikan sudah tercapai. Dengan demikian, evaluasi juga dapat dijadikan sebagai bahan perbaikan mutu dalam pendidikan.
Untuk mengetahui kualitas suatu tes, perlu dilakukan analisis pada
setiap butir soalnya. Sudjana (2012: 149) menyatakan bahwa ada beberapa cara untuk melakukan analisis butir soal. Analisis butir soal dapat dilakukan
dengan cara analisis tingkat kesukaran, analisis daya beda, analisis validitas, dan analisis reliabilitas. Selain itu, Azwar (1996: 141) berpendapat bahwa dalam analisis butir soal perlu juga dianalisis efektivitas distraktornya atau
dapat disebut juga pengecoh. Hal ini bertujuan untuk mengetahui berfungsi atau tidaknya pilihan jawaban yang tersedia. Analisis pada umumnya
dilakukan melalui dua cara, yaitu analisis kualitatif (qualitatif control) dan analisis kuantitatif (quantitatif control) (Surapranata, 2004: 1). Pada penelitian ini analisis dengan cara kualitatif digunakan untuk menguji
validitas isi dari soal bahwa soal tersebut sesuai atau tidak dengan isi atau materi yang telah diberikan, sedangkan analisis kuantitatif pada penelitian ini digunakan untuk menguji reliabilitas, tingkat kesukaran, daya beda, dan
efektivitas pengecohnya.
D. Hipotesis
Hipotesis pada penelitian ini adalah sebagai berikut:
1. Validitas isi pada butir soal pilihan ganda Ulangan Akhir Semester genap